GPU segítség. GPU teljesítményprobléma a gyorsított szoftvereknél

Zharoznizhyuchі zasobi gyerekeknek priznachayutsya pedіatr. Állítólag előfordulnak olyan helyzetek, amikor láz esetén kényelmetlen segítséget nyújtanak, ha titkot kell adni a gyereknek. A Todi apák magukra vállalják a lázcsillapító gyógyszerek sokoldalúságát és konzisztenciáját. Szabad-e mellet adni a gyerekeknek? Hogyan lehet legyőzni a nagyobb gyerekek hőmérsékletét? Melyek a legjobbak?

Szükséges a program a kriptovaluta bányászatához? Mi a vrahovuvati, amikor a bányászat birtokát választják? Yak Maini bitcoin és efirium további videokártyákhoz számítógépeken?

A megjelenéshez nem csak a fajok kedvelőinek van szükségük a szükséges videokártyákra számítógépek igor... Több ezer koristuvachіv minden svіt vykorystuyut grafikus adapterek kereső cryptocurrency! 3 decilkoh kártya kényszerített processzorokkal Bányász hajtogatni fermi- számozott központok, amelyek gyakorlatilag mostantól digitális filléreket adnak hozzá!

Ön Denis Kuderin – a „HiterBober” magazin szakértője a pénzügyi és írástudó pluralitás táplálkozásával kapcsolatban. Megnyílok, úgy ahogy vagyok Bányászat videokártyákon 17-18 rockban, mivel helyesen rezegnek a kriptovaluta keresetének beállításai, és nem nyilvánvaló, hogy miért adsz hozzá bitcoint a képernyőn.

Lásd még, de vásárolja meg a legproduktívabbat fogom húzni a videokártyát professzionális bányászathoz, és használja ki a szakértelmet bányagazdasága hatékonyságának javítására.

1. Bányászat videokártyákon - könnyű fillérek vagy rossz vitrati

A jó videokártya nem csak egy adapter digitális jelek, A th feszesebb processzor, Zdatnyy virishuvati a leggyakoribb én köztük - sorolja fel a blokkok lándzsájának hash kódját (blokklánc)... Árgrafikus fizetések ideális eszközzel Bányászati- vidobotku kriptovaluta.

étel: Miért van szükség videokártya processzorra? Van egy számítógépnek központi processzora? Nem logikus a számítást segítséggel elvégezni?

alábbiak szerint: A CPU processzor a blokkláncokat is kódolni tudja, több százszor csökkentve az árat, mint a videokártya processzor (GPU). És nem az egyik szebb, a másik jobb. Csak arról van szó, hogy robotelvük van. És amint lefotózza a videókártyát, az ilyenek nyomása számlálóközpont hogy előrelépjünk a fejlesztés során.

A csendesek számára a megértés nem azokról szól, akik digitális filléreket keresnek, kis link... Bányászat - fő, inodi és egyirányú kriptovaluta.

Oskilkit és fillért nem szabad verni, nem barát, és a bűz nem anyagi anyag, hanem digitális kód, ami a kódért felelős. Tsim bányászattal, vagy inkább számítógépekkel foglalkozik.

A kód Krym felsorolása, Mining Viconu

  • decentralizációs rendszerek támogatása: a ravaszság láthatósága a szerverek számára a blokklánc alapja;
  • tranzakciók visszaigazolása- bányászati ​​műveletek nélkül nem léphet új blokkra;
  • Új rendszerblokkok kialakítása- і їх bevitele a One for all computers restr-be.

Azonnal le akarom hűteni a kavicsok biztosítékát: egyre fontosabbá válik a bőrkővel történő bányászat folyamata. Például a kiegészítő videokártya mögött már régóta veszteséges.

A kiegészítő GPU-val rendelkező szukák először csak amatőröket adnak hozzá, a videokártyák cseréjéhez szükséges chipek speciális processzorokat kaptak ASIC... A chip kevesebb energiát él meg, és számot tekintve hatékonyabb. Minden jó, ale kostuyut közel 130-150 ezer rubel .

Az Antminer S9 modellt húzzák

A Miner szerencséjére a bitcoinok nem csak egy kriptovaluta a bolygón, hanem egy a több száz közül. Інші digitális fillérek - ефіріуми, Zcash, Expanse, dogkoini stb. Ahogy korábban is, további segítségért tekintheti meg a videokártyákat. A borváros stabil, a tulajdonlás körülbelül 6-12 hónapon belül megtérül.

Egy másik probléma a keményen nyomott videokártyák hiánya... A kriptovalutákkal kapcsolatos izgalom a cich mellékletek árának emelkedésébe oltható be. Nem olyan egyszerű új videokártyát vásárolni az oroszországi bányászathoz.

A Bányászt arra kérik, hogy cserélje ki a videoadaptert az online áruházakban (ideértve a külföldieket is), vagy vásároljon régi termékeket. Állj, a beszéd előtt robiti nem raju: A Mining birtoka régi, és fantasztikus élményekkel rendelkezik.

Az Aviton adjon el számos farmot vidobutku kriptovalutáért.

Sok oka van: az egyik Miner már a digitális fillérek videokazettáinál "bemelegedett", és egyre több befelé irányuló műveletet folytatnak kriptovalutával (zokrem, piaci kereskedés), intelligenciával, versenyezve a keménymagos kínai klaszterekkel. A harmadik videokártyáról Asikára váltott.

A dalos érkezést azonban feltétlenül hozni kell, és ha egyből gondoskodunk a kiegészítő videokártyáról, akár fel is állhatunk, hogy kiránduljunk a Maybut vonatra.

A jobb oldalon az egész emeleten egyre nagyobb a kavics. Ráadásul a digitális érmék teljes száma nem növekszik. Navpaki, a város régebbi.

Tehát abban a városban sok rakéta van egy blokklánchoz. 50 érme, Fertőzés tse lishe 12,5 BTK... A számítás hajthatósága 10 ezerszeresére nőtt. Igaz, magának a bitcoinnak a paritása egy egész óra alatt sokat nőtt.

2. Yak Mine kriptovaluta további videokártyához - pokrokova utasítások

Є két lehetőség a bányászathoz - egyedül és a raktárban. Egyetlen zdobichchyu zamatisya összecsukhatóan - anyának szüksége van fenségre a hash árfolyamok számára(Az egyik erőfeszítés), a mali kezdeti számítása és a sikeres zárások száma.

Az összes Miner 99%-a itt dolgozik medencék(Eng. Pool - pool) - spіlnotakh, számítási feladatok fejlesztése foglalkoztatja. A Spilny Mining új tényező a vapingban, és a stabil bevétel garanciája.

Egy hozzáértő bányászom a következő meghajtót tudta használni: 3 sziklás napja bányászom, egy teljes órája nem úszom meg, de van egy önkioldóm.

Az ilyen kutatók hasonlóak a 19. századi aranybányászokhoz. Megkeverheti a saját rögöt kövekkel (a mi vipad - bitcoinokkal) és így, és nem tudhatja. Tehát a blokklánc nem lesz bezárva, de ez azt jelenti, hogy nem utasít el semmilyen kupacot.

Még három esély a „saját készítésű mistereknek” a kriptoérmék efireire és tetteire.

A fejlett titkosítási algoritmus révén az ETH nem támogatja a speciális processzorokat (ezeket még nem találták fel). Vikoristovuyt az összes viklyuchno videokártyához. Az efіrіumok rakhunok és a legnagyobb altcoinok számára még mindig számos gazda van.

Egy videokártya nem lenne elegendő a fő farm megnyitásához: 4 db - "létminimum" a Bányásznak, Yaky rozrahovuє a stabil érkezésért. Nem fontos rendszer meg van húzva hűtő video adapter. І ne engedje, hogy elcsússzon tisztelettel і taku stattyu vitrat, mint az áram fizetését.

Pokrokova utasításai annak biztosítására, hogy minden támogatást megkapjanak, és felgyorsítsa a beállítási folyamatot.

Croc 1. Vibiraєmo medence

A legtöbb kriptovaluta golyót a KNK-ban, valamint Izlandon és az Egyesült Államokban telepítik. Formálisan a kettősség nem állami hovatartozás kérdése, a golyós orosz weboldalak ritkaságnak számítanak az interneten.

Oskilki dobuvati a videokártyán jobb lesz az egész efirium, akkor kaját kell venni, használd a kiszámolt valutát. Etheriumot akarok – egy bevallottan fiatal altcoint, medence a jógónak... A spilnoti választása miatt sok mindent meg lehet határozni a bevétel nagyságán és annak stabilitásán.

Rezgő medence a támadó kritériumokhoz:

  • termelékenység;
  • robotika óra;
  • népszerűség a kriptovaluta közepén;
  • pozitív üzenetek megjelenése független fórumokon;
  • a fillér haszna;
  • rozmіr comіsії;
  • a narahuvannya érkezés elve.

A piacon a kriptovaluták változásai jönnek ma. Ár a tanfolyamon való sztrájkért és az új digitális fillérekért - Villa bitcoinok. Csapda és globális változások.

Nem sokkal ezelőtt tehát nyilvánvalóvá vált, hogy az éter a lehető legjobb módon váltson át a forgalom elvi rendszerére. Néhány szóval az Etheriumnak nincs bányásza, és sok pénz az érmékért, és a guba nem akad el a boltban, és nem vált át az inshi fillérekért.

Ale ilyen "dibnytsi" entuziastiv nikoli nem voltak zupinali. Tim Bolshe, a program neve Profitable Pool. Vona automatikusan megjelenik az aktuális pillanatban az altcoin videóhoz. Є і magukat a hibákat, valamint azok értékelését valós időben szolgálják ki.

Croc 2. Állítsa be és futtassa a programot

A medence webhelyén való regisztráció után egy speciális bányászprogramot kell hozzáadni - a kód beírása nélkül átadom a kiegészítő számológépnek. Az ilyen programokat be lehet fejezni. bitcoin árért - 50 bányász abo CGMiner, efirunak - Ethminer.

Nalashtuvannya vimagaє tisztelet és ének tippek. Például szükség van a nemességre, valamint a szkriptekre, és illeszteni őket a számítógép parancssorába. A technikai mozzanatokat a gyakorló Minerekkel tisztázom, a beállítások, beállítások részleteit a skin programokban.

Croc 3. Reєstruєmo gamanets

Mindaddig, amíg még mindig sok bitcoin-gamantsya vagy egy efirium-skhovishcha van, regisztrálniuk kell. Gamantsi vikachuєmo hivatalos oldalakról.

Az egyik további segítség abban a jogban, hogy maguk készítsék el a golyókat, de nem ingyenesen.

Croc 4. Mo Mining and stezhimo elindítása statisztikákhoz

Amikor túlterhelt, indítsa el a folyamatot, és ellenőrizze az első nadkhodzhen. Igény szerint töltse le a kiegészítő programot, ha látni fogja a számítógépe főbb egyetemeit - megszakítás, túlmelegedés stb.

Croc 5. Vivodimo kriptovaluta

A számítógépek cylodobovo-val működnek, és automatikusan felsorolják a kódot... Csak varratokat kap, és nem fog rosszul járni a rendszerekkel. A kriptovaluta gyorsan, közvetlenül a hash-arányok számával arányosan áramlik a gamanetjeibe.

Hogyan lehet digitális valutát fiat valutává alakítani? Táplálkozás, gidny okremoї statty. Ha rövid, akkor te shvidky módon- cserepontok. A szaglásért sok pénzt kell költenie a szolgáltatásokért, és a személyzetének tudnia kell a legjobb kiváló tanfolyamot a minimális képregényben. Zrobiti tse segít professzionális szolgáltatás Ratio obminnikiv.

- egy erőforrás egy ilyen tervhez a Runetben. Több mint 300 kicserélt pont mutatóinak Tsei figyelése és a devizapárok árfolyama szerinti legkisebb jegyzések ismerete. Ezenkívül a szolgáltatás elrendeli a kriptovaluta készpénzben történő lefoglalását. A megfigyelési listákon - csak az átalakítások és a szükséges szolgáltatások cseréje.

3. Tiszteletben tartom az állatokat, amikor videokártyát választok a Mininghez

Rezgés a videokártya szükséges egy rózsa. Persha-lipsha, erre, ahogy a számítógépen már áll, azaz Maine, Ale az erőfeszítés tsієї, hogy megtalálja efіrіv bude mіznі kevés.

A főbb mutatók a következők: termelékenység (szívósság), energia fenntartása, hűtés, gyorsulási kilátások.

1) A késztetés

Itt minden egyszerű - milyen a processzor termelékenysége, szebb a hash kód kiszámításához. A nézetjelzők 2 GB-nál nagyobb memóriakapacitású képet biztosítanak. І válasszon egy mellékletet 256 bites busszal. A 128 bites nem alkalmas a közösség számára.

2) Energetikai szolgáltatások

Szívósság, tse, félelmetes, nagyszerű - magas hash-arány és egyben benne is. Ale ne felejtse el az energiaellátás mutatóit. A deyaki termelő gazdaságok elektromos áramstílusokat "hoznak létre", így a vitra jég kifizetődik vagy nem kifizetődő Zagalyban.

3) Hűtés

Normál tárhely 4-16 kártya számára. Vona viroblyát elborítja a hőmennyiség, káros a hajra és nem magára a gazdára. Egy légkondi nélküli egyszobás lakásban kényelmetlennek tűnik.

A Yakisne processzorhűtés nem azonos a sikeres bányászattal

Ehhez, ha két azonos termelékenységű kártyát választ ki, adja meg a pass tiy-t a yakiy-nál kisebb hőigény (TDP) . legjobb paraméterei jó bemutatni egy képet Radeonról. Ezenkívül az összes többi kártya jobb rögzítése aktív üzemmódban kopás nélkül működik.

A további hűtők nemcsak meleget hoznak a processzorokba, hanem az élettartamot is megőrzik.

4) Vezethető

Rozgin - primus a videokártya munkamutatóinak fejlesztéséhez. A "rozignati kártya" befizetés lehetősége két paraméterben - frekvenciák grafikus processzorés videó frekvenciák... Maga їkh і fog kezet, ha növelni akarja az erőfeszítések számát.

Milyen videokártyák vagytok testvérek? Ismernie kell a mellékletet utolsó generáció Aki kevésbé grafikus, annak nem előbbi, nem annak 2-3-szorosa. Bányász vikoristovoyt karty AMD Radeon, Nvidia, Geforce GTX.

Vessen egy pillantást a videokártyák kifizetési táblázatára (az adatok 2017 végére vonatkoznak):

4. Vásároljon videokártyát a bányászathoz - tekintse meg a TOP-3 üzleteket

Ahogy már mondtam, a Mining egyre népszerűbb videokártyáit szűkös termékké alakították újra. Schob vásárolni szükséges prist_y Kevesebb időbe telt a vitratitás megszerzése.

A legjobb online értékesítési pontokról alkotott véleményünk segíthet Önnek.

1) TopComputer

Moszkvai hipermarket by-run technológia... Pratsyu a piacon több mint 14 éves, ellátó elvtárs egy csomó árak az árak virobnik. Pratsyu szolgáltatás azonnali szállítás, bezkoshtovna a moszkoviták számára.

Az írás idején a statty akciós є rajzfilmek AMD, Nvidia(8 Gb) és інші minták, amelyek bányászatra alkalmasak.

2) Мybitcoinshop

Szaküzlet, bányászati ​​termékek kereskedelme... Itt mindent tudni fog, hogy ösztönözze otthoni farmját – videokártyák a szükséges konfigurációkhoz, élő blokkok, adapterek és ASIC-Minerek (egy új generációs Minerhez). Є fizetett szállítás és önszállítás egy moszkvai raktárból.

A cég többször is nem hivatalos felhívást intéz az Orosz Föderációban található Miner üzlethez. Gyors kiszolgálás, kedves beüzemelés az ügyfelek felé, a felállítás élvonala - a fejraktárak sikere.

3) Ship Shop America

Áru vásárlása és szállítása az USA-ból. A társaság közepén azoknak a csendeseknek, akiknek hatékony exkluzív és legfejlettebb elvtársakra van szükségük a bányászathoz.

A virobnik tartományi videokártya közvetlen partnere az igor és a bányászat terén - Nvidia... Egy termék maximális futamideje 14 nap.

5. Yak zbіlshiti dohіd from Mining videokártyákon - 3 a kedvéért

Türelmetlen olvasók, akik egyszerre szeretnék terjeszteni a Bányászatot, és levágni a holnapi sebet, összetéveszthetetlenül bekapcsolják - Skіlki bányászt keres?

A birtokban maradáshoz szükséges bevétel, a kriptovaluta árfolyama, a pool hatékonysága, a farm erőfeszítése, a hash árfolyamok száma és a többi tényező vásárlása. Az egyiknek meg kell adni a paszományokat 70 000 rubelben , Інші elégedettek 10 dollár minden nap. Az ár instabil és nem átadó üzlet.

Korisnі örömmel segít a vitrati növekedésében és optimalizálásában.

Ha lesz Mainy gyorsan növekszik a valuta ára, többet fog keresni. A popsiért - efir egyszerre kostu közel 300 dollár, Bitkoini - tovább 6000 ... Ale vrahovuvati kereslet nem csak egy finom részlet, hanem az első növekedési ütem a nap.

Örülök 2. Győzelem kalkulátor Bányászat az optimális birtoklás kiválasztásához

Bányászkalkulátor a medence helyén, vagy az egy speciális szolgáltatáson, amellett, hogy rezegteti az optimális programot és navigáljon a videokártyán a Bányászathoz.

Vikoristannya GPU a C ++ AMP-n túli számításokhoz

A párhuzamos programok egyeztetésénél eddig csak a processzormagokat nézték meg. Néhány gyorsjavítást dolgoztunk ki a több processzoros programok párhuzamosítására, a társadalmilag győztes erőforrásokhoz való hozzáférés szinkronizálására, valamint a kiváló minőségű szinkronizálási primitívek blokkolás nélküli végrehajtására.

Van azonban még egy módja a szoftver párhuzamos megvalósításának - grafikus processzor (GPU), scho volodyut remek szám kernelek, nіzh nіzh rendkívül termelékeny processzorok. A grafikus processzorok magjai kiválóan alkalmasak párhuzamos adatfeldolgozási algoritmusok megvalósítására, és nagy részük kárpótol a rajtuk lévő programok kézi láthatóságának hiányában. A statisztikák a programok grafikus processzoron való megjelenítésének egyik módjával olvashatók, név szerint C ++ kiterjesztések halmazában. C ++ AMP.

A C ++ AMP kiterjesztése a mov C ++-on alapul, és az adott stattiban a mov C ++-on lévő dumok bemutatója lesz. Helyes kapcsolati mechanizmus esetén azonban be. NET, használhat C ++ AMP algoritmusokat .NET-programjaiban. Beszéljünk róla a statisztikákban.

Bevezetve a C ++ AMP-ben

Egyébként a grafikus processzor ugyanaz a processzor, mintha egy speciális utasításkészlet, nagyszámú mag és saját protokoll lenne a memória eléréséhez. A grafikus processzor numerikus igényeinek megfelelően azonban nagy a láthatóság és a program leblokkolása, hatékonyan és hatékonyan.

    A modern grafikus processzorok akár kis utasításkészlettel is elkészíthetők. Az összekapcsolás deyakik tiszteletének ára: a funkciók megjelenítési lehetőségeinek láthatósága, az adattípusok halmazának összekapcsolása, a sokoldalú funkciók és ez utóbbiak láthatósága. A deyaky műveletek, mint például az okos átmenetek, drágábbak lehetnek, kevésbé analóg műveletek, hogyan lehet nyerni speciális processzorokon. Nyilvánvalóan nagy viták átvitele a kódra a processzorról a grafikus processzorra az ilyen vimag értékű zusil piszkozatokkal.

    A magok száma egy átlagos grafikus processzorban sokkal magasabb, mint egy átlagos grafikus processzorban. Azonban a deyakі zavdannya viyavlyayutsya zanadto keveset vagy nem engedi meg magát, hogy legyőzze magát, hogy befejezze remek szám részek, amelyek grafikus processzor formájában jeleníthetők meg.

    Podtrimka szinkronizálás a grafikus processzor magjai között, így egy feladat, akár több szemcse, és a nap több része a grafikus processzor magjaival jelenik meg, valamint a fejlesztés. Qia grafikus processzor szinkronizálása rendkívüli processzorral.

Először is, hogyan válasszak grafikus processzort? Mayte az uvazon, de nem minden algoritmus alkalmas grafikus processzoron való megjelenítésre. Például a grafikus processzorok nem akadályozzák a hozzáférést az add / vivod mellékletekhez, így nem fogja látni a programok termelékenységét, yaka vityagє RSS vonalak az internetről, a grafikus processzor megjelenítéséhez. Lehetőség van azonban számos számítási algoritmus átvitelére a grafikus processzorra és a tömeges feldolgozás védelmére. Az alábbiakban felsoroljuk az ilyen algoritmusok alkalmazásainak számát (a lista messze nem ismétlődik):

    az imázs növekedésének és javításának javítása és változása;

    Shvidke fur'є újrakonfigurálása;

    transzponált és többszörös mátrixok;

    számok rendezése;

    Inverzió hash-re "a homlokban".

A Microsoft Native Concurrency blog példaként használható további alkalmazásokra, ahol kódrészleteket mutatnak be és magyaráznak el nekik a C ++ AMP-ben implementált új algoritmusokhoz.

A C ++ AMP egy teljes keretrendszer, amely beépíthető a Visual Studio 2012 raktárába, és a C ++ fejlesztők számára van egy egyszerű módja annak, hogy ellenőrizzék a számítást a grafikus processzoron, és ebben az esetben a DirectX 11 illesztőprogramot megfosztják a a DirectX 11 illesztőprogram egyértelműsége. Legyen olyan, mint egy fordítói virobnik.

A C ++ AMP keretrendszer lehetővé teszi grafikus gyorsítók, Є obliuvalny mellékletei. A DirectX 11 illesztőprogram segítségével a C ++ AMP keretrendszer dinamikusan előhoz mindent. A C ++ AMP raktárt megelőzően létezik még egy bootstrap szimulátor és egy hordozható processzorra épülő szimulátor, a WARP, amely tartalék verzióként szolgál grafikus processzor nélküli, vagy grafikus processzoros rendszerekben, közvetlenül a rendelkezésre állás után. a DirectX 11 illesztőprogramot, valamint a SIMD magok listáját és

És most elkezdjük befejezni az algoritmust, amely egyszerűen párhuzamosítható grafikus processzoron való megjelenítéshez. Az alsó megvalósításához két azonos genezisű vektort kell alkalmazni, és az eredményt pontról pontra kell kiszámítani. Összecsukható az egyszerűbb megjelenítés érdekében:

Void VectorAddExpPointwise (lebegtetés * első, lebegés * második, lebegés * eredmény, int hossz) (for (int i = 0; i< length; ++i) { result[i] = first[i] + exp(second[i]); } }

Az egész algoritmus gyors processzoron történő párhuzamosításához fel kell osztani az iterációk tartományát több átmérőre, és egy folyamot kell elindítani belőlük a bőr számára. Az előző cikkekben kevesebb, mint egy órát szántunk erre a módszerre, amellyel az első csikkenket párhuzamba állítjuk a prímszámok tréfálásával - mi bachili, ahogyan lehetséges feldolgozni a folyamokat manuálisan felvillantani, a folyamok készletét és a folyamok rózsaszínűvé tételét a Parallel-ba. .Automatikus párhuzamossághoz. Gondolom, ha egy adott processzoron hasonló algoritmusokat párhuzamba állítunk, akkor ezt különösen jó megtenni, így nem kell a rendszert a háttérben terjeszteni.

Grafikus processzor esetén a növekedés nem szükséges. A grafikus processzorok magok nélkül is működhetnek, így még gyorsabban tudják kezelni a streameket, a kontextus keverésének szerepe pedig sokkal kisebb, a speciális processzorokban kisebb. Az alábbiakban egy töredéket vezetünk, amely mágnesezi a vikorista funkciót párhuzamos_mindenkinek a C ++ AMP keretrendszerből:

#beleértve #beleértve névtér párhuzamosság használata; void VectorAddExpPointwise (float * first, float * second, float * result, int long) (array_view avFirst (hossz, első); array_view avSecond (hossz, másodperc); array_view avResult (hossz, eredmény); avResult.discard_data (); parallel_for_each (avResult.extent, [=] (index<1>i) korlátoz (amp) (avResult [i] = avFirst [i] + fast_math :: exp (avSecond [i]);)); avResult.synchronize (); )

Most az okremo kód skin része készen áll. Azonnal észrevehető, hogy a fejciklus fejformája el lett mentve, de egy keveset a for ciklusból, amely a parallel_for_each függvényt kanócra cseréli. Az igazság kedvéért a hurok wiklik függvényté alakításának elve nem újdonság számunkra – a TPL könyvtár Parallel.For () és Parallel.ForEach () metódusaiból már bemutatták ezt a technikát.

A Dal, input dan (első, második és eredmény paraméterek) másolatokba vannak csomagolva array_view... Az array_view osztály a grafikus processzorba (prikoryuvacha) átvitt adatok szerkesztésére szolgál. A sablon paramétere az adatok típusa és mérete. Pl. a pénz előtt végrehajtott utasítások grafikus processzorán, a processzoron chipezettek egy része, de lehet, hogy a grafikus processzorban az adatok másolása a hibás, erre van egy sok memória a memóriakártyáknak. A feladat az array_view másolatainak ellenőrzése - a bűz nem tudja másolni az adományokat helyetted, és csak akkor, ha a bűzre valóban szükség van.

Ha a grafikus processzor látogató, az adatok visszamásolódnak. Ha az array_view példányait const típusú argumentummal adjuk hozzá, akkor garantált, hogy az első és a második a grafikus processzor memóriájába másolódik, vagy nem kerül visszamásolásra. Hasonlóképpen, viclikyuchi adat elvetése (), Mi viklyuchaєmo az eredményt a chip processzor memóriájából másolva a primer memóriájába, ale tsі danі feltűnő irányban másolásra kerül.

A parallel_for_each függvény elfogadja, hogy milyen mértékben alakítja ki a morphing adatok alakját, és a kiterjedésben a skin elem felszívásának függvényét. Az irányított alkalmazásban a lambda funkciók nyertek, amelyek az ISO C ++ 2011 szabványban (C ++ 11) jelentek meg. A restrikciós (amp) kulcsszó arra utasítja a fordítót, hogy konfigurálja újra a funkció megjelenítési képességét a grafikus processzoron, és engedélyezze a C ++ szintaxis több részét, amelyeket nem lehet a grafikus processzor utasításaiba fordítani.

Lambda funkció paraméter, index<1>ob'єkta, ugyanaz az index. Bűnös vagyok abban, hogy egy ördögi tárgyat olyan mértékben adtam meg - ők kétszeresen tagadták a mértéket (például kétoldalas mátrixban megadták a külső tribute formát), az index is egy bi-nim, de kettős. Az alábbiakban egy ilyen helyzet fenekét mutatjuk be.

Nareshty, wiklik módszer szinkronizál () Az utolsó metódusban a VectorAddExpPointwise garantálja, hogy az array_view avResult eredményeinek a grafikus processzor által elforgatva visszakerüljön az eredménytömbbe.

A nap végén az első ismereteink a könnyű C ++ AMP-ről, és most már készen állunk arra, hogy az előtáblákat, és így tovább további alkalmazásokhoz számoljunk, hogy párhuzamos feldolgozás formájában grafikus alapon demonstráljuk. A Suma vektorok nem egy talált algoritmus, és nem megfelelő jelölt a grafikus processzor bemutatására a nagy, többletköltségeken keresztüli másolási díjak segítségével. A támadó oldalon két nagy fenéket mutatnak be.

több mátrix

Az első "spravzhny" csikk, amely könnyen látható, egy többszörös mátrix. Egy rendkívül egyszerű köbös többmátrixos algoritmus megvalósításához, nem pedig a Strassen-féle algoritmushoz, amely közel van a köbös ~ O-hoz (n 2,807). Két mátrix esetén: az m x w méretű A mátrixok és a w x n méretű B mátrixok esetén elindul a vikon program, és az eredményt elforgatjuk - m x n méretű C mátrixszal:

Void MatrixMultiply (int * A, int m, int w, int * B, int n, int * C) (for (int i = 0; i< m; ++i) { for (int j = 0; j < n; ++j) { int sum = 0; for (int k = 0; k < w; ++k) { sum += A * B; } C = sum; } } }

A decalcom megvalósításának párhuzamosítása többféle módon lehetséges, és amikor egy adott processzoron a megjelenítéshez szükséges kódot kell párhuzamosítani az egység megfelelő rezgésével, akkor az párhuzamos a hívási ciklussal. A grafikus processzor azonban nagyszámú magot tud elérni, és csak egyetlen ciklust tud párhuzamosítani, nem lehet elegendő számú projektet végrehajtani ahhoz, hogy robottal blokkolja az összes magot. Ehhez lehetőség van két hívási ciklus párhuzamosítására, így a belső ciklus túl szűkre szabható:

Void MatrixMultiply (int * A, int m, int w, int * B, int n, int * C) (tömb_nézet avA (m, w, A); array_view avB (w, n, B); array_view avC (m, n, C); avC.discard_data (); parallel_for_each (avC.extent, [=] (index<2>idx) korlátoz (amp) (int összeg = 0; for (int k = 0; k< w; ++k) { sum + = avA(idx*w, k) * avB(k*w, idx); } avC = sum; }); }

Ez az implementáció még mindig közel áll ahhoz, hogy az index matricája mögött utoljára több mátrixot és további vektorokat adtunk meg, amely ma már kétoldalas, és a belső ciklusból elérhető az operátor tartózkodásaiból. Melyik a legfrissebb shvid alternatíva legjobb verziója, amely győztes a mobil processzoron? Két 1024 x 1024 méretű mátrixot (egész számokat) megszorozva az utolsó verzió a vicon zychayy processzorán a közepén 7350 ezredmásodperc, ugyanaz a verzió a grafikus processzorhoz - vágja le a kapcsolót - 50 ezredmásodpercben, 147 alkalommal!

A részecskék romjának modellezése

Alkalmazza a feladatok megoldását a grafikus processzorra, amelyet a belső ciklus visce, vagy még egyszerűbb megvalósítása jelent. Zrozumilo, szóval ne számíts rá. A vérbeli Native Concurrency-ben már rámutattak arra, hogy a gravitációs kölcsönhatások modelljének fenekét részecskékkel mutatták be. A modell korlátlan számú krokot tartalmaz; a vektorelemek új értékeit számolják a bőrszöveten; Itt a részecskék vektorát a párhuzamosítás kapja - ha nagyszámú részecskét érsz el (másfél ezertől), akkor nagy számú épületet hozhatsz létre, így a grafikus processzor összes magját lezárhatod a robot.

Az algoritmus alapja az eredmény értékének két darabbal összekapcsolt megvalósítása az alábbiak szerint, ami könnyen átvihető egy grafikus processzorra:

// itt a float4 egy vektor választható elemekkel, // olyan részecskéket jelöl, amelyek részt vesznek a műveletekben void bodybody_interaction (float4 & acceleration, const float4 p1, const float4 p2) restrikt (amp) (float4 dist = p2 - p1; / / w ne válasszon itt float absDist = dist.x * dist.x + dist.y * dist.y + dist.z * dist.z; float invDist = 1.0f / sqrt (absDist); float invDistCube = invDist * invDist * invDist ; gyorsulás + = dist * PARTICLE_MASS * invDistCube;)

A modell bőrfelületén lévő adatok є tömbök koordinátákkal és részecskék részecskéivel, és ennek eredményeként egy új tömb kerül kiszámításra a részecskék koordinátáival és részecskéivel:

Struktúra részecske (float4 pozíció, sebesség; // a konstruktor implementációja, a másoló konstruktor és // operátor = s limit (amp) a gazdaságosság kedvéért kimaradt); void szimulációs_lépés (tömb & Előző, tömb & Következő, belső testek) (terjed<1>ext (testek); parallel_for_each (ext, [&] (index<1>idx) korlátoz (amp) (részecske p = előző; float4 gyorsulás (0, 0, 0, 0); for (int body = 0; body< bodies; ++body) { bodybody_interaction (acceleration, p.position, previous.position); } p.velocity + = acceleration*DELTA_TIME; p.position + = p.velocity*DELTA_TIME; next = p; }); }

A rendelkezésre álló grafikus felület eredményei alapján a modell még trükkösebbnek tűnhet. A C ++ AMP fejlesztőcsapatának új eleme megtalálható a Native Concurrency blogban. Intel Core i7 processzorral és Geforce GT 740M videokártyával szerelt rendszeremen a 10 000 részecskékből álló modell ~ 2,5 képkocka/másodperc (crocs/s) sebességgel jelenik meg a videókártya legutóbbi verzióiból, ami a téli optimalizált verzióban egy másodpercre megjelenik, a grafikus processzort mutatva - nagy termelékenységnövekedés.

Először is el kell végezni a bontást, többet kell megtudni a C ++ AMP keretrendszer egy fontos jellemzőjéről, hiszen ezzel még tovább lehet javítani a kód produktivitását, valamint a grafikus processzoron látogatható. Grafikus processzorok állnak rendelkezésre programok gyorsítótár danih(Gyakran címek pam'yattyu (közös emlék)). Ez azt jelenti, hogy az egész gyorsítótárhoz hasonlóan a láthatóság összes folyamát egyetlen mozaikba (mozaikba) lehet szórni. A memória mozaikszervezésének dolgozói, a C ++ AMP keretrendszerre épülő programok a grafikus kép memóriájából be tudják olvasni az adatokat a memóriába, így a mozaikok szétosztásra kerülnek, majd a decilis folyamokból áramlik hozzájuk a memória. a memória képeinek megismétlése nélkül. Hozzáférés az emlékműhöz, ahol a mozaik körülbelül 10-szer gyorsabban jelenik meg, alacsonyabban, mint a grafikai festmény emlékműve. Más szóval, megvan az oka, hogy folytassa az olvasást.

Annak biztosítására, hogy a mozaikverziót ne jelenítse meg párhuzamosan a hurokkal, a parallel_for_each metódus átadásra kerül. tiled_extent domain, Ami a nagy kiterjedésű objektumot kiterjeszti a mozaik nagyméretű töredékeire, és a lambda paramétert tiled_index, ami a mozaik közepén lévő áramlás globális és lokális azonosítóját jelenti. Például egy 16x16-os mátrix felosztható egy 2x2 méretű mozaik töredékeire (ahogyan az alábbi kis képen látható), és a parallel_for_each függvény átvitelével:

Terjedelem<2>mátrix (16,16); csempézett_mérték<2,2>tiledMatrix = matrix.tile<2,2>(); párhuzamos_mindenkinek (mozaikmátrix, [=] (mozaik_index<2,2>idx) korlátoz (amp) (// ...));

A vikonannya choter patakjaiból származó bőr, ahol egy és ugyanazon mozaiknak kell lennie, lehet spillo vikoristovuvati dan, amely a blokkban tárolódik.

Ha mátrixokkal dolgozik, a grafikus processzor magjában cserélje ki a szabványos indexet<2>, Jak a csikk a whish, akkor vikoristovuvati idx.global... A helyi mozaikmemória és a helyi indexek kompetens regisztrációja megőrizheti a termelékenység századik növekedését. A mozaikmemória szabaddá tétele érdekében, hogy az összes láthatósági folyam egy mozaikban eloszthassa, a helyi változtatások megnyithatók a tile_static specifikátor segítségével.

A gyakorlatban gyakran előfordul, hogy az új folyamok blokkjainak memóriája és innovációja a csupasz elosztás eredményeként oszlik meg:

Parallel_for_each (mozaikmátrix, [=] (mozaik_index<2,2>idx) korlátoz (amp) (// A tile_static blokk összes szála 32 bájtot használhat int local; // érték hozzárendelése az elemhez a teljes szálhoz local = 42;));

Nyilvánvaló, hogy ha Ön egy győztes memóriaeloszlás látogatója, akkor csak akkor tudja javítani, ha szinkronizált hozzáféréssel rendelkezik a teljes memóriához; hogy a szálak ne forduljanak a memória felé, mindaddig, amíg valamelyikük nem inicializálja őket. A patakok szinkronizálása a mozaikban csempe_sorompó(Nagadu osztály Barrier a TPL könyvtárból) - a bűz továbbra is csak a tile_barrier gombra kattintva jeleníthető meg.Várj () metódus; például:

Parallel_for_each (mozaikmátrix, (csempés_index<2,2>idx) korlátoz (amp) (// 32 bájtot használhat minden szál a tile_static blokkban int local; // rendelje hozzá az elemet ehhez a szálhoz local = 42; // Az idx.barrier a tile_barrier idx példánya .barrier.wait (); // Most rátérhetünk a "local" tömbre

Most éppen itt az óra, hogy a tudást egy konkrét fenékbe integráljuk. Térjünk rá a több mátrix megvalósítására, a memória mozaikszervezésének tárolása nélkül, és a dodamóra az optimalizálás új leírásában. Tegyük fel, hogy a mátrix mérete 256 többszöröse - ez nem teszi lehetővé, hogy 16 x 16-os blokkokkal előre jelezzünk. A mátrixok természete lehetővé teszi a blokkonkénti szorzást, és felgyorsíthatjuk a speciális jellemzők száma (valójában a mátrixok blokkokra vannak osztva, az optimalizálás típusát használva Hatékonyan győztes processzor gyorsítótár).

Az egész priyomu lényege az, hogy támadóvá tegyük. C i, j (az eredmény mátrixában egy i sorban és egy száz és j-ben lévő elem) megismeréséhez ki kell számítani A i, * (az első mátrix i-edik sora) skaláris összeadását. ) és B *, j (a másik mátrix j-edik sora). A részleges skaláris létrehozások száma azonban nem egyezik meg a kapott sorok és több száz eredmény számával. A többmátrixos algoritmus mozaikverzióvá alakításához a beállítást használhatjuk:

Void MatrixMultiply (int * A, int m, int w, int * B, int n, int * C) (tömb_nézet avA (m, w, A); array_view avB (w, n, B); array_view avC (m, n, C); avC.discard_data (); parallel_for_each (avC.extent.tile<16,16>(), [=] (Csempézett_index<16,16>idx) korlátoz (amp) (int sum = 0; int localRow = idx.local, localCol = idx.local; for (int k = 0; k

A leírt optimalizálás lényege abban rejlik, hogy a mozaikban van skin-potenciál (egy 16 x 16-os blokknál 256 stream van); A blokkok, vagy az összes stream egyszerre feltekerve a skin sorig és felfelé a bőroszlophoz 16-szor. Az ilyen pidhid sutta a vadállatok számát a fő emlékre redukálja.

Az (i, j) elem számbavételéhez az eredménymátrixban az algoritmusnak szüksége van az első mátrix i-edik sorára és a másik mátrix j-edik százára. Ha a 16x16-os mozaik folyamait k = 0-val jelenítjük meg a diagramokon, akkor az első és a többi mátrixban lévő árnyékolt területek beolvasódnak a memóriába, majd szétosztásra kerülnek. Lehetőség az eredmény mátrixában az (i, j) elem számbavételére, majd az i-edik sorból az első k elem, a kimeneti mátrixok j-edik százának skalármátrixa.

Ebben az adott alkalmazásban a mozaikszervezés kialakítása a termelékenység nagy büszkesége lesz. Több mátrix mozaik verziója gyorsabban jelenik meg, mint az egyszerű verzió, és körülbelül 17 milliszekundum (1024 x 1024 méretű csendes mátrixoknál), de további 430 verzióban, amelyek a vezetékes processzoron láthatók!

Először is fejezzük be a C ++ AMP keretrendszer tárgyalását, az eszközöket szerettük volna használni (Visual Studioban), nyilván a megrendelt verziókban. A Visual Studio 2012 bevezet egy grafikus processzor (GPU) szerkesztőt, amely lehetővé teszi ellenőrzési pontok beállítását, wikihalmaz megtekintését, a helyi változtatások beolvasását és értékének módosítását (olyan műveletek, amelyek gyorsan fejlődnek a GPU-k fejlett szimulációja nélkül; igen, a műveletek párhuzamos működése mellett a grafikus processzor tárolása miatt nyert kép kiértékelésének lehetősége. A Visual Studio fejlesztési lehetőségeivel kapcsolatos további információkért olvassa el a „Pokrokove Kerіvnitstvo. C ++ AMP Programokkal továbbfejlesztve az MSDN oldalon.

Grafikus processzor alternatívák a .NET-ben

Eddig az egész stattyban csak a movi C ++, prote, є dugók voltak, є számos módot mutattak be a grafikus processzorok vikorisovuvatására a kerovan kiegészítőkben. Ennek egyik módja az eszközök használata a modokkal együtt, ami lehetővé teszi a robot GPU magokkal való újrahuzalozását alacsony gyökerű C ++ komponenseken. Jó ötlet C ++ AMP keretrendszert használni a csendességhez, de használhatja a C ++ AMP keretrendszert, valamint a C ++ AMP komponensek teljesítményét, hogy készen álljon.

Az első módszer az, hogy könyvtárat készítünk kerovizált kódú grafikus processzor használata nélkül. Dán órában van egy matrica az ilyen könyvtárakról. Például a GPU.NET és a CUDAfy.NET (sértő és kereskedelmi javaslatok). Engedje le a GPU.NET GitHub séma fenekét, amely bemutatja a két vektorból álló skaláris kiegészítő megvalósítását:

Nyilvános statikus void MultiplyAddGpu (dupla a, dupla b, dupla c) (int ThreadId = BlockDimension.X * BlockIndex.X + ThreadIndex.X; int TotalThreads = BlockDimension.X * GridDimension.X; for (int ElementIdx = ThreadId; Element IdId;

Ötleteket nézek, de egyszerűbb és hatékonyabb a film bővítésének elsajátítása (C ++ AMP alapján), nem próbálom megszervezni a modok interakcióját ugyanazon a könyvtáron, vagy bevinni. sok változás az IL filmben.

Emiatt is megvizsgáltuk a párhuzamos programozás lehetőségeit .NET-ben és a GPU-kon is, senkinek nem ment el a feje, de a párhuzamos számítások szervezése fontos a termelékenység növelése szempontjából. A bagatoh szervereken és munkaállomásokon az egész világon nincsenek csúcstechnológiás és grafikus processzorok magas színvonalú számítási erőfeszítései, így a kiegészítők egyszerűen nem használhatók.

A Task Parallel Library egyedülálló lehetőséget ad arra, hogy a központi processzor összes magját beépítsük a robotba, ha egyáltalán, akkor láthatjuk a szinkronizálási problémákat, az üzem mindent elsöprő zúzását és a nem hatékony robotarchitektúrát.

A C ++ AMP keretrendszer és a grafikus processzoron párhuzamos számításokat szervező számos nagy könyvtár sikeresen megvalósítható több száz grafikus processzormag megvalósításához. Nareshty, є, korábban nem számoltak be arról, hogy a számítások kidolgozásához rendelkezésre álló modern technológiák miatt a termelékenység növekedése újragondolható, az utolsó órában az információs technológiák egyik fő közvetlen fejlesztésévé dolgozták át.

A kereskedőnek hatékony grafikus processzort kell látnia a csatolmányhoz (GPU), a program nem játszott szerencsejátékkal, és nem ment a robothoz.

Állítsa be a GPU paramétereit a megjelenítéshez

Ha a dodatok egy galmu, az egy alkatrészt jelent, mert a képernyő összes képkockája több mint 16 ezredmásodpercig frissül. Vizuálisan hozzáadhat új kereteket a képernyőhöz, engedélyezhet egy speciális opciót (Profile GPU Rendering) a mellékleten.

Lehetősége lesz gyorsan összerázni a dolgokat, de a keretek megrajzolásához szánjon egy órát. Azt hiszem, 16 ezredmásodperc alatt kell befektetni.

A lehetőség az Android 4.1-ről javított kiegészítőknél érhető el. A mellékleten csúszott aktivuvati rozrobnika módban. A 4.2-es verzió melléképületein van egy rendszer a prímszámok használatára. Ide aktiválásához nalashtuvannya | A telefonálásrólés hétszer kattintson sorrendben zbirka szám.

Az aktiváláshoz látogasson el ide Kiskereskedelmi lehetőségek tudom a lényeget Állítsa be a GPU paramétereit a megjelenítéshez(Profil GPU renderelés), amelyet be kell kapcsolni. Rezgő opciók A képernyőn a viglyadi stovpchikivben(A képernyőn sávokként). A grafika a futó kiegészítő tetején jelenik meg.

Nemcsak a saját étrend-kiegészítői ellen tiltakozhat, hanem a sajátja ellen is. Indítson el egy kiegészítést, és javítsa ki. Várjon egy órát a robotokra a képernyő alsó részén, és kezdjen el játszani a grafikonokkal. Vízszintesen lógott az elmúlt órában. A függőleges kijelző a skin keret óráját mutatja ezredmásodpercben. Kiegészítővel való összekapcsoláskor függőleges szmogok jelennek meg a képernyőn, jobbra mutatva a gonoszt, és egy órán keresztül mutatják a keret termelékenységét. Kozhen egy ilyen százpets egy képkocka a képernyőhöz. Chim vishche a magassága a stovpchik, tim több mint egy óra rajzolni. Vékony zöld vonal működik és 16 milliszekundumot jelenít meg képkockánként. Ilyen ranggal pragmatikusnak kell lennie, mielőtt nem rezeg egy egész sort, amikor vakcinázza a grafikonját.

A grafikon továbbfejlesztett változata érthető.

A zöld vonal 16 ezredmásodperc múlva jelenik meg. A schob 60 képkocka/másodperc sebességgel ment le, a bőrember bűnös volt, hogy a vonal alatt festett. Egyes pillanatokban megjelenik a száz százalék a nagy és ha jön a zöld vonal. A Tse galmuvannya programokat jelent. A Kozhen tűzhelyek fekete-fehérek, lila (Lollipop і vishche), chervonia і narancssárga színűek.

A fekete szín egy óra múlva jelenik meg Kilátás.

Az ibolya rész egy óra, amelyet a renderelő erőforrások adatfolyamba való átvitelével töltenek.

Chervoniy kolir є óra a frissítésért.

Narancssárga szín jelenik meg, ami egy órát vett igénybe a processzor tisztításához, ha a GPU befejezte a robotját. Win és є dzherelom problémák nagy értékekkel.

Találja meg a speciális technikákat a grafikus processzorra való beállítás módosításához.

Javítsa a GPU túllépési arányát

A beállítás lehetővé teszi, hogy megtudja, mivel gyakran ugyanazt a képernyőt csiszolja (hogy lássa, robotot használ-e). Tudom, hogy ydemo be Kiskereskedelmi lehetőségek tudom a lényeget Javítsa a GPU túllépési arányát(Debug GPU Overdraw), amelyet be kell kapcsolni. Rezgő opciók Zóna és számla megjelenítése(Túlhúzási területek megjelenítése). Ne rúgj! A képernyőn néhány elem megváltoztatja a színét.

Váltson valami kiegészítővé, és próbáljon segíteni neki a robotjával. A szintén problémás tételek száma a vásárlás során.

A Yakshho színe ráadásul nem változik, ez azt jelenti, hogy minden látható. Nincs egy szín fedvénye az egyik tetején.

A fekete szín azt mutatja, hogyan festenek egy golyót az alsó golyó tetejére. Jó.

Zeleniy kolіr - darál kettőt. Gondolkodni kell az optimalizáláson.

Rozhevij kolіr - hármat őrölni. Minden még rohadtabb.

Chervoniy kolіr - daráljon sok fejlesztést. Nem esett jól.

Önállóan konvertálhatja kiegészítőit problémás problémákká. Hozzon létre tevékenységet, és tegyen rá egy komponenst TextView... Adja meg a gyökérelemet és a szöveg hátterét az attribútumokban android: háttér... Látni fogja a következő lépést: a tevékenység alsó labdáját egy színnel takarították ki. Ekkor egy új labda jelenik meg a tetején TextView... A beszéd előtt, egyedül TextView festeni több szöveget.

Egyes pillanatokban az idézetek alkalmazása nem egyedi. Ale, hogy zokogjon, a lista hátterét ugyanabban a rangban állította be Lista nézet, Yakiy minden tevékenységi területet kölcsönzött. A rendszer képes lesz mozgatni a robotot, ha az alsó tevékenységgolyó nem találja el a koristuvach nicolit. És még előtte a listán szereplő bőrelem hajszálát feloldod a saját háttereddel, majd eltávolítod.

Kicsit örülök. Gondold át a módszert setContentView () wiklik módszerrel, amely ezek színével tisztította meg a képernyőt. A Tse abban is segít, hogy szerezzen egy zaywe-fedvényt egy színhez:

GetWindow (). SetBackgroundDrawable (null);

Grafikus processzorokra számítva

A CUDA technológia (angolul Compute Unified Device Architecture) egy szoftver- és hardverarchitektúra, amely lehetővé teszi az NVIDIA grafikus processzorokról történő számítást, lehetővé téve a GPGPU technológia használatát. A CUDA architektúrája először a nyolcadik generációs NVIDIA chip - a G80 - megjelenésével jelent meg a piacon, és jelen volt az összes közelgő grafikus chip-sorozatban, ami győzött a gyorsuló GeForce, ION, Quadro és Tesla hazájában.

A CUDA SDK lehetővé teszi a programozók számára, hogy az NVIDIA grafikus processzorokon elérhető, algoritmusos programozás speciális, egyszerűsített változatán hajtsák végre a programozást, és speciális funkciókat építsenek be a C-n futó programok szövegébe. A CUDA lehetőséget ad a kereskedőnek, hogy megszervezze a hozzáférést a grafikus kártya utasításkészletéhez, és kezelje a memóriáját, és egy új, összecsukható párhuzamos számításra szervezze.

Történelem

2003-ban az Intel és az AMD részt vett a nagyon megerőltető processzorokat célzó üzenetküldőkben. A verseny végeredményében egy kis rockos, az órajelek gyorsan nőttek, különösen az Intel Pentium 4 esetében.

Az órajel-frekvenciák növelésére (2001-ről 2003-ra a Pentium 4 órajelfrekvenciája 1,5-ről 3 GHz-re ment), és a corystuvachi tíz rész gigahertzzel megelégedett, mivel a virobnikokat a piacra vitték (2003-tól 2005-ben az órajel frekvenciája 1,5-ről 3 GHz-re nőtt). 3,8 GHz).

A magas órajel-frekvenciára optimalizált architektúra ugyanaz a Prescott, így nehézkessé vált a bekapcsolódás, és nem csak a gonoszok. A csipek virobnikjai a fizika új törvényeinek problémáiba botlottak. Deyakі elemzők navіt megjövendölték, hogy Moore törvénye megszűnik dіyat. Ale tsyo nem zavartatta magát. A törvény eredeti értelme gyakran létrejön, azonban ez a szilíciummag felületén lévő tranzisztorok száma. A CPU-ban lévő tranzisztorok számának növekedésének utolsó órája a termelékenység növekedése szempontjából túltöltött - az érzékszervekre szólított fel. Kicsit később a helyzet felgyorsult. A CPU-architektúrák fejlesztői a gyors növekedés törvényéhez léptek: a termelékenység növeléséhez szükséges tranzisztorok száma egyre nőtt, és egyre nőtt a háttérbe.

Az ok, amiért a GPU virobnik nem ragadt le az egész problémával, még egyszerűbb: a központi processzorokat a maximális termelékenység érdekében az utasítások alapján szétszedik, mivel különböző adatokat dolgoznak fel (pl. egész számú szám, annyi szám), td. Eddig a fejlesztők egyre inkább párhuzamosítják az utasításokat – így párhuzamosan nagyobb az utasítások száma. Így például megjelent egy szuperskaláris vikonannya a Pentiumból, ha deyaka elmével két utasítást vikonuvathatunk óránként. A Pentium Pro lehetővé tette a számítási blokkok feldolgozásának optimalizálását az utasítások végrehajtása után. A probléma az, hogy az utolsó utasításfolyam párhuzamos nézete és a nyilvánvaló behatolás, a numerikus blokkok számának növekedése nem teszi lehetővé a játékos számára a játékot, a bűz egy része egyszerű lesz.

A robot GPU meglehetősen egyszerű. Az egyik oldalról vett sokszögcsoportban sokszögek vannak, az egyik oldalról pedig pixelcsoportok egy generációja. A sokszögek és négyzetek négyzetei egyek, így párhuzamosan is építhetők. Így a GPU-ban látni lehet a kristály nagy részét a számítási blokkon, például a CPU-ból nézve, hogy valóban győzni lehessen.

A GPU-t nem csak CPU-nak tekintik. A GPU memóriájához való hozzáférés ugyanolyan szoros, mint a kötések – ha egy texel beolvasásra kerül, akkor az óraciklusok ciklusán keresztül egy gyanús texel kerül beolvasásra; Ha felvesz egy picsel-t, akkor néhány ütemen keresztül egy susidniy-t fog rögzíteni. A memória ésszerű rendszerezése lehetővé teszi a termelékenység tükrözését, közel az építés elméleti teljesítményéhez. Ez azt jelenti, hogy a GPU a CPU szempontjából nem igényel nagy gyorsítótárat, a gyorsított textúrázási műveletekben betöltött szerepe miatt. Minden, ami kell, a teljes számú cylobyte, hogy bosszút álljon a texelek számán, amelyek győztesek a bilin és a háromrészes szűrőkben.

Az első GPU-k

A Nipers kipróbálta ezt a fajta tárolást, összekapcsolták más hardverfunkciókkal, mint például a raszterezés és a Z-pufferelés. Ale a kilencedik században, a shaderek megjelenésével a mátrixok száma emelkedni kezdett. 2003-ban a SIGGRAPH-nál a logikai szakaszt GPU-n történő számításhoz látták, és a GPGPU (General-Purpose Computation on GPU) nevet kapta – univerzális számítás GPU-n.

A Nybilsh vidomy BrookGPU streaming brook programok fordítója, olyan alkalmazások, amelyek nem grafikus számításokat jelenítenek meg a GPU-n. Megjelenése előtt a kereskedők, akik a videóminták lehetőségét tudták számításba venni, a két kiterjesztett API egyikét választották: a Direct3D-t vagy az OpenGL-t. A GPU árát komolyan felcserélték, a 3D-s grafikára pedig a shaderek és textúrák kerültek, a nem horgolás párhuzamos programozásáról, a szálak és magok bűzéről. Brook segítséget kapott a szállásban. A Stanford Egyetemen felbontott Movy C-re bővített streamek számát a triviális API programjaival ismertették meg, és a párhuzamos processzor nézői elé tárták azokat. A fordító felülvizsgálta a .br fájlt C ++ kóddal és kiterjesztett verziókkal, víruskóddal, a könyvtárhoz való kötésekkel DirectX, OpenGL vagy x86 segítségével.

A Brook wikipédia felkeltette az NVIDIA és az ATI érdeklődését, és új szektort nyitott – a videojeleken alapuló párhuzamos számításokat.

Nadal, a Brook projekt régi barátai az NVIDIA fejlesztőcsapatához költöztek, hogy bemutassák a párhuzamos számítások szoftver-hardveres stratégiáját, új piacrészt teremtve ezzel. Az NVIDIA kezdeményezésben az első kihívást azok jelentették, akik saját eszközeikre fejlesztették ki azt a képességet, hogy GPU-juk minden képességét megismerjék, és a grafikus API-ra nincs szükség, és a hardveres meghajtónak sem. Az NVIDIA CUDA a csapat zusil eredménye lett.

Párhuzamos GPU tároló területei

A számítás GPU-ra való átvitelével 5-30-szorosra gyorsulhat a problémamegoldás, míg a normáloknál intelligens, univerzális processzorokat szerelnek fel. A legtöbb szám (közel 100-szor gyorsabb és több!) Elérhető olyan kódokon, amelyek nem is jobbak további SSE blokkokhoz, vagy akár GPU-khoz.

Csak próbálja ki, és gyorsítsa fel a szintetikus kódot a GPU-n a CPU SSE-vektorizált kódjával szemben (az NVIDIA adatai alapján):

Fluoreszcens mikroszkóp: 12x.

Molekuláris dinamika (nem kötött erő számítása): 8-16x;

Elektrosztatika (közvetlen és rugalmas függő): 40-120x és 7x.

A táblázat az NVIDIA-hoz hasonlóan minden bemutatón látható lesz, amelyben a grafikus processzorok sebessége mellett a központiak is megjelennek.

A GPU-n számolható fő kiegészítők változása: képek és jelek elemzése és feldolgozása, fizika szimulációja, numerikus matematika, numerikus biológia, pénzügyi terápia, adatbázisok, gázdinamika, biológiai szimulációk, számítástechnika, számítástechnika adatbányászat, digitális mozi és távfelügyelet, elektromágneses szimulációk, geoinformációs rendszerek, elektronikus monitorozás, adatrészecskék molekuláris elemzése, gázmolekulák szimulációja, kvantumkémia, változások útvonaltervezés, vizualizáció, radarok, hidrodinamikai modellek (tározó) szimuláció), darab intelligencia, műholdas adatok elemzése, szekvenálás, ultrahangos fejlesztés

Perevagi és obmezhennya CUDA

A programozó szemszögéből a grafikus szállítószalag feldolgozási szakaszok összessége. A geometriák blokkja tricitákat generál, a raszterezés blokkja pedig a pixelek, amelyek megjelennek a monitoron. A viglyád GPGPU programjának hagyományos modellje a következő helyen áll:

A számításnak a GPU-ra történő átviteléhez egy ilyen modell keretein belül speciális bemenetre van szükség. Navigáljon egyesével két vektor összehajtásával, hogy figurát hozzon létre a képernyőn vagy a rejtett pufferben. Az ábra raszterezett, a skin pixel színe kiszámításra kerül az adott programhoz (pixel shader). A program beolvassa a bemeneti adatokat a textúrákból a skin pixel számára, eltárolja és a kimeneti pufferbe írja. És minden numerikus művelet szükséges ahhoz, hogy egy szolgáltató regisztráljon a speciális mobilprogramba!

Ezen kívül egy GPGPU-t biztosítottak a pénz buzgó jeleinek számbavételére nagyszámú embertől, akik már most is nagy fejlesztésekkel rendelkeznek. Hogy іnshikh іnshikh befejezni, még egy pixel shader is - annál kevésbé a képlet a pixelszín koordinátáról való leesésére, és a pixel shader mozgatására - ezeket a képleteket a Ci-more szintaxissal írhatjuk. A korai GPGPU-módszerek egy trükkös trükk, amellyel lehetővé teszik a GPU-ra nehezedő nyomást, hogy győzedelmeskedjen, vagy minden gond nélkül. Az adatok ott képekként (textúrákként) jelennek meg, az algoritmust pedig a raszterizálási folyamat reprezentálja. Szükség van egy speciális jelentésre és egy sajátos memória- és előadásmodellre.

Az NVIDIA cég GPU-ján történő számítástechnikai hardver- és szoftverarchitektúra a vezető GPGPU-modellek közül megtekinthető, így a referencia számítógépen a szabványos szintaxissal programokat írhat a GPU-hoz, megmutatva a szükséges akadálymentesítés mértékét a tartományban A CUDA nem a grafikus API-kban rejlik, hanem néhány speciális szolgáltatásban, amelyeket kifejezetten idegen értékek kiszámítására terveztek.

A CUDA újratöltődik, mielőtt a GPGPU hagyományos megközelítése jóváírásra kerülne

A CUDA biztosítja a hozzáférést a 16 Kb méretű memóriafolyamok közötti elosztáshoz egy többprocesszorhoz, amely széles sávszélességű gyorsítótár szervezésére használható, esetenként textúra vibrátorokkal;

Hatékonyabb adatátvitel a rendszer- és videoüzenetek között;

Grafikus API-k szükségessége overhead és overhead vitrátokkal;

Memóriacímzés, gyűjtés és szóródás sorai, bizonyos címekre írás képessége;

Hardveres vezérlés digitális és bitműveletekhez.

Fő CUDA összeköttetések:

A viconious függvények rekurziós nézetének megjelenése;

Minimális szélesség 32 menetes blokkhoz;

Lezárta a CUDA architektúráját, ami az NVIDIA-nak köszönhető.

Gyenge pontok szerint a kiegészítő front-end GPGPU metódusok mögött azok a programok állnak, amelyek nem teszik lehetővé, hogy az algoritmusok megjelenítsék a vertex shader blokkokat az előre nem definiált architektúrákban, amelyek a struktúrákba kerülnek elmentésre, és a blokkokat a struktúrák mögött tárolják. határárnyékolók. A GPGPU interfész a következőket tartalmazhatja: az eszköz képességeinek hatékonyságának hiánya, a memória sávszélessége, a szórási művelet (csak összegyűjtés), a grafikus API megjelenítő.

A főbb CUDA átvitelek a korábbi GPGPU-módszerekkel kapcsolatban azon a tényen alapulnak, hogy az architektúra a GPU-n végzett nem grafikus számítások hatékony feldolgozására és a kézi grafikus algoritmusban nem látható győztes C programozásra készült. A CUDA egy új számítási módszer a GPU-n, amely nem egy gonosz grafikus API, de elősegíti a memóriához való hozzáférést (szórja vagy gyűjti). Ez az architektúra hozzáadódik a GPGPU és a vicorist all viconavch blokkok hiányához, valamint az egész matematikai és bitműveletek szélesebb köréhez.

A CUDA a grafikus API-kból nem elérhető hardverképességeiről, valamint a kollektív memóriáról ismert. Tse memória egy kis obsyagu (16 kilobájt per multiprocesszor), amíg hozzáférési blokkok patakok. Vona lehetővé teszi keshuvati naybilsh gyakran vikorisovuvani dans és megőrizheti több nagy sebességű, bizonyos esetekben vikorystannya texturális vibrok az egész buzgó. Én viszont csökkentem a bagatokh-kiegészítők párhuzamos algoritmusainak áteresztőképességére vonatkozó érzékenységet. Például különösen fontos a lineáris algebra, a Fur'є gyors újraalkotása és a képfeldolgozás szűrői számára.

Lépjen a CUDA-ba, és nyissa meg a memóriát. A grafikus API-k programkódja egy 32 értékű megjelenítőből származó adatok egyetlen pontosságú lebegőpontos lebegőpontos (RGBA-értéke egyszerre körülbelül a nyolcadik renderelési célpont) megjelenítéséhez a mögötte lévő nagyított területen, és a CUDA kap egy szórási rekordot – ez nem kötelező. címek száma cím szerint. Lehetséges ilyen algoritmusok segítségével megjeleníteni a GPU-n néhány olyan algoritmust, amelyek kényelmetlenül hatékonyak a grafikus API-kon alapuló GPGPU-módszerek megvalósításában.

Ezenkívül a grafikus API kötési sorrendben rögzíti az adatokat struktúrákban, így az elülső tömbök előtt textúrákban, valamint egy gyorsított algoritmusban és speciális címzésben. A CUDA pedig lehetővé teszi az adatok bármely címen történő olvasását. A CUDA másik kihívása a CPU és a GPU közötti adatcsere optimalizálása. Azok a fejlesztők pedig, akik alacsony szintű hozzáférést szeretnének elérni (például új program írásakor), a CUDA az alacsony szintű programok erejét hirdeti az assemblereken.

a CUDA hiányosságai

A CUDA számtalan hiányossága közül az egyik a rossz hordozhatóság. A projekt architektúrája csak a cég videóján található, ami nem mindenkinek szól, hanem a GeForce 8 és 9 sorozattal, valamint a legújabb Quadro-val, ION-nal és Teslával javítják. Az NVIDIA 90 millió CUDA-wannabe-t céloz meg.

alternatívák a CUDA-hoz

Keretrendszer párhuzamos számításokkal összekapcsolt számítógépes programok írásához különböző grafikus és központi processzorokon. Az OpenCL keretrendszerben található egy programozási nyelv, amely a C99 szabványokon alapul, és egy programozási felület (API). Az OpenCL párhuzamosságot biztosít a korai utasításokhoz és a korai dátumokhoz, valamint a GPGPU technológia megvalósításához. OpenCL Egy elfogadott szabvány értelmében nem licencelhető.

Az OpenCL meta úgy lett megtervezve, hogy kiegészítse az OpenGL-t és az OpenAL-t, valamint a triviális számítógépes grafika és hangzás átlátható galuse szabványait, a GPU képességei alapján. Az OpenCL-t a Khronos Group nem kereskedelmi konzorciuma terjeszti és alkalmazza, amelybe számos nagyszerű cég tartozik, köztük az Apple, az AMD, az Intel, az nVidia, a Sun Microsystems, a Sony Computer Entertainment és mások.

CAL / IL (számítási absztrakciós réteg / középfokú nyelv)

Az ATI Stream Technology egy sor hardver- és szoftvertechnológia, amely lehetővé teszi a vikoristovuyu AMD grafikus processzorokat központi processzorral a további adatok (nem csak a grafikusok) felgyorsítására.

Az ATI Stream є kiegészítők tárolási területei, amelyek a számítási erőforrások rendelkezésére állnak, mint például a pénzügyi elemzés vagy a szeizmikus adatok feldolgozása. A viktoriánus streaming processzor 55-szörösére növelte az üzleti műveletek sebességét a jelenlegi processzorokhoz képest.

Az NVIDIA ATI Stream technológiája még csak nem is erős versenytárs. A CUDA і Stream két innovatív technológia készlete, amelyek a legújabb fejlesztési vonalakon állnak. Programozás ATI termékekhez útközben. CUDA C. Új stílusú és egyszerűbb írás. A nagy kiskereskedelmi cégek számára az ár még fontosabb. Ami a termelékenységet illeti, figyelembe lehet venni az ATI termékek fontosságát, de az NVIDIA megoldásokét nem. Ale mindent tud, amit meg kell tenni előtt, jak tsyu nehéz kijavítani.

DirectX11 (DirectCompute)

Programozási felület a kiegészítésekhez, amely a DirectX raktárban található - a Microsoft API-k készlete, amelyet az IBM PC-sumy számítógépeken lévő robotokhoz használnak a Microsoft Windows család operációs rendszereinek vezérlésére. DirectCompute értékek a grafikus feldolgozáshoz, a GPGPU koncepció megvalósításaként. Válogatott DirectCompute kiadványok a DirectX 11 raktárban, tiltakozva a DirectX 10 és DirectX 10.1 elérhetővé válása ellen.

NVDIA CUDA az Orosz Tudományos Központban.

Állj a mellkasra 2009-ben a CUDA programmodell 269 egyetemen működik. A Russie navchalnі természetesen CUDA chitayutsya a Maskovskiy, St. Peterburzkomu, Kazanskomu, Novosibіrskom i Permskomu regnáló unіversitetah, Mіzhnarodnomu unіversitetі Nature suspіlstva i Lyudin "Dubna" nukleáris Ob'єdnanomu іnstitutі doslіdzhen, Maskovskiy іnstitutі elektronnoї tehnіki, Іvanіvskomu államilag támogatott energetichnomu unіversitetі , BSTU im. V. G. Shukhova, MSTU im. Bauman, RCTU im. Mendelev, az Orosz Tudományos Központ "Kurchatov Institute", az Orosz Tudományos Akadémia Interregionális Szuperszámítógép Központja, a Taganroz Technológiai Intézet (TTI PFU).

Ha már a párhuzamos számításoknál tartunk a GPU-n, a memória bűnösek vagyunk, bármelyik órában él, az idei nap, ha a világon mindent felgyorsítottak, akkor minden rendben van, nem akarok elrohanni. Minden, ami robusztus, az információfeldolgozás nagy pontosságához és gyorsaságához van kötve, ilyen fejekben nem feltétlenül van szükségünk eszközökre az összes információ feldolgozásához, hiszen az ilyen információk minden egyes revíziója megvan, de ez szükséges. nem csak a nagy szervezeteknek, hanem a megavállalatoknak is az ilyen feladatok megoldásához egy időben a corystuvachi soraira lesz szükségük, mint például, akik maguk látják az életüket az ember alkalmazottaitól, kapcsolódnak a technológiákhoz. Az NVIDIA CUDA megjelenése döbbenetes lesz, de hamarabb felkerekedik, így észrevétlenül lényegesen több munkát kell majd a PC-re rakni, nem korábban. A robot, ahogy régen még több mint egy órát is igénybe vett, most is sok hilint fog elvinni, látszólag az egész világ elmaradott képéhez igazodva!

Nos, ez is a GPU-n van számolva

Számítás a GPU-n - a GPU ára a műszaki, tudományos, üzletági vállalkozások kiszámításához. A GPU-n végzett számítás az, hogy kihasználja a CPU-t és a GPU-t a saját listájában a köztük lévő eltérő rezgések miatt, illetve a program utolsó részét önmagában, a CPU-t, mivel a fáradságos számítás túlterhelt. a GPU. Az egész vezetői látják majd a gyárral párhuzamos munkafolyamatot, szeretik előállítani az információfeldolgozást és a robotlátogatás időpontjának módosítását, a rendszer produktívabbá válik, és egyszerre termelékenyebb is lehet. A sikerhez azonban nem lehet boldogulni a hardveres támogatással, az ilyen típusú szoftvereket szoftveres biztonsággal kell ellátni, hogy a kiegészítő a legmunkaigényesebb számításokat is át tudja vinni a GPU-ra.

SHO TAKE CUDA

A CUDA egy szoftvertechnológia, amely saját Ci-algoritmusaimra épül, amelyeket a nyolcadik generációs és régebbi GeForce-ra gyorsított grafikus processzorokon, valamint az NVIDIA cég legújabb Quadro és Tesla kártyáin hajtanak végre. A CUDA lehetővé teszi, hogy programokkal speciális függvényeket foglaljon a szövegbe. A függvények a C program egyszerű nyelvén vannak megírva, és a grafikus processzoron jelennek meg. A CUDA SDK első verzióját 2007. február 15-én mutatták be. A kód központi részre történő sikeres lefordítása érdekében a CUDA SDK-állomány az NVIDIA cég nvcc parancssorának hatékony C-fordítóját tartalmazza. Az nvcc fordító az Open64 nyílt forráskódú fordítón alapuló fordításokhoz, valamint a gazdagép kód (fej, kernel kód) és eszközkód (hardverkód) (.cu kiterjesztésű fájlok) lefordításához a könyvtárhoz hozzáadott nagy fájlokban a program tetszőleges közepén, például a Microsoft Visual Studio-ban.

a technológia ereje

  1. Szabványos mov C további adatok párhuzamos feldolgozásához a GPU-n.
  2. Készítsen numerikus elemzési könyvtárakat a Fur'є és a lineáris algebra alapvető szoftvercsomagjának gyors újraimplementálásához.
  3. Egy speciális CUDA illesztőprogram a GPU és a CPU közötti adatátvitel kiszámításához.
  4. Lehetőség a CUDA illesztőprogram és az OpenGL és a DirectX grafikus illesztőprogramok összekapcsolására.
  5. Linux 32/64 bites, Windows XP 32/64 bites és MacOS operációs rendszerek támogatása.

elsöprő technológia

  1. CUDA Dodatk programozási felület (CUDA API), amely a Deyakim Obezhenniy szabványos Movies Programming Ci-n alapul. Megbocsátok és zgladyzhu a CUDA architektúrájának létrehozásának folyamatát.
  2. A 16 Kb méretű folyamok közötti kollektív memória (megosztott memória) a gyorsítótár rendszerezésére használható szélesebb sávszélességgel, nem pedig rendkívüli textúrákkal vibrálva.
  3. Hatékonyabb tranzakciók a központi processzor memóriája és a videomemória között.
  4. Másrészt a digitális és a bitenkénti műveleteknek külön folyamata van.

Fenék tárolási technológia

cRark

A legtöbb munkás a programban az infúzió ára. A program konzolos felülettel rendelkezik, csak néhány instrukció, hogy el tudjunk jutni magához a programhoz, használni tudjuk. A programok beállításáról egy rövid útmutató található. A programot az „Advanced Archive Password Recovery” program adott verziójában alakítjuk át elfogadhatóvá és alkalmanként egy hasonló programmal, amely nem egy helyettesítő NVIDIA CUDA.

A cRark archívum letöltése után csak három fájlra van szükségünk: crark.exe, crark-hp.exe és password.def. A Сrark.exe egy konzolsegédprogram a RAR 3.0 jelszavak rootolásához titkosított fájlok nélkül az összes középső archívumban (az archívumok megnyitásához el kell nevezni, de az archívumok jelszó nélkül nem nyithatók meg).

A Сrark-hp.exe egy konzolos segédprogram a RAR 3.0 jelszavak rootolására az összes archívum titkosításával (hogy az archívumot ne lehessen megnyitni, nevezze el, sem magát az archívumot, sem az archívumot jelszó nélkül kicsomagolni).

Password.def - nincs változás a szöveges fájlban, még kis szóközzel sem (például: 1. sor: ## 2. sor :? *, A jelszavak listája esetén minden esetben a szimbólumok listájából kell kikeresni). Password.def - cRark program cRark. A fájlnál a jelszó megnyitásának szabályait próbálják ki (vagy a yaku crark.exe jelek területe lesz a győztes a robotban). E jelek megválasztásának lehetőségéről további részletek az oldalról eltávolított személy szövegfájljában találhatók, amelyet a webhelyen a szerző elől a cRark programokkal zárolnak: russian.def.

készítmény

Azonnal elmondom, hogy a program csak akkor működik, ha a videokártyádat a CUDA 1.1 támogatásával a GPU-ra másoljuk. Tehát egy sor G80 chipre épülő videokártya, mint például a GeForce 8800 GTX, kijelző, valamint a gyorsított CUDA 1.0 hardveres kijelzőjének bűze. A program kiválasztja a további CUDA jelszavakat a RAR archívum 3.0+ verziójában. Az összes szoftvert biztonságossá kell tenni, CUDA-hoz kell kapcsolni, és önmagában is:

  • NVIDIA illesztőprogramok állnak rendelkezésre a CUDA támogatásához, javításuk 169.21-től
  • NVIDIA CUDA SDK, Javítás az 1.1-es verziótól
  • NVIDIA CUDA Toolkit, Javítás az 1.1-es verziótól

Bármilyen zenében hozz létre mappát (például a C meghajtón :) és legyen az például valaki másnak, például "3.2". Ritka fájlok: crark.exe, crark-hp.exe і password.def і jelszó / titkosítási RAR archívumok.

Indítsa el a Windows parancssori konzolt, és lépjen az új mappába. Windows Vista és 7 esetén lépjen a "Start" menübe, és írja be a "cmd.exe" parancsot a mezőbe; Amikor megjelenik a konzol, írja be a következő formátumú parancsot: cd C: \ folder \, cd C: \ 3.2 ezen a vipadon.

Két sor kerül begépelésre a szövegszerkesztőben (a szöveget .bat fájlként is mentheti a cRark mappájába), hogy kiválasszon egy jelszót a titkosítatlan fájlokat tartalmazó RAR-archív jelszavakhoz:

visszhang ki;
cmd / K crark (archívum neve) .rar

jelszó kiválasztásához egy jelszóhoz és egy titkosított RAR-archívumhoz:

visszhang ki;
cmd / K crark-hp (archívum neve) .rar

Másoljon egy szövegfájl 2 sorát a konzolra, és nyomja meg az Enter billentyűt (vagy futtassa a .bat fájlt).

eredmények

A csecsemő indikációinak dekódolásának folyamata:

A CUDA több ezer hatszázhuszonöt jelszót adott hozzá másodpercenként a cRark kiválasztásához. Egy ghilina harminchat másodpercig egy 3 karakterből álló jelszót ír: "q) $". Okkal: a kétmagos Athlon 3000 processzoron az Advanced Archive Password Recovery szolgáltatásban a nyers erő sebessége több mint 50 jelszó/másodperc és 5 évre brutális erővé válik. Ahhoz, hogy a további GeForce 9800 GTX + videokártya mögötti cRark RAR archívumban bruteforce-t lehessen használni, 30-szor gyorsabban nézhető meg, mint a CPU-n.

Csendeseknek, Intel processzorral rendelkezőknek jó egy magas rendszerbusz-frekvenciájú (FSB 1600 MHz) alaplap, remek lesz a CPU sebesség jelző és a keresés sebessége. És ha van egy chotiro-core processzora és egy pár videokártyája, amely megegyezik a GeForce 280 GTX-vel, akkor a brute-force jelszó gyorsabb lesz. Tegyük fel, hogy a probléma a CUDA technológia 2 napos pangása miatt az üzenet vödörébe került, 5 éves, hogy a technológia nagy lehetőségeiről beszéljünk!

visnovka

Miután megvizsgáltuk a párhuzamos CUDA számítások jelenlegi technológiáját, a RAR archívumok jelszavának frissítésére szolgáló programokkal valóban felpumpáltuk a technológia fejlesztésének minden nagy potenciálját az alkalmazásban. Kötelező mesélni ennek a technológiának a kilátásairól, mivel a technológia nem egyöntetűen ismert a bőröndök életében, ami jó idő, legyen szó akár tudományos ismeretekről, akár egy jó videóhoz kapcsolódó lelkesedésről, amíg a elkerülhetetlen a pratsi termelékenységének növekedése, mivel lehetetlen nem pomititálni. Az aktuális napon a szókincsben szerepel az "otthoni szuperszámítógép" szó is; teljesen nyilvánvaló, hogy egy ilyen tárgynak a valóságba való bevezetéséhez a skin fülkében létezik egy CUDA nevű eszköz is. A G80 chipre épülő kártyák (2006) kibocsátásának pillanatában kijavítva, nagyszámú NVIDIA alapú kártya került piacra, így a CUDA technológiát alkalmazták, hogy a szuperszámítógépek világát behozzák a világ bőrébe. világ. A CUDA technológiával működő NVIDIA megszerezte tekintélyét a vásárlók szemében azon ügyfelek szemében, akik rendelkeznek a birtokukban lévő többletképességekkel, hiszen már megvásárolták őket a bagatokhtól. Pont olyan, mint amilyen igaz, de a CUDA-t nem fogják még gyorsabban kialkudni, és a GPU-n történő számítással párhuzamosan minden lehetőséggel gyorsabban adják a koristuvachamokat világszerte.

Készüljön fel a projektre – köszönjük szépen!
Olvassa el is
Sberbank (ugyanabban az Oschadbankban) Sberbank (ugyanabban az Oschadbankban) Az Autocad licencproblémák megoldása A Chi nem indítja el az Autocad Windows 7 rendszert Az Autocad licencproblémák megoldása A Chi nem indítja el az Autocad Windows 7 rendszert Útmutató a CryptoPro PIN kódjának regisztrálásához, bizonyos dokumentumok regisztrációjának órája előtt - Útmutató - AT Útmutató a CryptoPro PIN kódjának regisztrálásához