Odaberite stranicu

Isprobao: AMD GCN - predstavljamo Radeon HD 7970 i HD 7950

Došlo je vrijeme da napokon predstavimo AMD GCN (Graphics Core Next) arhitekturu i svoja dva najmoćnija predstavnika, Radeon HD 7970 i Radeon HD 7950.

Logotipi članaka GCN

Od HD 7950 odmah smo odali počast dvojici, pa smo imali priliku i testirati CrossFireX, a s obje smo kartice izvršili i podešena mjerenja. Naravno, poslali smo i niz vozača protiv dva nova topa kako bi vidjeli koliko su kartice ubrzale u odnosu na prethodnu generaciju GeForces i Radeons. 


Prije nego što uđemo u sudionike i testove, detaljnije ćemo pogledati GCN arhitekturu i preuzeti značajke HD 7970 i HD 7950.

 svekartice 2k

 Grafička jezgra Dalje

U svibnju 2007. AMD je predstavio grafičku karticu Radeon HD 2900 XT, koja je već izgrađena na jedinstvenoj shader arhitekturi. Kako se ispostavilo, dizajn je imao brojne nedostatke, ali problemi su gotovo u potpunosti uklonjeni u vrijeme serije Radeon HD 4000, dajući tvrtki uporište na tržištu stolnih grafičkih kartica. U ovom se trenutku moglo vidjeti da su sada potrebne radikalne promjene. Serija HD 6900 "Cayman" smatra se prvim korakom. Ovdje su prethodni 5-smjerni superskalarni procesori (VLIW5) zamijenjeni četverosmjernim procesorima (VLIW4), a Cayman je bio prvi čip koji je obrađivao više neovisnih tokova instrukcija. Druga velika inovacija bilo je uvođenje dva "grafička stroja" koji su udvostručili kapacitet postavljanja trokuta - povećavajući snagu testaliziranja - i broj nekih elemenata (Rasterizer, Hierarchical Z, Tessellator). Danas je postao predmet našeg sljedećeg testa. Zahvaljujući arhitekturi nazvanoj Graphics Core Next (GCN), nijansi sjenčica koje rade s VLIW uputama do sada korištenim zastarjeli su, zamijenjeni takozvanim računskim jedinicama (CU). GCN je prvi debitirao u obitelji Radeon HD 4 "Tahiti".

19 m

Zanimljivo, ali nije iznenađujuće, Tahiti GPU postigli su izvanredne gustoće tranzistora zahvaljujući TSMC-ovoj 28-nm tehnologiji proizvodnje propusnosti - sadrže 365 milijarde tranzistora na 4,3 kvadratnih milimetara. Jedna računarska jedinica sadrži četiri SIMD-a i jednu skalarnu jedinicu. AMD-ov vodeći Radeon HD 7970 “Tahiti XT” radi s 32 aktivna CU-a, pretpostavljajući ukupno 2048 shader procesora (četiri 16-smjerna SIMD-a, 64 ALU-a). S obzirom na dosadašnji napredak generacija, to na prvi pogled ne izgleda kao izvanredna vrijednost, ali radi veće učinkovitosti i iskorištavanja, željeli bismo ustvrditi da ne vrijedi slučajno iz toga donositi dalekosežne zaključke tehnički pokazatelj. Teoretski, CU može raditi koliko i jedna Cayman SIMD jedinica. Glavni problem prethodnih generacija je ovisnost podataka (uzastopne upute ovise o podacima), što je uzrokovalo da upotreba jako varira. GCN arhitektura je također korak naprijed u ovom području jer eliminira prethodno iskusne ovisnosti obradom toka. Prednosti su samo u ključnim riječima: raspoređivanje, otklanjanje pogrešaka, procjena očekivane izvedbe i razvoj pokretača također su postali radikalno jednostavniji i transparentniji. 

24

36 mCU ne samo da sadrži četiri SIMD jedinice, već ima i vlastiti planer, 340 KB privremene pohrane i klaster za teksturiranje. To je rezultat zbroja vektorskog registra od 4 × 64 KB, dijeljenja lokalnih podataka, koji je također veličine 64 KB, skalarnog registra od 4 KB i predmemorije prve razine kapaciteta 16 KB. Na gornjoj slici možete vidjeti još jednu komponentu koja svakako zaslužuje spomen, a to je takozvani "Branch & Message Unit" koji ima ulogu u učinkovitijoj kontroli programa.
Imajući dosadašnje informacije, pregledajmo ponovno ključne parametre grafičkog procesora “Tahiti XT”: 32 CU (2048 shader procesora, 128 SIMD-ova), 128 teksturnih jedinica, 512 jedinica za učitavanje i ukupno 8,2 MB predmemorije. Tako je položaj djevojke odmah bio drugačiji, iako smo se tek počeli "svlačiti".

35 mFront-end

Što se tiče frontenda, možemo vidjeti značajne razlike u odnosu na arhitekturu NVIDIA GF110. Upravljanje se u osnovi ne vrši na razini CU-a. Ovaj zadatak izvode naredbeni procesor i asinkroni računalni mehanizam (ACE). Čip je dobio dva geometrijska motora koji, uz Geometry-Assembler, Vertex-Assembler, također smještaju devete generacije teselatora. Komunikaciju s CU-ima olakšava Global Data Share (GDS), putem koje ove jedinice također mogu međusobno dijeliti podatke. Odjeljak sučelja sadrži dva rasterizacija - izgled možete vidjeti u nastavku.

37

ROP-ovi i memorijsko sučelje
AMD Tahiti sadrži 8 ROP klastera - u ovom smo trenutku pronašli podudaranje s Cayman čipom. Svaki takav "niz" sadrži četiri ROP jedinice i 16 Z uzorkovača. Važno je spomenuti da je svaki klaster dobio svoju vlastitu predmemoriju. Dogodila se još jedna velika promjena: više nema izravne veze s upravljačem memorije. Premještanje je namijenjeno poboljšanju fleksibilnosti i upotrebljivosti, što možemo vidjeti u kontekstu Pitcairna ... ROP-ovi mogu pisati u 768 KB L2 predmemoriju, koju zauzvrat može čitati više jedinica. Memorijsko sučelje prima radosnu sliku. Šest 64-bitnih memorijskih kontrolera ima ukupni kapacitet od 384 bita. Ovome bismo dodali samo riječ. Konačno! Zadana veličina video memorije je 3072 MB, ali u teoriji je moguće i 1536 MB i 6 GB.

Nadamo se da ga čitatelji neće shvatiti kao loše ime, ali u ovom bismo trenutku izrazili svoje osobno mišljenje o pozadini. Odnos između Bartsa, koji je imao jako dobre rezultate, i Caymanova čipa, koji pokazuje relativno skromne rezultate, sugerira da je "opći problem" AMD čipova uski ROP kapacitet. Ni ovdje nije postignut napredak na Tahitiju, dok bi se stranice mogle pisati s nekim pretjerivanjem o ostalim novitetima u čipu. Uloga ROP-ova posebno je istaknuta tijekom igara, tijekom GPGPU zadataka i aplikacija postaju drugi violinisti. Također je sigurno da ovaj odjeljak troši velik broj tranzistora, što se naravno odražava i na veličini čipa.

 

Dosadašnja AMD-ova poboljšanja uglavnom su služila potrebama igrača. Sada je došlo do okreta od najmanje 90 stupnjeva i postalo je snažno raskrižje za zadovoljenje profesionalnih potreba i širu upotrebu GPU-a. Naravno, to nije problem, jer u osnovi govorimo o vrlo gruboj razini izvedbe, koja će sigurno izdržati suđenja modernih igara nekoliko godina. Prema glasinama, ne samo AMD, već i NVIDIA usko tretira ROP-ove s Keplerom.

Proširenje memorijske sabirnice bio je hvalevrijedan korak. Zapravo, dizajneri su imali malo izbora. Satovi se više ne mogu značajno povećati, ali čip gladuje za podacima. Prema našem mišljenju, samo ovaj potez mogao je povećati performanse tijekom igara i do 15 posto.

44DirectX 11.1 i PCI Express 3.0
Standard PCI-Express 3.0 povećava brzinu sa 16 GB / s na 32 GB / s, udvostručujući brzinu prijenosa podataka od PCIe 2.0. Proizvođači matičnih ploča odmah su "zagrizli za tu temu", no koliko god željeli, prekidač trenutno ne nudi značajnu prednost. PCIe 3.0 važno je oružje iz marketinške perspektive, obvezni standard za AMD i NVIDIA i još jedna "zamka novca" za korisnike.
DirectX 11.1 može započeti osvajanje sa sljedećim operativnim sustavom Windows koji sadrži manje ispravke i optimizacije. Prema službenom materijalu, od novog API-a možemo očekivati ​​izvornu stereo 3D podršku i učinkovitiju rasterizaciju. Na žalost, možda najzanimljivija točka koja govori o tome kako se fleksibilnost i široka upotrebljivost grafičkog hardvera može poboljšati nije detaljno opisana.

31 m

Arhitektura Graphics-Core-Next otprilike ovako izgleda. Naravno, čip ne služi samo potrebama igrača, već ima i prostora za profesionalne zadatke. Teoretska izvedba Tahitijevog izračuna (za izračune dvostruke preciznosti) iznosi 947 GFLOP, četiri puta veća za operacije s pomičnom zarezom s jednom preciznošću. Uz to, memorije imaju ECC podršku, a GPU je dobro upoznat s API-jem DirectCompute 11.1, OpenCL 1.2 C ++ AMP.27 Nove značajke: Zero-Core
Općenito, vrhunski grabežljivci na razini Radeon HD 7900 navikli su na konzumiranje kao tabu temu, ali AMD-ovim inženjerima nedostaje domišljatosti. Ideja je jednostavna, ali sjajna, ali nije nova. Ako računalo ostavite dulje vrijeme, ali ga iz nekog razloga ne želite isključiti, možda biste monitor željeli ostaviti samo u stanju čekanja. Zahvaljujući ZeroCore Power tehnologiji, s isključenim zaslonom, cijeli grafički kontroler može se isključiti i u ovom obliku nije potrebno aktivno hlađenje. Prednosti su uvjerljive: nula šuma, 3 vata potrošnje energije. Za mnoge će to biti beznačajan faktor, ali postupak za četverosmjerne Crossfire sustave isključuje neprimarne video kartice, značajno smanjujući vaš račun za električnu energiju - iako svi koji razmišljaju o takvom sklopu malo pomažu u rješavanju energetske učinkovitosti.

21a

20

Eyefinity 2.0
Jedna od zanimljivih značajki nove verzije je ta što vam omogućuje vođenje konferencijskih razgovora s više monitora s višepojasnim zvukom. Službeni naziv postupka je Discrete Digital Multi-Point (DDM) Audio. Radeon HD 7970 može se istovremeno povezati na tri zaslona koji mogu primati osmokanalni audio tok. To možda nije posebno zanimljivo za kućne korisnike, ali je dobar primjer u koliko područja se novi top može koristiti. Pogon Catalyst također se razvija, što olakšava, na primjer, postavljanje ladice i omogućuje vam sastavljanje prilagođenih rezolucija. Vrijedno je spomenuti da se Full HD stereo 3D sadržaj također može gledati u Eyefinity modu. 

29 m

UVD i VCE
UVD 3.0 već nudi hardversko ubrzanje za DivX / Xvid, MPEG-4 dio 2 MVC sadržaja, a Video Code Engine (VCE) je gotovo AMD ekvivalent Intel Quick Sync Video. VCE je samostalni hardver i dizajniran je samo za ubrzavanje prekodiranja H.264 videozapisa. Motor je sporiji od shader procesora u grafičkom procesoru, ali mnogo energetski učinkovitiji. Korisnicima su dostupna dva načina. Isprva radi samo VCE, koji je sam po sebi brži od većine CPU-a. U ovom slučaju nećemo doživjeti usporavanje, bez problema možemo učitati video karticu ili središnju jedinicu. Druga opcija je hibridni način. Aritmetičko-logičke jedinice VCE i GPU zajedno prelaze na zadatak. Ovaj "brak" očito dobro utječe na brzinu kodiranja, ali u tom slučaju nemojte se iznenaditi ako vaša omiljena igra pređe u način "prezentacije".

32

Sad kad smo svjesni teorije i brojeva, upoznajmo se s tri GCN modela u testu!