AMD FireStream

AMD Firestream er en teknologi utviklet av ATI , skapt for å utnytte strømbehandling/ GPGPU ( Generell P urpose computation using GPU ) for tunge beregninger på flytende kommatall som er nyttige for en rekke applikasjoner, for eksempel High Performance Computing (HPC), av naturvitenskapelig natur, og økonomisk i sin natur.

Denne teknologien var tidligere et merke for både ATI og AMD, og ​​ble kalt henholdsvis ATI FireStream og AMD Stream Processor . Et AMD Firestream-kort kan også brukes som en koprosessor som er i stand til å utføre flyttalloperasjoner designet for å redusere CPU-arbeidsbelastningen, som også er en del av Tilità- initiativet , også produsert av AMD selv.

Beskrivelse

Siden utgivelsen av den siste generasjonen av Radeon R520 og GeForce 7 GPUer har ytelsen til den programmerbare Shader -arkitekturen med store flytende kommatall fått mye oppmerksomhet fra kommersielle og akademiske grupper, hovedsakelig på grunn av deres evne til å behandle data utover originalen. bruk, gjengivelse av visuelle effekter. På grunn av potensialet deres har det blitt investert mye ressurser i å utvikle GPGPU-produkter - ansvarlige for generelle beregninger av matematiske formler - for å behandle tunge beregninger som tidligere ble utført på vanlige servere, stasjonære CPU - er og spesialiserte flyttall-koprosessorer. GPGPU-er anslås å ha 10 ganger høyere ytelse i fremtiden med samme inngang sammenlignet med programvare som kun kjøres av CPU.

Lignende GPGPU-er dukket også opp i 2000. BionicFX eksperimenterte med å behandle lyddata med en GeForce 6008 , og annonserte rammeverket for Audio Video EXchange (AVEX), med ytelse som ligner på ATIs. Et annet eksempel er Folding @ Home , et forskningsprogram fra Stanford University . Dette var den første programvaren som brukte Radeon R580 GPU og andre ATI GPUer, utstyrt med en spesiell betaversjon av Catalyst-driverne (versjon 6.5), og for å utføre beregningsoperasjoner som ikke er relatert til grafikk. Siden mai 2006 har GPU-er blitt brukt til å akselerere proteinfoldingssimulering for å undersøke proteinrelaterte sykdommer. I løpet av denne tiden har ATI vært inaktiv med å planlegge fremtidig utvikling.

Den 15. november med anskaffelsen av den komplette ATI, kunngjør AMD offisielt gjenoppbyggingen av merket og kunngjør AMD Stream Processor (opprinnelig kjent som ATI FireStream), og blir dermed den første industrien som tilbyr maskinvareløsninger av denne typen. Basert på Radeon X1900, er AMDs Stream-prosessor et spesialisert kort som implementerer R580 GPU. Imidlertid ble den brukt i komplekse flytende tallberegninger brukt i vitenskap og finans i stedet for som en 3D-grafikkakselerator. AMD hevder at denne prosessoren yter 8 ganger bedre i flytepunktberegninger enn tradisjonell grafikkbehandling.

Faktisk ga ATI spesiell oppmerksomhet til forskning og utvikling (FoU) av GPGPU-produkter før de ble kjøpt opp av AMD, og ​​kunngjorde bruken av strømbehandlings-/GPGPU-prosjektet i tråd med 2006 GPU-ene, kalt Radeon R580 .

Merket ble først omdøpt til AMD FireStream med andre generasjon Stream-prosessorer (basert på 55nm-prosessen), utgitt 8. november 2007. Fremtidige planer inkluderer utvikling i en MXM-modul , designet for innebygde applikasjoner og fremtidige generasjoner. andre halvdel av 2008.

Maskinvare

Radeon -serien er 32-biters enkeltpresisjonsvektorprosessorer . Takket være den høye parallelliteten til vektorprosessorene har de hatt stor innvirkning i databehandlingsapplikasjoner. Masseprosjektet Folding @ Home rapporterte 20x til 40x ytelsesgevinster ved å bruke et grafikkort basert på R580-brikkesettet.

Radeon R580 inkluderer totalt 48 piksler og vertex shaders, som blir parallelle prosessorer i flytende kommaberegninger . ATI FireStream bruker et PCI Express x16-grensesnitt for å oppnå 8 GiB/s båndbredde. Kortet er utstyrt med 1 GB GDDR3 -minne mens kortet reiser med en frekvens på 600 MHz kjerne og 1,3 GHz minne. Kortet har muligheten til å kjøre 512 tråder samtidig ( samtidig multitreading , SMT), med en TDP på ​​165 watt. Hovedforskjellen mellom FireStream og et vanlig Radeon grafikkort er at streamprosessoren mangler videokontakter.

Stream Processing-maskinvare bruker et grensesnitt kalt THIN ( Thin Hardware Interface ), eller Close To Metal (CTM, tidligere Data Parallel Virtual Machine ), for å utvide GPU-arkitekturen i tillegg til det opprinnelige instruksjonssettet som brukes av programmerere. Disse lar deg få direkte kontroll over Stream / ALU-prosessorene og minnekontrollerne, og lar deg omgå 3D API -ene.

AMD-utviklingslinjen inkluderer en oppdatering til de nyeste GPU-arkitekturene ( Radeon R600 ) med kommersialisering av den siste generasjonen FireGL -skjermkort (7. august 2007), som er utstyrt med strømprosessorer. Arkitekturen ble unnfanget med en 80 nm produksjonsprosess, som R580, med et større antall parallelle prosessorer og strømbehandlingsenheter. I tillegg er GDDR4 -minne økt til 2GB, med maksimalt 128 GiB/s båndbredde. FireGL-produkter basert på R600 XTX-kjernen (FireGL V8600 og FireGL V8650) bruker mye mer enn en førstegenerasjons ATI Firestream, med en TPD estimert henholdsvis under 225W og over 255W.

Den andre generasjonen, AMD FIreStream 9170, er basert på RV670- brikkesettet og produsert med en 55nm produksjonsprosess. Hovedfunksjonene er å være den første GPUen som støtter dobbeltpresisjonstallberegninger, asynkron DMA (som lar prosessorer og minne utveksle data uten CPU-innblanding), minneeksportfunksjonalitet og redusert strømforbruk (mindre 150W med 2GB GDDR3 i en PCI) -E 2.0-grensesnitt, med 16 GiB/s båndbredde).

Den siste generasjonen av AMD FireStream-linjen er FireStream 9250 og FireStream 9270. AMD FireStream 9250, annonsert 16. juni 2008, er basert på RV770-brikkesettet og er produsert i en 55nm produksjonsprosess. De tekniske funksjonene rapporterer 1 TFLOPS kraft med enkeltpresisjons numeriske operasjoner, 1 GB GDDR3 og en enkelt kjøleribbe. Mens varianten, AMD FireStream 9270, kunngjort 13. november 2008, basert på RV770-brikkesettet med et svært høyt antall flytepunktoperasjoner med en topp på 1,2 TFLOPS, har 2 GB GDDR5 og en dobbel sporkjøler.

AMD utviklingslinje

Maskinvarespesifikasjonene til strømprosessorene distribuert av AMD (og tidligere av ATI) er oppsummert nedenfor:

Generasjon Mal
Tilsvarende skjermkort
Kjerne GPU Tråd maks Kjerne Hukommelse ( Flytepunktoperasjoner per sekund ) TDP ( watt ) Annen
Shaders
(SPUer) NB1
Klokke
( MHz )
Båndbredde ( GiB / s ) Fyr Bussbredde
( bit )
Beløp
( MiB )
Klokke
(MHz)
FP32 GFLOP-er FP64 GFLOP-er
1. NB2 580 / 2U Radeon X1900 XTX R580 512 48 600 83,2 GDDR3 256 1024 650 375 N/A ≤165 N/A
N / A NB2 FireGL V8650 R600 ? 64
(320)
743 128,0 GDDR4 512 1024 1000 475 N/A ≤225 første FireGL-kort
med støtte for strømbehandling
FireGL V8600 2048 ≤255
2. NB2 9170 Radeon HD 3870 RV670 ? 64
(320)
800 51,2 GDDR3 256 2048 800 512 102,4 NB3 ≤105
dobbel presisjon FP-støtte
3. NB2 9250 Radeon HD 4850 RV770 16.384 160
(800)
625 63,5 GDDR3 256 1024 993 1000 200 NB3 ≤150 utgitt 16.
juni 2008
9270 Radeon HD 4870 160
(800)
750 108,8 GDDR5 256 2048 850 1200 240 <160 utgitt 13.
november 2008

Merknader :

NB1 : Antall strømbehandlingsenheter kan bare brukes på DirectX 10- kompatibel maskinvare, som inneholder enhetlige shadere (implementert i produkter basert på Radeon R600 og større arkitekturer, der det er 5 ALU-er i hver shader, fire MADD / ADD / MUL / LEGG TIL hele/punktprodukt og ett for transcendentale funksjoner ), og skaper 320 strømbehandlingsenheter i 64 enhetlige shaders. Vær også oppmerksom på at arkitekturen er implementert annerledes enn Nvidia-motparten, i Tesla- produkter . SP i Nvidia-implementeringer har en høy klokkefrekvens (2,35x eller høyere) sammenlignet med de andre delene av kjernen, mens Ati SPU-ene har samme kjernefrekvens. NB2 : Den første generasjonen av produkter brukte opprinnelig ATI FireStream-merket, men ble senere omdøpt til AMD Stream Processor etter AMDs oppkjøp av ATI og gjenoppbyggingen av merket. AMD FireStream 9170-kortet basert på RV670-brikkesettet ble utgitt uten å ha noen tidligere R600-baserte kort som brettene som tidligere ble utgitt under den gamle ATI-utviklingslinjen (også prototyper av kort med konfigurasjoner som ligner på FireGL V8650 ble vist offentlig, men uten videoutgang) . Fra og med 2007 FireGL-serien har high-end og ultra high-end kort fått strømbehandlingsstøtte. NB3 : Utførelsestiden for enkeltpresisjonsoperasjoner er teoretisk en femtedel av det som er representert.

Programvare

Et av de første firmaene som støttet FireStream var PeakStream (kjøpt av Google i 2007, i juni), som var det første som ga ut en åpen beta av programvaren som støtter CTM og FireStream samt x86 og Cell (Cell Broadband Engine). FireStream har blitt hyllet for å være 20 ganger raskere ved å bruke en vanlig applikasjon enn en vanlig CPU etter å ha kjørt PeakStream-programvaren. RapidMind leverte også strømbehandlingsprogramvare som jobbet med ATI og NVIDIA, så vel som for celleprosessoren.

Software Development Kit

Den første utgivelsen av SDK (v1.0) ble utgitt i desember 2007, lisensiert under AMD EULA , for å kjøre under Windows XP . Programvaren inkluderte "Brook +", en revidert og korrigert versjon av Brook-språket produsert av Stanford University, som en variant av ANSI C ( C language ), åpen kildekode og optimert for strømdatabehandling. Også inkludert var AMD Core Math Library (ACML) og Framewave (APL) med optimalisering for AMD FireStream, og CODA-biblioteket (senere omdøpt til "Accelerated Video Transcoding" eller AVT) for videokodingsakselerasjon . En annen viktig del av SDK-en, Compute Abstraction Layer (CAL), er et programvareutviklingslag fokusert for lavnivåtilgang, gjennom CTM-maskinvaregrensesnittet, til GPU-arkitekturen skrevet på forskjellige programmeringsspråk på høyt nivå. .

I løpet av mars måned 2010 distribuerer AMD versjon 2.01 av ATI Stream Software Development Kit, som inkluderer støtte for OpenCL 1.0, et programmeringsspråk utviklet av Khronos Group . Støtte for de nye shader-bruksveiene til neste generasjon Microsoft API kalt DirectX 11 vil bli implementert i fremtidige utgivelser av Stream SDK.

AMD APP SDK

AMD Stream SDK (ATI Stream SDK) er erstattet av AMD APP SDK, tilgjengelig for Microsoft Windows og Linux, 32-bit og 64-bit. APP står for "akselerert parallell prosessering", og den retter seg også mot Heterogen System Architecture (ikke bare GPUer). [1]

Fordeler

AMDs testsystem med 2 Dual Core Opteron og 2 Radeon R600 GPUer og Microsoft Windows XP Professional -operativsystemet oppnår 1 TeraFLOPS , i multipli-add-beregninger (MADD). Til sammenligning oppnår en Intel Core 2 Quad Q9650 3,0 GHz 48 GFLOPS. Vi må imidlertid klart skille mellom enkeltpresisjons- og dobbelpresisjons-aritmetiske operasjoner: det forrige eksemplet bruker flytepunktsoperasjoner med enkelt-presisjon, sistnevnte representerer dobbeltpresisjonsoperasjoner.

Nylige demonstrasjoner viser at med Kaspersky SafeStream antivirus-skanningstester optimalisert for strømprosessorer, er systemet med 2 opteroner på 6,2 Gbit/s (775 MiB/s) båndbredde 21 ganger raskere sammenlignet med andre doble systemer. Strømprosessorsystemer viser også bare 1-2 % CPU-utnyttelse, noe som indikerer betydelig arbeidsbelastning fra CPU til strømprosessor.

Begrensninger

Merknader

  1. ^ APP SDK - A Complete Development Platform Arkivert 9. februar 2016 på Internet Archive .

Relaterte elementer

Eksterne lenker

Applikasjoner

For utviklere