Hem Framåt tänkande Nvidia driver minneförbättringar, enhetlig arkitektur för gpus, mobila processorer

Nvidia driver minneförbättringar, enhetlig arkitektur för gpus, mobila processorer

Video: Mythbusters Demo GPU versus CPU (September 2024)

Video: Mythbusters Demo GPU versus CPU (September 2024)
Anonim

Vid Nvidias GPU-teknikkonferens förra veckan blev jag förvånad över att se hur långt grafik och GPU-teknik rör sig - på skrivbordet och på mobila enheter - och hur hur människor skriver programvara måste ändras för att dra nytta av det.

Den stora rörelsen är mot heterogen programvara, program som kan använda både den traditionella mikroprocessor CPU och GPU på samma gång. Detta är inte ett nytt koncept - både Nvidia och AMD har pratat om detta ett tag - men de två sidorna närmar sig varandra.

AMD: s strategi har varit att främja vad den kallar "accelererade processorenheter", som kombinerar både GPU: er och CPU: er på en enda matris, och vad den kallas "heterogen systemarkitektur." Under de senaste åren har det främjat HSA och förra året etablerade den HSA Foundation, tillsammans med 21 andra företag, för att utveckla öppna standarder för heterogen datoranvändning.

Nvidias tillvägagångssätt har varit mycket annorlunda, med fokus på sina CUDA-plattformar för att skriva programvara på sina GPU: er och dess Tesla-version av GPU: er, som nu används i superdatorer som Oak Ridge National Laboratory's Titan-superdator. I sådana system hanterar ganska komplicerad mjukvara vad datorn fungerar på CPU och vad som fungerar på GPU.

Genom att öppna sin nyckelord sa Nvidia-verkställande direktören Jen-Hsun Huang: "Visuell databehandling är ett kraftfullt och unikt medium. Under de senaste 20 åren har detta medium förvandlat datorn från en dator för information och produktivitet till ett av kreativitet, uttryck och upptäckt." De kommande åren borde säga om övergången når en platå eller om den verkligen bara börjar."

Som förväntat talade Huang mycket i sin grundton om hur GPU-dator baserat på CUDA växer. Företaget har skickat 430 miljoner CUDA-kapabla GPU och 1, 6 miljoner nedladdningar av CUDA-programmeringspaket; Nvidia GPU: er används nu i 50 superdatorer runt om i världen. Till exempel, sade han, gjorde Titan nyligen världens största mekaniska simulering av fasta partiklar, och använde 40 miljoner CUDA-processorer för att leverera 10 petaflops med långvarig prestanda. Han sa också att GPU-datorer hade massor av potential i "big data" -applikationer.

Huang tog upp en representant från Shazam för att prata om hur företaget använder GPU: er för att matcha musik och ljud från ett stort antal användare. Huang nämnde då att ett företag som heter Cortexica använder liknande teknik för visuell sökning.

Viktigast av allt visade företaget en ny färdplan för sin GPU-motor som används i både sina GeForce-spelprodukter och Tesla-linjen. Den nuvarande GPU-arkitekturen kallas "Kepler", som levererades förra året. Nästa version, känd som "Maxwell", kommer nästa år. Det tar ett stort steg mot heterogen databehandling genom att lägga till en "enhetligt virtuellt minne" -arkitektur, vilket innebär att CPU och GPU kommer att kunna se hela systemets minne.

Detta är viktigt eftersom en av de stora flaskhalsarna i GPU-datorer har flyttat data mellan huvudminnesystem och grafikminne och för att skrivprogramvara som använder båda typerna av processorer har varit svårt. (AMD har meddelat en liknande funktion för sin Kaveri-processor, i slutet av detta år. Jag är lite oklar över hur detta fungerar utan direkt stöd från CPU-tillverkarna, men det är verkligen en metod som vi kommer att se mer av går framåt.)

För 2015 lovade Huang en annan version, kallad "Volta", som kommer att ta grafikminnet och stapla det direkt ovanpå GPU, vilket dramatiskt ökar minnesbandbredden till cirka en terabyte per sekund. Som jämförelse är Keplers totala maximala bandbredd cirka 192 gigabyte per sekund.

Ett antal företag, inklusive Intel, har pratat om att stapla minne ovanpå en processor, men ledningarna för att ansluta minnet och processorn, som använder en teknik som kallas genom-kisel vias, har varit komplex. Såvitt jag vet är Volta den första relativt mainstreamprocessor som tillkännages som kommer att ha den här funktionen.

Den mobila färdplanen har några av samma funktioner. Företaget tillkännagav nyligen sina Tegra 4 (kodnamn "Wayne") och Tegra 4i (kodnamn "Gray") processorer. "Logan", som kommer att vara i produktion 2014, lägger till den första CUDA-kapabla grafiken i Tegra-linjen. Detta följs 2015 med "Parker", som kommer att kombinera Maxwell GPU-tekniken med företagets första unika CPU-kärnkonstruktion, en 64-bitars ARM-processor känd som Project Denver. (Observera att medan de två processorerna delar GPU-designen, kommer antalet faktiska grafikkärnor sannolikt att vara mycket mindre i en mobil processor än i en skrivbordsversion.)

Detta borde vara intressant både på grund av den enhetliga minnesarkitekturen och eftersom den är planerad att tillverkas med 3D FinFET-transistorer. Intel använder denna teknik i sina 22nm-processorer och båda långvariga Nvidia-tillverkningspartner Taiwan Semiconductor Manufacturing Corp. och konkurrenterna Globalfoundries har sagt att de kommer att ha FinFETS någon gång nästa år. Massproduktionen kommer troligen att starta 2015.

"Om fem år kommer vi att öka Tegras prestanda med 100 gånger, " lovade Huang.

Naturligtvis är den stora frågan vad vi ska använda datorens hästkrafter för. Det är ganska lätt för mig att se applikationerna med hög prestanda och "big data" - de fortsätter att växa och kan enkelt använda GPU: s parallella datorfunktioner. Nvidia kommer att erbjuda dessa funktioner i en mängd olika metoder, bland annat genom sina Tesla-brädor för arbetsstationer och superdatorer; dess GRID CPU-server-virtualiseringsteknik för företagsservrar; och en ny GRID Virtual Computing Appliance (VCA), ett 4U-chassi med Xeon-processorer, Kepler-baserade GPU: er och minne, riktat till avdelningar.

Och naturligtvis kommer spel att använda mer grafik och blir mer realistiska i varje generation. Storleken och upplösningen på skärmar ökar, och människor vill ha mer grafik. Huang visade upp företagets nya avancerade stationära grafikkort, Titan, som körde en realtidssimulering från Waveworks. Det demoade också Faceworks, ett 3D-talande huvud med namnet Ira (ovan), skapat med Institute for Creative Technology på USC.

Att föra alla dessa funktioner till mobilen är särskilt intressant. Jag är inte helt säker på att jag verkligen behöver all kraften i en avancerad desktop-GPU i en mobil enhet - trots allt, på en fem-tums skärm verkar 1.980 av 1.080 vara tillräckligt - men jag tvivlar inte på att människor kommer att hitta användningsområden för det. En oro är att den skulle använda för mycket makt, men Huang sa att Logan skulle vara "inte större än en krona." I alla fall är jag intresserad av att se vad folk kommer att göra med så mycket prestanda.

Sammantaget satsar Nvidia, liksom AMD, på fortsatta grafikförbättringar, enhetligt minne och en heterogen strategi för programmering av CPU och GPU. AMD skulle säga att det fungerar med öppna standarder, medan Nvidia skulle peka på de framgångar som CUDA har, särskilt på den högpresterande arenan. Och naturligtvis finns det Intel, vars grafik fördröjer både AMD och Nvidia idag, men fortfarande dominerar PC-CPU-området. Det har också en egen uppsättning programvaruverktyg. De olika metoderna bör göra detta till ett fascinerande område att titta på.

Nvidia driver minneförbättringar, enhetlig arkitektur för gpus, mobila processorer