Video: Bärbara datorer startar, men skärmen förblir tom – Windows 8 (November 2024)
Under de senaste åren har vi sett några intressanta nya tillvägagångssätt för dator med hög prestanda, i synnerhet en förskjutning från traditionella stora processorer och mot kluster av x86-CPU: er med acceleratorer eller coprocessorer för att påskynda vissa typer av beräkningar. När vi kom ut från förra veckans Supercomputing-show såg vi Intel pressa på för att integrera sin Xeon Phi-processor med sin traditionella Xeon-serverprocessor för att underlätta programmeringen; Nvidia introducerar en ny version av sin Tesla GPU-accelerator; och Micron stödjer en helt annan typ av processor för ännu mer specialiserad datoranvändning. Och allt detta hände i en tid då acceleratorer och coprocessorer kommer att dominera Topp 500-listan över världens snabbaste datorer, vilket ledde till att vissa experter föreslår att de befintliga riktmärkena ger för mycket vikt för dessa processorer.
Nvidia utarbetade sina framgångar med sina Tesla-acceleratorkort, stora kluster av GPU: er anslutna till huvudprocessorer från antingen Intel eller AMD. Sådana chips används i en mängd olika system, inklusive Titan-systemet vid Oak Ridge National Laboratory och det nya Piz Daint-systemet vid Swiss National Supercomputing Computing Center. Mer intressant säger företaget att Tesla-styrelserna finns i alla de 10 bästa systemen på den senaste Green 500-listan över världens mest energieffektiva superdatorer. Alla dessa system använder också Intel Xeons, med undantag för AMD Opteron-baserade Titan, som är det näst snabbaste systemet i världen på Top 500 men rankas mycket lägre på Green 500-listan.
Dessutom tillkännagav Nvidia ett partnerskap med IBM för att erbjuda sina Tesla-acceleratorer i system baserade på IBM Power-arkitekturen. IBM har länge prövat sin seriella prestanda, och sitt BlueGene / Q-system baserat på Power-processorer driver Sequoia-systemet på Lawrence Livermore National Laboratory och Mira-systemet på Argonne National Laboratory bland andra. Att ha IBM och Nvidia tillsammans ska leda till några intressanta system i framtiden.
På utställningen tillkännagav företaget sin Tesla K40, nästa generations GPU-acceleratorkort. Företaget sa att det kommer att erbjuda 1, 4 teraflops med prestanda med dubbel precision, 12 GB minne (288 GBps bandbredd) och en GPU Boost-funktion, som gör att den kan köras med en snabbare klockhastighet i vissa situationer. Detta är en uppgradering från den befintliga Tesla K20-serien, med samma grundläggande GPU-design som produceras på 28nm-teknik.
Andra initiativ inkluderar sätt att underlätta GPU-programmering, inklusive CUDA 6, som nu stöder enhetligt minne, vilket låter utvecklare närma sig minnet som en enda pool, även om CPU och GPU-minne förblir separata. Företaget stöder också OpenACC, en standardsamling av kompilatordirektiv som säger systemet vilka delar av programmet (skrivna i C / C ++ och Fortran) som kan laddas från CPU till en accelerator för att öka prestandan.
Intels strategi, som den kallar sin Many Integrated Core (MIC) -arkitektur, är mycket annorlunda. Den kombinerar flera små x86-kärnor i ett enda chip som kallas Xeon Phi. Under de senaste åren har Intel framhållit det faktum att allt är x86 som gör det lättare att programmera, även om det är tydligt att utvecklare fortfarande måste rikta in sig på arkitekturen direkt. Den nuvarande versionen av Xeon Phi, kallad Knights Corner, är utformad för att användas som en accelerator tillsammans med mer traditionella Xeon E-serverchips, och används av en mängd toppsystem, inklusive Kinas Tianhe-2 (för närvarande det snabbaste systemet i världen) och Stampede-systemet vid Advanced Computing Center vid University of Texas.
Vid utställningen tillkännagav Intel en ny version med kodnamnet Knights Landing, som också kommer att fungera som en fristående CPU som kan passa in i en standard rackarkitektur och köra operativsystemet direkt, utan att behöva en värd-CPU (som Xeon E). Detta kan vara ganska viktigt för att bredda överklagandet från Xeon Phi, särskilt på arbetsstationsmarknaden. Återigen är detta utformat för att göra det lättare för mjukvaruutvecklare att se det som en enda CPU. Knights Landing kommer att finnas både som en fristående CPU och som ett PCI Express-kort som passar in i befintliga system som en uppgradering från Knights Corner.
Det finns andra betydande förändringar av Knights Landing också, inklusive att lägga till "nära minne", effektivt DRAM som erbjuds på paketet med CPU och därmed kan leverera en mycket högre bandbredd än det traditionella DDR-minnet, vilket begränsas av hastigheten på bussen. (Det blir också snabbare, men inte så mycket.) Det här är inte det första steget i denna riktning; IBM har spionerat inbyggd DRAM i sin Power-arkitektur i flera år och Intel själv lägger in inbäddad DRAM för grafik i Iris Pro-versionerna av sin Haswell Core-familj. Jag antar fortfarande att vi kommer att se mycket fler ansträngningar i denna riktning under de kommande åren.
Samtidigt kommer en av de mest intressanta nya tillvägagångssätten från Micron, som tillkännagav en ny accelerator som kallas en Automata-processor som främst är utformad för att hantera komplexa ostrukturerade dataproblem.
Micron beskrev detta som att erbjuda ett tyg bestående av tiotusentals till miljoner bearbetningselement anslutna för att lösa specifika uppgifter. Företaget, en av de största tillverkarna av DRAM- och NAND-minne, säger att detta kommer att använda minnebaserad behandling för att lösa komplexa datorutmaningar inom områden som nätverkssäkerhet, bioinformatik, bildbearbetning och analys. Micron kommer initialt att distribuera Automata-processorn på ett PCI-Express-kort för att få utvecklare att arbeta med den, men företaget planerar att sälja processorerna på standardminnesmoduler, kända som DIMM, eller som enskilda chips för inbäddade system. På vissa sätt låter detta liknande fältprogrammerbara grindmatriser (FPGA), som är inställda för att lösa vissa applikationer som involverar mönster-matchning.
Företaget sa att det arbetar med Georgia Tech, University of Missouri och University of Virginia för att utveckla nya applikationer för Automata. Även om företaget inte har meddelat ett datum för slutprodukter, planeras ett program för utveckling av programvara att komma ut nästa år, tillsammans med simuleringsverktyg.
Automata låter som ett pågående arbete och det är antagligen för tidigt att veta hur breda applikationerna är, men det är ett intressant tillvägagångssätt.
Sammantaget ser vi utvecklingen av högpresterande datoranvändning. För inte för många år sedan var de snabbaste datorerna för det mesta bara ett stort antal standard-serverprocessorer. Faktum är att IBM Blue Gene-system och de som är baserade på Sparc (som K-datorn vid RIKEN Advanced Institute for Computational Science i Japan, som använder Fujitsu Sparc-processorer) fortfarande står för en stor del av marknaden, inklusive fem av de 10 snabbaste system i världen. Men de senaste åren har momentumet svängit mot coprocessor, med system som använder Tesla och nyligen Xeon Phi-acceleratorer utgör mer av de nyare systemen. Med förbättringar i dessa system, nya partnerskap, bättre programvara och några nya tillvägagångssätt kan den superdatoriska marknaden vara mycket annorlunda i framtiden.