Hem Framåt tänkande Superdator 15: större förändringar i horisonten

Superdator 15: större förändringar i horisonten

2024

Video: Genetic Engineering Will Change Everything Forever – CRISPR (September 2024)

När jag tittar på tillkännagivanden och förfarandena för förra månadens Supercomputing 15 (SC15) -konferens i Austin, verkar det som om högpresterande datoranvändning kan vara lite avslappnad, men det är en marknad som är beredd för några stora förändringar under året komma.

Om du tittar på ledarna på top500-listan, den två gånger om året listade världens snabbaste datorer, är ledaren för sjätte gången i rad Tianhe-2, en superdator byggd av Kinas National University of Defense Technology. Enligt top500-listan levererar denna maskin 33, 86 petaflop / s (kvadrillioner beräkningar per sekund) av långvarig prestanda på Linpack-benchmark och 54, 9 petaflop / s av teoretisk toppprestanda. Detta är baserat på Intel Xeon och Xeon Phi-processorer.

Andra plats fortsätter att gå till Titan, ett Cray XK7-system baserat på AMD Opteron-CPU: er och Nvidia K20x GPU: er installerade vid DOE: s Oak Ridge National Laboratory, vid 17, 59 petaflop / s av långvarig prestanda på Linpack-benchmark.

Två nya maskiner knäckte topp 10. Trinity-datorn vid Lawrence Livermore National Laboratory (LLNL) är sjätte med 8, 1 petaflop / s, medan Hazel-Hen-systemet vid Tysklands Höchstleistungsrechenzentrum Stuttgart (HLRS) kom på åttonde med 5, 6 petaflop / s. Båda är Cray XC-maskiner, baserade på Intel Xeon-processorer med Väduren samtrafik.

Större förändringar inträffar längre ner på listan, särskilt med en stor ökning av antalet kinesiska system, som växte till 109, jämfört med bara 37 i den föregående listan. Delvis verkar detta vara från fler kinesiska system som kör riktmärken och skickar in resultat för listan. Som ett resultat sjönk antalet amerikanska system från 231 till 200, vilket är det lägsta antalet sedan listan startades 1993; och antalet europeiska system sjönk från 141 till 108.

En stor trend är en ökning av antalet system som använder acceleratorer eller samarbetare, som steg till 104 system på den aktuella listan, upp från 90 i juli. Majoriteten av dessa system använder Nvidia Tesla GPU: er, följt av Intels Xeon Phi-processorer, med några få som använder en kombination. Nvidia påpekade att det var i 70 av dessa system, inklusive 23 av de 24 nya systemen på listan.

Vid utställningen markerade Nvidia tillväxten av acceleratorer, och särskilt antalet applikationer som nu finns tillgängliga optimerade för företagets CUDA-arkitektur. Företaget säger att 90 procent av de 10 högsta datorns högpresterande applikationer och 70 procent av de 50 bästa är nu påskyndade. En spännande användning är för system som kör vädersimuleringar, en viktig applikation för dator med hög prestanda, eftersom väderprognoser produceras av alla slags regeringar. Cray hade tidigare pekat på användningen av sådana acceleratorer vid det schweiziska meteorologikontoret (MeteoSwiss) och har pratat om hur det fungerar med forskare i Schweiz för att skriva om många av dess applikationer. Nvidia pekar nu på användningen av acceleratorer från National Oceanic and Atmospheric Administration (NOAA) för en del av dess väderprognoser också.

Bland andra applikationer, Cray spionerad olja och gas applikationer, såsom att använda 3D geofysik för att simulera en reservoar, liksom finansiella tjänster, såsom riskbedömning. Sådana applikationer utgör sällan de snabbaste systemen i världen, men är en indikation på att högpresterande datoranläggning spelar en bredare roll i fler företagsapplikationer. Cray har talat om en stadig progression till att köra större och mer detaljerade modeller över alla vetenskapliga och tekniska discipliner och kombinera traditionella arbetsbelastningar med analys.

Jag var också intresserad av ett tillkännagivande från Linux Foundation om en ny insats som heter OpenHPC, utformad för att skapa mer öppna standarder i HPC-världen. Det är en intressant idé och en som verkar ha många av de stora spelarna som skriver sig på.

Det finns ett antal nya system i arbeten. IBM bygger en ny maskin som heter Summit at Oak Ridge National Laboratories (ORNL) och en annan som heter Sierra på Lawrence Livermore National Laboratory (LLNL), båda baserade på IBM Power-arkitektur CPU, Nvidia Tesla GPUs och Mellanox samtrafik. Toppmötet förväntas leverera 150 till 300 topp petaflop / s, och Sierra över 100 petaflop / s.

Dessutom bygger Intel och Cray en ny maskin som heter Aurora, baserad på de kommande Knights Hill Intel Xeon Phi-processorerna för The Argonne Leadership Computing Facility (del av Argonne National Labs), som syftar till 150 petaflops under 2018. Alla dessa ingår i ett avdelning för energiprogram som kallas Collaboration of Oak Ridge, Argonne och Lawrence Livermore nationella laboratorier (CORAL), som syftar till att påskynda utvecklingen av högpresterande datoranvändning, och specifikt FastForward 2-projektet.

Vi har fortfarande en lång väg att gå mot "exascale computing."

Under tiden fanns det flera processormeddelanden som kunde lova bra för framtiden. Nvidia drev i synnerhet användningen av superdatorer för hyperskala webbapplikationer, särskilt maskininlärning. Den tillkännagav några något lägre produkter: Tesla M40-kortet med 3072 CUDA-kärnor, som det sades kunna utföra vid upp till sju teraflop / s med enkel precision, främst inriktat på "deep learning" -utbildning, och M4, ett lägre effektkort med 1024 kärnor och 2, 2 precisionsteraflop / s, som kan användas för djup inlärningsstörning samt saker som bild- och videobearbetning. Dessutom tillkännagav företaget en ny "hyperscale suite" med applikationer riktade till de största datorplatserna. Båda de nya hårdvaruprodukterna är baserade på 28nm processteknik och företagets Maxwell-arkitektur.

Företaget har meddelat två uppföljningsarkitekturer, kända som Pascal, som kommer att komma nästa år, och Volta, som kommer att följa den. Intel fokuserade på hur HPC påverkar vetenskapen, och jag blev fascinerad av sin beskrivning av hur den använder sin egen superdator - för närvarande rankad 99 på topp 500-listan - för att hjälpa till att utforma egna processorer. I synnerhet sade företaget att det använder en miljon CPU-timmar bara för att designa fotomasker för nästa generations processorer.

Mycket av Intels aktivitet var inriktat på Knights Landing, nästa version av Xeon Phi-chipet, som kan användas som en accelerator men också startad. och dess Omni-Path-tyg. Trots att Intel nu säger att allmän tillgänglighet kommer att vara under första halvåret 2016 har några kunder tidigt tillgång till Knights Landing. För närvarande testar Cray ett stort Knights Landing-system som förberedelse för att leverera en ny superdator som heter Cori för National Energy Research Scientific Computing Center (NERSC) och Los Alamos National Laboratory och Sandia National Laboratories, nästa år. Bull, en enhet av den franska systemintegratören Atos, har också fått tidiga versioner av Knights Landing för att förbereda Tera 1000-systemet som det bygger för den franska alternativa energikommissionen och Atomic Energy Commission. Argonne Leadership Computing Facility arbetar på ett system som heter Theta, som ska levereras nästa år, och Sandia National Laboratories arbetar med Penguin Computing för att uppgradera flera system som använder tidigare generationer av Xeon Phi-co-processorer.

Intel har tidigare sagt att det kommer att finnas tre olika versioner av Knights Landing: en baslinje-värdprocessor (som kan starta själv), en värdprocessor med ett integrerat Omni-Path-tyg och ett PCIe-acceleratorkort. Själva chipet kommer att bestå av 36 brickor vardera med två CPU-kärnor (totalt 72 kärnor), fyra vektorbehandlingsenheter (två per kärna), 1 MB delad L2-cache och ett cachemedel för att upprätthålla koherens; och Intel har sagt att det borde leverera ungefär tre gånger den skalära prestandan för Knights Corner-CPU: n med 3 teraflop / s dubbel precision och 6 teraflop / s toppprecision. Den använder också ett nytt minnessystem som heter MCDRAM, på paketminnet med över 3 gånger den tillgängliga bandbredden jämfört med att gå ut till DDR4 som verkar vara en variant på Hybrid Memory Cube-arkitekturen som Intel och Micron har talat om. På utställningen hade Cray ett prototypsystem med en startbar Knights Landing, och ett antal andra leverantörer visade system designade för Knights Landing. Denna version av Xeon Phi är planerad att följas av en version som kallas Knights Hill, som ska byggas på den kommande 10nm-processen.

Dessutom talade Fujitsu lite mer om sitt Flagship 2020-projekt, baserat på ett nytt chip känt som FX100 med 32 kärnor. Detta förväntas ge ungefär fyrdubbla flytande punktprestanda över den nuvarande FX10, och precis som Knights Landing kommer Fujitsus FX100 också att använda en version av Hybrid Memory Cube-arkitekturen. Dessutom har NEC ett projekt som heter Aurora (inte relaterat till CORAL-projektet), baserat på dess uppföljning till SX-ACE-chipet men med större minnesbandbredd. Detta är riktat för 2017.