Hem Framåt tänkande Supercomputing 17 har några överraskningar, antydningar för framtiden

Supercomputing 17 har några överraskningar, antydningar för framtiden

Video: Essential Scale-Out Computing by James Cuff (September 2024)

Video: Essential Scale-Out Computing by James Cuff (September 2024)
Anonim

Det var några överraskningar vid denna månads Supercomputing 17-konferens, inklusive en mycket bra visning för PEZY-SC2-acceleratorn, liksom Intels riktningsförändring för sin Xeon Phi-linje. Dessutom såg vi också de första systemen byggda på Intels Xeon Scalable Processor (Skylake) och de första med Nvidias Volta-accelerator.

Men kanske mest anmärkningsvärt är nyheten att kinesiska system nu står för 202 av de 500 superdatorerna på den senaste topp 500-listan jämfört med bara 143 från USA. Amerikanska system har dominerat listan sedan starten för 25 år sedan, och för bara några månader sedan hade USA 169 system till Kinas 160. Detsamma gäller när det gäller aggregerade prestanda, där de kinesiska systemen tillsammans står för 35, 4 procent av den totala prestanda för Top 500-systemen.

De snabbaste datorerna i världen är fortfarande de två massiva kinesiska maskinerna som har toppat listan i flera år nu: Sunway TaihuLight, från Kinas National Supercomputing Center i Wuxi, med en långvarig Linpack-prestanda på mer än 93 petaflops (93 tusen biljoner flytande punkt verksamhet per sekund) och Tianhe-2 från Kinas National Super Computer Center i Guangzhou, med en fortsatt prestanda på mer än 33, 8 petaflops. Dessa är fortfarande de snabbaste maskinerna och med en enorm marginal. Piz Daint-systemet från Swiss National Supercomputing Center, ett Cray-system som använder Intel Xeons och Nvidia Tesla P100s, höll tredje plats med Linpack: s fortsatta prestanda på 19, 6 petaflops.

Den största förändringen överst är ett nytt system på fjärde plats: en uppgraderad version av superdatorn Gyoukou, ett ZettaScaler-2.2-system som distribueras vid Japans byrå för marin jordvetenskap och teknik. Den här maskinen använder PEZY-SC2-acceleratorer, en andra generationens 2048-kärnchip som ger en toppprestanda på 4, 996 teraflops i dubbelprecision såväl som konventionella Intel Xeon-processorer för totalt 19 860 000 kärnor. (En tidigare ZettaScaler-maskin med PEZY-SC2 gjorde listan på en lägre nivå i juniversionen). Det ger det högsta antalet kärnor som används tillsammans - även känt som den högsta nivån för samtidighet - hittills sett över TaihuLight, som har 10, 6 miljoner kärnor. Gyoukou-maskinen uppnådde en Linpack långvarig prestanda på 19, 14 petaflops, men det intressanta är att den använder 1, 35 megawatt effekt, jämfört med 2, 27 megawatt för PizDaint, 17, 8 megawatt för Tinahe-2 och 15, 4 megawatt för Taihulight. Det är fortfarande mycket kraft, men det är en stor minskning jämfört med de andra systemen och en stark indikation på att strömhänsyn är viktigt, även för de snabbaste maskinerna i världen. Det är också värt att notera att detta visar hur nya arkitekturer kan minska kraftdragningen dramatiskt.

Det bästa amerikanska systemet förblir Titan-superdatorn på Oak Ridge National Laboratory, ett fem år gammalt system som använder Nvidia K20x GPU-acceleratorer och levererar 17, 59 petaflops, som nu ligger på femte plats på listan.

I den senaste Green 500-listan över de mest energieffektiva superdatorerna gick fyra av de fem toppluckorna - inklusive de tre bästa - till nyinstallerade japanska system, alla baserade på ZettaScaler-2.2-arkitekturen och PEZY-SC2-acceleratorn. Den mest effektiva av dessa är Shoubu System B, som installeras på RIKENs Advanced Center for Computing and Communication. Shoubu System B uppnådde 17, 0 gigaflops / watt; Shoubu System B och de två följande systemen, som använder 16, 8 respektive 16, 7 gigaflops / watt, ligger alla i den nedre halvan av topp 500-listan. Det femte systemet på den gröna rankningen är Gyoukou-systemet som nämns ovan - systemet nummer fyra på topp 500-listan, med 14, 2 gigaflops / watt.

Detta är stora genombrott för PEZY-SC2-acceleratorn och kan peka på framtida riktningar för superdatoriska arkitekturer.

Den fjärde grönaste superdatorn är Nvidias interna DGX SaturnV Volta-system, som uppnådde 15, 1 gigaflops / watt och kommer in på 149 på Top 500-listan. Detta system har 22 440 Volta-kärnor (som verkar räknas på något annorlunda sätt på listan än några av de andra kärnorna.) Nvidia har haft ett mycket bra år för sin accelerator och har stora förhoppningar på fler maskiner som använder Volta GPU-arkitektur.

Som vanligt kråkade de stora leverantörerna om sina framgångar på listan, med Intel som noterade att dess CPU: er var i sex av de tio bästa systemen och ett rekordhögt av 471 av 500 system. Intel noterade också att dess nya Xeon skalbara processorer var i 18 superdatorer med över 25 petaflops prestanda. Men vad som kan vara mer anmärkningsvärt är att Intel sa att det avbryter Knights Hill, den planerade 10nm efterträdaren till 14nm Knights Landing Xeon Phi-processor. Företaget sa att det nu planerar en ny plattform för exascale-system (1 000 petaflops) fram till 2021, men avslöjade inga detaljer.

Nvidia betonade att det hade 34 nya system med sina acceleratorer på listan, vilket förde företagets totala till 87. Nvidia och partner IBM kråkade om möjligheten att när nästa lista är klar i juni, Summit-maskinen vid Oak Ridge National Laboratory (ORNL) bör vara bland maskinerna högst upp på listan. Den här maskinen har 4600 noder, var och en med två IBM Power 9-bas-CPU och 6 Nvidia Volta-acceleratorer, med en planerad prestanda på cirka 200 petaflops. Detta skiljer sig från Nvidias interna lösning, genom att CPU: er och GPU: er alla kommunicerar via NVLink 2.0 på ett cachekoherent sätt med hjälp av OpenCAPI, så att GPU: erna direkt kan komma åt huvudsystem RAM. Toppmötet kommer att följas av Sierra-maskinen vid Lawrence Livermore National Laboratory, och av AI Bridging Cloud Infrastructure (ABCI) -maskin i Japan.

Jag var intresserad av att höra Cray tillkännage en "produktionsklar" superdator baserad på Cavium ThunderX2-processor på 64-bitars Armv8-A-arkitekturen, nu tillgänglig som en del av sin XC50 superdator. ARM-baserade maskiner testas i Barcelona Supercomputer Center (vars Mare Nostrum-maskin nu rankas som nummer 16 på topp 500-listan), liksom "Post-K" superdatorn i Japan och Isambard superdatorn i Storbritannien. Cavium hade några tidiga riktmärken på ThunderX2, som visade att 14nm-chipet fungerade bättre på multigängade eller minnesbundna applikationer än Intels Skylake Xeons, även om Intel förblir ledande inom enkeltrådiga och i råa teraflops. Observera att Qualcomm utöver Cavium-designen också har meddelat ett ARM-baserat serverchip som heter Centriq.

I andra processornyheter tillkännagav AMD att det hade försvagat produktionen av sina Epyc-processorer, även om dessa ännu inte finns i några topp 500-system, medan NEC tillkännagav versioner av sitt Vector Engine PCIe-accelerationskort för sin nya SX-Aurora TSUBASA superdator-serie, som har en särskilt snabb minnesbandbredd.

På sammankopplingssidan sa Mellanox att 77 procent av de nya systemen på Top 500-listan använder InfiniBand, medan Intel utropade de senaste framgångarna med sin Omni-Path Architecture, som mest används i sina Xeon Scalable Processor (Skylake) -system. Samtidigt tittar ett antal leverantörer på Gen-Z, designad för att vara en minnescentrisk strategi med en lägre latens, för mycket höghastighetsanslutningar mellan datorer och minnes / lagringsenheter.

Det är också intressant att notera att alla maskiner på Top 500 för första gången kör Linux.

Mellan det starka första intrycket från PEZY-SC2, Intels beslut att dumpa Knights Mill för en ny arkitektur, Nvidias Volta och ny konkurrens från AMD, ARM-leverantörer och NEC, är det nu en spännande tid i superdatorns värld. Nästa års listor borde vara ganska intressanta, eftersom vi ser vilka arkitekturer som verkligen utför och vilka som är mest effektiva, eftersom många av leverantörerna och superdatorns webbplatser försöker positionera sig i loppet för att producera en exascale (1000 petaflop) dator med en sub -20 megawatt effektdragning.

Är du nyfiken på din bredbandsinternet hastighet? Testa det nu!

Supercomputing 17 har några överraskningar, antydningar för framtiden