Hem Framåt tänkande Amd och Intel öppnar grafikfront i processorkamp

Amd och Intel öppnar grafikfront i processorkamp

Video: 🏆 ЛУЧШИЕ ПРОЦЕССОРЫ для игр на конец 2020 года (September 2024)

Video: 🏆 ЛУЧШИЕ ПРОЦЕССОРЫ для игр на конец 2020 года (September 2024)
Anonim

I en serie av de senaste tillkännagivandena har Intel och AMD separat avslöjat flera viktiga förändringar i arkitekturen för sina x86-processorer, som lovar att förändra hur x86-processorer kommer att användas under de närmaste åren.

Förra veckan tillkännagav AMD en ny minnesarkitektur som syftar till att föra CPU- och GPU-datorer närmare varandra. Intel avslöjade en ny betoning på att förbättra sin position i mer traditionell PC-grafik. I går tillkännagav Intel en helt ny version av mikroarkitekturen för sin Atom-serie processorer, en som borde göra dessa chips mycket kraftigare och potentiellt stänga klyftan mellan Atom och företagets mer mainstream Core-familj av processorer.

AMDs nya minnesarkitektur

AMD: s tillkännagivande om vad det kallar heterogen enhetlig minneåtkomst (hUMA) var inte en stor överraskning, eftersom företaget har pratat om Heterogene Systems Architecture (HSA) under en lång tid.

Konceptet är ganska enkelt. Även i ett chip som har både CPU och grafikbearbetning (GPU) på samma form, som i AMD: s accelererade processorenheter (APU), har minnet som används av CPU och grafiken förblivit i separata pooler. Det finns fysiskt samma minne, men CPU och GPU använder olika pekare till minnet. För att använda GPU för beräkning måste ett program kopiera data från den del av minnet som används av CPU till den del som används av grafiken, göra beräkningen och kopiera den igen. Allt detta tar tid. Med ett verkligt enhetligt minnessystem som inkluderar grafik kommer detta inte att behövas.

AMD driver detta som en del av HSA Foundation, som inkluderar ARM, Qualcomm, Samsung, Texas Instruments, MediaTek och Imagination. I synnerhet använder detta tillvägagångssätt en mjukvarudrift som kallas HSAIL och en uppsättning gränssnitt för HSA-accelererade applikationer.

Denna vecka specificerade AMD hur CPU och GPU i sin HUMA-arkitektur dynamiskt kan tilldela minne från hela minnesutrymmet och använda detta tillsammans med samma virtuella adresseringsschema. Minnet kommer att vara i två riktningar sammanhängande så att alla uppdateringar till minnet som gjorts av CPU eller GPU kommer att ses av de andra behandlingselementen. GPU stöder nu överlägset minne, med virtuella sidor, så det kan fungera med större datasätt (hur CPU: er för närvarande fungerar). Tanken är att CPU och GPU kan arbeta tillsammans mer effektivt. AMD sade att utvecklare kommer att kunna skriva HSA-accelererade applikationer med vanliga programmeringsspråk som Python, C ++ och Java.

AMD är inte det enda företaget som ser heterogen databehandling som viktig och HSA Foundation har också sina konkurrenter. Nvidia har varit en stor förespråkare för vad den brukade kalla GP-GPU genom att driva sina CUDA-API: er och lovade att en framtida version av sina grafikprocessorer kommer att stödja enhetligt minne. Flera av de stora mjukvaruplattformarna har sina egna alternativ: Microsofts DirectCompute-tillägg till DirectX för GP-GPU-datoranvändning och Googles Renderscript API för heterogen databehandling. Kanske viktigast av allt är att Khronos Group, ett industrikonsortium, främjar OpenCL-standarden.

Den stora frågan kommer att vara vilken av dessa standarder som kommer att locka utvecklare. AMD: s första processor som stöder hUMA kommer att vara dess Kaveri-processor, som planeras att ske i slutet av 2013 (men troligen inte i system förrän i början av nästa år). AMD tillhandahåller också APU för PlayStation 4 och ryktas allmänt att de också levererar APU till nästa generations Xbox. Det låter troligt att andra medlemmar i HSA Foundation kan använda hUMA-arkitektur också, men ingen har ännu meddelat några sådana mönster. Tillsammans kan detta räcka för att skapa kritisk massa för utvecklare och för verktyg och i så fall kan det visa sig vara mycket viktigt.

Intel fördubblar grafik för Haswell

I slutet av förra veckan avslöjade Intel mer information om sin kommande 4: e Generation Core-processor, en 22nm produkt känd som Haswell. Intel hade tidigare avslöjat ett antal nya funktioner för Haswell inklusive nya AVX2-instruktioner för att arbeta med större heltalvektorer och fused multiply-add (FMA) instruktioner för flytande punkt. Detta är saker som slutanvändare troligen inte kommer att se, förutom när det gäller förbättrad prestanda i ganska specialiserade arbetsbelastningar.

Det som är mest intressant med det nya tillkännagivandet är fokus på grafik, ett område där konkurrenterna AMD och Nvidia säkert har haft en ledning.

Men Intel tar några stora steg med Haswell-processorerna. Intel har länge sagt att det kommer att lägga till mer grafik till matrisen för vissa modeller av Haswell, inklusive en avancerad version känd som GT3. Effektivt är detta bara ytterligare grafikinstruktionsenheter, över beloppen i de nuvarande Ivy Bridge-processorerna. Av sig självt är detta en stor förändring eftersom Intel i sina produkter vanligtvis har ägnat mer die-utrymme till CPU-utrymme medan AMD: s konkurrerande APU-enheter har ägnat mer die-utrymme till grafik.

Men Intel visade nyligen en annan variant, vad den kallar GT3e-grafik, som lägger till en andra matris med 128 MB inbäddad DRAM till paketet som innehåller Haswell-formen och är utformad för att snabba grafikprestanda. Förra veckan meddelade Intel att högre hastighetsversioner av GT3-grafiken nu kommer att kallas Iris, och de med den inbäddade DRAM kommer att kallas Iris Pro, eftersom Intel hoppas få en viss varumärkesfördel för de nya grafiknivåerna.

I synnerhet kommer Haswell-linjen att segmenteras med versioner med en liten mängd grafik (GT1) som kallas HD Graphics; med GT2-grafik (motsvarande high-end av Ivy Bridge-linjen) som kallas HD Graphics 4200 till 4600, beroende på hastighet; med GT3-grafik men körs på 15 watt som kallas HD Graphics 5000; de delar med GT3-grafik som går med 28 watt och högre kommer nu att kallas Intel Iris Graphics 5100; och de med GT3e-grafik och inbäddad grafik som heter Iris Pro 5200. (Intel har aldrig varit en för att namnge enkelhet.)

Intels delnummer förblir komplicerade men observera att ett delnummer som börjar med 4 indikerar Haswell medan ett som börjar med en 3 indikerar Ivy Bridge. Företaget använder MQ för att ange standard GT3-bärbara delar och HQ för att indikera delar som har den inbäddade DRAM.

Som del av tillkännagivandet delade Intel prestandanummer för de nya delarna och visade betydande prestandaförbättringar jämfört med företagets befintliga processorer. Intel visade siffror som tyder på Ultrabook-prestanda på upp till 1, 5 gånger den föregående generationen på ungefär samma strömförbrukning (och dubbelt så hög prestanda med ett högre wattchip riktat till något större bärbara datorer, de med 14-in och större skärmar), två gånger grafiken prestanda på traditionella bärbara datorer och nästan tre gånger prestandan på stationära system.

Intel säger att den nya Iris och Iris Pro-grafiken är jämförbara med diskreta GPU: er, och det är en stor sak. (Som alltid tar jag alla prestandanummer med ett saltkorn tills jag faktiskt kan testa produkterna.) Jag är säker på att det fortfarande finns mycket högre prestanda diskreta skrivbordsdelar från AMD och Nvidia för spel- och arbetsstationsapplikationer, men vanligtvis använder dessa delar mycket kraft. I bärbara datorer i full storlek där krafthöljet är mycket mindre är grafik på skärmen viktigare men det har fortfarande varit en stor marknad för diskret grafik. Intel verkar vara riktat mot den marknaden. Ultrabooks och andra tunna anteckningsböcker har vanligtvis inte haft kraftkravet för att köra diskret grafik, så förbättrad grafik på-die är verkligen välkommen.

Intels nya Atom-mikroarkitektur

I många avseenden betraktade dock det största meddelandet från Intel sin lågkraftsarkitektur, som är avsett att ersätta den arkitektur som används i företagets nuvarande Atom-arkitektur. Atom-familjen är mest känd för att användas i mobila enheter, till exempel surfplattor och i mindre grad några smarta telefoner. Den nya arkitekturen, som kallas Silvermont, syftar också till en mängd olika datacenter och inbäddade marknader.

Arkitekturen representerar en stor förändring. I stället för den exekverade exekveringsmotorn som användes i tidigare versioner av Atom-arkitekturen, inklusive Saltwell-arkitekturen som användes på företagets nuvarande 32nm Atom-versioner, lägger Silvermont till en out-of-order exekveringsmotor, som används i Intels Core- och Xeon-processorer. Detta skulle betydligt förbättra enkeltrådad applikationsbehandling. Det erbjuder en ny systemvävarkitektur, utformad för att skala upp till åtta kärnor (troligen för applikationer som mikroservrar). Slutligen lägger den till nya instruktioner (för att göra det i nivå med de som används i Westmere-versionen av Core-processorerna), och nya säkerhets- och virtualiseringsteknologier.

Den nya arkitekturen har en modulär design baserad på moduler som innehåller två kärnor, 1 MB delad L2-cache (mycket låg latens, hög bandbredd) och ett dedikerat punkt-till-punkt-gränssnitt till SoC-tyget. Observera att detta ersätter konceptet med flera trådar som Intel har kraftigt främjat, och i själva verket låter lite som AMDs modulära tillvägagångssätt som används i dess nuvarande desktop och serverchips. (Intel gick dock ur sitt sätt att förklara att det inte var samma sak; AMDs moduler delar fler saker inklusive flytande punkt.) Modulerna kan kombineras för att inkludera upp till åtta kärnor.

För energiförbrukning säger Intel att den nya arkitekturen tillåter ett bredare dynamiskt effektområde och tillåter varje kärna sin egen oberoende frekvens och effekthantering, vilket gör att varje rörelse går upp och ner i prestanda och effektdragning. (I kontrast till mobila processorer är det mer som Qualcomm använder med sina Krait-kärnor än den mer standard-ARM big.LITTLE-kombinationen.) Den är också designad med förbättrad effekthantering och snabbare in- och utgång från standby-lägen, funktioner som är särskilt viktiga på mobilmarknaden.

Företaget säger att det bättre kan justera kraften mellan CPU-kärnan och andra element som grafik, vilket möjliggör en mer sofistikerad implementering av burst-läget.

Sammantaget säger Intel att den nya arkitekturen och en övergång till företagets 22nm FinFet SoC-process borde tillåta chips som erbjuder upp till tre gånger högre prestanda eller fem gånger lägre effekt än nuvarande Atom-chips. I allmänhet sa Intel att den "effektiva" dubbelkärnan kan överträffa en ineffektiv nuvarande fyrkärniga processor under strömbegränsningar. (Återigen, som alltid, väntar jag på att produkterna bedömer detta.)

Precis som den nuvarande Atom-linjen kommer Silvermont-arkitekturen sannolikt att användas i en mängd processorer, allt från sådana som riktar sig till mobila enheter till större system. Dessa bör omfatta Avoton, riktad till mikroservrar, Rangely riktad till nätverksenheter, Merrifield riktad mot smartphones och Bay Trail riktad mot surfplattor och konvertibler. Av dessa är den mest efterlängtade 22nm Bay Trail-plattformen, som Intel förväntar sig att ha på marknaden i tid för att surfplattor ska vara tillgängliga vid högsäsongen, med mer information kommer inom kort.

Sammantaget låter Silvermont-arkitekturen som ett stort steg upp från den befintliga Atom-arkitekturen, och jag är särskilt intresserad av att se hur Bay Trail, baserat på denna arkitektur, faktiskt fungerar. Hittills har det varit ett märkbart prestationsgap mellan kärnfamiljens låga ände och avancerade atomer, men denna arkitektur ser ut som om den verkligen skulle kunna stänga klyftan.

Slutsats: Grafik och Power Define Competition

Varje större processor du ser idag - oavsett om ett Intel- eller AMD-chip riktat till stationära datorer eller bärbara datorer eller ett ARM-baserat chip riktat mot smartphones och surfplattor - har flera CPU-kärnor, vanligtvis flera GPU-kärnor (förutom serverchips), och alla typer av annan specialiserad logik för saker som bildbehandling, videokodning och avkodning och hantering av kryptering.

När chipprocessen blir mindre kan fler transistorer inkluderas på ett enda chip. Men vilka funktioner som ska integreras (och hur man integrerar dem) förblir en viktig differentierare bland chipleverantörerna, liksom den specifika designen och mikroarkitekturen för själva chips.

Dessa tillkännagivanden visar de avvägningar som Intel och AMD gör, och dessa borde ha enorma konsekvenser för datorer under de närmaste åren.

För stationära och bärbara datorer ser Intel ut som om det inte bara försöker fånga upp AMD med inbyggd grafikprestanda genom att lägga till fler exekveringsenheter, utan också försöka gå vidare med funktioner som inbäddad DRAM och dra nytta av sin processteknik leda. AMD kommer inte heller att sitta stilla med sin grafik, så det borde göra en intressant matchup. Samtidigt driver AMD hårt för att bättre integrera grafik- och CPU-funktioner, vilket kan resultera i ett nytt sätt att programmera; det tar längre tid, men kan visa sig vara oerhört viktigt.

Striden mellan AMD: s Kaveri och Intels Haswell kan därför vara mer intressant än Intel-AMD-tävlingen de senaste åren. Haswell kommer säkert att skicka först. (Jag förväntar mig att se system i sommar, kontra i början av nästa år för Kaveri.) Återigen är detta mest för vanliga stationära stationära datorer och bärbara datorer. Spelare och användare av arbetsstationer kommer fortfarande utan tvekan att para ihop antingen chip med diskreta grafiklösningar från antingen AMD eller Nvidia.

För surfplattor och potentiellt så småningom telefoner kan den heterogena systemarkitekturstrategin som AMD och andra driver driva visa sig vara ännu viktigare, även om det åter kommer att ta ett tag att se om applikationer verkligen drar nytta av det. Intels nya arkitektur borde göra den mer konkurrenskraftig i detta utrymme. Det ser verkligen ut som ett stort steg framåt, men konkurrenterna kommer också att fortsätta.

Jag är lite nyfiken på om saker som den Silvermont-baserade Bay Trail-plattformen för Atom faktiskt körs tillräckligt snabbt så att det börjar dyka upp i mer mainstream low-end bärbara datorer eller till och med stationära datorer. Redan dagens Atom-baserade surfplattor kör Windows rimligt bra, och med förbättringarna kan det räcka för många mainstream-användare, även om det ligger bakom prestandan hos Haswell eller Kaveri (eller Intels nuvarande Sandy Bridge och AMD: s nuvarande Richmond, för det materia).

Det borde göra en spännande tävling under året som kommer.

Amd och Intel öppnar grafikfront i processorkamp