Intel, AMD a Nvidia navrhují nový standard pro zefektivnění zpracování AI • TechCrunch

Ve snaze o rychlejší a efektivnější vývoj systému AI dnes Intel, AMD a Nvidia zveřejněno návrh specifikace toho, co označují jako společný formát výměny pro AI. Navrhovaný standard „8bitové pohyblivé řádové čárky (FP8)“ je sice dobrovolný, ale podle nich má potenciál urychlit vývoj umělé inteligence optimalizací využití hardwarové paměti a práce pro trénink umělé inteligence (tj. inženýrské systémy umělé inteligence) a odvození (spouštění systémy).

Při vývoji systému umělé inteligence se datoví vědci potýkají s klíčovými technickými možnostmi, než je pouhé shromažďování dat pro trénování systému. Jedním z nich je výběr formátu reprezentujícího váhy systému – váhy jsou faktory získané z tréninkových dat, které ovlivňují předpovědi systému. Váhy umožňují například systému jako GPT-3 generovat celé odstavce z věty dlouhé, nebo DALL-E 2 vytvářet fotorealistické portréty z titulku.

Mezi běžné formáty patří plovoucí desetinná čárka s poloviční přesností nebo FP16, který používá 16 bitů k reprezentaci vah systému, a jednoduchá přesnost (FP32), který používá 32 bitů. Poloviční přesnost a nižší přesnost snižují množství paměti potřebné k trénování a provozování systému AI a zároveň zrychlují výpočty a dokonce snižují šířku pásma a spotřebu energie. Ale obětují určitou přesnost, aby dosáhli těchto zisků; koneckonců, 16 bitů je méně pro práci než 32.

Mnoho v tomto odvětví – včetně Intel, AMD a Nvidia – se však spojuje kolem FP8 (8 bitů) jako sladkého bodu. V příspěvku na blogu vedoucí produktový marketingový manažer skupiny Nvidia Shar Narasimhan poznamenává, že výše uvedený navrhovaný formát, kterým je FP8, vykazuje „srovnatelnou přesnost“ s 16bitovou přesností napříč případy použití, včetně počítačového vidění a systémů pro generování obrazu, přičemž poskytuje „významné“ zrychlení.

Nvidia, Arm a Intel tvrdí, že svůj formát FP8 vydávají bez licencí, v otevřeném formátu. Podrobněji to popisuje dokument whitepaper; Narasimhan říká, že specifikace budou předloženy IEEE, profesionální organizaci, která udržuje standardy v řadě technických domén, ke zvážení později.

„Věříme, že společný formát výměny umožní rychlý pokrok a interoperabilitu hardwarových a softwarových platforem pro pokrok v oblasti výpočetní techniky,“ Narasimhan.

Trio nutně netlačí na rovnost z dobroty svých srdcí. Architektura GH100 Hopper společnosti Nvidia nativně implementuje FP8, stejně jako tréninkový čipset Intel Gaudi2 AI. Očekává se, že AMD bude podporovat FP8 ve svém nadcházejícím APU Instinct MI300A.

Společný formát FP8 by však také prospěl soupeřům, jako jsou SambaNova, Groq, IBM, Graphcore a Cerebras – z nichž všechny experimentovaly nebo přijaly nějakou formu FP8 pro vývoj systému. V blog v příspěvku letos v červenci spoluzakladatel Graphcore a technický ředitel Simon Knowles napsal, že „nástup 8bitové pohyblivé řádové čárky nabízí ohromné ​​výhody výkonu a efektivity pro výpočetní umělou inteligenci“, přičemž tvrdil, že je to také „příležitost“ pro průmysl usadit se na „ jeden otevřený standard“ spíše než uvádění směsi konkurenčních formátů.

Leave a Comment

Your email address will not be published.