SiFive pohání umělou inteligenci s procesory X160, X180, X280 Gen 2, X390 Gen 2 a XM Gen 2

  • Nová řada SiFive Intelligence Gen 2: X160/X180 pro edge framework, X280/X390 pro pokročilé vektorování a XM s maticovým enginem.
  • Podpora formátů RVA23, RVV 1.0 a BF16/MXFP8/MXFP4; rozhraní VCIX/SSCI pro připojení koprocesorů s přímým přístupem k registrům.
  • X390 Gen 2 se škáluje na 4 koherentní jádra s rychlostí až 1 TB/s; XM Gen 2 dosahuje 64 TFLOPS FP8 na cluster a v multiclusteru překračuje 4 PFLOPS.
  • IP již licencovatelné; první čipy založené na nich jsou plánovány na druhý kvartál roku 2026.

Rodina SiFive Intelligence Gen 2

Nová várka IP adres od SiFive Přichází s pevnými základy a s povoláním pokrýt vše: od IoT a robotika k srdci datová centraSpolečnost představuje druhou generaci své řady Intelligence s pěti klíčovými prvky: X160 Gen 2, X180 Gen 2, X280 Gen 2, X390 Gen 2 a XM Gen 2, všechny založené na architektuře RISC-V a zaměřené na moderní úlohy umělé inteligence.

Není náhoda, že tato aktualizace byla oznámena na referenčním fóru, jako je například AI Infra SummitTrh se tlačí směrem k konfigurovatelnějším, škálovatelnějším a efektivnějším řešením a SiFive reaguje integrací... skalární, vektorové a maticové enginy v rámci jediné strategie. Firma se dále snaží zkrátit dobu a náklady na návrh pomocí dobře propojených IP bloků a nových rozhraní koprocesoru optimalizováno pro urychlení vývoje.

Co přináší druhá generace SiFive Intelligence

V této části SiFive vylepšuje svůj vzorec kombinací flexibilita a výkon na watt. Řada Intelligence Gen 2 konsoliduje heterogenní výpočetní přístup, který integruje výkonná skalární jádra s Vektory RVV 1.0 a v případě XM motor matice vlastní, to vše s paměťovou strategií navrženou tak, aby zkrátila šířku pásma a omezila úzká hrdla.

Společnost si zachovává svou designovou filozofii modulární a přidává dvě cesty propojení akcelerátoru: rozšíření rozhraní vektorového koprocesoru (VCIX) a rozhraní skalárního koprocesoru (SSCI). Tato rozhraní umožňují akcelerátorům přímý přístup Registry CPU, zjednodušení softwaru, snížení latence a zlepšení efektivity dat při integraci externích koprocesorů nebo specializovaných enginů.

Na pozadí prognóz, že podle Deloitte, očekávají růst 20% pracovní zátěže umělé inteligence ve všech technologických oblastech a až do výše 78 % v oblasti edge computinguKrok společnosti SiFive dává velký smysl. Cílem je nabídnout licencované součástky, které umožní výrobcům originálního vybavení (OEM) a poskytovatelům cloudových služeb vytvářet... platformy AI modulární a připravený na budoucnost.

Kromě hardwaru společnost podniká důležitý krok i v softwarovém ekosystému: SiFive urychluje uvedení produktů na trh. vydání jako open source jeho knihovnu jádra SiFive. Tato iniciativa doplňuje návrh rozhraní VCIX/SSCI a jejím cílem je vývoj Zásobníky umělé inteligence rychlejší a levnější.

X160 a X180 Gen 2: Efektivita pro Edge a IoT

Nový X160 Gen 2 (32 bitů) a X180 Gen 2 (64bitové) jsou určeny pro scénáře s omezeným výkonem a prostorem, jako například IoT zařízení, drony y autonomní robotikaSdílejí podporu 128bitových vektorových registrů a 64bitovou datovou cestu, což jim umožňuje efektivní provoz. formáty čísel populární v umělé inteligenci, jako je INT8 a BF16.

Z hlediska škálování lze oba seskupit do klastry až se čtyřmi jádry, čímž se dosahuje velmi atraktivní rovnováhy mezi výkonem a spotřebou. Tento přístup umožňuje přizpůsobit výkon každému případu použití, aniž by se obětovalo energetická účinnost že okraj vyžaduje.

Skutečnost, že integrují 128bitové vektory v tomto „lehkém“ rozsahu, odhaluje záměr SiFive: vzít výpočet Opravdu užitečná umělá inteligence k senzorům, řídicím jednotkám a robotům, které fungují na baterie nebo na omezené tepelné rozpočty, bez penalizace nákladů nebo silikonový povrch.

Pro aplikace, které potřebují zpracovávat strojové vidění, klasifikaci signálů nebo inteligentní monitorování, tato jádra nabízejí přesně tu správnou sadu vektorových funkcí s velkorysou (64bitovou) datovou cestou a podporou pro typy se sníženou přesností které ovlivňují závěr.

X280 Gen 2: Zralá vektorizace optimalizovaná pro hrany

Série X280 již pochází z první generace s velmi dobrým přijetím v oblasti AI/ML a recenze X280 Gen 2 zdvojnásobuje se na hraně s mikroarchitekturou 8 stupňů, dvojité emise, v pořadí a superskalární. Toto jádro je schopné více jader a je vyladěno pro výpočetní techniku ​​s využitím umělé inteligence/strojového učení na okraji sítě s rozšířením o široký vektor, navržené tak, aby RVV 1.0 a jejich vlastní Rozšíření inteligence SiFive.

Konkrétně X280 Gen 2 nabízí vektorové zpracování s 512bitová VLEN a 256bitovou DLEN, konfiguraci, která umožňuje efektivní paralelizaci typických operací s vizuálními, zvukovými a odlehčenými modely. Tato šířka vektoru spolu s rozšířeními specifickými pro SiFive zrychluje kritická jádra které označují výkon reálných aplikací.

Další klíčovou změnou je zjednodušení hierarchie paměti: paměťová vrstva je odstraněna. Mezipaměť L3 ve prospěch a Sdílená L2 až 1 MB na cluster. Tímto rozhodnutím se SiFive snaží snížit latence a složitost a sází na větší a flexibilnější L2 cache, která je obzvláště výhodná inferenční úlohy se středními pracovními sadami.

Na úrovni ISA nová zásilka přijímá RVA 23, který zavádí nativní podporu pro nově vznikající formáty v oblasti umělé inteligence, jako například BF16, MXFP8 y MXFP4Ten druhý byl nedávno vybrán OpenAI pro distribuci modelů s otevřenou váhou, což zdůrazňuje důležitost nabízení kompaktních datových typů s dobrou věrností v rozsáhlé závěry.

Díky vícejádrovému procesoru a orientaci na okraji se X280 Gen 2 hodí do mobilních zařízení, infrastruktury a automobilový průmysl, tedy oblasti, kde jeho první generace již triumfovala. Pro ty, kteří potřebují kombinovat nízké latence s úzkým profilem spotřeby, je to velmi solidní základ pro vestavěné aplikace IA.

X390 Gen 2: Když záleží na každém vektoru

Pro scénáře, které vyžadují více vektorové síly, X390 Gen 2 Oproti původnímu X280 dělá významný krok vpřed: s jedním jádrem již poskytuje 4× zlepšení ve vektorových výpočtech díky zdvojnásobení délky vektoru a přidání dvě vektorové ALU pracující paralelně.

Architektonicky se jedná také o návrh 8 stupňů, dvojitá emise, in-order a superskalární, ale zde jsou zahrnuty dvě vektorové jednotky s 1024bitovou VLEN a 512bitovou DLEN. Výsledkem je platforma, která dramaticky zrychluje náročné operace v šířka vektoru, což otevírá dveře náročnějším modelům a jádrům.

X390 Gen 2 je škálovatelný až koherentní 4jaderné komplexya volitelně může zahrnovat rozhraní VCIX úzce propojit akcelerátory umělé inteligence nebo jiné koprocesory navržené zákazníkem. Tato blízkost snižuje komunikační režii a usnadňuje integraci externí motory bez zbytečných softwarových „poplatků“.

V konfiguracích se čtyřmi jádry SiFive hovoří o dosažení až 1 TB/s efektivní šířky pásma, což je číslo, které řadí X390 Gen 2 jako ideálního kandidáta na to, aby fungoval jako... Řídicí jednotka akcelerátoru (ACU) aby fungoval jako autonomní engine umělé inteligence. Tato všestrannost umožňuje konstrukci čehokoli od hybridních akceleračních stacků až po čisté potrubí umělé inteligence na RISC‑V.

Není náhoda, že si návrhy X280 a X390 našly cestu do velkých technologických projektů: již byly k vidění v aplikacích od společností jako například Google na svých TPU, kde symbióza mezi řízením, předběžným/postprocessingem a tvrdou akcelerací je klíčová pro výkon výroba.

XM Gen 2: Maticový blok, který se škáluje do datového centra

Série XM 2. generace představuje „tukový blok“ pro lehké tréninkové zátěže a rozsáhlé inference: integra Čtyřjádrový procesor X390 Gen 2 vedle motoru výpočet matic Vyvinuto společností SiFive. Tato kombinace umožňuje vysoce paměťově efektivní smíšené zpracování skalárních, vektorových a maticových dat.

Každý cluster XM Gen 2 může poskytovat až 64 TFLOPS v FP8 na 2 GHz a návrh je určen pro stohování v konfiguracích víceklastrový které dohromady překračují 4 PFLOPSTento modulární přístup usnadňuje vytváření vlastních akcelerátorů pro datových center s různými profily spotřeby a výkonu.

SiFive také zdůrazňuje, že XM Gen 2 je silně naladěni na LLM a udržuje tradici společnosti v oblasti výkonu na watt. Úzká integrace tří výpočetních domén (skalární, vektorové a maticové) umožňuje použití šířka pásma paměti velmi efektivní a minimalizují redundantní kopie a přesuny dat.

Pro týmy, které potřebují základ pro budování vlastních akcelerátorů, slouží XM Gen 2 jako modrotisk Připraveno k licencování: Bloky X390 Gen 2 poskytují výkonné vektorování a řízení, zatímco maticový engine škáluje propustnost tam, kde je to potřeba. Hustota MAC.

Rozhraní VCIX a SSCI: zrychlení bez tření

Příchod VCIX (Rozšíření rozhraní vektorového koprocesoru) a SSCI (Scalar Coprocessor Interface) je jedním z rozlišovacích znaků této generace. Obě rozhraní umožňují akcelerátorům a koprocesorům přímý přístup k Registry CPU, což snižuje objem middlewarového stacku, snižuje latence a zlepšuje celkové využití paměťový subsystém.

V praxi se to projevuje kratším časem propojení a více užitečným výpočetním časem: týmy mohou připojit vektorové nebo specializované akcelerátory, aniž by musely znovu vynalézat kolo, s… stabilní protokoly a optimalizovanou datovou cestu. V kombinaci s otevřením Knihovna jádra SiFive, tření potřebné k dosažení funkčních prototypů výrazně klesá.

Pro zatížení s fázemi předběžného zpracování, plánování a následného zpracování (např. potrubí vize a inference), toto přímé propojení s registry výrazně zjednodušuje orchestraci. Jádra RISC-V dokáží přesně řídit tok a zároveň delegovat „těžkou práci“ na koprocesory které fungují s co nejnižšími tresty.

Přijetí RVA23 a podpora nově vznikajících formátů

SiFive sladila své IP adresy se specifikací RVA 23, klíč k budoucnosti softwaru RISC-V orientovaného na umělou inteligenci. Tento krok umožňuje datové typy, jako například BF16, MXFP8 y MXFP4, což je obzvláště cenné, když se trh posouvá směrem k smíšené přesnosti a dynamika.

Podpora MXFP4 není rozmar: byla zvolena OpenAI pro distribuci modelů s otevřenou váhou, takže přímé zrychlení do tohoto formátu snižuje konverze a úzká místa v moderních nasazeních. V inferenci ve velkém měřítku se počítá každý cyklus a každý bajt.

kompatibilita s RVV 1.0 na X280 a rozšíření VLEN/DLEN na X390 zajišťují, že knihovny, kompilátory a rámců může snadno vytlačit hardware. To urychluje přijetí v ekosystémech, kde jsou cykly ověřování a údržby softwaru obvykle nejdelší drahý.

Výkon, paměť a praktická škálovatelnost

Průřezovou výhodou rodiny Intelligence Gen 2 je způsob, jakým zvládá šířka pásma a přesun dat. Rekonfigurace mezipaměti v X280 Gen 2 (sbohem L3, vítejte ve sdílené L2 až do 1 MB) a kombinace Duální vektorové ALU V X390 Gen 2 umožňují udržovat vysoké frekvence bez předčasného vyčerpání.

Data až 1 TB / s U čtyř konfigurací X390 Gen 2 to dobře ilustruje ambice návrhu: nestačí mít mnoho FLOPS, pokud nejsou napájeny efektivně. V XM Gen 2 integrace vektor-matice a topologie multiclusterů tuto myšlenku posilují minimalizací přeskakování a mezilehlé kopie.

Pro inženýrské týmy se to promítá do řešení, která se dají „čistě“ škálovat: můžete začít s malé shluky pro POC a rozvíjet se směrem k nasazení s více clustery, aniž by bylo nutné přehodnocovat celou datovou architekturu a soudržnost.

Případy použití: od senzoru do datového centra

Na okraji sítě umožňuje X160/X180 Gen 2 aplikaci umělé inteligence v chytré senzory, řízení letu dronů a mobilních robotů, kde jsou kritické energetické rozpočty a jednotkové náklady. Podpora INT8 a BF16 spolu se 128bitovými vektorovými registry zrychluje konvoluce, filtry a jádra vidění s velkou účinností.

O krok dál, X280 Gen 2 se hodí do bran a vestavěné systémy které vyžadují větší vektorovou hustotu, ať už pro analýzu v reálném čase, předzpracování dat v sítích 5G/6G nebo pokročilé funkce v automobilovém průmyslu. Jeho zaměření je na RVV 1.0 a sdílená L2 mezipaměť připravuje cestu pro inferenční kanály s nízkou latencí.

Ve vysoce výkonném rozsahu se X390 Gen 2 hodí k funkci mozku externí akcelerátory (ACU) nebo přímo jako samostatný vektorový engine s výhodou jasné cesty k přidání koprocesorů prostřednictvím VCIXDíky tomu je snazší nastavit hybridní řešení, kde řízení a náročné výpočty koexistují v komplexnějším prostředí. efektivní.

A konečně, XM Gen 2 je třešničkou na dortu pro rozsáhlé náklady, kde... TFLOPS na watt a snadnou škálovatelnost. Díky „jemnému vyladění“ pro LLM je obzvláště atraktivní pro odvozování velkých modelů a pro určité fáze lehký trénink nebo jemné doladění v datových centrech.

Dostupnost a plán

Společnost SiFive potvrdila, že všechny tyto IP adresy jsou již k dispozici pro licencování, což partnerům umožní okamžitě zahájit integraci. Pokud jde o komerční produkty, první čipy založené na těchto IP adresách se očekávají v druhé čtvrtletí roku 2026, rozumný horizont pro složité návrhy s certifikace a vyčerpávající validaci.

Toto časové okno odpovídá očekávané rostoucí poptávce po edge a datové centruma dává týmům prostor k vylepšení jejich softwarových balíčků tím, že staví na Knihovna jádra SiFive a ve standardizaci rozhraní navržené značkou.

Souhrn specifikací a klíčových vlastností

Abychom každý dílek umístili na své místo, je vhodné si připomenout nejvýraznější rysy této řady. Model X160/X180 Gen 2 je zaměřen na... nízká spotřeba s mírným vektorováním; X280 Gen 2 posiluje okraj pomocí RVV 1.0 a sdíleného L2; X390 Gen 2 zvyšuje šířku vektoru a rovnoběžnost; a XM Gen 2 přidává vlastní maticový engine určený pro LLM a škálování více clusterů.

  • X160/X180 2. generace32/64bitové, 128bitové vektorové registry, 64bitová datová cesta, podpora INT8 a BF16, klastry po 4, zaměření na IoT/robotiku s účinnost maxima.
  • X280 Gen 28stupňový, duální, řazený v pořadí, superskalární; VLEN 512/DLEN 256; RVV 1.0 + SiFive Intelligence Extensions; hierarchie s Sdílená L2 až 1 MB na cluster.
  • X390 Gen 28stupňový, duální, řazený v pořadí, superskalární; duální vektorová ALU; VLEN 1024/DLEN 512; škálovatelný na 4 koherentní jádraVolitelný VCIX; až 1 TB/s v konfiguraci se 4 jádry.
  • XM 2. generace4 × X390 Gen 2 + maticový engine SiFive; až 64 TFLOPS FP8 při 2 GHz na cluster; škálovatelné i výše 4 PFLOPS v multiklastrovém provedení; vysoce vyladěné pro LLM a vysoký výkon na watt.

Proč je to teď důležité: software, standardy a ekosystém

Oznámení o hardwaru jsou relevantní, pokud jsou doprovázena solidní software a standardy. Přijetí RVA23, explicitní podpora formátů jako MXFP8/MXFP4/BF16 a vydání Knihovna jádra SiFive Podporují návrh, aby ho knihovny a frameworky mohly využívat bez problémů.

Závazek k jasným rozhraním (VCIX a SSCI) také snižuje „rizikový faktor“ pro ty, kteří plánují integraci. vlastní akcelerátoryV době, kdy je diferenciace poháněna specifickými jádry a proprietárními modely, je důležité mít jasnou cestu k záznamům a datové cesty Nízká latence dělá rozdíl.

Přidáno do předtrakci v sektorech jak automobilový průmysl, infrastrukturu a mobilní zařízení, které již vstoupily do ekosystému velkých společností, jako je GoogleSiFive vysílá signál, že RISC‑V již není jen alternativou, ale vyspělou platformou pro pracovní zátěže. Produkční umělá inteligence.

To vše navíc přichází, když dodavatelé usilují o technologickou autonomii, udržitelné náklady a flexibilitu... licencíModulární receptura Intelligence Gen 2 odpovídá této touze vytvářet přesně to, co je potřeba, nic víc, nic míň, a škálovat, když to firma potřebuje. vyžadovat.

Ačkoli každý případ užití bude mít své vlastní blokové schéma, konzistence návrhu mezi X160/X180, X280, X390 a XM umožňuje kombinování součástí bez „překvapení“ a se zřejmou cestou k optimalizaci. výkon/spotřebaTato konzistence otevírá dveře ke kratším vývojovým cyklům a menšímu množství přepracování.

Celkově rodina Intelligence Gen 2 s lehkostí pokrývá celý sortiment: od senzor která vyžaduje základní umělou inteligenci až po rackový systém, která vyžaduje škálovatelné PFLOPS, procházející branami a řídicími jednotkami, které orchestrují akcelerátory externí. Jedná se o krok v souladu s trendem v oboru směrem k heterogenním a kompozibilním architekturám.

Pro každého, kdo chce vybudovat moderní platformu umělé inteligence, zde existují stavební bloky, které kombinují zralá vektorizace, výkonné maticové výpočty a softwarový ekosystém, který nezačíná od nuly. Připočtěte k tomu tlak nově vznikajících standardů a prognózu růstu v oblasti edge computingu a je celkem jasné, že všechny součásti jsou v pořádku. význam.

Společnost SiFive přináší hardware RISC‑V AI, který působí praktickým a dobře promyšleným dojmem: konfigurovatelné tam, kde by měl být, efektivní v tom, co je důležité, a se stále pevnějším mostem k softwaru. Vzhledem k tomu, že licence jsou již k dispozici a první implementace křemíkových čipů jsou plánovány na rok 2026, jedná se o návrh s potenciálem vybudovat dnešní platformy pro... ráno.

Co je RISC-V RVA23?
Související článek:
RISC-V RVA23: Vše o profilu, který mění procesory