Il processore più grande al mondo: 850.000 core per il Wafer Scale Engine 2 di Cerebras
Anticipato lo scorso agosto, il Wafer Scale Engine 2 (WSE-2) di Cerebras è realtà, in vista di un debutto su più ampia scala nel terzo trimestre: si tratta di un super chip grande quanto un wafer di silicio da 12 pollici, di forma rettangolare, dedicato al mondo dell’intelligenza artificiale e in generale a quello dei supercomputer (HPC).
Cerebras, un’azienda da circa 300 dipendenti dislocati tra Toronto, San Diego, Tokyo e San Francisco, punta a entrare in competizione con le GPU Nvidia e molte altre architetture che affollano il mondo dell’IA. L’obiettivo è rimpiazzare cluster di centinaia o persino migliaia di GPU distribuite su diversi rack di server che usano una potenza di decine di kilowatt, garantendo migliori prestazioni e minori consumi.
Dopo una prima generazione con 400.000 core e 1200 miliardi di transistor prodotti a 16 nanometri da TSMC, WSE-2 passa ai 7 nanometri per offrire 850.000 core e un totale di 2.600 miliardi di transistor su un’area di 46225 mm2. Completano il quadro delle specifiche 40 GB di memoria SRAM con un throughput di 20 petabyte/s e una bandwidth totale dell’interconnessione che collega le tile pari a 220 petabit/s. Quanto al consumo, si parla di 15kW come il predecessore, il che è ottimo considerando le prestazioni raddoppiate: “miracolo” dei 7 nanometri.
WSE 2 | WSE | Nvidia A100 | Differenze WSE-2 vs A100 | |
Dimensione | 46.255 mm2 | 46.255 mm2 | 826 mm2 | 56 volte |
Transistor | 2.600 miliardi | 1.200 miliardi | 54,2 miliardi | 48 volte |
Core | 850.000 | 400.000 | 7344 (6912 CUDA core + 432 Tensor core) |
123 volte |
Memoria a bordo | 40 gigabyte | 18 gigabyte | 40 megabyte | 1000 volte |
Bandwidth memoria | 20 petabyte/s | 9 petabyte/s | 155 gigabyte/s | 12.733 volte |
Bandwidth interconnessione | 220 petabit/s | 100 petabit/s | 600 gigabyte/s | 45.833 volte |
Processo produttivo | 7 nm | 16 nm | 7 nm | – |
Cerebras non ha indicato in modo preciso le frequenze di clock di WSE-2, ma ha spiegato che la prima generazione funzionava tra 2,5 e 3 GHz, e la seconda non vede differenze sotto questo profilo. Interessante, almeno per gli addetti ai lavori, come le rese produttive dichiarate siano pari al 100%. Cerebras ha progettato un sistema grazie al quale può aggirare i difetti produttivi: inizialmente l’azienda aveva allocato un 1,5% di core extra per compensare eventuali difetti di produzione, ma il numero è stato successivamente ridotto grazie alla maturità della tecnologia produttiva di TSMC.
La prima generazione di WSE era venduta all’interno di un sistema completo chiamato CS-1, che ha avuto un buon successo, raccogliendo diverse dozzine di clienti tra cui diversi laboratori di ricerca, aziende farmaceutiche, settore militare, dell’energia e altri ancora. Ad esempio, il Lawrence Livermore ha un CS-1 accoppiato al suo supercomputer Lassen, mentre il Pittsburgh Supercomputer Center ha acquistato due sistemi e li ha collegati al supercomputer Neocortex.
I sistemi di Cerebras sono proposti in un cabinet grande come un rack da 15 unità, che integra networking, raffreddamento a liquido e alimentazione, a un costo che dai 2-3 milioni di dollari del CS-1 dovrebbe salire a “diversi milioni” nel caso del nuovo CS-2.
Fonte: http://feeds.hwupgrade.it/