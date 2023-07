Inflection AI, una nuova startup fondata dall’ex capo di Deep Mind e sostenuta da Microsoft e Nvidia, la scorsa settimana ha raccolto 1,3 miliardi di dollari, che saranno destinati a costruire un supercomputer basato su ben 22.000 GPU di calcolo H100 di Nvidia. In teoria avrà prestazioni di picco simili a quelle del Frontier.

“Costruiremo un cluster di circa 22.000 H100”, ha dichiarato Mustafa Suleyman, fondatore di DeepMind e cofondatore di Inflection AI. Si tratta di una quantità di calcolo circa tre volte superiore a quella utilizzata per addestrare tutto il GPT-4. Velocità e scala sono gli elementi che ci permetteranno di costruire un prodotto differenziato”.

Un cluster alimentato da 22.000 GPU di calcolo Nvidia H100 è teoricamente in grado di raggiungere 1,474 exaflops di prestazioni FP64, utilizzando i core Tensor. Nel frattempo, il supercomputer più veloce del mondo, Frontier, ha prestazioni di calcolo di picco di 1,813 FP64 exaflops (raddoppiate a 3,626 exaflops per le operazioni matriciali). Questo dato colloca il nuovo computer al secondo posto per ora, anche se potrebbe scendere al quarto dopo che El Capitan e Aurora saranno completamente online.

Questo sistema sarà probabilmente molto più veloce per le attività orientate all’intelligenza artificiale. Il throughput di picco FP16/BF16 è di 43,5 exaflops, e raddoppia a 87,1 exaflops per il throughput FP8. Il supercomputer Frontier, alimentato da 37.888 Instinct MI250X di AMD, ha un throughput di picco BF16/FP16 di 14,5 exaflop.

Il costo non è noto, ma se si considera che le GPU di calcolo H100 di Nvidia hanno un prezzo al dettaglio di oltre 30.000 dollari per unità, ci aspettiamo che le sole GPU costino centinaia di milioni di dollari. Se si aggiungono tutti i server rack e l’altro hardware, la maggior parte del finanziamento di 1,3 miliardi di dollari è da attribuire a questo.

Inflection AI è attualmente valutata circa 4 miliardi di dollari, a circa un anno dalla sua fondazione. Il suo unico prodotto attuale è un chatbot di intelligenza artificiale generazionale chiamato Pi, abbreviazione di personal intelligence.