Il colosso di Redmond ha finalmente svelato i suoi primi modelli di intelligenza artificiale sviluppati interamente in casa, segnando una svolta strategica che potrebbe ridefinire i rapporti di forza nel settore tecnologico.
Dopo anni di dipendenza dai sistemi di OpenAI, Microsoft ha presentato MAI-Voice-1 e MAI-1 Preview, due soluzioni proprietarie che rappresentano il primo passo concreto verso l'indipendenza tecnologica dell'azienda.
Il modello MAI-Voice-1 è progettato per la sintesi vocale, ed è capace di generare un minuto di audio di alta qualità in meno di un secondo utilizzando una singola GPU. L'applicazione pratica di questa tecnologia è già visibile in Copilot Daily, dov'è usato per la funzione di riassunto delle notizie tramite AI, e in Copilot Podcasts, che permette agli utenti di creare podcast istantanei semplicemente fornendo delle istruzioni testuali. Durante le dimostrazioni nei laboratori Copilot, Microsoft ha mostrato come il sistema riesca a produrre audio espressivo e di alta qualità sia per parlatori singoli che multipli.
Parallelamente, MAI-1 Preview utilizza un'architettura Mixture-of-Experts (MoE) che ottimizza l'uso delle risorse computazionali. Mentre alcuni concorrenti impiegano cluster da 100.000 GPU, Microsoft ha addestrato il suo modello utilizzando "solo" 15.000 GPU Nvidia H100, sfruttando l'efficienza dell'architettura MoE che attiva selettivamente moduli specializzati in base al tipo di input ricevuto.
L'orchestratore del futuro
La strategia di Microsoft non punta a una rottura completa con OpenAI, ma piuttosto alla creazione di un ecosistema diversificato. Mustafa Suleyman, ex-fondatore di DeepMind acquisito da Microsoft insieme al suo team di Inflection AI, ha spiegato che l'azienda sta sviluppando un "orchestratore" - una piattaforma intermedia capace di instradare le richieste verso il modello più adatto alle specifiche esigenze.
Questo approccio modulare rappresenta una filosofia radicalmente diversa rispetto alla dipendenza da un singolo fornitore. Come ha dichiarato Suleiman in un'intervista a Semafor: "Ci stiamo concentrando sulla sicurezza delle opzioni. Possiamo utilizzare modelli di sviluppatori terzi, continueremo a usare i modelli OpenAI per molto tempo, e impiegheremo anche modelli open source come stiamo facendo ora".
Microsoft ha iniziato a testare MAI-1 Preview su LMArena, la stessa piattaforma che ha portato alla ribalta la startup cinese DeepSeek lo scorso gennaio. Questa comunità permette confronti diretti tra diversi modelli AI, offrendo agli sviluppatori l'opportunità di richiedere l'accesso alle API Microsoft per sperimentazioni dirette. L'azienda ha annunciato che nelle prossime settimane integrerà MAI-1 Preview in alcune funzionalità testuali di Copilot, raccogliendo feedback degli utenti per perfezionare ulteriormente il sistema.
Dopo aver investito circa 13 miliardi di dollari in OpenAI dal 2019, Microsoft sta ora diversificando i propri investimenti nell'intelligenza artificiale. L'acquisizione del team di Suleyman e lo sviluppo di modelli proprietari dimostrano una volontà di non dipendere esclusivamente da partner esterni, pur mantenendo relazioni collaborative. Attualmente, i modelli girano su cluster Nvidia GB200 per ottimizzare le performance, mentre l'azienda continua a perfezionare le proprie capacità tecnologiche.
L'approccio iniziale si concentra prevalentemente sui servizi consumer di Copilot piuttosto che sulle soluzioni enterprise, suggerendo una strategia graduale di implementazione. Microsoft ha dichiarato di essere "pronta per salti più ampi" e di non accontentarsi dei risultati attuali, puntando a creare "modelli specializzati per diverse intenzioni e casi d'uso degli utenti, un approccio che può generare valore immenso".