AI, Gemini 3.1 Pro registra punteggi record

Google ha rilasciato oggi Gemini 3.1 Pro, una versione potenziata del suo modello linguistico di grandi dimensioni che si candida a diventare uno degli LLM più capaci attualmente disponibili sul mercato. Il lancio, ancora in fase di anteprima con disponibilità generale prevista a breve, rappresenta un salto qualitativo significativo rispetto al predecessore Gemini 3 e si inserisce in un contesto di competizione sempre più serrata tra i giganti dell'intelligenza artificiale.

I primi test indipendenti confermano che Gemini 3.1 Pro segna un miglioramento sostanziale rispetto alla generazione precedente. Google ha condiviso i risultati di benchmark riconosciuti come Humanity's Last Exam, che evidenziano prestazioni nettamente superiori rispetto a Gemini 3, già considerato al momento del suo lancio a novembre scorso uno strumento di AI estremamente competente. La capacità del modello di affrontare compiti complessi e articolati sembra rappresentare il vero punto di forza di questa iterazione.

Particolarmente significativa è la valutazione di Brendan Foody, CEO della startup AI Mercor, che ha sviluppato APEX, un sistema di benchmark progettato specificatamente per misurare le performance dei modelli di intelligenza artificiale in scenari professionali reali. Secondo Foody, "Gemini 3.1 Pro è ora in cima alla classifica APEX-Agents", sottolineando come i risultati ottenuti dal modello dimostrino la rapidità con cui gli agenti AI stanno migliorando nell'esecuzione di compiti lavorativi concreti che richiedono conoscenza specialistica.

Gemini 3.1 Pro è ora in cima alla classifica APEX-Agents, dimostrando quanto rapidamente gli agenti AI stiano migliorando nei compiti professionali reali

Il rilascio di giovedì si inserisce in una fase particolarmente intensa della competizione tra modelli linguistici, con le principali aziende tecnologiche impegnate a spingere i confini delle capacità di ragionamento e autonomia operativa degli LLM. OpenAI e Anthropic hanno entrambe aggiornato recentemente le proprie proposte, concentrandosi su funzionalità avanzate per il lavoro agentivo e il problem solving articolato su più passaggi. La roadmap di Google con Gemini punta chiaramente a consolidare la posizione dell'azienda in questo segmento strategico.

La disponibilità in anteprima di Gemini 3.1 Pro permetterà a sviluppatori e aziende di testare le nuove capacità prima del lancio generale, seguendo una strategia ormai consolidata nel settore che consente di raccogliere feedback e ottimizzare il modello prima della distribuzione su larga scala. Le specifiche tecniche complete e i dettagli sui parametri del modello non sono stati ancora divulgati pubblicamente, ma le prime valutazioni sul campo suggeriscono un avanzamento significativo nell'architettura sottostante e nelle capacità di inferenza del sistema.

Fonte dell'articolo: techcrunch.com

Le notizie più lette

AI, Gemini 3.1 Pro registra punteggi record

Le notizie più lette

Sì Apple! È tempo di restituirci l’iPod

OpenAI: Altman denuncia il fenomeno dell'AI washing

AMD Ryzen 10000, sette configurazioni per accontentare tutti

Il coding è morto. Le software house anche?

La RX 9060 XT demolisce un record della RTX 4090

1 Commenti