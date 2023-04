Databricks, una società americana specializzata in software per il big data e il machine learning, ha lanciato Dolly 2.0, il primo modello di linguaggio di grandi dimensioni (LLM) open source e in grado di seguire istruzioni per uso commerciale. Si tratta dunque di un’alternativa a ChatGPT, il famoso modello proprietario di OpenAI che richiede agli utenti di pagare per accedere alla sua API e di rispettare specifici termini di servizio.

Dolly 2.0 è basato sul modello GPT-J di EleutherAI, una comunità di ricercatori indipendenti che si occupa di intelligenza artificiale generativa. Il modello è stato modificato per includere nuove capacità di tracciamento delle istruzioni, come il brainstorming e la generazione di testo. Queste capacità non erano ancora presenti nel modello originale.

Il modello è stato anche addestrato su un set di dati creato da Databricks con la partecipazione di oltre 5.000 dei suoi dipendenti; copre sette compiti specifici, tra cui domande e risposte aperte e chiuse, estrazione e sintesi di informazioni da Wikipedia, brainstorming, classificazione e scrittura creativa.

Tutto è stato pubblicato con licenza Creative Commons, consentendo a chiunque di usarli, modificarli o estenderli per qualsiasi scopo, incluso quello commerciale. In questo modo, Databricks spera di permettere alle organizzazioni di creare e personalizzare i propri LLM “senza pagare per l’accesso all’API o condividere i dati con terze parti”, come si legge nel post sul blog Dolly.

Dolly 2.0 potrebbe quindi innescare una nuova ondata di LLM simili a ChatGPT ma completamente open source. Simon Willison, ricercatore in intelligenza artificiale, ha definito Dolly 2.0 “un affare davvero grosso” su Mastodon.

Immagine di copertina: 123RF