Una startup di San Francisco sta spingendo i confini della neurotecnologia applicata all'intelligenza artificiale con un progetto ambizioso che potrebbe ridefinire l'interfaccia tra cervello umano e sistemi computazionali. Conduit, questo il nome dell'azienda, ha trascorso gli ultimi sei mesi raccogliendo dati neurali su scala senza precedenti: circa 10.000 ore di registrazioni non invasive provenienti da migliaia di individui unici. L'obiettivo è addestrare modelli di intelligenza artificiale capaci di decodificare l'attività cerebrale e trasformarla in testo, anticipando di fatto ciò che una persona sta per dire o digitare nei secondi precedenti all'azione vera e propria.
Il dataset assemblato da Conduit rappresenterebbe, secondo le dichiarazioni dell'azienda, la più vasta raccolta di dati neuro-linguistici mai creata fino ad oggi. Le registrazioni vengono effettuate in uno studio allestito in un seminterrato, dove i partecipanti vengono ospitati in piccole cabine per sessioni della durata di due ore. Durante questi esperimenti, i soggetti interagiscono liberamente con un modello linguistico di grandi dimensioni (LLM) attraverso la voce o tramite tastiere semplificate, mentre sensori non invasivi catturano l'attività neurale.
La metodologia di raccolta dati ha subito un'evoluzione significativa nel corso del progetto. Inizialmente Conduit aveva adottato un approccio basato su compiti rigidi e strutturati, tipico degli esperimenti neuroscientifici tradizionali. Tuttavia, l'azienda ha rapidamente cambiato strategia dopo aver osservato che il livello di coinvolgimento dei partecipanti influenzava drasticamente la qualità dei dati raccolti. La scelta è quindi ricaduta su conversazioni personalizzate e bidirezionali, che permettono di generare un volume maggiore di linguaggio naturale mantenendo al contempo una sincronizzazione temporale precisa tra testo, audio e segnali neurali.
L'aspetto più significativo di questo progetto risiede nella sua natura non invasiva. A differenza delle interfacce cervello-computer che richiedono impianti chirurgici, come quelle sviluppate da aziende quali Neuralink, la soluzione di Conduit si basa su tecnologie di sensing esterne. Questo approccio abbassa considerevolmente le barriere all'ingresso per la sperimentazione e potrebbe accelerare notevolmente i tempi di sviluppo e validazione dei modelli di AI.
Il nucleo tecnologico del progetto consiste in modelli di machine learning addestrati a identificare pattern nell'attività cerebrale che precedono la produzione linguistica. In teoria, questi sistemi potrebbero imparare ad associare specifiche configurazioni di segnali neurali a contenuti semantici, permettendo una decodifica in tempo reale del "pensiero linguistico" prima che si manifesti in parole pronunciate o testo digitato. Le implicazioni spaziano dall'assistenza a persone con disabilità comunicative fino a nuove forme di interfaccia utente per dispositivi computazionali.