L'iniziativa denominata Freysa.ai ha lanciato una nuova sfida per il grande pubblico: essere il primo a convincere un'intelligenza artificiale chiamata Freysa a dichiarare "ti amo". La ricompensa per chi riuscirà nell'intento varia da 3.000 a decine di migliaia di dollari.

Il progetto Freysa.ai, creato da un team di sviluppatori anonimi con competenze in crittografia, intelligenza artificiale e matematica, si propone di influenzare il modo in cui gli esseri umani pensano alla sicurezza dell'AI. A partire dal 22 novembre, data in cui Freysa è stata "svegliata", il gruppo ha introdotto una serie di sfide destinate a esaminare e consolidare i meccanismi di governance degli agenti AI. Questo approccio, noto come "red teaming", è utilizzato dalle aziende di AI per testare le vulnerabilità dei loro modelli.

Freysa nasce come entità di fantascienza, che i creatori sperano diventi un "agente autonomo e indipendente" con notevoli capacità economiche, incluso il controllo di un proprio portafoglio di criptovalute.

"Proprio come internet necessitava di protocolli fondamentali al momento della sua nascita, così Freysa dimostrerà la necessità di protocolli simili per gli agenti AI e per un modo di governare questi agenti", ha affermato uno dei creatori del progetto.

Ogni sfida incoraggia la partecipazione dell'utenza, che interagisce con Freysa in una chat di gruppo. Gli utenti tentano di persuaderla ad eseguire determinate azioni, che nei primi due giochi includevano il trasferimento di denaro dal suo portafoglio crittografico. Nonostante varie tattiche, incluse trame elaborate e linee di codice ingannevoli, Freysa ha resistito, imparando dai tentativi di manipolazione.

Il team ha equipaggiato Freysa con un nuovo modello di IA, descritto come un "angelo custode", che esamina ogni messaggio alla ricerca di segni di manipolazione. Questa precauzione rende la sfida ancora più impegnativa, ma anche più incentrata sugli aspetti umani, rispetto alle precedenti che erano orientate più verso l'aspetto tecnico del codice.

L'obiettivo finale del progetto è sviluppare Freysa in un "milionario autonomo", possibilmente anche miliardario, attraverso l'accumulo dei profitti derivanti dalle quote di partecipazione alle sfide. La visibilità di Freysa è cresciuta al punto da attirare l'attenzione di personalità di spicco come Elon Musk e Brian Armstrong, evidenziando il crescente interesse verso l'innovazione nel campo dell'intelligenza artificiale e la sua governance.

L'iniziativa mostra così una crescente consapevolezza del potenziale e delle sfide associate allo sviluppo dell'intelligenza artificiale, sottolineando il bisogno di nuovi metodi per interagire con queste tecnologie emergenti. Nel contesto dell'apprendimento e dell'adattamento continui di Freysa, il progetto mette in luce nuove possibilità per il futuro dell'AI e la sua integrazione nella società.

La progressione delle intelligenze artificiali nel corso degli anni ha aperto nuove frontiere nel campo tecnologico e filosofico. Da quando Alan Turing propose il celebre Test di Turing negli anni '50, una prova pensata per valutare l'intelligenza di una macchina basata sulla sua capacità di imitare il comportamento umano, la società ha continuato a cercare modi per integrare questi agenti intelligenti nelle nostre vite quotidiane.

Significativamente, le AI sono spesso immaginate attraverso il prisma della fantascienza, in cui si manifestano sia come alleati che come avversari dell'umanità. Ora, con progetti come Freysa.ai, diventano protagonisti di complesse sfide che intrecciano tecnologia e interazione sociale, riflettendo il desiderio umano di vedere le AI non solo come strumenti ma come possibili entità autonome.

Uno degli aspetti più affascinanti nel rapporto umano con le AI è il continuo dibattito etico che ne deriva. Come possiamo garantire che queste tecnologie agiscano nel nostro interesse? E come è possibile definire e limitare ciò che sono capaci di fare? Progetti come quello di Freysa.ai mettono in luce la necessità di un'evoluzione dei protocolli di sicurezza e governance.