Dalla ANI alla AGI: perché è tanto difficile

Lo sviluppo dell'intelligenza artificiale è forse la ricerca più importante della nostra epoca, e avrà con ogni probabilità effetti mai visti prima sul genere umano.

Avatar di Tom's Hardware

a cura di Tom's Hardware

Dalla ANI alla AGI: perché è tanto difficile

Niente vi farà apprezzare di più l'intelligenza umana quanto capire le sfide incredibili che si nascondono nel tentativo di creare un computer intelligente quanto noi. Costruire grattacieli, portare esseri umani nello spazio, comprendere i dettagli del Big Bang – ognuna di queste cose è molto più semplice che comprendere il nostro stesso cervello, o costruire qualcosa di altrettanto strabiliante. A oggi, il cervello umano è l'oggetto più complesso che conosciamo nell'Universo.

È interessante notare che le parti difficili nella realizzazione di una AGI (un computer intelligente quanto un essere umano in generale, non in una specifica attività) non sono quelle a cui si potrebbe pensare intuitivamente. Costruire un computer che sappia moltiplicare due numeri a dieci cifre in una frazione di secondo è incredibilmente facile. Costruirne uno che possa guardare un cane e dire se si tratta di una cane o un gatto? Spettacolarmente difficile. Creare una AI che possa battere chiunque a scacchi? Fatto. Farne una che possa leggere un paragrafo preso da un libro per bambini, e non solo riconoscere le parole ma capirne il significato? Google sta spendendo miliardi di dollari per provarci.

Le cose difficili – come il calcolo, la strategia finanziaria, la traduzione – sono facilissime per un computer, mentre le cose facili – la visione, il movimento, la percezione – sono difficilissime. O, per dirla con lo scienziato Donald Knuth, "la AI è riuscita a fare essenzialmente tutto ciò che richiede pensiero, ma fallisce nel fare la maggior parte delle cose che persone e animali fanno senza pensare"[1].

Pensando a tutto questo si comprende velocemente come certe cose che a noi sembrano facili sono invece incredibilmente complicate, e a noi sembrano semplici solo perché le abilità necessarie sono state ottimizzate in noi (e molti animali) per centinaia di milioni di anni di evoluzione. Quando muovete la mano per prendere un oggetto i muscoli, tendini e ossa nella vostra spalla, braccio e polso compiono istantaneamente una lunga serie di operazioni, in coordinamento con gli occhi, che ci permettono di muovere la mano in linea retta dentro un spazio tridimensionale. A noi sembra un'azione priva di sforzo, perché nel nostro cervello c'è un software perfezionato per compierla.

La stessa idea si può ritrovare nel dire che il malware non è stupido perché non è in grado di superare un test captcha – riscrivere lettere e numeri mostrati in un'immagine; è il vostro cervello a essere incredibilmente bravo nel farlo.

D'altra parte, moltiplicare grandi numeri o giocare a scacchi sono attività nuove per le creature biologiche e non abbiamo avuto il tempo di evolverci per diventare efficienti nel metterle in atto, quindi un computer non deve lavorare molto per batterci. Pensateci: che cosa preferireste fare, scrivere un programma che possa moltiplicare grandi numeri o uno che possa comprendere abbastanza bene la natura di una B da riconoscerla tra mille lettere diverse scritte in ogni modo, anche se la scrivete a mano malamente?

Un esempio simpatico: se guardate l'immagine qui sotto, sia voi che un computer potete capire che c'è un rettangolo con due diverse sfumature di grigio che si alternano:

Screen Shot 2015 01 21 at 12 59 21 AM

Fin qui è un pareggio, ma se rimuoviamo la parte nera per rivelare l'intera immagine …

Screen Shot 2015 01 21 at 12 59 54 AM

… non avrete alcun problema a descrivere i vari cilindri, riquadri e gli altri elementi che la compongono, ma il computer fallirà miseramente. Descriverebbe ciò che vede – una varietà di forme bidimensionali in diverse sfumature – che è effettivamente ciò che appare nell'immagine. Il vostro cervello sta facendo un grosso lavoro nell'interpretare la profondità rappresentata, le unioni di forme, l'illuminazione[2]. E guardando l'immagine qui sotto, un computer vede un collage bidimensionale di bianco, nero e grigio, mentre voi riconoscete senza problemi il soggetto per ciò che realmente è – la fotografia di una roccia completamente nera.

article 2053686 0E8BC15900000578 845 634x330
Foto: Matthew Lloyd

E tutto ciò che abbiamo appena menzionato si riassume nel prendere informazioni statiche ed elaborarle. Per avere un'intelligenza di livello umano, un computer dovrebbe capire cose come la differenza tra le diverse espressioni del viso, quella tra essere soddisfatti, sollevati, contenti e rallegrati, e perché Bravehearth fu un gran film e The Patriot terribile.

Scoraggiante.

Quindi come ci arriviamo?