Google Translate, bravo quasi quanto un traduttore umano

La traduzione automatica esiste ormai da molto tempo ma non è ancora un strumento davvero utile. Per tradurre una singola parola può essere utile, e può servire per farsi un'idea generale di una frase o un'intera pagina. Ma ad oggi la traduzione fatta da un essere umano è ancora inarrivabile per un computer.

Questa situazione prima o poi finirà naturalmente, e un giorno i computer sapranno tradurre da una lingua all'altra in modo perfetto. Google è tra le aziende che lavorano a questo ambizioso obiettivo, e l'azienda ha fatto sapere di aver appena introdotto il nuovo sistema Google Neural Machine Translation, o GNMT o NMT.

Come il nome fa intuire, si tratta di usare reti neurali e deep learning per ottenere una traduzione automatica più precisa. Secondo Google si arriva (a volte) a livelli vicini a quelli prodotti da un traduttore umano. La nuova risorsa si aggiunge (idealmente sostituisce) agli algoritmi basati sulla traduzione di frasi, che sono la base di Google Translate come lo conosciamo oggi. Alla base di GNMT c'è l'uso di Reti Neurali Ricorrenti (Recurrent Neural Networks, RNN) che esaminano la relazione tra lingua di partenza e lingua di arrivo.

Invece che spezzettare l'input in frasi e parole, NMT considera l'intero testo come elemento di partenza. "Il vantaggio di questo approccio è che richiede meno scelte progettuali rispetto ai precedenti sistemi basati sulle frasi (Phrase Based Machine Translation, PBMT o PB)", si legge sul blog di Google.

Passare dalla teoria alla pratica tuttavia non è mai semplice, e gli ingegneri di Google hanno dovuto lavorare duramente per rendere davvero migliore l'approccio NMT, in termini di velocità o precisione. Lo hanno messo alla prova con una traduzione dal cinese all'inglese, ottenendo risultati a volte molto vicini a quelli di un traduttore umano, in particolare nella coppia spagnolo-inglese.

"Per prima cosa, la rete codifica le parole cinesi come una lista di vettori, dove ogni vettore rappresenta il significato di tutte le parole lette fino a quel punto (Encoder). Una volta che tutta la proposizione è stata letta, il decoder si avvia e genera la proposizione inglese una parola alla volta (Decoder). Per generare le parole tradotte a ogni passaggio, il decoder considera una distribuzione ponderata dei vettori codificati in cinese, scegliendo quelli più rilevanti per la traduzione all'inglese".

Prendendo come punto di riferimento la traduzione umana, GNMT ha prodotto risultati nettamente migliori rispetto a PBMT, e per questo Google ha deciso di pubblicarla immediatamente per quanto riguarda le traduzioni cinese-inglese, una coppia di lingue particolarmente difficile con la quale GNMT ha mostrato il miglioramento più grande rispetto a PB.

"La traduzione automatica non è certo una questione risolta. GNMT può comunque incorrere in errori rilevanti che un traduttore umano non farebbe mai", continua la nota diffusa da Google, "[...] c'è ancora molto lavoro che possiamo fare per servire meglio i nostri utenti. GNMT tuttavia rappresenta un'importante pietra miliare. Vorremmo festeggiarla con i molti ricercatori e sviluppatori - dentro e fuori da Google - che hanno contribuito a questa ricerca negli ultimi anni".