L'Unione Europea sta investendo milioni di euro nella traduzione automatica, con l'obiettivo di rendere più veloce ed efficiente la traduzione tra le lingue di tutti i paesi membri. Gli investimenti vanno a diversi progetti, due dei quali sono diretti da Josef van Genabith, professore di Tecnologie Linguistiche orientate alla traduzione presso la Saarland University, nonché dirigente scientifico presso il German Research Center for Artificial Intelligence (DFKI).
Da una parte ci sono 3,6 milioni di euro in tre anni per il progetto Quality Translation 21 (QT21), a cui fa capo un consorzio composto da 14 diversi enti di ricerca. Dall'altra, 1,7 milioni di euro in due anni vanno invece European Language Resources Coordination (ELRC): in questo caso l'obiettivo è raccogliere una grande base di dati linguistici (Big Data) che serviranno poi a far evolvere la European Commission's automated translation platform (CEF AT).
Il progetto ELRC è relativamente facile da capire: si tratta di raccogliere e organizzare quanti più campioni linguistici possibili, per andare a creare un database che possa alimentare e far evolvere i sistemi di traduzione automatica.
Il progetto QT21 è invece mirato proprio a realizzare sistemi di traduzione automatica che siano non solo veloci, ma anche capace di generare risultati di qualità accettabile per tutte le lingue in uso nella Comunità Europea.
Non è un compito facile: finché si tratta di lingue molto note e studiate, diciamo francese e inglese, la traduzione automatica genera un testo sgrammaticato ma comprensibile. Il documento e accettabile se l'obiettivo è una comunicazione immediata dei concetti di base. Se però entrano in gioco lingue di cui si sa meno o più complesse, allora la traduzione automatica è del tutto inutile.
Ecco perché il professor van Genabith ha deciso di seguire un diverso approccio per il deep learning orientato alla traduzione. In sostanza "i computer non sono alimentati con regole grammaticali e dettagli linguistici", spiega il comunicato stampa, "ma viene insegnato loro a riconoscere schemi negli enormi database testuali, e a imparare da essi". Una cosa non troppo diversa da quanto ha fatto IBM con Watson - un sistema strabiliante che tuttavia dà il meglio di sé solo in inglese - o da ciò che fa Google con Deep Mind.
Come in tanti altri casi quindi si insegue il processo di apprendimento naturale, accantonando l'idea che si possa insegnare una lingua solo trasmettendo lessico e regole grammaticali - un'idea fallimentare, che tra l'altro anche la didattica "per umani" ha cestinato da molti anni in favore di percorsi più naturali, mirati appunto a far scattare nell'alunno il riconoscimento degli schemi e l'automazione spontanea.
Se i bambini imparano a padroneggiare una lingua senza regole grammaticali, allora forse può farlo anche un computer. Questa è l'idea generale del progetto QT21, anche se naturalmente tradurre questa idea in algoritmi funzionanti non è affatto facile – anzi la padronanza delle lingue naturali è forse la più grande sfida per chi si occupa di Intelligenza Artificiale.
Tutto questo impegno solo per avere una produzione veloce delle bozze, che comunque andranno riviste e corrette da personale umano. Tranne per chi ritiene accettabile una traduzione fatta con Google o Bing, ma la maggior parte di noi sa che quelli non sono testi utilizzabili. La concretizzazione di questi progetti quindi non metterà a rischio il lavoro dei traduttori europei, almeno non in tempi brevi. Dovrebbe però aiutare a rendere più immediate le comunicazioni tra un paese e l'altro.
Lucchetti babbani e medaglioni .... | ||
Dire quasi la stessa cosa ... | ||
La traduzione: teorie e metodi |