Avatar di Alessandro Crea

a cura di Alessandro Crea

‎Durante il Re-Work Deep Learning Summit di Boston, Chris Lott, un ricercatore che si occupa di intelligenza artificiale presso Qualcomm, ha fornito alcune indicazioni sul lavoro che il suo nuovo team sta svolgendo sul riconoscimento vocale. Il sistema infatti funzionerebbe interamente in locale, su smartphone e altri dispositivi, offrendo una precisione elevatissima, pari al 95%. Inoltre, non effettuando operazioni via cloud, non cattura né conserva sample ed è quindi molto rispettoso della privacy degli utenti.

Il sistema utilizza due tipi di reti neurali, quelle ricorsive e quelle convoluzionali, ‎apprendendo sia dai modelli che dall'uso del dispositivo, adattando il comportamento allo stile d'uso dell'utente. La differenza principale però riguarda soprattutto l'uso del cloud.

qualcomm building

La maggior parte dei sistemi di riconoscimento vocale attuali, da Google ad Amazon passando per Microsoft infatti non svolgono alcuna operazione in locale ma delegano il tutto a potenti server remoti connessi via cloud. Per questo registrano snippet delle nostre conversazioni audio che poi vengono trasmesse ai server e lì custodite, una situazione che a molti utenti non piace. Secondo Lott inoltre il fatto che la tecnologia Qualcomm lavori in locale e non necessiti di una connessione Internet la rende anche più reattiva ed affidabile.

Ovviamente questo tipo di soluzione ha anche dei limiti: non essendo connessa al Web infatti non può fornire risposte basate sui risultati dei motori di ricerca, e le capacità non possono essere aggiornate facilmente come nel caso del cloud, grazie all'adozione di nuovi database ad esempio. Lott si è detto comunque ottimista che presto sarà possibile offrire le stesse potenzialità del cloud anche in locale, ma non ha spiegato come.