La tua faccia potrebbe essere usata per allenare una IA

IBM ha usato milioni di foto provenienti dal noto portale Flickr per allenare i propri algoritmi di riconoscimento facciale e le ha condivise con ricercatori esterni all'azienda, il tutto senza avere il consenso dei diretti interessanti.

Come spiegato da NBC News, è probabile che queste persone non abbiano dato il consenso all'uso delle loro foto tanto facilmente, visto che tale sistema potrebbe potenzialmente in futuro essere impiegato in sistemi di sorveglianza. Uno dei fotografi ha inoltre confidato a NBC che "nessuna delle persone che ho fotografato aveva idea che le foto sarebbero state usate in questo modo".

Il riconoscimento del volto è una tecnologia che si è molto diffusa negli ultimi anni ed è in continuo miglioramento, ma nonostante ciò è ancora giovane e imperfetta. È basata su algoritmi che imparano a riconoscere il volto umano e tutte le caratteristiche che rendono ogni persona diversa dall'altra e viene usata negli ambiti più disparati, dallo sbloccare lo smartphone all'identificare criminali in mezzo alla folla.

Per imparare a riconoscere i volti l'algoritmo ha bisogno di centinaia di migliaia di immagini diverse. Tutte le foto che vengono analizzate provengono ovviamente da internet e vengono categorizzate per età, genere, colore della pelle e decine di altre caratteristiche, per poi essere condivise con università e compagnie per scopi di ricerca - senza che chi le ha postate ne sia a conoscenza.

Le foto usate da IBM fanno parte di una collezione più grande conosciuta come YFCC100M, contenente la bellezza di 99,2 milioni di immagini e usata da Yahoo (ex proprietaria di Flickr) per condurre delle ricerche. Ogni fotografo avrebbe condiviso le proprie foto sotto licenza Creative Commons, quindi sarebbe possibile usarle in maniera più o meno libera.

Il punto fondamentale della questione è che non sarebbe possibile usare queste foto per allenare un algoritmo di intelligenza artificiale a riconoscere i volti umani, ad esempio a seconda dell'etnia, senza il consenso dei diretti interessati, nemmeno se le suddette foto sono sotto licenza Creative Commons.

IBM ha dichiarato di non aver partecipato a progetti in cui era presente una profilazione razziale. Bisogna anche considerare che IBM avrebbe potuto voler allenare l'intelligenza artificiale al fine di evitare di discriminare alcune minoranze: lo scorso gennaio l'azienda ha spiegato che un dataset così ampio per allenare la propria IA è necessario non solo per migliorarne la precisione, ma anche per renderla "equa".

In ogni caso, visto che il dataset di IBM è privato, è difficile per l'utente medio controllare se le proprie immagini sono state usate ed eventualmente chiedere di rimuoverle. NBC è riuscita però ad ottenerlo da una fonte esterna e ha creato un tool apposito (dentro il suo articolo) con cui controllare se il proprio account Flickr è incluso nel dataset.

IBM ha rilasciato una dichiarazione in merito alla faccenda "prendiamo seriamente in considerazione la privacy di ogni singolo individuo e ci siamo assicurati di rispettare tutti i limiti imposti dalla legge. Le persone possono anche chiedere di essere escluse dal dataset". L'azienda ha anche comunicato che il dataset è accessibile solamente da ricercatori verificati e include immagini disponibili pubblicamente.

IBM è solamente una delle varie aziende attive nel campo del riconoscimento facciale e non è l'unica ad usare foto di gente comune senza chiedere espressamente il loro consenso. Facebook, ad esempio, rende disponibili a ricercatori esterni le foto di oltre 800 mila volti.