L’Intelligenza Artificiale di Google sa già leggere il labiale

Quando l'ultima serie tv di Aaron Sorkin ha debuttato, sembrava dovesse essere una rivoluzione. Ma la HBO ha rinnovato la serie per una terza stagione, solo per annunciare che sarà anche l'ultima
Il sistema di Intelligenza Artificiale è stato allenato con programmi di informazione. (Foto: Newsroom, di Aaron Sorkin / HBO)

La divisione dedicata all’Intelligenza Artificiale di Google e i ricercatori dell’Università di Oxford, ha elaborato un sistema capace di leggere il labiale senza dover ricorrere al “metodo Aldo” (di Aldo, Giovanni e Giacomo), cioè di uno che ti indica le labbra scandendo le parole con estrema lentezza, per giunta urlando (“S-i-a-m-o q-u-a-s-i a-r-r-i-v-a-a-a-t-i!”).

Usando migliaia di ore di filmati della BBC, gli scienziati hanno allenato una rete neurale capace di offrire un risultato con una percentuale di precisione del 46,8%. Non sarà il 100%, ma basti pensare che un lettore professionista, sulla base degli stessi filmati, è stato capace di capire le parole esatte solo il 12,4% delle volte.

Una serie di ricercatori di Oxford, all’inizio del mese, hanno pubblicato una lavoro simile. Con tecniche del tutto assimilabili, hanno creato un sistema chiamato LipNet, capace di raggiungere una percentuale del 93.4% nei test. I due esperimenti però partono da basi diverse: LipNet ha lavorato grazie a frasi pronunciate da volontari.

Il software di DeepMind, invece, conosciuto come “Watch, Listen, Attend and Spell” ha usato filmati naturali, ripresi da trasmissioni televisive.

Il materiale – più di 5000 ore di trasmissione tra Newsnight, Question Time, e World Today – includeva una varietà di linguaggio molto più ricca rispetto a quello di Oxford.

Le applicazioni di questo genere di sistemi possono essere molteplici, dall’aiuto nella comprensione delle conversazioni per persone con problemi di udito, alla sorveglianza, fino al controllo di assistenti vocali, se abbinati a una fotocamera.

Leggi anche

Vuoi ricevere aggiornamenti su questo argomento?

Segui

nbsp

  • Get
    Livefyre
  • FAQ

Licenza Creative Commons

This opera is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 3.0 Unported License.

Shares 0

You must be logged in to post a comment Login