copertina web chat

web chat

Probabilmente tutti hanno sempre desiderato ciò che Intel ha finalmente fatto diventare realtà. A tutti sarà capitato di avere quel problema del “dove guardare” durante una videochiamata, che fosse per un colloquio di lavoro o per scambiare due chiacchiere con un amico. Finalmente i ricercatori di Intel hanno sviluppato una correzione della direzione dello sguardo durante le videochiamate.

La direzione degli occhi durante una videochiamata ha sempre “preoccupato” tutti gli utenti delle video chat poiché non si ha mai lo sguardo fisso sul volto dell’altra persona, a causa di alcuni fattori. Primo fra tutti il fatto che, se si guardasse la webcam, in modo da centrare lo sguardo sul volto dell’interlocutore, non si potrebbe vedere lo schermo, quindi non si potrebbe vedere la persona con la quale stiamo parlando. Ovviamente c’è di contro che se si guardasse lo schermo, l’altra persona noterebbe che non la stiamo guardando in viso.

Ma qui ci viene in soccorso proprio la famosa multinazionale statunitense, con il suo approccio innovativo, che centra automaticamente lo sguardo di una persona, senza la necessità di input che specifichino l’angolo di reindirizzamento o le caratteristiche geometriche della telecamera, del display e dell’utente che abbiamo di fronte. Vediamo un po’ più nel dettaglio di cosa si tratta.

Reti Neurali Convoluzionali per sistemare lo sguardo

Il nuovo sistema sviluppato da Intel utilizza una Convolutional Neural Network (CNN), o Rete Neurale Convoluzionale, per reindirizzare lo sguardo di una persona deformando e regolando gli occhi nei suoi frame in input. Essenzialmente, la CNN, elabora un’immagine monoculare e produce un campo vettoriale e una mappa della luminosità per correggere lo sguardo dell’utente. Il sistema utilizza un rilevatore di segni facciali per inquadrare e ritagliare gli occhi, in modo da utilizzarli per la CNN grazie al modello ECC-Net.

Schema ECC-Net
credit: groundai.com

Questo sistema reindirizza uno sguardo arbitrario verso il centro senza richiedere un angolo di reindirizzamento. In questo modo, quando non viene fornito un angolo di reindirizzamento, il sistema riesce a dedurre implicitamente lo sguardo in input. Come caratteristica secondaria, questo modello prevede la direzione e l’ampiezza dello sguardo in ingresso. Infine, il punto di forza di quest’applicazione, è che viene eseguita sulla CPU, rendendo questo correttore di contatto visivo una soluzione che può essere utilizzata su un’ampia gamma di dispositivi.

Questo sistema sfrutta quindi una sorta di modello di auto-apprendimento, cosa che non è nuova per casa Intel, che aveva già sfruttato questo tipo di apprendimento, seppur con tecnologie diverse, per progettare un chip che imitasse il cervello. Lasciamo qui un approfondimento riguardante questa nuova tecnologia sviluppata, che eviterà l’imbarazzo di molti durante le videochiamate!

In ogni coppia di occhi, nell'immagine di sinistra l'occhio guarda in una direzione qualsiasi, nell'immagine di destra viene corretta la direzione
In ogni coppia di occhi, nell’immagine di sinistra l’occhio guarda in una direzione qualsiasi, nell’immagine di destra viene corretta la direzione