Riconoscimento facciale (Depositphotos foto) - www.systemcue.it
Una nuova tecnologia rivoluziona il tracking facciale, rendendo le espressioni in AR più realistiche che mai.
La realtà aumentata sta cambiando il modo in cui viviamo l’intrattenimento, la moda e persino il makeup. Questa tecnologia permette di fondere il digitale con il mondo reale, creando esperienze sempre più immersive. Tra le tante innovazioni che stanno prendendo piede, ce n’è una che sembra uscita da un film di fantascienza: il dynamic facial projection mapping (DFPM). In parole povere, si tratta di proiettare immagini animate direttamente sul volto di una persona, adattandole ai suoi movimenti ed espressioni in tempo reale.
Sembra magia, ma in realtà dietro c’è un’enorme sfida tecnologica. Perché l’illusione funzioni, il sistema deve tracciare il viso con una precisione incredibile, riconoscendo occhi, naso e bocca in meno di un millisecondo. Se anche solo un piccolo ritardo si infiltra nel processo, si rischia di avere proiezioni fuori posto, un effetto che spezza l’immersione e rovina il risultato finale. Insomma, la velocità è tutto.
Il problema? Fino ad ora, i sistemi di tracking si sono sempre dovuti barcamenare tra rapidità e precisione. Alcuni sono fulminei ma poco accurati, altri precisi ma troppo lenti per reggere il ritmo delle espressioni umane. E non è tutto: c’è anche una grave carenza di dataset video con abbastanza dettagli per addestrare gli algoritmi a riconoscere i movimenti facciali con l’accuratezza necessaria.
Senza dati di qualità, anche l’intelligenza artificiale più avanzata si ritrova con le mani legate. Proprio su queste criticità ha lavorato un team di ricercatori dell’Institute of Science di Tokyo, sviluppando un sistema capace di seguire i movimenti del volto con una rapidità mai vista prima.
Il progetto, guidato dal professor Yoshihiro Watanabe e supportato dal ricercatore Hao-Lun Peng, è stato descritto in uno studio pubblicato su IEEE Transactions on Visualization and Computer Graphics il 17 gennaio 2025. La loro idea rivoluzionaria? Un sistema chiamato “high-speed face tracking method”, che combina due tecniche di riconoscimento facciale in parallelo per massimizzare velocità e precisione.
Da un lato, hanno sfruttato un metodo chiamato Ensemble of Regression Trees (ERT), che permette di individuare rapidamente i tratti salienti del volto. Dall’altro, hanno integrato un sistema ausiliario più lento, ma capace di correggere eventuali errori e migliorare l’accuratezza. E per accelerare ulteriormente il processo, hanno ideato un trucco ingegnoso: limitare l’area di ricerca utilizzando i dati dei fotogrammi precedenti. In pratica, invece di analizzare l’intera immagine, il software si concentra solo sul volto, riducendo il tempo di elaborazione a 0,107 millisecondi. Una velocità impressionante.
Ma il team non si è fermato qui. Un altro grande problema del DFPM è il cosiddetto errore di allineamento, che si verifica quando la proiezione non combacia perfettamente con il volto della persona. Per evitarlo, i ricercatori hanno sviluppato un sistema proiettore-telecamera co-assiale con meccanismo di spostamento della lente. In pratica, questo setup permette di allineare meglio le coordinate delle immagini proiettate con la posizione reale del volto, riducendo gli errori a 1,274 pixel per soggetti distanti tra 1 e 2 metri.
E non è finita. Per aggirare il problema della mancanza di dataset video adeguati, il team ha inventato un metodo per simulare annotazioni video ad alta frequenza partendo da immagini statiche. Così, gli algoritmi hanno potuto imparare a riconoscere il movimento in modo più preciso, migliorando drasticamente le prestazioni del sistema. In altre parole, questa nuova tecnologia porta il tracking facciale a un livello mai visto prima, aprendo la strada a esperienze di realtà aumentata ancora più spettacolari.