L’ultimo tormentone deepfake-like si chiama Wombo, che fa cantare le foto di amici e parenti (e non solo) con l’aiuto dell’IA. Conosciuta anche come Wombo.ai, l’applicazione si presenta come la leader mondiale delle app di lip sync, capace di animare qualsiasi volto e farlo cantare e ballare diverse canzoni. Il web è impazzito per l’app e ha prodotto video incredibili, come quello di Nefertiti che canta “I will survive”. Non solo: anche Biden, Putin, Kim Jong-Un e la Gioconda sono finiti nel vortice delle animazioni, dando vita a risultati esilaranti.
Carica una foto, scegli la canzone e aspetta la magia: Wombo animerà il volto facendogli cantare la hit scelta, creando un risultato incredibile. L’ultima moda che dilaga sul web consiste nel far diventare star della musica dei personaggi improbabili, vedendoli ballare e cantare sui pezzi più famosi, sia storici che del momento.
Il funzionamento è molto simile a Deep Nostalgia, l’app che a inizio mese aveva fatto impazzire gli utenti vedendo vecchie foto “prendere vita”. Grazie all’IA Wombo è in grado di riconoscere i lineamenti del volto e la sua inclinazione, per poi animarli. C’è però una grossa differenza tra le due app: Wombo AI non inserisce semplicemente del movimento nella foto statica, ma lo adatta alle parole della canzone scelta, facendo muovere la bocca seguendo il ritmo e la melodia (lip sync). Non solo: il volto e le spalle si muoveranno a ritmo di musica, come se il soggetto della foto ballasse.
Sono 14 le tracce tra cui scegliere per far ballare le proprie foto. Tra queste troviamo “All Star” degli Smash Mouth, “YMCA” dei Village People, “I feel good” di James Brown, e altri pezzi famosi. Molti di questi sono le hit più ascoltate e usate su applicazioni come TikTok, dove sono state rispolverate per creare video-tormentoni.
Usarla è molto semplice: una volta scaricata dallo store si clicca su “Let’s go!” e, dopo aver fornito i permessi necessari all’app, si può caricare una foto o scattarsi un selfie. Per ottenere un risultato migliore la foto deve essere fatta di fronte e deve comprendere anche le spalle, così che il soggetto possa anche ballare. Dopodiché si clicca sul bottone di lip sync e si sceglie la canzone; infine, cliccando di nuovo sul pulsante, l’applicazione genererà il video, che potrà essere salvato o inviato ai propri contatti.
Wombo ha già conquistato molta fama: si sono già registrati circa 2 milioni di download e i video stanno spopolando su Twitter e Facebook. L’applicazione è completamente gratuita, ma c’è la possibilità di abbonarsi per eliminare la pubblicità in-app e ottenere priorità per la creazione dei video, velocizzando i tempi.
Riguardo la privacy Ben-Zion Benkhin, fondatore dell’azienda dietro Wombo, è molto chiaro: il materiale caricato dall’utente viene usato solo per il video, e cancellato subito. Le foto non vengono caricate su server di terze parti e vengono eliminate non appena l’utente crea il video. L’app si appoggia però a servizi terzi sia per limitare l’interruzione del servizio, sia per effettuare delle analisi sull’uso di Wombo. Questi provider hanno però accesso ad alcune informazioni personali dell’utente, anche se non è stato specificato quali.
Wombo è nato dalla passione di Benkhin per l’intelligenza artificiale e il divertimento. “Il mio unico obiettivo è permettere a tutti di creare un contenuto divertente con le proprie foto” ha detto l’imprenditore in un’intervista per The Verge. E a giudicare dai numeri e dal successo, Benkhin ha avuto l’idea giusta, facendo un ulteriore passo avanti nel mondo del deepfake. Nulla di particolarmente innovativo a livello tecnologico, ma sicuramente molto divertente e coinvolgente. Oltre ad aver dato vita a volti del passato o aver fatto cantare diversi personaggi politici, alcuni utenti hanno usato personaggi di videogiochi e anime o addirittura animali.