Quante volte ti sarà capitato di canticchiare una canzone e di volerne conoscere il titolo? C’è una novità in casa Google che fa al caso nostro. Non sarà più necessario eseguire una ricerche assurde su Google per individuare il titolo di un brano.
Fino ad ora app come Shazam aveva già portato un grosso contributo a questo tipo di problematica ma Google fa di più. Nella barra di ricerca sarà possibile ricercare una canzone semplicemente fischiettandola o canticchiandola.
Sul blog Google The Keyboard viene presentata questa novità. Una canzone fischiettata o canticchiata potrà essere ricercata in un baleno. Il funzionamento dell’algoritmo è semplice: la canzone fischiettata viene convertita in digitale, dopodiché viene fatto un match tra il segnale così ottenuto e quelli presenti nel database di Google. Tra i risultati ottenuti verranno mostrate le alternative più plausibili per la scelta.
Sul proprio smartphone, bisognerà seguire questi semplici passi: aprire l’ultima versione dell’app Google, toccare l’icona del microfono pronunciando la frase “cos’è questo brano?”. O ancora basterà fare clic sul pulsante “Cerca una canzone”. Quindi iniziare a canticchiare per 10-15 secondi il brano scelto ed attendere il risultato.
La funzionalità sarà abilitata ovviamente anche su Google Assistant e sarà altrettanto semplice da utilizzare. “Hey Google, conosci questa canzone?” e poi canticchia la melodia. A questo punto il motore di ricerca mostrerà tutti i possibili risultati ottenuti dall’algoritmo. In questo caso i risultati verranno mostrati in base alla percentuale di corrispondenza tra il brano mormorato e quelli individuati.
Una volta scelta la corrispondenza migliore sarà possibile esplorare tutte le informazioni riguardanti quella canzone. L’artista, la visualizzazione di eventuali video musicali di accompagnamento saranno a portata di clic. Sarà inoltre possibile ascoltare la canzone sull’app musicale preferita, consultarne il testo, leggere l’analisi e persino ascoltare altre versioni del brano quando disponibili.
Ma qual è la strategia dietro questa nuova funzionalità? L’assunzione di base è che qualsiasi suono, compreso quella della voce di ognuno di noi, ha un’identità unica. Dunque proprio come accade per le impronte digitali non possono esistere due corrispondenze esatte. Una volta appurato ciò, è stato “sufficiente” creare modelli di machine learning in grado di tradurre il fischio o il motivo di una canzone nella sua corrispondente impronta digitale.
Questi modelli di machine learning trasformano l’audio in una sequenza di numeri che rappresenta la melodia del brano. L’identificazione della canzone si basa su una grande varietà di fonti, tra cui anche il fischio o il mormorio delle persone. Ovviamente inseguito a questa prima scrematura seguirà l’eliminazione di tutti gli altri dettagli, come gli strumenti di accompagnamento e il timbro e il tono della voce del cantante.
Ciò che resterà sarà esclusivamente la sequenza basata sui numeri della canzone ovvero la sua “impronta digitale”. Lo sviluppo di un algoritmo di questo genere deriva dal lavoro messo a punto dalle tecnologie di music recognition. La rete neurale così composta è frutto dello studio di un team che si occupa prevalentemente di questo ambito di ricerca da diverso tempo. Nel corso degli anni si è passati dallo sviluppo di app per l’ascolto di musica alle funzioni di Sound Search, servizio molto simile a quello di Shazam. Il passo successivo non poteva che essere quello di sviluppare la ricerca di brani musicali solo grazie ad un mormorio.
Il colosso di Mountain View sta sfornando diverse novità in ambito di intelligenza artificiale. Recentemente è stata anche annunciata una nuova funzionalità che consente al proprio smartphone di rimanere in attesa di un operatore al posto nostro. Anche questa può essere vista un’applicazione degli algoritmi di speech recognition, molto simile alla casistica descritta qui.
Sicuramente nei prossimi mesi assisteremo ad altre novità di questo tipo, dal momento che la ricerca in questo settore sta compiendo passi da gigante.