YouTube utilizzerà le reti neurali per comprendere realmente i video

YouTube utilizzerà le reti neurali per comprendere realmente i video / Tecnologia del futuro

Ricerca su YouTube Come cercare su YouTube Come su un PRO con Google Operatori avanzati Come cercare su YouTube come un PRO con Google Operatori avanzati Leggi di più può essere un'esperienza frustrante; se sai di cosa parla un video, o ricordi il contenuto ma non il nome, potresti cercare per un tempo molto lungo. Questo perché YouTube in realtà non lo è vedere i video come fa una persona. Vede solo i metadati: titolo, descrizione e tag. E si presume che l'uploader si sia preso la briga di includere le informazioni.

Tutto ciò potrebbe cambiare nel prossimo futuro. Google ha recentemente depositato un brevetto che indica che YouTube potrebbe effettivamente iniziare capire i video che riproduce.

Selezione dell'immagine basata sulla pertinenza

La domanda di brevetto di Google è per “selezione dell'immagine basata sulla rilevanza,” un modo elegante di dire “trovare le cose che qualcuno ha cercato in base a cosa c'è in un video.” Nel sistema elaborato nel brevetto, viene addestrato un algoritmo per estrarre le caratteristiche specifiche di ciascun video e assegnare parole chiave a loro-può quindi restituire un video in risposta a una ricerca avviata dall'utente che include quelle parole chiave.

L'applicazione fornisce un esempio interessante:

“[I] f l'utente inserisce la query di ricerca “gara automobilistica,” il motore di ricerca video ... può trovare e restituire una scena di corse automobilistiche da un film, anche se la scena può essere solo una breve parte del film che non è descritta nei metadati testuali.”

Ovviamente, questo cambierà drasticamente l'efficacia di una ricerca su YouTube. Verranno trovati video che sono stati precedentemente introvabili a causa di metadati errati. I video che contengono clip utili nel mezzo, circondati da cose meno interessanti all'inizio e alla fine, saranno molto più preziosi. TED video talk 8 TED Talks Video Meno di 5 minuti a cui vuoi guardare 8 TED Talks Video Meno di 5 minuti da guardare Vuoi avere cinque minuti per uccidere? Quale modo migliore di trascorrere quel tempo che guardare un video TED Talks affascinante o informativo. C'è un sacco di ottimi contenuti disponibili per guardare su TED, ma a volte ... Leggi di più saranno disponibili sulla base di singole linee pronunciate in loro. Sarai in grado di trovare video di gatti anche se “gatto” non è nel titolo.

Combinare questa tecnologia con la capacità già notevole di Google di trovare elementi correlati ai termini di ricerca probabilmente significa che trovare video diventerà un'esperienza completamente diversa. Vedrai i video correlati che non includono il termine di ricerca, ma includono un termine correlato (forse anche visivamente correlato). L'equivalente visivo del posizionamento delle parole chiave potrebbe iniziare a influire sul posizionamento di un video nelle classifiche. Chissà quanto potrebbe essere avanzato?

Come funziona?

Google sta mantenendo comprensibilmente le loro carte vicino al loro petto su questo. Tuttavia, il paragrafo seguente nella loro domanda di brevetto fa luce su come raggiungeranno YouTube “vedere” video:

“In un aspetto, un sistema informatico genera l'indice video ricercabile utilizzando un modello appreso in macchina 4 Algoritmi di apprendimento automatico che modellano la tua vita 4 Algoritmi di apprendimento automatico che modellano la tua vita Potresti non rendertene conto ma l'apprendimento automatico è già tutto intorno a te, e può esercitare un sorprendente grado di influenza sulla tua vita. Non mi credi? Potresti essere sorpreso. Ulteriori informazioni sulle relazioni tra le funzionalità dei fotogrammi video e le parole chiave descrittive dei contenuti video. Il sistema di hosting video riceve un set di dati di formazione etichettati che include un set di elementi multimediali (ad es. Immagini o clip audio) insieme a una o più parole chiave descrittive del contenuto degli elementi multimediali. Il sistema di hosting video estrae funzionalità che caratterizzano il contenuto degli elementi multimediali. Un modello studiato a macchina viene addestrato per apprendere le correlazioni tra particolari caratteristiche e le parole chiave descrittive del contenuto. Viene quindi generato l'indice video che associa i fotogrammi dei video in un database video alle parole chiave in base alle funzionalità dei video e al modello appreso in macchina.”

È un sacco di cose davvero dense, ma ecco a cosa serve. Viene creato un algoritmo di apprendimento automatico e, per facilitare l'apprendimento, Google mostrerà un gruppo di video e fornirà parole chiave per dirgli cosa c'è nel video. L'algoritmo inizia a imparare ad associare caratteristiche specifiche dei video con parole chiave specifiche e riceve feedback dagli ingegneri di Google. Più video e parole chiave vengono visualizzati, migliore sarà il processo.

Alla fine, l'algoritmo verrà introdotto nel motore di ricerca di YouTube, dove continuerà ad apprendere e migliorerà nel selezionare parole chiave pertinenti da contenuti audio e video. Mentre la domanda di brevetto non menziona specificamente le reti neurali L'ultima tecnologia informatica che devi vedere per credere all'ultima tecnologia informatica che devi vedere per credere Scopri alcune delle tecnologie informatiche più recenti che sono destinate a trasformare il mondo dell'elettronica e dei PC nei prossimi anni. Per saperne di più, è molto probabile che verrà utilizzato questo particolare tipo di apprendimento automatico, in quanto è molto utile per l'apprendimento graduale come questo.

Simulando il cervello umano (o almeno un modello teorico di come apprende), le grandi reti neurali possono diventare molto efficaci nell'apprendimento da soli, senza supervisione, e YouTube fornirebbe un campo di gioco assolutamente gigantesco in cui potrebbe imparare e ricevere feedback . Altri tipi di apprendimento automatico potrebbero essere utilizzati, ma da quello che sappiamo al momento, le reti neurali sembrano decisamente le più probabili.

Ricercatore di Google (e “padre dell'apprendimento profondo”) Geoffrey Hinton ha accennato a qualcosa in tal senso nel suo Reddit AMA all'inizio di quest'anno.

“Penso che le aree più interessanti nei prossimi cinque anni saranno davvero la comprensione di video e testo. Sarò deluso se tra cinque anni non avremo qualcosa che possa guardare un video di YouTube e raccontare una storia di quello che è successo.”

Will It Gain Sentience and Kill Us All?

Questa è sempre la domanda che emerge quando un nuovo annuncio sull'apprendimento automatico raggiunge le notizie. E la risposta è, come sempre, sì Ecco perché gli scienziati pensano che dovresti essere preoccupato per l'intelligenza artificiale Ecco perché gli scienziati pensano che dovresti essere preoccupato per l'intelligenza artificiale Pensi che l'intelligenza artificiale sia pericolosa? L'intelligenza artificiale può rappresentare un serio rischio per la razza umana. Questi sono alcuni motivi per cui potresti voler essere preoccupato. Leggi di più . YouTube collaborerà con Watson e Wolfram Alpha per ingannarci in servilismo usando i video di YouTube, dopo di che probabilmente ci trasformeranno in cibo per computer. (Non hai visto Colosso?)

Io scherzo, certo. Ma le potenziali implicazioni di addestrare i computer a riconoscere cose che loro “vedere” e “sentire” nei video sono molto impressionanti. DARPA ha già iniziato a cercare Non crederai: DARPA Future Research nei computer avanzati Non ci crederai: DARPA Future Research in Advanced Computer DARPA è una delle parti più affascinanti e segrete del governo degli Stati Uniti. Di seguito sono riportati alcuni dei progetti più avanzati di DARPA che promettono di trasformare il mondo della tecnologia. Leggi di più sulle implicazioni per la sicurezza di questa tecnologia, ma non è difficile immaginarlo come usato per legge, sicurezza domestica, istruzione ... praticamente ovunque.

Se la selezione delle immagini basata sulla rilevanza di Google sarà altrettanto efficace di quanto immaginiamo resta da vedere, ma questo potrebbe essere un cambiamento potenzialmente rivoluzionario nella ricerca di video. E da lì, chi lo sa? Se Google può utilizzare la verità come fattore di ranking Google può utilizzare un algoritmo per determinare la verità? Google può utilizzare un algoritmo per determinare la verità? Google sta studiando se il suo algoritmo possa includere la verità come fattore di ranking. Cosa significa questo per il web? Per saperne di più, non c'è motivo di credere che questa tecnologia non sarà incredibilmente potente. Potrebbe cambiare solo quanto Internet capisca veramente se stesso. Se quel pensiero non lega la tua mente a nodi, non so cosa lo farà.

Cosa ne pensi della domanda di brevetto di Google? Quali altri usi puoi immaginare di avere questa tecnologia? Condividi i tuoi pensieri qui sotto!

Crediti immagine: Willyam Bradberry tramite Shutterstock.com, Ciumac Sergiu tramite Code42, Marko Bradic tramite Shutterstock.com.

Scopri di più su: Intelligenza Artificiale, Ricerca Google, Ricerca video, YouTube.