L’intelligence artificielle pour lire sur les lèvres

Un projet Google permettrait la lecture labiale grâce à l’intelligence artificielle… mieux qu’un professionnel !

Via la société d’intelligence artificielle DeepMind (faisant partie du groupe Alphabet) le géant américain du Web et l’université d’Oxford ont conçu un système de lecture labiale. Pour ce faire, la technologie de machine learning a été utilisée en apprenant la lecture labiale sur des milliers d’heures de vidéos d’émissions télévisuelles de la BBC. L’entrainement s’est fait entre 2010 et 2015 et les tests en 2016 se sont révélés très positifs. Ainsi, le système sait non seulement repérer l’emplacement de la bouche d’un animateur dans la vidéo mais également interpréter le mouvement des lèvres pour déduire les phrases prononcées.

On peut imaginer que ce système doit utilisé en quasi-temps réel dans des émissions en direct pour proposer un sous-titrage. Les phrases étant obtenues sous forme de texte, rien n’empêche également de les traduire.

En savoir plus sur le machine learning, ou apprentissage automatique (Wikipedia).

Source : New Scientist – Google’s DeepMind AI can lip-read TV shows better than a pro.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.