in

¡LA CIENCIA AVANZA! Desarrollan inteligencia artificial que puede leer los labios

En vista a la creciente cantidad de vídeos que diariamente producimos, subtitularlos a bajo costo sería un complemento ideal

Investigadores del Departamento de Ciencias de la Computación de la Universidad de Oxford desarrollaron LipNet, un servicio financiado parcialmente por el área de Deep Learning del gigante Google para poder leer los labios. Inicialmente el programa cuenta con una impresionante precisión del 93,4%.

Sólo para comprender las dimensiones de este avance, las personas dedicadas al arte de leer los labios sólo pueden entender entre un 20% y un 60% de lo que la persona está diciendo a causa de la dificultad para entender los movimientos de los labios a la velocidad natural del habla. Por lo cual, teniendo presente que para muchas personas incapaces de oír es una herramienta esencial para entender al mundo siendo así, contamos con razones suficientes para querer automatizar la tarea.

En la práctica, el programa es un éxito, pero la teoría indica que la única manera de mejorar el servicio es con más datos. En momentos futuros estiman poder demostrarlo al alimentar la inteligencia artificial sobre la cual está construida LipNet con conjuntos más amplios de textos y vídeos.

Jack Clark, especialista en inteligencia artificial asegura que a la técnica todavía le falta pulido y escribió en el newsletter deImport AI que los investigadores de Oxford se verán en el deber de hacer 3 cosas: acumular grandes muestras de vídeo del mundo real (no generadas en el ambiente controlado de un laboratorio), mejorar el software para pueda leer los labios desde distintos ángulos y diseñar un modelo del lenguaje que permita adivinar cuáles tipos de frases está usando quien habla para afinar la precisión.

A pesar de que la lectura de los labios sólo emplea imágenes, también se plantean hacer pruebas con contenido audiovisual para aumentar la cantidad de usos posibles del servicio. Por ejemplo, resultaría clave el soporte en vídeo cuando el reconocimiento del habla se ve dificultado por el sonido ambiental.

LipNet representa otro avance hacia la inclusión y la accesibilidad en la Web. En vista a la creciente cantidad de vídeos que diariamente producimos, subtitularlos a bajo costo sería un complemento ideal. De igual forma, en caso de que mejore su precisión, funcionaría como un eventual reemplazo de los teclados y otras formas de interacción entre el hombre y las máquinas que hoy continúan siendo un poco complicadas.

Con información de Clarín

Written by Edu Ascanio

Leave a Reply

Your email address will not be published. Required fields are marked *

Las relaciones bilaterales de EEUU con Cuba y Venezuela, se avizoran complicadas, complejas e inciertas ante la llegada de Trump al poder| archivo

¡TIEMBLAN LOS DICTADORES! Trump revisará relaciones de EEUU con Cuba y Venezuela

Los manifestantes quemaron banderas estadounidenses y gritaron "¡Ese no es mi presidente!" | vozdeamerica

Elección de Donald Trump desata protestas en Estados Unidos y el Reino Unido (+Video)