lunes, 4 de junio de 2012

Dragon TV










La voz es el interfaz natural de la comunicación humana. El lenguaje, el discurso, el habla son primarios. La escritura, los gadgets de la computadora son secundarios. La tecnología de reconocimiento de voz tendrá un impacto económico sobresaliente.

En el mundo hay millones de analfabetos. Hay millones de personas que no se acercan a una computadora, un potencial mercado. Desarrollar una tecnología de reconocimiento de voz mucho mejor que los balbuceantes esbozos actuales puede dar la premicia a la empresa que lo consiga. Nuance es una de ellas: desde la computadora hasta televisores, está tratando de llevar su conocimiento a todos lados.
















Hasta hace dos años el reconocimiento de voz era un objeto de investigación científica más o menos pintoresco. Hoy nuestros smartphones pueden hacerlo, aunque con muchos problemas. En realidad no es el teléfono el que lo hace. Este graba la voz y la envía a un servidor. Allí se compara con una base de datos de millones de ejemplos y se traduce a texto que es enviado de vuelta al teléfono. Cada vez que usas el reconocimiento de voz, la base de datos se amplía y mejora. Es la tecnología de Google, similar a lo que hace Translator, un gigantesco proceso estadístico. Es también lo que hace Siri, aunque en este caso incorpora un intento de entender el mensaje y responder a él.

Entender la voz es muy complejo, nos cuesta a los humanos. En un ambiente ruidoso pedimos a nuestro interlocutor que repita la frase, más alto y más claro. De forma similar las computadoras tienen grandes problemas, uno de ellos es el acento. La ventana de edad óptima para aprender la fonología, el sonido de la lengua, se cierra a los diez años, aunque es óptima hasta tan solo los cinco años, después es muy complicado perder el acento extranjero al aprender una nueva lengua.













Watson, la computadora más lista del mundo compitió en Jeopardy sin implementar reconocimiento de voz. Recibía las preguntas como texto. Para incorporar a Watson al mundo médico, IBM estableció un acuerdo con Nuance, una compañía que entre otras cosas trabaja en el reconocimiento de voz.












Nuance está extendiendo su software a muchos ámbitos y acaba de presentar Dragon TV, una televisión con reconocimiento de voz, puedes pedirle que busque programas en los que aparezca Brad Pitt. O que cambie al canal FOX. O que reproduzca música de U2.















El sistema de entretenimiento Sync de los coches de la Ford usa la tecnología de Nuance para preguntar la dirección al conductor, el lugar de destino para proporcionar la información del tiempo o que canciones quieres oír. El mundo del teclado, mouse y pantalla táctil evoluciona hacia el interfaz de voz, mucho más natural.

Visita el sitio de Dragon TV
Atte. DM

No hay comentarios:

Publicar un comentario