Microsoft TechFest 2010: El teléfono traductor

El 3 y 4 de marzo está teniendo lugar TechFest 2010, un evento de Microsoft donde algunos de los principales proyectos de investigación que se llevan a cabo en los diversos laboratorios  que Microsoft tiene repartidos por el mundo se reunen en Redmond y muestran sus resultados.    Se trata de algo a lo que suele merecer la pena dedicarle cierta atencion,  dada la  magnitud de la organización de investigación de Microsoft.

Este año veo un proyecto muy interesante:  el teléfono traductor.  Se trata de un servicio que permite nada menos que conversaciones en tiempo "real" (utilizando  teléfonos móviles)  entre personas que hablan idiomas diferentes. 

¿Como es esto posible?.  Pues mediante el uso conjunto de varias tecnologías:  reconocimiento de voz y conversión a texto en tiempo real,  traducción automática, conversión de  texto a voz en tiempo real.

Por supuesto se trata de un proyecto de investigación probablemente aun algo  lejos del mercado,  pero, no obstante,  en este vídeo demostrativo (que merece la pena ver)  creo que puede comprobarse como, aceptando ciertas limitaciones, este tipo de servicio  puede  estar mas cerca de su aplicación práctica  de lo que pudiéramos pensar.   La demostración se realiza entre inglés y alemán. 

¿Que limitaciones son esas?.  En primer lugar  para conseguir un reconocimiento de voz de suficiente calidad se requiere que cada persona dedique un cierto tiempo a entrenar el sistema   hasta que este quede  optimizado para reconocer su voz  (esto se realiza de forma automática simplemente procesando las llamadas de voz que  cada persona realiza en el curso de su trabajo).  En segundo lugar  se requiere una especial  atención por parte de las personas que utilizan el sistema en el sentido de cuidar las palabras que emplean y como las dicen  (usando  expresiones mas bien simples  en definitiva y hablando algo mas despacio de lo normal)   aunque  esto no quiere decir  que  la aplicación no  pueda ser  util para gran cantidad de interacciones simples entre personas que utilizan diferentes lenguas.  En tercer lugar la conversación no es totalmente fluida sino que se producen pausas al modo que ocurriría si un traductor humano fuera el que proporcionara una funcionalidad similar.  

El procesado de voz  y los algoritmos de traducción automática  lógicamente no se ejecutan en los propios teléfonos moviles  sino en servidores situados en la Red  (en la nube podriamos decir).   Los telefonos móviles se limitan a proporcionar la interfaz con el usuario.  La funcionalidad se ha cuidado bastante tratando de proporcionar al usuario datos que le permitan calibrar en cada momento si el proceso global de traducción automática está funcionando razonablemente bien  (por ejemplo proporcionandole el resultado de una re-traducción inglés – alemán – inglés frase a frase). 

Resulta interesante también resaltar que Microsoft ha desarrollado este sistema experimental como una extensión del conjunto  de aplicaciones Microsoft Office  (Exchange, Communicator, …),  centrándolo por tanto en el área de aplicaciones para empresas, algo que parece bastante razonable. 

En definitiva un trabajo muy interesante de los laboratorios de Microsoft.   ¿Cuando podremos empezar a utilizar aplicaciones similares aún aceptando sus limitaciones iniciales?. 

Twitter Digg Delicious Stumbleupon Technorati Facebook Email

No hay comentarios aún... ¡Se el primero en dejar una respuesta!

Dejar un Comentario