Proyecto Fondef:
Háblele suavemente a su computador
La Universidad de Chile realiza tres proyectos que utilizan la interfaz hombre-máquina por voz.
ELIETTE ANGEL V.
Una voz recita a Neruda. Pero no es cualquier voz, el que habla es un computador.
Ojalá en un futuro cercano seamos reconocidos internacionalmente no sólo por nuestros poetas, sino también por proponer nuevos paradigmas tecnológicos, dice Néstor Becerra Yoma, un ingeniero y académico de la U. de Chile que está obsesionado con que los humanos nos podamos comunicar con los computadores por medio de la voz.
Becerra Yoma está feliz. La semana pasada lanzó su proyecto Fondef (Fondo de Fomento al Desarrollo Científico y Tecnológico) que trae bajo el brazo $180 millones. Su proyecto tiene tres patas.
La primera, son unos libros interactivos en los cuales la pantalla tiene un cuento escrito y el niño debe leerlo. La máquina reconoce la voz y así va marcando de un color las oraciones ya leídas y un tutor virtual mueve la cabeza en señal de aprobación o de desaprobación si el lector lo hace mal.
Becerra Yoma explica que sirve para los niños que están aprendiendo a leer, para las personas con discapacidad cognitiva – como dislexia- o para los que están aprendiendo otro idioma (para chequear la pronunciación).
El Centro de Investigación para el Lenguaje Hablado de la Universidad de Colorado, EE.UU. (CSLR, por sus siglas en inglés) es el que lidera el desarrollo de libros interactivos. Los muchachos que trabajan con Becerra Yoma viajaron para allá en julio e hicieron la versión chilensis, que reconocerá los modismos y acentos usados en Chile.
La otra pata reserva pasajes aéreos por teléfono. Esto, que no parece tener ninguna gracia, sí la posee: el que contesta no es un operador humano, sino que un computador. Una voz metálica irá averiguando el destino, la fecha y la hora del viaje. E irá procesando cada una de las respuestas.
Odisea actual
El Laboratorio de Procesamiento y Transmisión de Voz (LPTV) de la U. de Chile – que dirige Becerra Yoma- logró que el computador reconociera la voz de las personas. Hace un año, la máquina preguntaba, pero el software no interpretaba las respuestas; los ingenieros debían teclearlas.
La tercera, y última, pata es un sistema que sirve para consultar por teléfono la cartelera del cine.
¿Qué-película-quiere-ver?, pregunta el computador, marcando cada una de las sílabas. También cuestiona por el cine y por los horarios.
Cinemarx ofreció un sistema similar hace un tiempo. La empresa Atcom estaba detrás de esto.
Todos hablamos distinto. Entonces, ¿cómo hace el computador para entender? Tiene dos trucos: trabaja con palabras clave, como las ciudades de Chile, en el caso de las reservas de pasajes.
Lo otro que hacen los ingenieros es probar el sistema con harta gente. Para eso, los del LPTV hicieron un concurso. Las personas tenían que dedicar 20 minutos a responder las preguntas que le hiciera el computador. Y, a cambio, rifaban $50 mil. Así engordaron su base de datos y pudieron crear un sistema que responda a distintas preguntas y formas de hablar.
Llegó el primer día una niña y el computador le preguntó: ¿qué película quiere ver?. Y la muchacha le respondió: ‘no estoy ni ahí’. Nos sonó, porque nosotros no habíamos pensado que alguien podía dar esa respuesta. Lo mismo sucedió cuando alguien dijo ‘una de acción’, cuenta Paul Aguayo (23), uno de los futuros ingenieros que trabajan con Becerra Yoma.
¿Por qué a alguien le podría interesar este tipo de tecnologías? Porque ocupa otro medio para acceder a internet, explica Paul. Y, claro, porque aún el teléfono es más masivo que los computadores.
Los sistemas que desarrolla el LPTV emplean la información que contiene la web. Si el sitio no se actualiza, todas las semanas estaríamos mostrando ‘Lo que el viento se llevó’, bromea Paulo Seguel (25), del equipo de Becerra Yoma.
¿Cuáles son los desafíos que vienen en este proyecto?
El reconocimiento de voz lo que hace es casar la señal acústica con un modelo matemático. De eso sale una probabilidad, por ejemplo, de haber leí-do mal o bien el cuento. La idea de Becerra Yoma es perfeccionar este matrimonio porque a veces el sistema falla o no es tan preciso, tal como ocurre con los matrimonios en la vida real.
Otra cosa es testear las tecnologías que están desarrollando con un psicólogo, lo que se llama evaluación de usabilidad.
Imagínate, llamas, te atiende una máquina y empiezas a interactuar, al poco rato la persona cuelga porque no le gustó o no se siente confortable. ¿Cuánto esfuerzo se va por la borda?, comenta el ingeniero. Y añade: ¿Cómo elaborar una aplicación o diseñar una interfaz de modo de maximizar el éxito. Ése es el gran desafío.
RECURSOS
PLATA: Entre Fondef, las empresas (Entel y Atcom) y las universidades de Chile y Colorado reunieron para este proyecto $384 millones.
Fuente: El Mercurio