Las máquinas reconocen cualquier voz

Robots pueden reaccionar, preguntar, hablar. Y encuestar, pagar, bendecir.

(Viernes 24 de Noviembre de 2006, por Nicolás Luco Rojas)

Los argentinos de “Soda Stéreo” podrían caerse muertos.

Si los artistas de “Nada personal” marcaran el 313 desde el celular y navegaran con la voz por un árbol de decisiones, llegarían a “karaoke”, para cantar una melodía, grabarla, escuchar las que otros han grabado y votar por la versión que les guste.

Funciona así el robot de reconocimiento automático de voz.

Otra aplicación: El poder de la voz permite que un autómata le llame por teléfono y le pregunte “¿ha tenido quejas de nuestro servicio?”. Según la respuesta, siguen nuevas preguntas. Un computador ficha los problemas y el servicio al cliente reacciona.

“De hecho, nuestros ingenieros han estado probando los sistemas de una telefónica y quejándose a propósito y muy agriamente del mal servicio”, cuenta Mario Arancibia, el gerente general de Merlín, la empresa que trabaja con la Universidad de Chile en el rubro reconocimiento de voz.

“La telefónica criticada llamó muy solícita a nuestros ingenieros quejosos. ¡Hubo que explicarles que era un ensayo!”.

Merlín se asoció hace 18 meses con el Laboratorio de Procesamiento y Transmisión de Voz de la Facultad de Ciencias Físicas y Matemáticas de la Universidad de Chile.

Fondef también había intervenido financiando parte de la aventura en la universidad, y Corfo en la empresa.

El jueves 16 celebraron su primera exportación: a una telefónica argentina.

“Les vendimos interacción por voz con el respaldo de la Universidad de Chile”, dice Mario Arancibia.

El doctor Néstor Becerra-Yoma conformó un equipo de estudiantes de pre y posgrado y se pusieron a escuchar. Hay software de reconocimiento automático de voz (ASR, su sigla en inglés) muy avanzado. Pero había que crear uno adaptable a nuestros países e igualmente competitivo. Y comercializable.

“Nosotros no tenemos necesariamente la capacidad empresarial”, reconoce el doctor Becerra-Yoma. Y afirma que aquí se dio lo que tanto se busca cuando se habla de innovación: la alianza de empresa y universidad para tener éxito en el mercado.

Sonoman

Becerra-Yoma y su equipo partieron por escuchar. Debían lograr que una máquina reconociera el habla, cosa compleja.

No basta con el sonido, hay muchas palabras parecidas. El computador tiene que ver en qué contexto está lo que escucha (“caza” y “casa” podrán sonar igual, pero se entiende por el ambiente que rodea la palabra), cuáles reglas del lenguaje se cumplen y sólo entonces identificará la palabra.

Lo peor es que cada persona habla distinto. No importa, ellos vencen esa barrera.

Le ofrecen a cada cliente una solución. Algunas son fáciles: coordinar la agenda personal a punta de voces, asignar horas en consultas médicas mediante un robot, vender y comprar pasajes, revisar la cuenta bancaria…

“Cada vez que presentamos el proyecto surgen ideas. ¡Es un campo infinito y nuevo!”, dice Mario Arancibia.

Merlín desarrolló y controla proyectos en Argentina, Colombia, Venezuela, Puerto Rico y República Dominicana.

La idea del karaoke telefónico es suya. “No la patentamos, la hicimos”. Después, una empresa japonesa salió con bombos diciendo que ellos habían lanzado un karaoke telefónico.

EN INTERNET

Laboratorio de la universidad:

www.die.uchile.cl/LPTV

Merlín

www.merlin.com

CONFERENCIA

Para llamar a varios y trabajar en grupo idearon www.multiconferencia.movistar.cl

Fuente: El Mercurio

Escrito por Josue Fredes