El Reconocimiento de Voz es una tecnología que permite la entrada de voz en los sistemas. Hablas con tu ordenador, teléfono o móvil para activar alguna acción en los dispositivos inteligentes. La tecnología se está utilizando para reemplazar otros métodos de entrada, como escribir, hacer clic o seleccionar de otras maneras. Es un medio para hacer que los dispositivos y el software sean más fáciles de utilizar y para aumentar la productividad.
Conoce ahora nuestra solución de Analítica de Voz (Speech Analytics).
Hay muchas aplicaciones en las que se utiliza el reconocimiento de voz, como en el campo médico, en robótica, en el sector militar, etc. En un futuro cercano, casi todos estarán expuestos al reconocimiento de voz debido a su propagación entre dispositivos comunes como ordenadores y móviles.
La mayoría de los dispositivos inteligentes están haciendo un uso interesante del reconocimiento de voz. Ya son muchas las empresas y plataformas que tienen su asistente de voz: Alexa, Google, Siri, etc… A través de ellos, puede iniciar una llamada simplemente recibiendo instrucciones de voz como «Siri, llama a la oficina».
Problemas con el Reconocimiento de Voz
El Reconocimiento de Voz, en su versión conocida como Speech to Text (STT), también se ha utilizado durante mucho tiempo para traducir palabras habladas en texto. Pero hay un problema con STT tal como lo conocemos. La tecnología ha madurado y mejorado, pero la voz a texto todavía hace que las personas hagan preguntas. Una de sus principales dificultades son las inmensas variaciones entre las personas al pronunciar palabras.
No todos los idiomas se encuentran en el Reconocimiento de Voz, y aquellos que lo hacen a menudo no son compatibles, al igual que el inglés. Como resultado, la mayoría de los dispositivos que ejecutan software de Reconocimiento de Voz funcionan razonablemente sólo en inglés.
Un conjunto de requisitos de hardware hace que el reconocimiento de voz sea difícil de implementar en ciertos casos. Necesita un micrófono que sea lo suficientemente inteligente como para filtrar el ruido de fondo, pero al mismo tiempo lo suficientemente potente como para capturar la voz de forma natural.
Hablando de ruido de fondo, puede hacer que falle todo un sistema. Como resultado, el reconocimiento de voz falla en muchos casos debido a ruidos que están fuera del control del usuario.
El reconocimiento de voz está demostrando ser mejor como método de entrada para nuevos móvil y tecnologías de comunicación como VoIP que como una herramienta de productividad para la entrada de texto masivo.
Aplicaciones del Reconocimiento de Voz
La tecnología está ganando popularidad en muchas áreas y ha tenido éxito en lo siguiente:
- Control de dispositivo. Simplemente decir «OK Google» a un teléfono Android enciende un sistema que es todo oídos para sus comandos de voz.
- Sistemas Bluetooth para automóviles. Muchos automóviles están equipados con un sistema que conecta su mecanismo de radio a su teléfono inteligente a través de Bluetooth. Luego puede hacer y recibir llamadas sin tocar su teléfono inteligente, e incluso puede marcar números con solo decirlos.
- Transcripción de voz. En áreas donde las personas tienen que escribir mucho, el Speech Analytics captura tus palabras habladas y las transcribe en texto.