Reconocimiento de comandos de voz en español orientado al control de una silla de ruedas
Cargando...
Fecha
2015
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Autónoma de Manizales
Resumen
El propósito de un sistema de reconocimiento del habla es tomar como entrada la forma de onda acústica de la voz humana y producir como salida una cadena de palabras equivalente [1]. Para lograr dicho resultado, la señal de voz ingresa a un módulo de procesamiento de señales en el que se extraen los vectores de características sobresalientes que son enviados posteriormente al decodificador; el decodificador utiliza tanto un modelo acústico como un modelo de lenguaje para generar finalmente la secuencia de palabras que tienen la máxima probabilidad de asemejarse a los vectores de características de entrada [2]. El modelo acústico es esencial para definir el comportamiento del sistema, este se obtiene con corpus de habla (ficheros de voz que contienen los datos de una amplia población de oradores con su correspondiente transcripción) de voces recogidas en el mismo idioma en el que se realizará el reconocimiento, mientras más robusto sea el corpus mejor será su desempeño. Si bien existen varias herramientas de software para realizar desarrollos con reconocimiento del habla, el hecho de que este proyecto es desarrollado para comandos en español limita su escogencia y finalmente se opta por hacer el desarrollo con el SAPI de Microsoft que para este idioma ya tiene un desarrollo importante. Otras herramientas como “Julius” solo ponen a disposición modelos acústicos completos en japonés o en otros pocos idiomas principalmente el inglés.