Reconocimiento de comandos de voz en español orientado al control de una silla de ruedas

Gil Vásquez, Lily Jhohana

Reconocimiento de comandos de voz en español orientado al control de una silla de ruedas

Archivos

Reconocimiento_comandos_voz_español_orientado_control_silla_ruedas.pdf (4.47 MB)

Auto_Reconocimiento_comandos_voz_español_orientado_control_silla_ruedas.pdf (852.51 KB)

Fecha

2015

Autores

Gil Vásquez, Lily Jhohana

Editor

Universidad Autónoma de Manizales

Resumen

El propósito de un sistema de reconocimiento del habla es tomar como entrada la forma de onda acústica de la voz humana y producir como salida una cadena de palabras equivalente [1]. Para lograr dicho resultado, la señal de voz ingresa a un módulo de procesamiento de señales en el que se extraen los vectores de características sobresalientes que son enviados posteriormente al decodificador; el decodificador utiliza tanto un modelo acústico como un modelo de lenguaje para generar finalmente la secuencia de palabras que tienen la máxima probabilidad de asemejarse a los vectores de características de entrada [2]. El modelo acústico es esencial para definir el comportamiento del sistema, este se obtiene con corpus de habla (ficheros de voz que contienen los datos de una amplia población de oradores con su correspondiente transcripción) de voces recogidas en el mismo idioma en el que se realizará el reconocimiento, mientras más robusto sea el corpus mejor será su desempeño. Si bien existen varias herramientas de software para realizar desarrollos con reconocimiento del habla, el hecho de que este proyecto es desarrollado para comandos en español limita su escogencia y finalmente se opta por hacer el desarrollo con el SAPI de Microsoft que para este idioma ya tiene un desarrollo importante. Otras herramientas como “Julius” solo ponen a disposición modelos acústicos completos en japonés o en otros pocos idiomas principalmente el inglés.

URI

https://repositorio.autonoma.edu.co/handle/11182/868

Colecciones

Maestría en Mecatrónica y Control

Página completa del ítem

Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)

Reconocimiento de comandos de voz en español orientado al control de una silla de ruedas

Archivos

Fecha

Autores

Título de la revista

ISSN de la revista

Título del volumen

Editor

Resumen

Descripción

Palabras clave

Citación

URI

Colecciones