Please use this identifier to cite or link to this item:
https://repositorio.autonoma.edu.co/handle/11182/868
Title: | Reconocimiento de comandos de voz en español orientado al control de una silla de ruedas |
Authors: | Gil Vásquez, Lily Jhohana |
Advisor: | Flórez Hurtado, Rubén Darío Castillo Ossa, Luis Fernando |
Keywords: | Ingeniería artificial Automatización Control automático Sistemas de procesamiento de la voz |
Keywords: | Artificial engineering Automation Control automatic Voice processing systems |
Publisher: | Universidad Autónoma de Manizales |
Abstract(esp): | El propósito de un sistema de reconocimiento del habla es tomar como entrada la forma de onda acústica de la voz humana y producir como salida una cadena de palabras equivalente [1]. Para lograr dicho resultado, la señal de voz ingresa a un módulo de procesamiento de señales en el que se extraen los vectores de características sobresalientes que son enviados posteriormente al decodificador; el decodificador utiliza tanto un modelo acústico como un modelo de lenguaje para generar finalmente la secuencia de palabras que tienen la máxima probabilidad de asemejarse a los vectores de características de entrada [2]. El modelo acústico es esencial para definir el comportamiento del sistema, este se obtiene con corpus de habla (ficheros de voz que contienen los datos de una amplia población de oradores con su correspondiente transcripción) de voces recogidas en el mismo idioma en el que se realizará el reconocimiento, mientras más robusto sea el corpus mejor será su desempeño. Si bien existen varias herramientas de software para realizar desarrollos con reconocimiento del habla, el hecho de que este proyecto es desarrollado para comandos en español limita su escogencia y finalmente se opta por hacer el desarrollo con el SAPI de Microsoft que para este idioma ya tiene un desarrollo importante. Otras herramientas como “Julius” solo ponen a disposición modelos acústicos completos en japonés o en otros pocos idiomas principalmente el inglés. |
Abstract(eng): | The purpose of a speech recognition system is to take the acoustic waveform of the human voice as input and produce an equivalent word string as output [1]. To achieve this result, the voice signal enters a signal processing module in which the vectors with outstanding characteristics are extracted and subsequently sent to the decoder; the decoder uses both an acoustic model and a language model to finally generate the sequence of words that are most likely to resemble the input feature vectors [2]. The acoustic model is essential to define the behavior of the system, this is obtained with speech corpus (voice files that contain the data of a large population of speakers with their corresponding transcription) of voices collected in the same language in which it will be performed. recognition, the more robust the corpus, the better its performance. Although there are several software tools to carry out development with speech recognition, the fact that this project is developed for commands in Spanish limits its choice and finally it is decided to do the development with Microsoft's SAPI, which for this language already has a important development. Other tools such as "Julius" only make available complete acoustic models in Japanese or in a few other languages, mainly English. |
URI: | https://repositorio.autonoma.edu.co/handle/11182/868 |
Appears in Collections: | Maestría en Mecatrónica y Control |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Reconocimiento_comandos_voz_español_orientado_control_silla_ruedas.pdf | Texto completo | 4,58 MB | Adobe PDF | View/Open |
Auto_Reconocimiento_comandos_voz_español_orientado_control_silla_ruedas.pdf | Autorización | 852,51 kB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License