Use este identificador para citar ou linkar para este item: https://ri.ufs.br/jspui/handle/riufs/10760
Tipo de Documento: Dissertação
Título: Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos
Autor(es): Santana, Luciana Maiara Queiroz de
Data do documento: 26-Jul-2017
Orientador: Matos, Leonardo Nogueira
Resumo: Inúmeras tarefas de aprendizagem exigem lidar com dados sequenciais, a exemplo de tradutores de textos, geradores de músicas, entre outros. Os sistemas que utilizam redes neurais profundas têm mostrado resultados promissores no reconhecimento automático de fala, onde um dos maiores desafios é o reconhecimento em sinais de voz contaminados com ruído. Para este trabalho, combinamos duas arquiteturas conhecidas de aprendizagem profunda, as redes neurais convolucionais para abordagem acústica e uma arquitetura recorrente com classificação temporal conexionista para modelagem sequencial. As redes neurais recorrentes são modelos que capturam a dinâmica da sequência através de uma topologia que contém ciclos, ao contrário das redes neurais acíclicas ou de alimentação direta (feedforward). O modelo estudado neste trabalho é um caso particular de rede recorrente profunda que, ao contrário de seus correlatos de arquitetura rasa, é capaz de reter um estado que pode representar informações de uma janela de contexto arbitrariamente longa. Os resultados experimentais mostraram que a arquitetura proposta alcançou um desempenho superior quando comparado ao modelo clássico, modelo oculto de Markov, em testes realizados sobre as mesmas bases de dados.
Abstract: Many learning tasks require dealing with sequential data, such as text translators, music generators, and more. Deep Neural Networks have shown promising results in automatic speech recognition, where one of the main challenges is voice recognition signals in the presence of noise. In this manuscript, we combine two known deep learning architectures, Convolutional Neural Networks for acoustic modeling, and a recurrent architecture with Classification Temporal Conexionist for sequential modeling. Recurrent Neural Networks (RNN) are models that capture sequence dynamics through a topology that contains cycles, unlike acyclic neural networks or feedforward networks. The RNN studied in this work is a particular case of a deep learning network that, unlike its shallow correlates, it is able to retain a state that can represent information from an arbitrarily long context window. The experimental results showed that the proposed architecture achieved superior performance when compared to Hidden Markov Model in tests carried out on the same databases.
Palavras-chave: Reconhecimento automático de voz
Ruído aditivo
Aprendizado profundo
Rede Neural Recorrente (RNN)
Automatic Speech Recognition (ASR)
Additive noise
Deep learning
Recurrent Neural Network (RNN)
área CNPQ: CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
Sigla da Instituição: UFS
Programa de Pós-graduação: Pós-Graduação em Ciência da Computação
Citação: SANTANA, Luciana Maiara Queiroz de. Aplicação de redes neurais recorrentes no reconhecimento automático da fala em ambientes com ruídos. 2017. 68 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2017.
URI: http://ri.ufs.br/jspui/handle/riufs/10760
Aparece nas coleções:Mestrado em Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
LUCIANA_MAIARA_QUEIROZ_SANTANA.pdf10,89 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.