ArchLearn : Implementação de acelerador em hardware baseado em FPGA para redes neurais artificiais

Santana, Gabriel Dias de

Use este identificador para citar ou linkar para este item: https://ri.ufs.br/jspui/handle/riufs/13507

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.author	Santana, Gabriel Dias de	-
dc.date.accessioned	2020-06-27T01:37:24Z	-
dc.date.available	2020-06-27T01:37:24Z	-
dc.date.issued	2020-05-29	-
dc.identifier.citation	Santana, Gabriel Dias de. ArchLearn : implementação de acelerador em hardware baseado em FPGA para redes neurais artificiais. São Cristóvão, 2020. Monografia (graduação em Engenharia da Computação) – Departamento de Computação, Centro de Ciências Exatas e Tecnologia, Universidade Federal de Sergipe, São Cristóvão, SE, 2020	pt_BR
dc.identifier.uri	http://ri.ufs.br/jspui/handle/riufs/13507	-
dc.description.abstract	The need to run real-time and latency-sensitive systems has led to the development of a new paradigm in relation to dominant cloud computing, which is called edge computing. Thus, the new data distribution model seeks to bring the processing and treatment of data close to the edge of the network, a reason that leads to the development of platforms with low power processors close to sensors and mobile applications. Within this context, the growth in the use of Machine Learning algorithms and the possibility of transferring part of the execution of these models locally, opens up a range of questions regarding how to execute them efficiently. That said, this work implemented the convolution operation for an FPGA platform in order to optimize the execution time of a CNN (Convolutional Neural Network) in a microcontroller. The proposed approach was designed to perform in a specialized manner three convolutional layers of a CNN, which was trained to perform the classification of 10 classes of images present in the CIFAR-10 dataset. For comparison, two approaches were tested using an ARM CORTEX-M4 processor: without any software optimization and with optimization provided by special instructions SIMD (Single Instruction, Multiple Data) through the CMSIS-NN library. As a result, the execution time of the convolutional layers achieved in this work was up to 25% less than the fastest time using only the processor.	por
dc.language	por	pt_BR
dc.subject	Ciência da computação	por
dc.subject	Ensino de engenharia de computação	por
dc.subject	Engenharia da computação	por
dc.subject	FPGA	por
dc.subject	Aceleração de hardware	por
dc.subject	Redes neurais artificiais	por
dc.subject	Hardware	por
dc.subject	Hardware acceleration	eng
dc.subject	Artificial neural networks	eng
dc.title	ArchLearn : Implementação de acelerador em hardware baseado em FPGA para redes neurais artificiais	pt_BR
dc.type	Monografia	pt_BR
dc.contributor.advisor1	Prado, Bruno Otávio Piedade	-
dc.description.resumo	A necessidade de executar sistemas em tempo real e sensíveis a latência levou ao desenvolvimento de um novo paradigma em relação a dominante computação em nuvem, que é chamado de edge computing. Dessa forma, o novo modelo de distribuição dos dados busca trazer o processamento e tratamento dos dados para próximo da borda da rede, motivo que leva o desenvolvimento de plataformas com processadores de baixa potência próximo a sensores e aplicações móveis. Dentro desse contexto, o crescimento do uso de algoritmos de Machine Learning e a possibilidade de transferir parte da execução desses modelos localmente, abre um leque de questões referentes a maneira de como executá-los eficientemente. Isto posto, este trabalho implementou a operação de convolução para uma plataforma FPGA com o objetivo de otimizar o tempo de execução de uma CNN (Convolutional Neural Network) em um microcontrolador. A abordagem proposta foi projetada para executar de forma especializada três camadas convolucionais de uma CNN, que foi treinada para realizar a classificação de 10 classes de imagens presentes no dataset CIFAR-10. Para comparação duas abordagens foram testadas usando um processador ARM CORTEX-M4: sem nenhuma otimização de software e com otimização fornecida por instruções especiais SIMD (Single Instruction, Multiple Data) por meio da biblioteca CMSIS-NN. Como resultado, o tempo de execução das camadas convolucionais alcançado neste trabalho foi até 25% menor em relação ao tempo mais rápido usando apenas o processador.	pt_BR
dc.publisher.department	DCOMP - Departamento de Computação – Engenharia de Computação – São Cristóvão - Presencial	pt_BR
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO	pt_BR
dc.publisher.initials	Universidade Federal de Sergipe	pt_BR
dc.description.local	São Cristóvão, SE	pt_BR
Aparece nas coleções:	Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
Gabriel_Dias_Santana.pdf		2,9 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Visualizar estatísticas