Por favor, use este identificador para citar o enlazar este ítem:
https://ri.ufs.br/jspui/handle/riufs/11112
Registro completo de metadatos
Campo DC | Valor | Lengua/Idioma |
---|---|---|
dc.contributor.author | Rodrigues, Ariel Ferreira | - |
dc.date.accessioned | 2019-05-08T13:15:01Z | - |
dc.date.available | 2019-05-08T13:15:01Z | - |
dc.date.issued | 2019-03-16 | - |
dc.identifier.citation | Rodrigues, Ariel Ferreira. Extração de relações semânticas binárias a partir de dados não estruturados em português. São Cristóvão, SE, 2018. Monografia (Graduação em engenharia da Computação) – Curso de Engenharia de Computação, Departamento de Computação, Centro de Ciências Exatas e Tecnologia, Universidade Federal de Sergipe, 2018 | pt_BR |
dc.identifier.uri | http://ri.ufs.br/jspui/handle/riufs/11112 | - |
dc.language | por | pt_BR |
dc.subject | Engenharia da computação | por |
dc.subject | Ensino de computação | por |
dc.subject | Engenharia de software | por |
dc.subject | Processamento de linguagem natural | por |
dc.subject | Extração de informações | por |
dc.subject | Extração de relações | por |
dc.subject | Redes neurais convolucionais | por |
dc.title | Extração de relações semânticas binárias a partir de dados não estruturados em português | pt_BR |
dc.type | Monografia | pt_BR |
dc.contributor.advisor1 | Macedo, Hendrik Teixeira | - |
dc.description.resumo | O presente trabalho avalia o uso de redes neurais convolucionais para extração de relações semânticas binárias de textos em português do Brasil e português de Portugal. Também é avaliado neste trabalho a influência da quantia de dimensões dos vetores de palavras nas macro-métricas (precisão, cobertura e métrica F1) resultantes. Para isso, foram avaliados quatro algoritmos de word embeddings diferentes (Word2Vec, Wang2Vec, FastText, GloVe), tendo sido os três primerios treinados a partir das abordagens SkipGram e CBoW. Cada word embedding foi avaliado com os valores de dimensões 50, 300 e 1000. O conjunto de dados utilizado neste trabalho foi gerado utilizando supervisão distante e inclui mais de 90 mil relações semânticas e mais de 1 bilhão de tokens. Os experimentos realizados alcançaram precisão de 80% e cobertura de 72%, resultados superiores aos apresentados pelos autores do conjunto de dados adotado, também pôde-se perceber que a quantia de dimensões dos word embeddings não influencia de forma linear as macro-métricas resultantes, reforçando resultados já encontrados na literatura. | pt_BR |
dc.publisher.department | DCOMP - Departamento de Computação – Engenharia de Computação – São Cristóvão - Presencial | pt_BR |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS | pt_BR |
dc.publisher.initials | Universidade Federal de Sergipe | pt_BR |
dc.description.local | São Cristóvão, SE | pt_BR |
Aparece en las colecciones: | Computação |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
Ariel_Ferreira_Rodrigues.pdf | 567,87 kB | Adobe PDF | ![]() Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.