Use este identificador para citar ou linkar para este item: https://ri.ufs.br/jspui/handle/riufs/24778
Tipo de Documento: Dissertação
Título: Uma análise exploratória e experimental de métodos de resumo automático de texto na saúde
Autor(es): Guimarães, João Alysson dos Santos
Data do documento: 3-Mar-2026
Orientador: Colaço Júnior, Methanias
Resumo: Contexto: Fraude e corrupção estão entre os principais crimes que afetam as instituições públicas, sendo o setor de saúde particularmente vulnerável em razão de sua complexidade estrutural, da coexistência de prestadores públicos e privados, do grande número de atores envolvidos, da natureza globalizada das cadeias de suprimentos, dos elevados custos financeiros e da assimetria de informações entre as partes interessadas. Esses fatores fragilizam os sistemas de saúde, resultando em desperdício de recursos, redução da resiliência em situações de emergência médica e limitação do acesso a serviços essenciais. Objetivo: Este trabalho tem como objetivo geral desenvolver e avaliar Métodos de Resumo Automático de Texto, voltados ao apoio de auditorias no setor de saúde. Métodos: Inicialmente, foi realizado um Mapeamento Sistemático da Literatura com o objetivo de investigar os estudos mais recentes sobre sumarização de textos no domínio da saúde, por meio da análise dos métodos desenvolvidos, dos desafios enfrentados, dos benefícios alcançados e das áreas de aplicação. Em seguida, dois métodos de resumo extrativo de texto foram propostos, e, somado a isso, realizamos avaliações experimentais para as tarefas de resumo abstrativo, classificação de texto e modelagem de tópicos. Resultados: Os achados do Mapeamento evidenciam a predominância contínua de métodos tradicionais de sumarização, como os baseados em Linguística Computacional (73,91%), observamos também que 73,91% dos métodos utilizam abordagens híbridas, bem como a necessidade de abordagens mais escaláveis. Além disso, a maioria dos estudos aborda o problema sob a perspectiva extrativa (82%), o que evidencia uma lacuna de pesquisa no que se refere a métodos abstrativos. A ampla gama de aplicações ressalta a adaptabilidade das técnicas de sumarização de textos em diferentes campos médicos e biomédicos. Foram propostos, desenvolvidos e avaliados experimentalmente dois métodos não supervisionados baseados em otimização e algoritmos meméticos para a tarefa de resumo automático genérico extrativo multi-documento de texto, buscando mitigar as limitações identificadas na literatura, como limitações de avaliação, capacidade de generalização, complexidade computacional, dependência de especialistas, resumos baseados em query e utilizando apenas um documento. Os resultados das análises estatísticas indicam que as abordagens propostas são melhores que 16 métodos da literatura de algoritmos bioinspirados. Ademais, as avaliações experimentais demonstraram a viabilidade e confiabilidade no uso de métodos abstrativos para resumo de texto, classificação de texto e modelagem de tópicos para o suporte na atividade de auditoria, contribuindo para a redução da sobrecarga informacional. Conclusão: Em síntese, os resultados obtidos a partir de análises estatísticas indicam a viabilidade do emprego de técnicas de sumarização, classificação textual e modelagem de tópicos como ferramentas de apoio à tomada de decisão, contribuindo tanto para a mitigação da sobrecarga informacional quanto para o aprimoramento da eficiência das atividades analíticas desempenhadas por auditores.
Abstract: Context: Fraud and corruption are among the main crimes that affect public institutions, with the health sector being particularly vulnerable due to its structural complexity, the coexistence of public and private providers, the large number of actors involved, the globalized nature of supply chains, the high financial costs and the asymmetry of information between interested parties. These factors weaken health systems, resulting in wasted resources, reduced resilience in medical emergencies and limited access to essential services. Objective: The general objective of this work is to develop and evaluate Automatic Text Summary Methods, aimed at supporting audits in the health sector. Methods: Initially, a Systematic Literature Mapping was carried out with the aim of investigating the most recent studies on text summarization in the health domain, through the analysis of the methods developed, the challenges faced, the benefits achieved and the areas of application. Then, two methods for extractive text summarization were proposed, and, in addition, we carried out experimental evaluations for the tasks of abstractive summarization, text classification and topic modeling. Results: The Mapping findings highlight the continued predominance of traditional summarization methods, such as those based on Computational Linguistics (73.91%), we also observe that 73.91% of the methods use hybrid approaches, as well as the need for more scalable approaches. Furthermore, the majority of studies approach the problem from an extractive perspective (82%), which highlights a research gap regarding abstractive methods. The wide range of applications highlights the adaptability of text summarization techniques in different medical and biomedical fields. Two unsupervised methods based on optimization and memetic algorithms were proposed, developed and experimentally evaluated for the task of automatic generic extractive multi-text document summarization, seeking to mitigate the limitations identified in the literature, such as evaluation limitations, generalization capacity, computational complexity, dependence on experts, summaries based on query and using only one document. The results of the statistical analyzes indicate that the proposed approaches are better than 16 methods from the bioinspired algorithm literature. Furthermore, experimental evaluations demonstrated the feasibility and reliability of using abstractive methods for text summarization, text classification and topic modeling to support audit activity, contributing to the reduction of information overload. Conclusion: In summary, the results obtained from statistical analyzes indicate the feasibility of using summarization, textual classification and topic modeling techniques as tools to support decision-making, contributing both to mitigating informational overload and improving the efficiency of analytical activities performed by auditors.
Palavras-chave: Processamento de linguagem natural
Computação
Resumos
Inteligência artificial
Mineração de dados
Resumo de texto
Classificação de texto
Modelagem de tópicos
Saúde pública
Auditoria
Natural language processing
Text summarization
Text classification
Topic modeling
Public health
Public audit
área CNPQ: CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
Sigla da Instituição: Universidade Federal de Sergipe (UFS)
Programa de Pós-graduação: Pós-Graduação em Ciência da Computação
Citação: GUIMARÃES, João Alysson dos Santos. Uma análise exploratória e experimental de métodos de resumo automático de texto na saúde. 2026. 186 f. Dissertação (Mestrado em Ciência da computação) — Universidade Federal de Sergipe, São Cristóvão, 2026.
URI: https://ri.ufs.br/jspui/handle/riufs/24778
Aparece nas coleções:Mestrado em Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
JOAO_ALYSSON_SANTOS_GUIMARAES.pdf6,86 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.