Please use this identifier to cite or link to this item: https://ri.ufs.br/jspui/handle/riufs/15098
Document Type: Dissertação
Title: Avaliação experimental de um classificador para apoiar a detecção de fraudes em compras públicas
Authors: Fontes, Raphael Silva
Issue Date: 31-Jan-2022
Advisor: Rodrigues Júnior, Methanias Colaço
Resumo : Contexto: A Organização das Nações Unidas (ONU) descreve a corrupção como uma praga insidiosa, que tem uma ampla gama de efeitos corrosivos nas sociedades. Na prática, a corrupção possui uma variedade de instrumentos, desde pequenas quantias no aceleramento de concessões de licenças, até grandes fraudes em processos licitatórios de diversas áreas do país. Para a área da saúde, por exemplo, os gastos com medicamentos envolvem um volume expressivo de recursos, cerca de R$ 18 bilhões em 2018, potencialmente expostos às condutas lesivas ao erário. Em outra área de importante impacto, a de combustíveis, o devedor contumaz, aquele que deixa de recolher o tributo devido, foi responsável por R$ 14 bilhões de sonegação de impostos em 2020. Para tentar combater esses problemas, faz-se necessária a classificação e subtotalização automática das Notas Fiscais Eletrônicas (NF-es) emitidas para aquisição destes produtos, considerando os seus códigos de identificação únicos e suas descrições. Todavia, nem sempre os códigos são cadastrados corretamente pelos fornecedores. Além disso, se a descrição do produto for considerada uma alternativa ao código, esta não é um campo uniformizado, possuindo escrita livre e variável. Por fim, alguns produtos possuem uma classificação hierárquica nas suas descrições, importantes para uma identificação completa. Objetivo: Construir e avaliar a eficácia de um classificador de Notas Fiscais de Combustíveis e Medicamentos, baseado na mineração dos textos desestruturados destas notas, no contexto de compras feitas por órgãos públicos dos estados de Sergipe e do Rio Grande do Norte, analisadas pelos Ministérios Públicos Estadual e Federal (MPE; MPF), Grupo de Atuação Especial de Combate ao Crime (GAECO) e Secretarias da Fazenda Estaduais. Método: Após o desenvolvimento e a parametrização inicial do classificador, foram executados dois experimentos controlados com NF-es custodiadas pelos MPs, respeitando o sigilo fiscal dos envolvidos. Resultados: Considerando a significância estatística, o classificador foi capaz de identificar as descrições de medicamentos e suas subclasses hierárquicas, com os seguintes resultados médios: acurácia de 99.81%, precisão de 100%, revocação ou sensibilidade de 99.64% e medida-F1 de 99.82%. Já para combustíveis, o classificador alcançou acurácia de 100% e medida-F1 de 100%. Conclusão: Foi possível evidenciar que é factível automatizar a classificação de combustíveis e medicamentos, viabilizando investigações. Para medicamentos, também foi possível extrair as subclasses hierárquicas das descrições, a saber: princípio ativo, dosagem, forma farmacêutica e quantidade.
Abstract: Context: The United Nations (UN) describes corruption as an insidious plague, which has a wide range of corrosive effects on societies. In practice, corruption has a variety of instruments, from small amounts in accelerating the granting licenses, to large frauds in bidding processes in different areas of the country. For the health area, for example, spending on medicines involves a significant volume of resources, about R$18 billion in 2018, potentially exposed to harmful conduct to the public purse. In another area of important impact, fuel, the persistent debtor, the one who fails to pay the tax due, was responsible for R$ 14 billion of tax evasion in 2020. To try to combat these problems, it is necessary to classify and automatic subtotaling of Electronic Invoices (NF-es) issued for the purchase of these products, considering their unique identification codes and descriptions. However, the codes are not always registered correctly by the suppliers. Furthermore, if the product description is considered an alternative to the code, this is not a uniform field, being free-write and variable. Finally, some products have a hierarchical classification in their descriptions, which are important for complete identification. Objective: To build and evaluate the effectiveness of a classifier of Invoices for Fuels and Medicines, based on mining the unstructured texts of these invoices, in the context of purchases made by public bodies in the states of Sergipe and Rio Grande do Norte, analyzed by the State and Federal Prosecution Offices (MPE; MPF), Special Action Group to Combat Organized Crime (GAECO) and State Finance Departments. Method: After the development and initial parameterization of the classifier, two controlled experiments were carried out with NF-es held by the MPs, respecting the fiscal secrecy of those involved. Results: Considering the statistical significance, the classifier was able to identify drug descriptions and their hierarchical subclasses, with the following average results: accuracy of 99.81%, precision of 100%, recall or sensitivity of 99.64% and F1-measure of 99.82%. As for fuels, the classifier reached an accuracy of 100% and an F1-measure of 100%. Conclusion: It was possible to show that it is feasible to automate the classification of fuels and medicines, enabling investigations. For drugs, it was also possible to extract the hierarchical subclasses of the descriptions, namely: active ingredient, dosage, pharmaceutical form and quantity.
Keywords: Medicamento
Combustível
Corrupção
Mineração de dados
Nota Fiscal Eletrônica
Medicine
Fuel
Corruption
Data mining
Electronic invoice
Subject CNPQ: CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Language: por
Institution: Universidade Federal de Sergipe
Program Affiliation: Pós-Graduação em Ciência da Computação
Citation: FONTES, Raphael Silva. Avaliação experimental de um classificador para apoiar a detecção de fraudes em compras públicas. 2022. 68 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, 2022.
URI: https://ri.ufs.br/jspui/handle/riufs/15098
Appears in Collections:Mestrado em Ciência da Computação

Files in This Item:
File Description SizeFormat 
RAPHAEL_SILVA_FONTES.pdf1,73 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.