Use este identificador para citar ou linkar para este item: https://ri.ufs.br/jspui/handle/riufs/19584
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.authorSantos, Anderson dos-
dc.date.accessioned2024-07-12T11:30:15Z-
dc.date.available2024-07-12T11:30:15Z-
dc.date.issued2024-04-11-
dc.identifier.citationSantos, Anderson dos. Detecção de anomalias em um conjunto de dados de imóveis comerciais no município de Aracaju. São Cristóvão, 2024. Monografia (graduação em Estatística) – Departamento de Estatística e Ciências Atuariais, Centro de Ciências Exatas e Tecnologia, Universidade Federal de Sergipe, São Cristóvão, SE, 2024pt_BR
dc.identifier.urihttps://ri.ufs.br/jspui/handle/riufs/19584-
dc.description.abstractThe present work uses the local anomaly factor (LOF) to detect anomalies in a data set of commercial properties, located in the city of Aracaju, made available by the Aracaju Real Estate Market Observatory (OMI-AJU), of the Municipal Finance Secretariat. from Aracaju (SEMFAZ). A well-known semi-automatic procedure for selecting the optimal values of the hyperparameters involved in the LOF calculation is applied. As the data are of mixed types, that is, quantitative and qualitative, the Gower distance is adopted to calculate the LOF. Six anomalies are identified. The anomaly with the highest LOF is a property with 14 floors, in the Centro neighborhood. There are three other properties, with 14 floors, in the same neighborhood. The values of the variables, referring to these three properties, are practically the same and are different from the one identified as an anomaly. This may explain the anomaly, suggesting that there is an error in the data relating to these three properties or that such data are repeated observations. The anomaly with the lowest LOF is a property, also in the Center, which is among the most expensive in the municipality, but has a much higher commercial density than that of this group of properties, which suggests an incompatibility between the value of the property identified as an anomaly and its density commercial. In addition to contributing to OMI-AJU/SEMFAZ, providing mechanisms for identifying anomalies that can negatively interfere with the quality and modeling of real estate data, this work presents a methodological contribution to the field of anomaly detection, which consists of using of the aforementioned semi-automatic selection procedure for LOF hyperparameters, combined with the Gower distance, to identify anomalies in mixed-type data sets.eng
dc.languageporpt_BR
dc.subjectEstatísticapor
dc.subjectEnsino superior (UFS)por
dc.subjectAprendizagem de máquinapor
dc.subjectDetecção de anomaliaspor
dc.subjectValores atípicospor
dc.subjectMétodos não-supervisionadospor
dc.subjectMétodos semi-automáticospor
dc.subjectFator de anomalia localpor
dc.subjectDados de tipos mistospor
dc.subjectDistância de Gowerpor
dc.subjectMachine learningeng
dc.subjectAnomaly detectioneng
dc.subjectOutlierseng
dc.subjectUnsupervised methodseng
dc.subjectSemiautomatic methodseng
dc.subjectLocal outlier factoreng
dc.subjectLOFeng
dc.subjectMixed type dataeng
dc.subjectGower’s distanceeng
dc.titleDetecção de anomalias em um conjunto de dados de imóveis comerciais no município de Aracajupt_BR
dc.typeMonografiapt_BR
dc.contributor.advisor1Araujo, Luiz Henrique Gama Dore de-
dc.description.resumoO presente trabalho emprega o fator de anomalia local (LOF) na detecção de anomalias em um conjunto de dados de imóveis comerciais, localizados no município de Aracaju, disponibilizado pelo Observatório do Mercado Imobiliário de Aracaju (OMI-AJU), da Secretaria Municipal da Fazenda de Aracaju (SEMFAZ). Um conhecido procedimento semi-automático para seleção dos valores ótimos dos hiperparâmetros envolvidos no cálculo do LOF é aplicado. Como os dados são de tipos mistos, isto é, quantitativos e qualitativos, adota-se, para o cálculo do LOF, a distância de Gower. Seis anomalias são identificadas. A anomalia com maior LOF é um imóvel com 14 pavimentos, no bairro Centro. Há três outros imóveis, com 14 pavimentos, nesse mesmo bairro. Os valores das variáveis, referentes a esses três imóveis, são, praticamente, os mesmos e são diferentes do daquele identificado como anomalia. Isso pode explicar a anomalia, sugerindo haver erro nos dados referentes a esses três imóveis ou que tais dados tratam-se de observações repetidas. A anomalia com menor LOF é um imóvel, também no Centro, que está entre os mais caros do município, mas possui densidade comercial muito superior àquelas desse grupo de imóveis, o que sugere uma incompatibilidade entre o valor do imóvel identificado como anomalia e sua densidade comercial. Além de contribuir com o OMI-AJU/SEMFAZ, fornecendo mecanismos para identificação de anomalias que podem interferir negativamente na qualidade e na modelagem dos dados imobiliários, o presente trabalho apresenta uma contribuição metodológica para o campo da detecção de anomalias, a qual consiste no uso do referido procedimento de seleção semi-automática dos hiperparâmetros do LOF, combinado com a distância de Gower, para identificar anomalias em conjuntos de dados de tipos mistos.pt_BR
dc.publisher.departmentDECAT - Departamento de Estatística e Ciências Atuariais – Estatística – São Cristóvão - Presencialpt_BR
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA::ANALISE DE DADOSpt_BR
dc.publisher.initialsUniversidade Federal de Sergipe (UFS)pt_BR
dc.description.localSão Cristóvão, SEpt_BR
Aparece nas coleções:Estatística e Ciências Atuariais

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Anderson_Santos.pdf750,34 kBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.