Revista de Saúde Pública (Apr 2010)

Classificação de microáreas de risco com uso de mineraçãode dados Clasificación de microáreas de riesgo con uso de mineración de datos Classification of risk micro-areas using data mining

  • Andreia Malucelli,
  • Altair von Stein Junior,
  • Laudelino Bastos,
  • Deborah Carvalho,
  • Marcia Regina Cubas,
  • Emerson Cabrera Paraíso

DOI
https://doi.org/10.1590/S0034-89102010000200009
Journal volume & issue
Vol. 44, no. 2
pp. 292 – 300

Abstract

Read online

OBJETIVO: Identificar, com o auxílio de técnicas computacionais, regras referentes às condições do ambiente físico para a classificação de microáreas de risco. MÉTODOS: Pesquisa exploratória, desenvolvida na cidade de Curitiba, PR, em 2007, dividida em três etapas: identificação de atributos para classificar uma microárea; construção de uma base de dados; e aplicação do processo de descoberta de conhecimento em base de dados, por meio da aplicação de mineração de dados. O conjunto de atributos envolveu as condições de infra- estrutura, hidrografia, solo, área de lazer, características da comunidade e existência de vetores. A base de dados foi construída com dados obtidos em entrevistas com agentes comunitários de saúde, sendo utilizado um questionário com questões fechadas, elaborado com os atributos essenciais, selecionados por especialistas. RESULTADOS: Foram identificados 49 atributos, sendo 41 essenciais e oito irrelevantes. Foram obtidas 68 regras com a mineração de dados, as quais foram analisadas sob a perspectiva de desempenho e qualidade e divididas em dois conjuntos: as inconsistentes e as que confirmam o conhecimento de especialistas. A comparação entre os conjuntos mostrou que as regras que confirmavam o conhecimento, apesar de terem desempenho computacional inferior, foram consideradas mais interessantes. CONCLUSÕES: A mineração de dados ofereceu um conjunto de regras úteis e compreensíveis, capazes de caracterizar microáreas, classificando-as quanto ao grau do risco, com base em características do ambiente físico. A utilização das regras propostas permite que a classificação de uma microárea possa ser realizada de forma mais rápida, menos subjetiva, mantendo um padrão entre as equipes de saúde, superando a influência da percepção particular de cada componente da equipe.OBJETIVO: Identificar, con auxilio de técnicas computacionales, reglas relacionadas con las condiciones del ambiente físico para la clasificación de microáreas de riesgo. MÉTODOS: Investigación exploratoria, desarrollada en la ciudad de Curitiba, Sur de Brasil, en 2007, dividida en tres etapas: identificación de atributos para clasificar una microárea; construcción de una base de datos; y aplicación del proceso de descubrimiento de conocimiento en base de datos, por medio de la aplicación de mineración de datos. El conjunto de atributos involucró las condiciones de infraestructura, hidrografía, suelo, área de diversión, características de la comunidad y existencia de vectores. La base de datos fue construida con datos obtenidos en entrevistas con agentes comunitarios de salud, siendo utilizado un cuestionario con respuestas cerradas, elaborado con los atributos esenciales, seleccionados por especialistas. RESULTADOS: Fueron identificados 49 atributos, siendo 41 esenciales y ocho irrelevantes. Fueron obtenidas 68 reglas con la mineración de datos, las cuales fueron analizadas bajo la perspectiva de desempeño y calidad y divididas en dos conjuntos: las inconsistentes y las que confirman el conocimiento de especialistas. La comparación entre los conjuntos mostró que las reglas que confirmaban el conocimiento, a pesar de tener desempeño computacional inferior, fueron consideradas más interesantes. CONCLUSIONES: La mineración de datos ofreció un conjunto de reglas útiles y comprensibles, capaces de caracterizar microáreas, clasificándolas con respecto al grado de riesgo, con base en características del ambiente físico. La utilización de las reglas propuestas permite que la clasificación de una microárea pueda ser realizada de forma más rápida, menos subjetiva, manteniendo un patrón entre los equipos de salud, superando la influencia de la percepción particular de cada componente del equipo.OBJECTIVE: To identify, with the assistance of computational techniques, rules concerning the conditions of the physical environment for the classification of risk micro-areas. METHODS: Exploratory research carried out in Curitiba, Southern Brazil, in 2007. It was divided into three phases: the identification of attributes to classify a micro-area; the construction of a database; and the process of discovering knowledge in a database through the use of data mining. The set of attributes included the conditions of infrastructure; hydrography; soil; recreation area; community characteristics; and existence of vectors. The database was constructed with data obtained in interviews by community health workers using questionnaires with closed-ended questions, developed with the essential attributes selected by specialists. RESULTS: There were 49 attributes identified, 41 of which were essential and eight irrelevant. There were 68 rules obtained in the data mining, which were analyzed through the perspectives of performance and quality and divided into two sets: the inconsistent rules and the rules that confirm the knowledge of experts. The comparison between the groups showed that the rules that confirm the knowledge, despite having lower computational performance, were considered more interesting. CONCLUSIONS: The data mining provided a set of useful and understandable rules capable of characterizing risk areas based on the characteristics of the physical environment. The use of the proposed rules allows a faster and less subjective area classification, maintaining a standard between the health teams and overcoming the influence of individual perception by each team member.

Keywords