Aplicación de metodología CRISP-DM para segmentación geográfica de una base de datos pública
2020; National Autonomous University of Mexico; Volume: 21; Issue: 1 Linguagem: Espanhol
10.22201/fi.25940732e.2020.21n1.008
ISSN2594-0732
Autores Tópico(s)Competitive and Knowledge Intelligence
ResumoEl avance tecnológico ha permitido a las organizaciones en todos los niveles almacenar grandes volúmenes de datos. Sin embargo, un problema al cual se están enfrentando actualmente es el análisis de dichos datos a fin de extraer conocimiento útil para toma de decisiones en problemas reales. Actualmente existen varias metodologías que facilitan el análisis de datos a fin de extraer información que se pueda convertir en conocimiento: una de ellas es la metodología CRISP-DM (acrónimo de Cross Industry Standard Process for Data Mining) que a pesar de ser la metodología más utilizada para proyectos de Minería de Datos y de tener más de veinte años desde su creación no es muy conocida en el ámbito laboral de muchas organizaciones de todo tipo en México. El presente artículo tiene como objetivo ejemplificar la aplicación de la metodología CRISP-DM en la obtención de un modelo de segmentación básico sobre la base pública de unidades económicas (establecimientos y empresas) del Directorio Nacional de Unidades Económicas (DENUE). Para ello se aplicaron los seis pasos de la metodología (comprensión del problema, comprensión de datos, preparación de datos, modelado, evaluación del modelo e implementación del mismo) para obtener un modelo de segmentación que dividió las unidades económicas de México en dos grupos (el primer grupo conteniendo seis entidades y el segundo grupo conteniendo veintiséis entidades) con volumetrías de unidades económicas similares y con un patrón geográfico de interés. Aunque se trata de un primer modelo sobre la base del DENUE que es susceptible de mejora, muestra el beneficio de aplicar la metodología CRISP-DM lo cual sin duda es de utilidad para las organizaciones que aplican actualmente dichos proyectos en México y también muestra la potencialidad de explotar una base pública con información valiosa como la base del DENUE en muchos sentidos (comercial, académico, etc.) mediante Minería de Datos.
Referência(s)