Análisis regional de delitos de alto impacto en la Ciudad de México, con mapeo de puntos de interés (original) (raw)

Ésta es la tesis de maestría de Manuel Gutiérrez. Sus directores de tesis fueron Adolfo Guzmán y Gilberto Martínez Luna. RESUMEN. La Minería de Datos muestra su utilidad de análisis en los fenómenos de interés para la humanidad, fenómenos que a hoy en día involucran variables de diferentes tipos: categóricas, numéricas, booleanas, geo-referencias, entre otras. Por lo anterior, los análisis que debe desarrollar la Minería de datos se vuelven más complejos, ya sea al solo realizar su descripción y después una posible predicción de hechos. Un fenómeno de interés a analizar es la ocurrencia de delitos, fenómeno que tiene la característica indicada en el párrafo anterior, de involucrar diferentes tipos de variables, como la clasificación del delito, tiempo del hecho (día de semana, día, mes, año, hora), genero de los involucrados, localidad (en sus diferentes áreas de análisis y geo-referenciación), y otras variables más que se catalogan como confidenciales. Las variables de primer nivel del fenómeno, podrían describirlo parcialmente, aún con la Visualización que involucre a todas ellas. Pero, para una descripción más completa, es necesario, coleccionar más datos de variables que podrían estar relacionadas con el fenómeno. En el caso de delitos, los datos a coleccionar y que podrían estar relacionados, son datos que identifiquen a objetos o sitios de interés, cercanos al lugar del delito y que podrían ser desde sitios de diversión, académicos, comerciales u otro que se puedan relacionar, además de estaciones del metro o paradas de autobús. Para una descripción más completa, las técnicas de visualización ayudan, pero aquí surgen problemas de seleccionar las visualizaciones o diseñar las que ayuden a describir más el fenómeno. En este proyecto se propone una plataforma de software para el análisis en su parte de descripción de fenómenos como el indicado. Este fenómeno es de interés para México, ya que cuenta con 10 ciudades en el Ranking de las 50 ciudades más peligrosas del mundo [1], utilizando los delitos de alto impacto de la Ciudad de México en el lapso de tiempo del 2013 al 2016. El análisis de descripción se realiza a diferentes niveles: • El análisis geográfico en diferentes regiones de la ciudad (colonias, delegaciones, cuadrantes y no convencionales) • El mapeo de información geo-referenciada de delitos con otros puntos de interés • Así como funcionalidades que puedan aportar a un análisis temporal. Para las funcionalidades se destacan como aportaciones, varios algoritmos propios como • El que localiza las rutas entre dos diferentes puntos • Y el que califica a las regiones en diferentes niveles de peligrosidad • Además de las estructuras de almacenamiento que permiten responder las funcionalidades desarrolladas (Base de datos con información delictiva, BD de polígonos de las regiones de análisis y de puntos de interés, cubos de datos y matrices de adyacencia). Funcionalidades que, a través de diversas presentaciones con CONACYT, SSP-CDMX, CNS, IPN, Empresariales y medios de información se han considerado útiles e innovadoras.