Limpieza, corrección y geocodificación de grandes bases de direcciones utilizando minería de texto
PDF
HTML

Palabras clave

Georreferenciación
geocodificación
minería de texto

Cómo citar

Troncoso Espinosa, F. H., & Fernández Rozas, N. E. (2021). Limpieza, corrección y geocodificación de grandes bases de direcciones utilizando minería de texto. Universidad Ciencia Y Tecnología, 25(109), 80-87. https://doi.org/10.47460/uct.v25i109.451

Resumen

Para la georreferenciación de un gran número de direcciones, es necesaria la previa geocodificación mediante sistemas de carácter público o privado. La geocodificación no es una ciencia exacta porque las direcciones generalmente son escritas y almacenadas por personas, lo que provoca diferentes problemas de precisión en el registro, como errores ortográficos, datos innecesarios o falta de datos mínimos. Para enfrentar este problema, en este artículo se describe una metodología que limpia y corrige las direcciones optimizando el proceso de geocodificación utilizando los sistemas existentes. Para su desarrollo se utiliza el proceso Knowledge Discovery in Text (KDT). La metodología se aplica a una base de datos de direcciones de hechos delictivos proporcionada por la unidad de análisis penal de la Fiscalía Regional del Biobío, Chile. Los resultados muestran un aumento en el número de geocodificaciones de los sistemas implementados, que varía según el sistema utilizado.

Palabras Clave: Georreferenciación, Geocodificación, Minería de Texto.

Referencias

[1]C. Davis y F. Fonseca, «Assessing the Certainty of Locations Produced by an Address Geocoding System,» Geoinformatica, vol. 11, pp. 103-129, 2007.

[2]L. Hill, «Georeferencing in Digital Libraries,» D-Lib Magazine, vol. 10, nº 5, 2004.

[3]J. Pontón y A. Santillán, «Seguridad Ciudadana: escenarios y efectos,» 2008.

[4]D. W. Goldberg, «Spatial approaches to reducing error in geocoded data,» 2010.

[5]D.-H. Yang, L. M. Bilaver, O. Hayes y R. Goerge, «Improving Geocoding Practices: Evaluation of Geocoding Tools,» Journal of Medical Systems, vol. 28, pp. 361-370, 2004.

[6]T. Ah-Hwee, «Text mining: The state of the art and the challenges,» de PAKDD’99 workshop on Knowledge Discovery from Advanced Databases, Beijing, 1999.

[7]R. Feldman y I. Dagan, «Knowledge discovery in textual databases,» de First International Conference on Knowledge Discovery and Data Mining (KDD-95), 1995.

[8]M. d. C Justicia de la Torre , «Nuevas Tecnicas de Mineria de Textos: Aplicaciones,» Granada, 2017.

[9]M. Lutz, Programming Python, vol. 2, O'reilly & Associates, 2001, pp. 1-10.

[10]W. McKinney, Python For Dara Analysis, O'Reilly, 2012, pp. 111-152.

[11]E. Ukkonen, «Algorithms for Approximate String Matching,» de International Conference on Foundations of Computation Theory, 1985.

[12]M. A. Alvarez Carmona, «Deteccion de similitud en textos cortos considerando traslape, ordeny relacion semantica de palabras,» Tonantzintla, Puebla, 2014.

[13]V. I. Levenshtein, «Binary Codes Capble Of Correcting Deletions, Insertions, and Reversals,» Soviet Physics Doklady, vol. 10, p. 707, 2 February 1966.

[14]Google, «Google Maps Plataform,» 2020. [En línea]. Disponible: https://developers.google.com/maps/documentation/javascript/geocoding?hl=es-419. [Último acceso: 29 Julio 2020].

[15]Mapquest, «Mapquest Developer,» 2020. [En línea]. Disponible: https://developer.mapquest.com/. [Último acceso: 25 Julio 2020].

[16]Microsoft Corporation, «Bing Maps Dev Center,» 2020. [En línea]. Disponible: https://www.bingmapsportal.com/. [Último acceso: 29 Julio 2020].

[17]Open Street Map Wiki, 2020. [En línea]. Disponible: https://wiki.openstreetmap.org/wiki/Main_Page. [Último acceso:29 Julio 2020].

[18]OpenAdrdresses, «OpenAdrdresses,» 2020. [En línea]. Disponible: https://openaddresses.io/. [Último acceso: 25 Julio 2020].

[19]OpenCage Geocoder, 2020. [En línea]. Disponible: https://opencagedata.com/. [Último acceso: 29 Julio 2020].

[20]Yahoo, «Yahoo Developer,» 2016. [En línea]. Disponible:https://developer.yahoo.com/. [Último acceso: 14 Agosto 2020].

[21]K. Jordahl, J. Van Den Bossche y J. Wasserman, «Geopandas/Geopandas: V0. 4.1. Zenodo,» 2020.

https://doi.org/10.47460/uct.v25i109.451
PDF
HTML
Creative Commons License
Esta obra está bajo licencia internacional Creative Commons Reconocimiento 4.0.

Descargas

La descarga de datos todavía no está disponible.