Por favor, use este identificador para citar o enlazar este ítem:
http://rid.unrn.edu.ar/handle/20.500.12049/11052
Título: | Algoritmo para realizar matching automático en bases de datos |
Autor(es): | Graziani, Alfredo |
Director: | Formia, Sonia Alejandra |
Fecha de publicación: | 2023 |
Citación: | Graziani, Alfredo (2023) Algoritmo para realizar matching automático en bases de datos. Trabajo final de grado. Universidad Nacional de Río Negro. |
Abstract: | - |
Resumen: | La búsqueda y el matching de cadenas de texto son tareas fundamentales en el ámbito de las bases de datos y la gestión de la información. Con el crecimiento exponencial de los datos y la diversidad de fuentes de información, se ha vuelto cada vez más crucial desarrollar técnicas eficientes para realizar búsquedas precisas y rápidas en conjuntos de cadenas de texto. En este Trabajo Final de Carrera, se aborda específicamente el problema de implementar un procedimiento de matching de cadenas de texto en el motor de bases de datos PostgreSQL, un sistema de gestión de bases de datos relacionales ampliamente utilizado. El objetivo principal de esta investigación es mejorar la capacidad de realizar matching de cadenas de texto en PostgreSQL, superando las limitaciones de las funciones de búsqueda de cadenas incorporadas en el sistema. Estas funciones, si bien son útiles en muchos casos, pueden ser insuficientes cuando se trata de escenarios más complejos que requieren mayor flexibilidad y rendimiento. Por lo tanto, se propone desarrollar un procedimiento personalizado que aproveche las capacidades de PostgreSQL y brinde una solución más eficiente y precisa para el matching de cadenas de texto. El entorno real en el que se utiliza el matching de cadenas de texto es amplio y diverso. Desde aplicaciones de búsqueda web hasta sistemas de recomendación en plataformas de comercio electrónico, este proceso juega un papel fundamental en la recuperación de información precisa y relevante. Además, en el ámbito de la gestión de datos, se aplica en la deduplicación de registros, la corrección de datos erróneos o mal escritos, y la identificación de patrones y relaciones en conjuntos de datos masivos. El proceso de matching de cadenas de texto implica comparar y encontrar coincidencias entre cadenas de texto en un conjunto de datos. Para lograr esto, se utilizan diversas técnicas y algoritmos, como la búsqueda de patrones, el uso de expresiones regulares, la distancia de edición y los trigramas. Estas técnicas permiten identificar cadenas similares o idénticas, incluso cuando existen variaciones, errores ortográficos o diferencias léxicas. En este trabajo, se enfocará en la mejora de un procedimiento personalizado de matching de registros para PostgreSQL, basado en la implementación de un algoritmo de matching de cadenas de texto. Se explorarán enfoques como el uso de trigramas, el cálculo de distancias de edición y otros métodos que permitan mejorar la precisión y el rendimiento. |
URI: | http://rid.unrn.edu.ar/handle/20.500.12049/11052 |
Aparece en las colecciones: | Licenciatura en Sistemas |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
Graziani Alfredo- 2023.pdf | 1,12 MB | Adobe PDF | Visualizar/Abrir |
Este documento es resultado del financiamiento otorgado por el Estado Nacional, por lo tanto queda sujeto al cumplimiento de la Ley N° 26.899
Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons