|
|
|
|
LEADER |
00000nam a2200000 a 4500 |
003 |
AR-LpUFIB |
005 |
20250311170507.0 |
008 |
230201s2020 ag a om 000 0 spa d |
024 |
8 |
|
|a DIF-M8235
|b 8455
|z DIF007528
|
040 |
|
|
|a AR-LpUFIB
|b spa
|c AR-LpUFIB
|
100 |
1 |
|
|a Soloaga, Ignacio
|
245 |
1 |
0 |
|a Detección de registros académicos duplicados obtenidos desde repositorios digitales
|
260 |
|
|
|c 2020
|
300 |
|
|
|a 1 archivo (3,21 MB) :
|b il. col.
|
502 |
|
|
|a Tesina (Licenciatura en Sistemas) - Universidad Nacional de La Plata. Facultad de Informática, 2020.
|
505 |
0 |
|
|a Capítulo 1 Introducción -- Motivación -- Objetivos -- Objetivo general -- Objetivos secundarios -- Escenario de trabajo -- Ingesta masiva de registros -- Estructura de la tesis -- Capítulo 2 - Marco teórico -- Introducción -- Repositorios digitales -- Repositorios institucionales -- Repositorios institucionales en Argentina -- Metadatos -- Registro de metadatos -- Esquema de metadatos -- Dublin Core -- Perfiles de aplicación -- Identificadores persistentes -- Handle System -- DOI (Digital Object Identifier) -- ORCID -- Interoperabilidad vía OAI-PMH -- Interoperabilidad entre esquemas de metadatos -- Mapeo de metadatos -- Capítulo 3 - Detección de registros académicos duplicados -- Introducción -- Deduplicación de registros -- Heterogeneidad de los datos -- Deduplicación de registros académicos -- Heterogeneidad en los metadatos de distintas fuentes -- Uso de identificadores persistentes -- Técnicas para la detección de registros duplicados -- Modelos probabilísticos de emparejamiento -- Aprendizaje supervisado y semi supervisado -- Técnicas basadas en aprendizaje activo -- Técnicas basadas en distancia -- Enfoques basados en reglas -- Aprendizaje sin supervisión -- Metodologías para optimizar la cantidad de comparaciones -- Soluciones existentes -- Capítulo 4 - Análisis y desarrollo -- Introducción -- Desarrollo de un primer prototipo -- Solución propuesta -- Núcleo de la herramienta -- Esquema de metadatos genérico -- Normalización de la tipología de cada registro -- Engine y algoritmo de comparación -- Reglas -- Resultado asociado a la evaluación de una regla -- Tipos de reglas -- Elección del conjunto de reglas a evaluar -- Lógica de comparación de las reglas -- Comparación de metadatos -- Comparación de autores -- Comparación de títulos -- Comparación de fechas -- Auxiliar utils -- Funciones de similitud entre strings -- Distancia Levenshtein -- Distancia Jaro-Winkler -- Metaphone -- Función utilizada -- Obtención de identificadores -- Resultado de una deduplicación -- Mapeo de metadatos -- Funcionamiento -- Combinación de columnas -- Capítulo 5 - Desarrollo de la aplicación web -- Introducción -- Tecnologías utilizadas -- Aplicación back-end -- Extensiones al modelo -- Tarea de deduplicación -- Tarea de mapeo -- Endpoints principales de la API REST -- Aplicación front-end -- Interfaz de usuario de la herramienta de deduplicación -- Pantalla de inicio -- Formulario para iniciar una tarea -- Detalle de una tarea -- Listado de tareas -- Interfaz de usuario del módulo de mapeo -- Formulario para iniciar una tarea -- Detalle de una tarea -- Listado de tareas -- Capítulo 6 - Proceso de importación y resultados obtenidos -- Introducción -- Proceso para importaciones masivas -- Obtención de registros desde un repositorio -- Mapeo de metadatos a formato genérico -- Deduplicación con registros del repositorio destino -- Reconciliación de metadatos -- Mapeo a formato esperado por el repositorio destino -- Correcciones sobre los metadatos -- Obtención de los objetos digitales asociados a cada registro -- Generar archivo de importación y carga del mismo -- Casos de aplicación -- SCOPUS -- Memoria Académica -- CONICET Digital -- Capítulo 7 - Conclusiones y trabajos futuros -- Conclusión -- Trabajos futuros -- Mejorar performance de la herramienta de deduplicación -- Expandir módulo de comparación de autores -- Enriquecimiento de registros detectados como duplicados -- Explorar enfoque de Aprendizaje Automático -- Incorporar funcionalidad de deduplicación dentro del sistema de repositorio -- Bibliografía
|
650 |
|
4 |
|a REPOSITORIOS
|
650 |
|
4 |
|a INTEROPERABILIDAD
|
653 |
|
|
|a mapeo de metadatos
|
700 |
1 |
|
|a De Giusti, Marisa Raquel ,
|e Director/a
|
700 |
1 |
|
|a Lira, Ariel Jorge ,
|e Asesor/a profesional
|
856 |
4 |
0 |
|u http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2231
|
942 |
|
|
|c TE
|
952 |
|
|
|0 0
|1 0
|4 0
|6 TES_2053
|7 0
|9 83068
|a DIF
|b DIF
|d 2025-03-11
|i DIF-04929
|l 0
|o TES 20/53
|p DIF-04929
|r 2025-03-11 17:05:07
|w 2025-03-11
|y TE
|
952 |
|
|
|0 0
|1 0
|4 0
|7 3
|8 BD
|9 83069
|a DIF
|b DIF
|d 2025-03-11
|l 0
|r 2025-03-11 17:05:07
|u http://sedici.unlp.edu.ar/handle/10915/115229
|w 2025-03-11
|y TE
|
952 |
|
|
|0 0
|1 0
|4 0
|7 3
|8 BD
|9 83070
|a DIF
|b DIF
|d 2025-03-11
|l 0
|r 2025-03-11 17:05:07
|u http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2231
|w 2025-03-11
|y TE
|
999 |
|
|
|c 57302
|d 57302
|