Integración de métodos de descubrimiento de conocimiento embebido en fuentes de información desestructuradas

Detalles Bibliográficos
Autor Principal: Rodríguez, J. M.
Otros autores o Colaboradores: Pesado, Patricia Mabel (Director/a), Bertone, Rodolfo Alfredo (Director/a), Merlino, Hernán (Asesor/a de tesis)
Formato: Tesis
Lengua:español
Datos de publicación: 2023
Temas:
Acceso en línea:http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2585
Consultar en el Cátalogo
Descripción Física:1 archivo (1,1 MB) : il. col.
Tabla de Contenidos:
  • 1 Objetivos
  • 1.1 Objetivo primario
  • 1.2 Objetivos secundarios
  • 2 Introducción
  • 2.1 Extracción de conocimiento
  • 2.1.1 Surgimiento de la extracción de conocimiento
  • 2.1.2 Extracción de relaciones semánticas
  • 2.1.2.1 Métodos basados en conocimiento
  • 2.1.2.2 Métodos supervisados
  • 2.1.2.3 Métodos auto-supervisados
  • 2.1.3 Métodos de extracción de conocimiento para la Web (OIE)
  • 3. Revisión sistemática de literatura
  • 3.1 Revisión de la evolución de los métodos de extracción de conocimiento para la Web (2015)
  • 3.2 Estudio de mapeo sistemático sobre métodos extracción de conocimiento para la Web (2018)
  • 3.2.1 Revisión de los métodos de Open IE relevados por Glauber y Barreiro Claro
  • 3.3 Revisión sistemática de literatura: nuevos métodos de Open IE (2021)
  • 3.3.1 Revisión de los métodos de Open IE publicados a partir de 2018
  • 3.4 Revisión de los métodos de Open IE, en idioma español
  • 4. Conjunto de pruebas
  • 4.1 Extracción manual de relaciones semánticas
  • 4.2 Evaluación de las extracciones automáticas
  • 4.2.1 Consideraciones sobre ClausIE
  • 4.2.2 Consideraciones sobre MinIE
  • 4.3 Resultados obtenidos
  • 4.3.1 Consideraciones sobre los conjuntos de datos de entrada
  • 4.4 ClausIE mejorado: identificador de oraciones
  • 4.4.1 Nuevos resultados para ClausIE
  • 5. Problemas abiertos
  • 5.1 Precisión y exhaustividad
  • 5.2 Relaciones semánticas poco informativas
  • 5.3 Manejo de información subjetiva
  • 5.4 Autonomía de los métodos
  • 5.5 Métodos en lenguaje español
  • 6. Soluciones propuestas
  • 6.1 TP-OIE (Tree Pattern Open Information Extraction)
  • 6.1.1 Proceso de aprendizaje
  • 6.1.2 Conjunto de entrenamiento
  • 6.1.3 Proceso de extracción
  • 6.1.4 Problemas encontrados con este enfoque
  • 6.2 ATP-OIE (Autonomous Tree Pattern Open Information Extraction)
  • 6.2.1 Precisión y exhaustividad
  • 6.2.1.1 Puntaje de las extracciones realizadas
  • 6.2.1.2 Utilización de métodos auxiliares
  • 6.2.1.3 Aprendizaje en línea
  • 6.2.2 Extracciones poco informativas
  • 6.2.3 Manejo de información subjetiva
  • 6.2.4 Resultados de ATP-OIE
  • 6.3 TP-OIE-ES (Tree Pattern Open Information Extraction Español)
  • 6.3.1 Precisión y exhaustividad
  • 6.3.2 Relaciones semánticas poco informativas
  • 6.3.3 Manejo de información subjetiva
  • 6.3.4 Resultados de TP-OIE-ES
  • 6.4 ECMes (Extractor de Conocimiento Mejorado en Español)
  • 6.4.1 Puntos de mejora sobre TP-OIE-ES
  • 6.4.1.1 Mejorar la precisión
  • 6.4.1.2 Mejorar la evidencia disponible
  • 6.4.1.3 Mejorar las relaciones poco informativas
  • 6.4.2 Evaluación y resultados de ECMes
  • 7. Aportes y Conclusiones
  • 7.1 Objetivo principal: creación de métodos de Open IE para idioma español
  • 7.2 Objetivo secundario: creación de un marco de referencia para la evaluación de los métodos de Open IE
  • 7.3 Objetivo secundario: creación de un método de Open IE novedoso
  • 7.4 Aporte adicional: Mejoras en métodos existentes
  • 8. Futuras líneas de investigación
  • Referencias