Caracterización de documentos utilizando técnicas de minería de textos

Detalles Bibliográficos
Autor Principal: Aquino, Germán
Otros autores o Colaboradores: Lanzarini, Laura Cristina (Director/a)
Formato: Tesis
Lengua:español
Datos de publicación: 2013
Temas:
Acceso en línea:Consultar en el Cátalogo
Descripción Física:110 p. : il. col. + 1 DVD
Tabla de Contenidos:
  • 1. Minería de Datos y Minería de Textos
  • 1.1. El Proceso de Extracción
  • 1.2. Fases del proceso de Extracción de Conocimiento
  • 1.2.1. Integración y Recopilación
  • 1.2.2. Selección, limpieza y transformación
  • 1.2.3. El proceso de Minería de Datos
  • 1.2.4. Evaluación e interpretación
  • 1.3. Cuestiones relevantes en la Minería de Datos
  • 1.3.1. Tipos de datos. Discretización y numerización
  • 1.3.2. Normalización y escalado de los datos
  • 1.3.3. Expresividad y separabilidad
  • 1.3.4. Dimensionalidad
  • 1.3.5. Medidas de distancia
  • 1.4. Minería de Textos
  • 1.4.1. Tareas y representaciones en la minería de textos
  • 1.4.2. Caracterización de documentos
  • 1.5. Resumen del capítulo
  • 2. Técnicas de la Minería de Datos
  • 2.1. Tareas de la Minería de Datos
  • 2.2. Relación entre las técnicas y las tareas
  • 2.3. Redes Neuronales
  • 2.3.1. Aprendizaje supervisado
  • 2.3.2. Perceptrón multicapa y algoritmo de Backpropagation
  • 2.3.3. Aprendizaje no supervisado
  • 2.4. Algoritmo K-medias
  • 3. El método LIKE. Pre-procesamiento de los datos
  • 3.1. El problema de la extracción de palabras clave
  • 3.2. LIKE: Recopilación, integración y limpieza de los datos
  • 3.3. Transformación de los datos
  • 3.3.1. Obtención de los términos
  • 3.3.2. Generación de características
  • 3.4. Resumen del capítulo
  • 4. El método LIKE. Entrenamiento y evaluación del modelo
  • 4.1. El problema del desbalance de clases
  • 4.2. Entrenamiento de la red neuronal
  • 4.3. KEA: Keyphrase Extraction Algorithm
  • 4.3.1. Generación de frases candidatas
  • 4.3.2. Construcción del modelo
  • 4.4. Medidas de evaluación. Precisión, recall y F-measure
  • 4.5. Evaluación y resultados obtenidos
  • 4.6. Resumen del capítulo
  • 5. Conclusiones
  • Índice de figuras
  • Índice de tablas
  • Bibliografía