Clasificación automática de correos electrónicos

Detalles Bibliográficos
Autor Principal: Fernández, Juan Manuel
Otros autores o Colaboradores: Errecalde, Marcelo Luis (Director/a), Oloriz, Mario G. (Codirector/a)
Formato: Tesis
Lengua:español
Datos de publicación: 2022
Temas:
Acceso en línea:http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2600
Consultar en el Cátalogo
Descripción Física:1 archivo (2,5 MB) : il. col.
Tabla de Contenidos:
  • 1. Introducción
  • 1.1. Contexto
  • 1.2. Objetivos
  • 1.3. El caso de estudio
  • 1.4. Organización del documento
  • 2. El correo electrónico
  • 2.1. Historia
  • 2.2. Estado actual
  • 2.3. Estructura del correo electrónico
  • 3. Marco teórico y revisión bibliográfica
  • 3.1. Conceptos preliminares
  • 3.2. Email Minig: Concepto y estado del arte
  • 3.3. Clasificación automática de textos
  • 3.4. Email mining: Clasificación automática
  • 3.4.1. Etiquetado de documentos
  • 3.4.2. Representación de documentos
  • 3.4.3. Extracción de características de los documentos
  • 3.4.4. Estrategias de Representación de documentos
  • 3.4.5. Entrenamiento del Modelo
  • 3.4.6. Estrategias de evaluación de modelos
  • 3.4.7. Métricas de selección de modelos
  • 3.4.8. Utilización del modelo
  • 4. Clasificación semi-supervisada
  • 4.1. Introducción
  • 4.2. Antecedentes
  • 4.3. Estrategia semi-supervisada propuesta
  • 4.3.1. Conjunto de datos inicial de Correos electrónicos
  • 4.3.2. Indexación de correos electrónicos con Elasticsearch
  • 4.3.3. Estrategias de selección de características
  • 4.3.4. Recuperación de correos electrónicos
  • 4.3.5. Construcción del Modelo de clasificación
  • 5. trabajos experimentales
  • 5.1. Consolidación del conjunto de datos
  • 5.1.1. Origen de los correos electrónicos
  • 5.1.2. Etiquetado de documentos
  • 5.1.3. Preprocesamiento de los correos .
  • 5.2. Análisis exploratorio del conjunto de datos
  • 5.2.1. Análisis de la fecha de la consulta
  • 5.2.2. Análisis de los atributos categóricos
  • 5.2.3. Análisis exploratorio del texto de la consulta
  • 5.3. Separación del conjunto de datos en entrenamiento y evaluación
  • 5.4. Ejecución de los experimentos
  • 5.4.1. Primera iteración: Distribución de clases original
  • 5.4.2. Segunda iteración: Redistribución de clases y corrección de etiquetas
  • de clases
  • 5.5. Implementación de la estrategia de aprendizaje semi-supervisado
  • 5.5.1. Extracción de características
  • 5.5.2. Recuperación de correos electrónicos
  • 5.5.3. Construcción del Modelo de clasificación
  • 5.5.4. Síntesis del trabajo experimental
  • 6. conclusiones y trabajos futuros
  • 6.1. Conclusiones
  • 6.2. Trabajos Futuros