Caracterización de documentos utilizando técnicas de minería de textos

Detalles Bibliográficos
Autor Principal: Aquino, Germán
Otros autores o Colaboradores: Lanzarini, Laura Cristina (Director/a)
Formato: Tesis
Lengua:español
Datos de publicación: 2013
Temas:
Acceso en línea:Consultar en el Cátalogo
Descripción Física:110 p. : il. col. + 1 DVD

MARC

LEADER 00000nam a2200000 a 4500
003 AR-LpUFIB
005 20250423183200.0
008 230201s2013 ag a rm 000 0 spa d
024 8 |a DIF-M6940  |b 7105  |z DIF006340 
040 |a AR-LpUFIB  |b spa  |c AR-LpUFIB 
100 1 |a Aquino, Germán  |9 49012 
245 1 0 |a Caracterización de documentos utilizando técnicas de minería de textos 
260 |c 2013 
300 |a 110 p. :  |b il. col. +  |e 1 DVD 
502 |a  Tesina (Licenciatura en Informática) - Universidad Nacional de La Plata, Facultad de Informática, 2013. 
505 0 |a  1. Minería de Datos y Minería de Textos -- 1.1. El Proceso de Extracción -- 1.2. Fases del proceso de Extracción de Conocimiento -- 1.2.1. Integración y Recopilación -- 1.2.2. Selección, limpieza y transformación -- 1.2.3. El proceso de Minería de Datos -- 1.2.4. Evaluación e interpretación -- 1.3. Cuestiones relevantes en la Minería de Datos -- 1.3.1. Tipos de datos. Discretización y numerización -- 1.3.2. Normalización y escalado de los datos -- 1.3.3. Expresividad y separabilidad -- 1.3.4. Dimensionalidad -- 1.3.5. Medidas de distancia -- 1.4. Minería de Textos -- 1.4.1. Tareas y representaciones en la minería de textos -- 1.4.2. Caracterización de documentos -- 1.5. Resumen del capítulo -- 2. Técnicas de la Minería de Datos -- 2.1. Tareas de la Minería de Datos -- 2.2. Relación entre las técnicas y las tareas -- 2.3. Redes Neuronales -- 2.3.1. Aprendizaje supervisado -- 2.3.2. Perceptrón multicapa y algoritmo de Backpropagation -- 2.3.3. Aprendizaje no supervisado -- 2.4. Algoritmo K-medias -- 3. El método LIKE. Pre-procesamiento de los datos -- 3.1. El problema de la extracción de palabras clave -- 3.2. LIKE: Recopilación, integración y limpieza de los datos -- 3.3. Transformación de los datos -- 3.3.1. Obtención de los términos -- 3.3.2. Generación de características -- 3.4. Resumen del capítulo -- 4. El método LIKE. Entrenamiento y evaluación del modelo -- 4.1. El problema del desbalance de clases -- 4.2. Entrenamiento de la red neuronal -- 4.3. KEA: Keyphrase Extraction Algorithm -- 4.3.1. Generación de frases candidatas -- 4.3.2. Construcción del modelo -- 4.4. Medidas de evaluación. Precisión, recall y F-measure -- 4.5. Evaluación y resultados obtenidos -- 4.6. Resumen del capítulo -- 5. Conclusiones -- Índice de figuras -- Índice de tablas -- Bibliografía 
650 4 |a REDES NEURONALES  |9 42953 
650 4 |a APRENDIZAJE AUTOMÁTICO  |9 42949 
650 4 |a BÚSQUEDA Y RECUPERACIÓN DE INFORMACIÓN  |9 44688 
653 |a minería de textos 
653 |a extracción de palabras clave 
700 1 |a Lanzarini, Laura Cristina ,  |e Director/a  |9 43377 
942 |c TE 
952 |0 0  |1 0  |4 0  |6 TES_1330  |7 1  |9 81305  |a DIF  |b DIF  |d 2025-03-11  |i DIF-04356  |l 0  |o TES 13/30   |p DIF-04356  |r 2025-03-11 17:04:28  |w 2025-03-11  |x  DV 128   |y TE 
999 |c 56121  |d 56121