Estudio comparativo entre Apache Flink y Apache Spark : medición de la performance en la ejecución de algoritmos tradicionales de un Datawarehouse

Detalles Bibliográficos
Autor Principal: Jaime, Rubén Alejandro
Otros autores o Colaboradores: Hasperué, Waldo (Director/a)
Formato: Tesis
Lengua:español
Datos de publicación: 2021
Temas:
Acceso en línea:http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2410
Consultar en el Cátalogo
Descripción Física:1 archivo (1,5 MB) : il. col.
Tabla de Contenidos:
  • CAPÍTULO 1
  • Introducción
  • Objetivos
  • Metodología
  • Contribución
  • Marco Referencial
  • 1. Big Data
  • 1.1 Formato y Tipos de Archivos a utilizar en Big Data
  • 1.1.1 Parquet
  • 1.1.2 ORC
  • 1.1.3 AVRO
  • 2. Antecedentes de Investigación
  • CAPÍTULO 2
  • Apache Flink
  • 1. Introducción
  • 2. Casos de Uso
  • 3. Aplicaciones Basadas en Eventos
  • 4. Aplicaciones de Análisis de Datos
  • 5. Aplicaciones de Data Pipelines
  • 6. Flink CEP-Procesamiento de Eventos Complejos para Flink
  • 7. Tabla API y SQL
  • 7.1 Flink SQL
  • 8. Librerías
  • 8.1 Flink ML
  • 8.2 API de Gráficos-Gelly
  • 9. API de Flink Data Stream
  • 9.1 Transformaciones de Data Stream
  • 9.2 API de Flink Data Set
  • 9.2.1 Transformaciones de Data Set
  • CAPÍTULO 3
  • Apache Spark
  • 1. Introducción
  • 2. Data Frame
  • 2.1 Particiones
  • 2.2 Transformaciones
  • 3. Arquitectura y Componentes
  • 4. Programación Funcional con Spark
  • 5. Spark RDD
  • 5.1 Evaluación Perezosa
  • 5.2 Limitaciones de los RDDs
  • 6. La Aplicación Spark
  • 7. Agregaciones
  • 7.1 Funciones de la Agregación
  • 8. Persistencia en Memoria y Gestión de Memoria
  • 9. La Anatomía de un Job de Spark
  • 10. Gráfico Acíclico Dirigido
  • CAPÍTULO 4
  • Resultados
  • 1. Descripción del Problema de Datawarehouse
  • 2. Planteo del Problema Utilizando Spark y Flink
  • 3. Descripción de la Base de Datos
  • 4. Experimentos Realizados
  • 5. Hardware Utilizado
  • 6. Herramientas de Monitoreo
  • 7. Consultas SQL Implementadas
  • 7.1Tabla View_precalculated
  • 7.2 Agregación RU
  • 7.3 Agregación RV
  • 8. Experimentación
  • 8.1 Resultados de la Ejecución en una Data Warehouse Convencional….
  • 66
  • 8.2 Experimentación con Spark y Flink
  • 8.2.1 Valores Medidos por Ganglia y JConsole
  • 8.3 Análisis de Datos Columnares
  • CAPÍTULO 5
  • 1 Conclusiones
  • Referencias Bibliográficas