D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark

Mostrar todas las versiones(2)

Detalles Bibliográficos
Autor Principal:	Molina, Roberto Pedro
Otros autores o Colaboradores:	Hasperué, Waldo
Formato:	Capítulo de libro
Lengua:	español
Temas:	ALGORITMOS FLUJO DE DATOS PROCESAMIENTO DE DATOS
Acceso en línea:	Consultar en el Cátalogo
Resumen:	En este trabajo se presenta una prueba de concepto de un algoritmo de clustering basado en densidad, denominado D3CAS, el cual fue implementado para ser ejecutado bajo el framework Spark Streaming y que permite el procesamiento de flujos de datos. La principal característica del algoritmo presentado es que es dinámico, es decir selecciona automáticamente el número de clusters del flujo de datos. El algoritmo fue probado datasets de CLUTO, midiendo la calidad de los clusters obtenidos. Los resultados, obtenidos en un ambiente virtualizado, fueron comparados con otro algoritmo de clustering (CluStream), demostrando que D3CAS arroja mejores resultados.
Notas:	Formato de archivo PDF. -- Este documento es producción intelectual de la Facultad de Informática - UNLP (Colección BIPA/Biblioteca)
Descripción Física:	1 archivo (669,9 kB)

MARC


LEADER	00000naa a2200000 a 4500
003	AR-LpUFIB
005	20250423183236.0
008	230201s2018 xx r 000 0 spa d
024	8		\|a DIF-M8029 \|b 8245 \|z DIF007332
040			\|a AR-LpUFIB \|b spa \|c AR-LpUFIB
100	1		\|a Molina, Roberto Pedro \|9 49600
245	1	0	\|a D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark
300			\|a 1 archivo (669,9 kB)
500			\|a Formato de archivo PDF. -- Este documento es producción intelectual de la Facultad de Informática - UNLP (Colección BIPA/Biblioteca)
520			\|a En este trabajo se presenta una prueba de concepto de un algoritmo de clustering basado en densidad, denominado D3CAS, el cual fue implementado para ser ejecutado bajo el framework Spark Streaming y que permite el procesamiento de flujos de datos. La principal característica del algoritmo presentado es que es dinámico, es decir selecciona automáticamente el número de clusters del flujo de datos. El algoritmo fue probado datasets de CLUTO, midiendo la calidad de los clusters obtenidos. Los resultados, obtenidos en un ambiente virtualizado, fueron comparados con otro algoritmo de clustering (CluStream), demostrando que D3CAS arroja mejores resultados.
534			\|a Congreso Argentino de Ciencias de la Computación (24to : 2018 : Tandil, Argentina)
650		4	\|a ALGORITMOS \|9 42858
650		4	\|a FLUJO DE DATOS \|9 42825
650		4	\|a PROCESAMIENTO DE DATOS \|9 7694
700	1		\|a Hasperué, Waldo \|9 45531
942			\|c CP
952			\|0 0 \|1 0 \|4 0 \|6 A1089 \|7 3 \|8 BD \|9 82667 \|a DIF \|b DIF \|d 2025-03-11 \|l 0 \|o A1089 \|r 2025-03-11 17:05:00 \|u http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2037 \|w 2025-03-11 \|y CP
999			\|c 57107 \|d 57107

D3CAS: un algoritmo de clustering para el procesamiento de flujos de datos en spark

MARC

Ejemplares similares