Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetas

Detalles Bibliográficos
Autor Principal: Ríos, Gastón Gustavo
Otros autores o Colaboradores: Dal Bianco, Pedro A., Ronchetti, Franco, Quiroga, Facundo Manuel, Stanchi, Oscar, Hasperué, Waldo
Formato: Capítulo de libro
Lengua:español
Temas:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/164827
Consultar en el Cátalogo
Resumen:Obtener datos etiquetados para el entrenamiento de redes neuronales en tareas de reconocimiento de lengua de señas es un desafío difícil y costoso. En este artículo investigamos la factibilidad de generar datos utilizando Generative Adversarial Networks (GAN), para mejorar el entrenamiento de redes neuronales. Específicamente, generamos imágenes de manos condicionando los modelos GAN con información semántica de poses y etiquetas. Comparamos los modelos ReACGAN y SPADE en la generación de nuevas imágenes de alta calidad. Evaluamos la generación de señas en dos conjuntos de datos: RWTH y HaGRID. Se entrenaron modelos generativos utilizando subconjuntos de tamaño reducido para probar el efecto de la reducción de datos de entrenamiento. Medimos la calidad de los modelos resultantes utilizando métricas cuantitativas (FID, IS, cobertura y densidad) y cualitativas (encuestas). Como resultado obtuvimos modelos GAN capaces de generar señas con un buen nivel de realismo que luego podrán ser utilizados para aumentar conjuntos de datos de lengua de señas.
Notas:Formato de archivo PDF. -- Este documento es producción intelectual de la Facultad de Informática - UNLP (Colección BIPA/Biblioteca)
Descripción Física:1 archivo (629,5 kB) : il. col.

MARC

LEADER 00000naa a2200000 a 4500
003 AR-LpUFIB
005 20250311170530.0
008 230201s2023 ag a o 000 0 spa d
024 8 |a DIF-M8856  |b 9082  |z DIF008119 
040 |a AR-LpUFIB  |b spa  |c AR-LpUFIB 
100 1 |a Ríos, Gastón Gustavo 
245 1 0 |a Generación de gestos de lengua de señas con redes neuronales generativas basadas en poses y etiquetas 
300 |a 1 archivo (629,5 kB) :  |b il. col. 
500 |a Formato de archivo PDF. -- Este documento es producción intelectual de la Facultad de Informática - UNLP (Colección BIPA/Biblioteca) 
520 |a Obtener datos etiquetados para el entrenamiento de redes neuronales en tareas de reconocimiento de lengua de señas es un desafío difícil y costoso. En este artículo investigamos la factibilidad de generar datos utilizando Generative Adversarial Networks (GAN), para mejorar el entrenamiento de redes neuronales. Específicamente, generamos imágenes de manos condicionando los modelos GAN con información semántica de poses y etiquetas. Comparamos los modelos ReACGAN y SPADE en la generación de nuevas imágenes de alta calidad. Evaluamos la generación de señas en dos conjuntos de datos: RWTH y HaGRID. Se entrenaron modelos generativos utilizando subconjuntos de tamaño reducido para probar el efecto de la reducción de datos de entrenamiento. Medimos la calidad de los modelos resultantes utilizando métricas cuantitativas (FID, IS, cobertura y densidad) y cualitativas (encuestas). Como resultado obtuvimos modelos GAN capaces de generar señas con un buen nivel de realismo que luego podrán ser utilizados para aumentar conjuntos de datos de lengua de señas. 
534 |a Congreso Argentino de Ciencias de la Computación (29no : 2023 : Luján, Argentina) 
650 4 |a REDES NEURONALES 
653 |a reconocimiento de señas 
653 |a red generativa antagónica 
700 1 |a Dal Bianco, Pedro A. 
700 1 |a Ronchetti, Franco 
700 1 |a Quiroga, Facundo Manuel 
700 1 |a Stanchi, Oscar 
700 1 |a Hasperué, Waldo 
856 4 0 |u http://sedici.unlp.edu.ar/handle/10915/164827 
942 |c CP 
952 |0 0  |1 0  |4 0  |6 A1340  |7 3  |8 BD  |9 84319  |a DIF  |b DIF  |d 2025-03-11  |l 0  |o A1340   |r 2025-03-11 17:05:30  |u http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2745  |w 2025-03-11  |y CP 
999 |c 57891  |d 57891