Métricas de calidad para validar los conjuntos de datos abiertos públicos gubernamentales
Autor Principal: | |
---|---|
Otros autores o Colaboradores: | , , |
Formato: | Tesis |
Lengua: | español |
Datos de publicación: |
2021
|
Temas: | |
Acceso en línea: | http://catalogo.info.unlp.edu.ar/meran/getDocument.pl?id=2498 Consultar en el Cátalogo |
Descripción Física: | 1 archivo (6,5 MB) : il. col. |
Tabla de Contenidos:
- Capítulo 1 - Introducción
- 1.1. Contexto
- 1.2. Definición del Problema
- 1.3. Objetivo General
- 1.4. Objetivos Específicos
- 1.5. Hipótesis
- 1.6. Alcance
- 1.7. Contribución Científica
- 1.8. Enfoque Metodológico
- 1.9. Organización de la Tesis
- Capítulo 2 - Marco Teórico
- 2.1. Innovación Pública
- 2.2. Gobierno Abierto
- 2.3. Datos Públicos
- 2.3.1. Acceso a la Información Pública
- 2.3.1.1. Transparencia Activa
- 2.3.1.2. Transparencia Pasiva
- 2.4. Datos Abiertos
- 2.4.1. Niveles de Apertura de Datos
- 2.4.2. Apertura de datos en el mundo
- 2.4.3. Apertura de datos en América Latina y el Caribe
- 2.4.4. Apertura de datos abiertos en Argentina
- 2.4.4.1. Relevamiento de Portales abiertos gubernamentales provinciales argentinos
- 2.5. Catálogos de datos y conjuntos de datos (datasets)
- 2.6. Principios internacionales de los datos abiertos
- 2.7. Aspectos de Calidad: Norma y Estándares
- Capítulo 3 – Trabajos Relacionados
- 3.1. Construcción de Bancos de datos abiertos
- 3.2. Evaluación de la reutilización de datos abiertos
- 3.3. Crowdsourcing y datos abiertos
- 3.4. Calidad en los portales de datos abiertos
- 3.5. Medición de calidad
- 3.6. Herramientas de validación de datos abiertos
- 3.7. Resumen de Trabajos relevados
- Capítulo 4 – Definición de Métricas para el análisis de Datasets Gubernamentales
- 4.1. Métricas Críticas
- 4.1.1. Números Decimales
- 4.1.2. Registros Duplicados
- 4.1.3. Datos Faltantes y/o Completos
- 4.1.4. Caracteres Inválidos
- 4.2. Métricas No Críticas
- 4.2.1. Redundancia para el dominio de una columna .
- 4.2.2. Redundancia entre campos de una misma fila
- 4.2.3. Detección de valores ID
- 4.2.4. Campos Triviales
- Capítulo 5 – Implementación
- 5.1. Herramienta Desarrollada - HEVDA
- 5.1.1. Aspectos Técnicos
- 5.1.2. Aspectos Funcionales
- 5.2.1. Métricas
- 5.2.1.1. Tratamiento de Números Decimales
- 5.2.1.2. Registros Duplicados
- 5.2.1.3. Datos Faltantes y/o Completos
- 5.2.1.4. Caracteres Inválidos
- 5.2.1.5. Redundancia para el dominio de una columna
- 5.2.1.6. Redundancia entre campos de una misma fila
- 5.2.1.7. Detección de valores ID
- 5.2.1.8. Campos Triviales
- 5.3. Recolección de datos
- 5.4. Análisis de resultados
- 5.4.1. Análisis de las métricas bloqueantes
- 5.4.2. Resultados generales de las métricas
- Capítulo 6 – Validación
- 6.1. Introducción
- 6.2. Aspectos de Validación
- 6.2.1. Precisión
- 6.2.2. Exactitud
- 6.2.3. Completitud
- 6.2.4. Integridad
- 6.2.5. Consistencia
- 6.2.6. Relación entre valores de campos
- 6.2.7. Estructurales/Representación
- 6.2.8. Redundancia
- 6.3. Análisis de los criterios aplicados a las métricas sugeridas
- Capítulo 7 – Conclusiones y Trabajo Futuro
- 7.1. Reflexiones Finales
- 7.2. Ejecución de los Objetivos
- 7.3. Líneas Futuras de Investigación
- 7.4. Publicaciones en Revistas y Congresos
- Anexos
- Anexo A: ISO/IEC 25012
- Anexo B: Principios Internacionales de los datos abiertos
- Anexo C: Funciones secundarias de la Herramienta HEVDA
- Anexo D: Portales de datos abiertos gubernamentales
- Anexo E: Detalle de los resultados arrojados con HEVDA
- Anexo F: Detalle de los criterios de Validación
- Acrónimos
- Referencias Bibliográficas