Para la mayoría de entidades de investigación y empresas, los datos de calidad son fundamentales para medir el éxito y planificar los objetivos. Pero lograr la exactitud de los datos y la integridad puede ser una tarea desalentadora dada la naturaleza desordenada de los datos en bruto. ¿De qué manera se puede confiar en que los datos de origen son exactos? ¿Qué datos deben ser excluidos? ¿Qué pasos se deben tomar para asegurar que todos los datos se transforman correctamente?
Este informe presenta un estudio de caso de un proyecto de gestión de datos intensivos (Big Data) Spiceworks, la vibrante red, la comunidad línea y el mercado para profesionales de TICs. La autora Jessica Roper, desarrolladora senior en la división de análisis de datos de Spiceworks, demuestra formas de pensar en la verificación, procesamiento, análisis y automatización de datos. Además de ser una guía de herramientas para:
- Determinar si los datos que recopila y utiliza son fiables y precisos.
- Comprender lo que implica investigar los datos para verificar su fiabilidad.
- Aprender estrategias y casos de prueba para verificar fuentes de datos sin procesar y trabajar con transformaciones de datos.
- Familiarizarse con los datos de cada capa y crear pruebas entre cada transformación para garantizar la coherencia.
- Entender qué casos , qué tendencias y valores esperamos obtener.
- Monitorización de datos para identificar anomalías y problemas del sistema.
- Automatizar las pruebas de proceso y aceptación para supervisar y garantizar la fiabilidad de los datos.
- Trabajar con otros equipos y grupos para mejorar y validar la exactitud de los datos.
- Aumentar la adopción mediante el uso de datos para medir el éxito.