Todas tendencias apuntan a que la gestión de grandes cantidades de datos de investigación para hacerlos re-utilizables va a ser una de las tareas de futuro del profesional de las bibliotecas universitarias y de investigación. El problema es que aún no está muy claro como hacerlo adecuadamente. Ya que en lugar de datos de alta calidad con la velocidad correcta, formatos, variedad y volumen, los científicos tienen que trabajar con información incompleta y a veces incorrecta.
En este informe de O’Reilly, Jerry Overton-Ingeniero y líder mundial sobre datos y TICs de CSC-nos introduce a las mejores prácticas en la gestión de datos de investigación, lo cual nos llevará a la toma de las mejores decisiones en un mundo desordenado y complicado. Lo que él llama simplemente “la ciencia de datos que funciona” es un proceso de ensayo y error de crear y probar hipótesis, la recopilación de pruebas y sacar conclusiones. Estas habilidades son mucho más útiles para la práctica de científicos de datos que el dominio de los detalles de un algoritmo de aprendizaje.
Adaptado y ampliado a partir de una serie de artículos publicados en Overton O’Reilly Radar y en el blog de CSC, cada capítulo es una lección de conocimiento para los gestores y científicos de datos y aspirantes a serlo, que desean desarrollar un trabajo profesional.
El informe aborda cuestiones como:
- Uso de un método científico para obtener una ventaja competitiva. El conjunto de habilidades que se necesita para llegar a ser un científico de datos.
- ¿Por qué la práctica es una parte clave para pensar como un científico de datos. Las mejores prácticas para una escritura de código sólida en la ciencia de datos.
- ¿Cómo una ágil experimentación permite encontrar respuestas mucho más rápido. – Recomendaciones para sobrevivir (e incluso prosperar) como un científico de datos en su organización.