La Ciencia de datos puede considerarse [1] el cuarto paradigma de la ciencia (empírico, teórico, computacional y ahora basado en datos). Su origen está en la evolución e impacto de la tecnología de la información y el diluvio de los datos.
En general la Ciencia de Datos usa conjuntamente aprendizaje automático, estadísticas, minería de datos, analítica predictiva y metodologías de visualización, para comprender y analizar en profundidad casos complejos.
La ciencia de datos es la herramienta principal de la nueva y demandada profesión denominada Cientifico de Datos. Hoy es comúnmente aceptado que cualquier persona que pretenda sostenerse en el mercado de trabajo a mediano plazo analizando datos, deberá probar en la práctica que es un Cientifico de Datos. Ello implica que además de los instrumentos tradicionales de análisis (estadística), deberá conocer y saber aplicar los nuevos (Mineria de Datos, Aprendezaje Automatico, Analitica Predictiva, Visualizacion y capacidad de programación).
En las RAMS (Reliability, Availability, Maintainability and Safety/Security), la Ciencia de Datos ha de aplicarse a grandes masas de datos que provienen de sensores instalados en múltiples equipos monitorizados remotamente. Ello requiere de una preparación específica orientada a los conocimientos y herramientas que han de aplicarse, así como del desarrollo de cierta pericia a la hora de su aplicación. La experiencia en ambos mundos : RAMS y Ciencia de Datos, es una característica vital a requerir a los instructores que forman a los Científicos de Datos RAMS.
[1] Tansley, Stewart, Tolle y Michelle. 2009. The fourth paradigm : Data intensiv Scientific Discovery. Microsoft Research. ISBN 9780982544204.