Un Data Scientist es un experto en Data Science (Ciencia de datos), su trabajo consiste en extraer conocimiento a partir de los datos para poder responder a las preguntas que se le formulan. Son personas apasionadas por las ciencias y las oportunidades que les brinda la tecnología para dar soluciones modernas.
El perfil del Data Scientist, requiere como ingredientes principales habilidades avanzadas en informática, matemáticas, estadística, aprendizaje automático, pasión por los datos, saber manejar grandes volúmenes de datos, curiosidad, capacidad de comunicar el conocimiento que hemos extraído de los datos, visión de negocio, etc.
Hay que aprender muchas cosas, ya que la "ciencia de datos" es multidisciplinaria, y es una especialización vez exigente y avanzada, pero la combinación es muy potente y difícil de encontrar.
El proceso que sigue un Data Scientist para responder a las cuestiones que se le plantean se pueden resumir en estos 5 pasos:
Extraer los datos, independientemente de su fuente (webs, csv, logs, APIs, etc.) y de su volumen (Big Data o Small Data).
Limpiar los datos, para eliminar lo que distorsiona las mismas.
Procesar los datos usando diferentes métodos estadísticos (inferencia estadística, modelos de regresión, pruebas de hipótesis, etc.).
Diseñar nuevos tests o experimentos en caso necesario.
Visualizar y presentar gráficamente los datos.
El principal beneficio del Data Science en una organización es la facilidad para tomar decisiones. Las organizaciones con Data Scientists pueden incluir evidencia cuantificable basada en datos en sus decisiones comerciales. Estas decisiones basadas en datos pueden, en última instancia, llevar a una mayor rentabilidad y una mejor eficiencia operativa, rendimiento comercial y flujos de trabajo. En las organizaciones orientadas al cliente, el Data Science ayuda a identificar y refinar las audiencias objetivo.
Por otra parte, el Data Science también puede ayudar al reclutamiento. El procesamiento interno de aplicaciones y las pruebas de aptitud basadas en datos y los juegos pueden ayudar al equipo de recursos humanos de una organización a realizar selecciones más rápidas y precisas durante el proceso de contratación.
Los beneficios específicos del Data Science varían según el objetivo de la empresa y la industria. Los departamentos de ventas y marketing, por ejemplo, pueden extraer datos de clientes para mejorar las tasas de conversión o crear campañas de marketing uno a uno. Las instituciones bancarias están extrayendo datos para mejorar la detección de fraudes. Las empresas de envío utilizan el Data Science para encontrar las mejores rutas, horarios y mejores modos de transporte.