¿Tiene futuro la ciencia de los datos?
El futuro de la ciencia de los datos como profesión no está claro, ya que las nuevas tecnologías cambian las responsabilidades de los científicos de datos. También puede cambiar pronto la naturaleza del trabajo.
Nota del editor: Este artículo fue originalmente reportado y publicado en abril de 2021. Fue actualizado con nueva información en julio de 2022.
Los científicos de datos son uno de los papeles más buscados en los Estados Unidos corporativos hoy en día, porque las organizaciones, armadas con el talento adecuado, pueden generar más valor a partir de sus datos.
Sin embargo, científico de datos las funciones están evolucionando como una cuestión de innovación tecnológica y madurez del mercado. De hecho, los títulos de estadístico, actuario y cuant, dependiendo de la industria, precedieron al título de científico de datos.
Hay algunos desafíos a la hora de determinar cómo el papel científico de los datos Sin embargo, está cambiando. Por un lado, a pesar de la alta demanda de científicos de datos no hay requisitos claros para el trabajo.
¿Qué es la ciencia de los datos?
La ciencia de los datos, definida por los profesionales de la industria de hoy en día, es el estudio y el uso de datos para informar las decisiones empresariales y crear nuevos productos orientados al cliente. Los científicos de datos suelen ser responsables del análisis de datos para encontrar nuevas ideas. A menudo trabajan con modelos avanzados de aprendizaje automático para predecir el futuro comportamiento del cliente o del mercado basado en tendencias pasadas.
El objetivo final de lo que las empresas esperan obtener de los científicos de datos no se espera que cambie. Pero es probable que la manera en que los científicos de datos logren esos objetivos experimenten alteraciones sustanciales en los años venideros.
¿Tiene futuro la ciencia de los datos?
Los expertos han dicho que el 80% o más del trabajo de un científico de datos es preparar los datos para el análisis. Ahora, los proveedores de tecnología vender plataformas que automatiza tareas y datos abstractos en entornos de código bajo o sin código, potencialmente eliminando gran parte del trabajo realizado actualmente por los científicos de datos.
"[El título de científico de datos] probablemente se desvanecerá en el fondo porque más herramientas se están convirtiendo en prevalentes", dijo Kathleen Featheringham, director de estrategia de IA y capacitación en la empresa de consultoría de tecnología de TI y gestión Booz Allen Hamilton. "Para mí, es como el diseño de sitios web hace años cuando tenías que tener gente a la que realmente le gusta el código, pero ahora puedes ir en línea y usar una herramienta que construirá tu sitio web para ti".
¿La IA y la automatización reemplazarán a los científicos de datos?
Predecir el futuro de la inteligencia artificial requiere comprender su pasado. El ámbito más antiguo de la ciencia de los datos -- análisis o estocásticos -- incorporó la teoría de la probabilidad y el análisis en la programación. El lenguaje R surgió como un equivalente de código abierto de SASS y SRS, dos antiguos paquetes de análisis que remontan su linaje a Fortran. La incorporación de Python de paquetes similares lo convirtió en el lenguaje de referencia para combinar los resultados de dicho análisis de datos con otros componentes.
Estos dieron paso a herramientas visuales de tuberías como Alteryx o Microsoft BI, que redujo la necesidad de la experiencia de programación, sin embargo, requirió suficiente comprensión de las estadísticas para saber lo que estos paquetes estaban haciendo. Es poco probable que la necesidad de competencia para modelar tales tuberías desaparezca por completo, por lo que mientras la noción de ser un científico especializado en datos se desvanecerá, la necesidad de analistas expertos en materia temática continuará.
Por otra parte, se puede argumentar que el campo de la ingeniería de aprendizaje automático, que requiere una comprensión de las matemáticas de nivel superior, ya se está moviendo fuera del ámbito del científico de datos. Esto entra en el ámbito de la ciencia cognitiva adaptativa, donde las neuronas programáticas manejan tareas como la generación del habla, el reconocimiento de imágenes, la clasificación contextual y áreas similares.
Por último, la cognición gráfica, que utiliza gráficos matemáticos para apoyar el análisis inferencial, estuvo fuera del ámbito de la ciencia de datos "formal" durante algún tiempo, pero ahora está siendo atraído de nuevo al papel de ingeniero de aprendizaje automático porque las soluciones de aprendizaje automático puro tienden a ser inadecuadas para construir sistemas inferenciales. Un área que se está volviendo especialmente intrigante hoy en día es redes neuronales como gráficos , mientras que la aparición de Mantas bayesianas y markov dentro de los sistemas de gráficos ofrece una forma completamente novedosa de gestionar análisis predictivos.
Como es típico de las carreras dentro del espacio tecnológico, el científico de datos como entidad distinta se está desvaneciendo, pero las carreras emergentes que demuestran el avance de la programación en estas áreas son tan importantes como siempre.
¿Cómo afectará la computación cuántica a los trabajos de ciencia de datos?
Computación cuántica y la ciencia cuántica de la información están todavía en su infancia, pero representan un nuevo mercado para los científicos de datos.
"Si estás haciendo un cálculo en una computadora clásica y tienes un montón de entradas iniciales, tienes que ejecutarlas una a la vez. En una computadora cuántica, se pueden ejecutar a través de ellos al mismo tiempo", dijo Patty Lee, científico jefe de Honeywell Quantum Solutions.
"No puedes simplemente tomar un algoritmo de computación clásica y conectarlo a una computadora cuántica. Tienes que crear nuevos algoritmos que aprovechen las propiedades mecánicas cuánticas y luego puedas extraer la información de tus datos de esa manera", dijo.
Los científicos de datos cuánticos deben entender la mecánica cuántica y cómo utilizar un algoritmo cuántico para resolver un problema en particular. Sin embargo, Lee no cree que necesariamente necesiten un grado avanzado en el tema.
"Necesitamos mucha gente para estar en ese espacio porque hay gente en el lado de la aplicación de los negocios y teóricos cuánticos que están bien versados en los algoritmos cuánticos. Necesitamos a alguien en el medio para hacer la traducción", dijo Lee.
Científico de datos vs. trabajos de ingeniero de datos
En el mundo de hoy, una empresa es mejor tener la combinación correcta de habilidades basadas en datos en lugar de la combinación correcta de títulos.
Sin embargo, los títulos ayudan a las personas y a otros a comprender el alcance de sus responsabilidades y su escala salarial. Incluso las personas que han logrado el codiciado título científico de datos pueden convertirse en otro papel porque les conviene mejor o su empresa necesita algo más.
Mientras que es más probable que un el ingeniero de datos podría convertirse en un científico de datos en los EE.UU., la tendencia opuesta está sucediendo en el Reino Unido, según Rob Weston, fundador de Heimdal Satellite Technologies.
"Hay una expectativa de que van a trabajar sólo en el aprendizaje automático, lo que no es el caso en absoluto. ¿Cómo puedo preparar los datos? ¿Cómo se van a mover los datos a la tubería?" Weston dijo. "El reto es que el volumen y la diversidad de datos están cambiando y, por lo tanto, la capacidad de manejar y mover los datos, es un problema de ingeniería".
Muchas organizaciones piensan necesitan un científico de datos , pero puede que no sea así. La firma ManpowerGroup es consciente de este fenómeno, por lo que primero pregunta a los clientes qué problema de negocio están tratando de resolver.
"Mucha gente escucha palabras de moda y quiere esas palabras de moda, pero no es realmente lo que necesitan", dijo Chuck Kincaid, un científico de datos principal y arquitecto de productos de Experis Solutions, una subsidiaria de ManpowerGroup.
Kincaid dijo que una de sus mayores preocupaciones ahora son los candidatos que listan herramientas de software en su currículum que no saben cómo utilizar correctamente. Del mismo modo, advierte de los candidatos que tratan de tomar el crédito completo para un proyecto de grupo.
Cualificaciones básicas de los científicos de datos
La Asociación de Ciencia de Datos, una asociación profesional sin fines de lucro de científicos de datos, quiere para establecer normas para certificaciones y licencias de ciencia de datos. Desde un punto de vista profesional, significaría que los científicos de datos tendrían que cumplir criterios predefinidos para solicitar una licencia y cualquier persona que no sea un profesional con licencia no podría utilizar el título legalmente.
Weston hace un punto de verificación de las calificaciones de un candidato y a menudo está decepcionado. Por ejemplo, si le da a un candidato un escenario hipotético, "49 de 50" candidatos dirán que nunca han trabajado en la industria en la que el escenario hipotético tiene lugar, en lugar de demostrar su proeza de solución de problemas y llegar a una respuesta.
"Entrevisté recientemente a un tipo que tenía un currículum vitae masivo que decía ciencia de datos, big data y muchos papeles en todas las áreas que estamos buscando. Necesitamos análisis altamente sofisticados, ya que estamos tratando con datos en el rango de petabyte", dijo Weston. "Dije, 'Estamos usando Python para la mayor parte de nuestro código. ¿Cómo podemos usar Python dentro de EMR Spark? ¿Qué bibliotecas podríamos usar?' No podía responder a la pregunta y ni siquiera había oído hablar de PySpark. Es una pregunta justa ya que su CV declaró tres años de experiencia haciendo exactamente esto".
Títulos y certificaciones en ciencias de los datos
Muchos de los principales científicos de datos tienden a tener Grados avanzados en matemáticas o estadísticas y son maestros en la solución de problemas. Otros tienen experiencia en ciencias de la computación, astrofísica u otros temas.
"¿Creo que los científicos de datos deben tener esos grados específicos? No. Por supuesto que no," dijo Featheringham. "Ha habido muchas definiciones, pero es inherentemente alguien que tiene curiosidad".
Como cualquier otro papel, un científico de datos puede evolucionar en otra cosa, y hay algunos indicadores que sucederán.
En última instancia, el papel del científico de datos está cambiando, aunque exactamente cómo está cambiando es una cuestión de debate. Las soluciones automatizadas están acelerando y simplificando algunas tareas, pero no lo son. automatizar a los científicos de datos No tiene trabajo todavía. Mientras tanto, están surgiendo otras oportunidades, como la ciencia cuántica de datos .
¿Desaparecerán las carreras de científicos de datos? Algunos piensan que sí. Sin embargo, mientras tanto, hay un montón de oportunidades para aquellos que han dominado su oficio.
Artículos Relacionados: