¿Qué tipo de personas son científicos de datos?

En 2012, HBR apodó al científico de datos “el trabajo más sexy del siglo XXI”. Podría decirse que también es la más vaga. Para contratar a las personas adecuadas para los roles adecuados, es importante distinguir entre diferentes tipos de científicos de datos. Hay un montón de diferentes distinciones que uno puede dibujar, por supuesto, y cualquier intento de agrupar a los científicos de datos en cubos diferentes es por necesidad una simplificación excesiva. Sin embargo, me parece útil distinguir entre los entregables que crean. Un tipo de científico de datos crea salida para que los humanos consuman, en forma de recomendaciones de producto y estrategia. Son científicos de decisión. El otro crea salida para que las máquinas consuman como modelos, datos de entrenamiento y algoritmos. Están modelando a los científicos.

En 2012, HBR apodado científico de datos “el trabajo más sexy del siglo XXI ”. Podría decirse que también es la más vaga. Para contratar a las personas adecuadas para los roles adecuados, es importante distinguir entre diferentes tipos de científicos de datos. Hay un montón de diferentes distinciones que uno puede dibujar, por supuesto, y cualquier intento de agrupar a los científicos de datos en cubos diferentes es por necesidad una simplificación excesiva. Sin embargo, me parece útil distinguir entre los entregables que crean. Un tipo de científico de datos crea salida para que los humanos consuman, en forma de recomendaciones de producto y estrategia. Son científicos de decisión. El otro crea salida para que las máquinas consuman como modelos, datos de entrenamiento y algoritmos. Están modelando a los científicos.

  • Ciencia de datos para humanos: los consumidores de la producción son los responsables de la toma de decisiones como ejecutivos, gerentes de productos, diseñadores o médicos. Quieren sacar conclusiones de los datos con el fin de tomar decisiones como qué contenido para licenciar, qué ventas conducen a seguir, qué medicina es menos probable que cause una reacción alérgica, qué diseño de página web llevará a más compromiso o más compras, qué email de marketing dará mayores ingresos, o qué parte específica de una experiencia de usuario de producto es subóptimo y necesita atención. Estos científicos de datos diseñan, definen e implementan métricas, ejecutan e interpretan experimentos, crean tableros de instrumentos, dibujan inferencias causales y generan recomendaciones a partir del modelado y la medición.
  • Ciencia de datos para máquinas: aquí los consumidores de la salida son ordenadores que consumen datos en forma de datos de formación, modelos y algoritmos. Ejemplos de los productos de trabajo de estos científicos de datos son: sistemas de recomendación que recomiendan qué camisa podría gustar a un cliente o qué medicina un médico debe considerar la prescripción basada en una función de optimización diseñada, como la optimización para clics del cliente o para minimizar las tasas de readmisión al hospital. Dependiendo de los antecedentes técnicos de estos científicos de datos, estos productos de trabajo se implementan directamente en el sistema de producción, o si son prototipos se entregan a los ingenieros de software para ayudar a implementarlos, optimizarlos y escalarlos.

Los escurridizos científicos de la pila completa de datos existen, aunque son difíciles de encontrar. En la mayoría de las organizaciones, tiene sentido que los científicos de datos se especialicen en un tipo u otro. Pero los científicos de datos son criaturas curiosas que prosperan de ser capaces de incursionar creativamente; hay beneficios para darles flexibilidad para trabajar en proyectos que tocan ambos “tipos” – tanto para ellos como para la organización. (La barra lateral ofrece más detalles sobre cómo los dos tipos de datos científicos difieren no sólo en sus habilidades y el trabajo que hacen, pero en quién se asocian y sus medidas de éxito.)

Decision Scientist vs. Científico modelista

¿Quién consume la salida?

Científico de la decisión: Humanos.

Científico modelista: Máquinas.

¿Cuál es la salida?

Científico de decisiones: Tableros, presentaciones, memos, nuevas métricas, modelos predictivos para informar la toma de decisiones, análisis de oportunidades para determinar en qué invertir o priorizar, informes sobre los resultados de experimentos incluyendo recomendaciones.

Científico modelista: Modelos, datos de entrenamiento, algoritmos.

¿Cuáles son las medidas del éxito?

Científico de decisiones: Mejora de la toma de decisiones en la organización.

Científico modelista: Mejoras directas en el producto o negocio del código desarrollado y enviado.

¿Cuáles son algunos ejemplos?

Científico de decisiones: Qué contenido para licenciar, qué ventas conducen a seguir, qué medicina es menos probable que cause una reacción alérgica, qué diseño de la página web llevará a más compromiso o más compras, qué email de marketing dará mayores ingresos, qué parte específica de una experiencia del usuario del producto es subóptimo y necesita atención.

Científico modelista: sistemas de recomendación que recomiendan qué camisa le gustaría a un cliente o qué medicamento debe recetarse basándose en una función de optimización diseñada como la optimización para clics del cliente, o para minimizar las tasas de retorno a la clínica.

¿Qué habilidades se requieren?

Científico de decisiones: Estadísticas, experimentación, pensamiento analítico, comunicación y habilidades de colaboración para trabajar con socios técnicos y no técnicos, conocimientos tanto de scripting como de lenguajes de consulta (p. ej. Python, R, SQL), e idealmente también formación en ciencias de la computación.

Científico modelador: ingenieros de backend, gerentes de productos (para determinar para qué optimizar), otros colegas modelistas-científicos que comparten técnicas, científicos de decisión sobre qué características a considerar y conjuntos de datos a utilizar.

Una mirada más detallada a los roles de datos

En operaciones de datos más grandes y sofisticadas, se necesitan roles más finos. Aquí hay cinco áreas clave que contribuyen a las operaciones de ciencia de datos. En las organizaciones pequeñas, una persona hará varias de estas cosas. En equipos un poco más grandes, cada uno de ellos puede ser un papel integrado por uno o más individuos. En operaciones más grandes, cada uno puede ser un equipo en sí mismo. Estas funciones abarcan la creación, el mantenimiento y el uso de datos, y se suman a los científicos de datos descritos anteriormente (científicos de decisiones y científicos de modelos).

  • Gestor de productos de datos: crear productos para que los clientes internos los utilicen dentro de su flujo de trabajo, para permitir la incorporación de mediciones creadas por científicos de datos. Ejemplos incluyen: un portal para leer los resultados de las pruebas A/B, una herramienta de análisis de fallos o un panel de control que permite el autoservicio de datos y el diagnóstico de la causa raíz de cambios en las métricas o el rendimiento del modelo.

¿A quién contratar?

Entonces, ¿qué tipo de científico de datos debería estar reclutando? Para responder a esa pregunta, primero decide en qué etapa estás con tu operación de datos, y en segundo lugar pregunta cómo son los datos vitales para tu producto. Si usted es una organización pequeña que acaba de empezar y contratar a su primer científico de datos, trate de contratar a alguien que puede abarcar tantos de estos papeles como sea posible — el científico de datos de pila completa elusivo. Si usted es más grande o más lejos en su operación de datos, la respuesta dependerá más de cómo los datos esenciales es para su producto. Si su producto va a depender del aprendizaje automático desde el principio, necesitará experiencia de aprendizaje automático en su primer contrato, o su primer líder. Si, por el contrario, estás buscando identificar oportunidades de productos o mejorar la toma de decisiones generales en toda la organización, necesitarás a alguien más capacitado en ciencia de decisiones, análisis descriptivos y predictivos y estadísticas, y alguien que pueda traducir cómo usar los datos en todo el equipo de liderazgo y a socios no técnicos.

Por último, si usted no tiene datos internos en un formato que es consumible o razonable, necesitará un científico de datos con un fondo de ingeniería o ciencias de la computación lo suficientemente fuerte que pueden trabajar con los ingenieros para guiar qué datos deben ser capturados y cómo, antes de que puedan comenzar su trabajo.

Cómo organizar

Ya se ha escrito mucho sobre cómo deben organizarse las funciones de la ciencia de los datos. Tal vez el punto más importante es que si la ciencia de datos es un diferenciador estratégico para la organización, el jefe de la unidad de ciencia de datos debería informar al CEO. Si esto no es posible, al menos deberían informar a alguien que entienda la estrategia de datos y esté dispuesto a invertir para darle lo que necesita. La ciencia de los datos tiene sus propias habilidades, flujo de trabajo, herramientas, procesos de integración, cultura; si es crítica para la organización es mejor no enterrarla bajo una parte de la organización con una cultura diferente.

La otra gran pregunta es si y cómo integrar la ciencia de los datos en las diferentes líneas de negocio. Hay tres modelos básicos: centralizados en un equipo de ciencia de datos, distribuidos a través de las líneas de negocio, o un híbrido entre los dos donde se tiene un equipo centralizado informando en una sola cabeza, pero coubicar físicamente e integrar equipos de científicos de datos en unidades de negocio a largo plazo. A menos que su operación de datos incluye varios cientos de empleados, es bastante claro en este punto que el modelo híbrido es más eficaz. (Si usted alcanza esta escala, un modelo completamente distribuido puede tener sentido, pero muy pocas empresas trabajan de esta manera.)

En el modelo híbrido, la centralización en la estructura de presentación de informes permite a los científicos de datos progresar y crecer en una escala especializada para los científicos de datos, crecer con sus pares y ser evaluados contra ellos, y facilitar y garantizar que las mejores prácticas se compartan entre ellos, ya que no están cada uno en sus propios silos. (Establecer este grupo de pares es clave; los científicos de datos son criaturas curiosas que quieren crecer y aprender unos de otros.) Debido a la estructura de informes, también permite al líder promover más fácilmente la movilidad interna entre grupos empresariales; esta polinización cruzada en toda la empresa suele ser un gran beneficio.

Al mismo tiempo, la integración en grupos empresariales permite a los científicos de datos establecerse como expertos de dominio en su grupo empresarial, y desarrollar una relación con los socios empresariales como parte esencial a largo plazo del equipo. Esta asociación proporcionará a los científicos de datos un rico contexto empresarial, lo que les permitirá tener un impacto máximo al comprender y orientar verdaderamente las prioridades empresariales que deben abordarse utilizando los datos y cómo.

¿Qué datos científicos necesitan para tener éxito

Aunque diferentes tipos de científicos de datos pueden tener diferentes especialidades o deberes, hay algunas cosas que todos necesitan para tener éxito. Necesitan socios de negocios que puedan ayudarles a integrarse en la línea de negocio principal y la línea de productos. Necesitan socios de datos —como ingenieros de aplicaciones de software e ingenieros de infraestructura de datos— que ayuden a garantizar que los instrumentos de datos básicos necesarios y los feeds de datos sean correctos, completos y accesibles. Y necesitan líderes dispuestos a invertir en las bases necesarias para su trabajo, incluyendo la calidad de los datos, la gestión de datos, la visualización de datos y las plataformas de acceso, y una cultura de esperar que los datos formen parte del proceso de desarrollo de negocios y productos. La clave para ello es asignar un tiempo apropiado (y a menudo subestimado) dentro del proceso de desarrollo para los datos y la medición. Con demasiada frecuencia, los equipos de productos y software piensan en los datos y la medición como algo que pueden “añadir” rápidamente al final.

Un último consejo para aquellos que contratan científicos de datos: Busque a personas que estén enamoradas de resolver problemas, no con soluciones o métodos específicos, y para personas que sean increíblemente colaborativas. No importa qué tipo de científico de datos usted está contratando, para tener éxito necesitan ser capaces de trabajar junto con una gran variedad de otras funciones de trabajo — desde ingenieros, gerentes de productos, vendedores y equipos ejecutivos. Finalmente, busque a personas que tengan alta integridad. Como sociedad, tenemos la responsabilidad social de utilizar los datos para el bien y con respeto. Los científicos de datos son responsables de la custodia de los datos dentro y fuera de la organización en la que trabajan.

Artículos Relacionados:

Esta web usa cookies, puedes ver la política de cookies, aquí -
Política de cookies +