¿Qué te fascina de la ciencia de los datos?

y por qué puede que no te guste

Hace años leí un artículo del famoso blogger Mark Manson. Desde entonces ha publicado varios libros y es bastante conocido ahora. Lo que él dijo en ese artículo fue que usted podría pensar que usted quiere algo, pero usted tiene que asegurarse de que usted está considerando los problemas y los desafíos que se enfrentarán que vienen con él, no sólo el estado de haberlo logrado. Su punto es que «necesitas amar el camino, no sólo el resultado». De lo contrario, usted será miserable.

Interrogo a profesionales de datos de diferentes empresas, antecedentes y niveles de antigüedad en mi podcast. Durante estos chats, les pregunto por qué eligieron la ciencia de los datos y qué les gusta de ella. Una respuesta que recibo a menudo es: “Me encanta poder decirle a la gente qué hacer basado en datos”. Estoy seguro de que todo el mundo puede relacionarse con que ser un buen sentimiento. Imagínese subir a su jefe y decir, “bueno, esa campaña que hizo el mes pasado fue un error, aquí es por qué y aquí es lo que usted debe hacer en su lugar”. Por supuesto, no todos los científicos de datos hacen eso. Nunca llegué a hacer eso todavía. Si esta es también su aspiración, podríamos tener un problema allí.

Mi opinión sobre la ciencia de los datos es un poco diferente. Me encanta la ciencia de los datos para el viaje en lugar de los resultados de él. El proceso de hacer algo de aparentemente nada me deleita cada vez. En este artículo, me gustaría compartir algunas de las cosas específicas que observé en mi trabajo que me gusta más cada día y las cosas que podrían no gustarle.

No es posible ser un científico de datos sin estar expuesto a cualquier tipo de conocimiento de dominio. Trabajo con diferentes empresas para cada nuevo proyecto y es un paseo divertido. Cuando he terminado con un proyecto, por lo general estoy mucho mejor informado sobre esa industria de lo que estaba antes. Es en parte porque necesito saber más para ser capaz de realizar mi trabajo, pero también porque estar cerca de la gente que trabaja en esa industria le da una nueva apreciación por lo que hacen y las complejidades del trabajo. En cierto modo, entiendo cómo el mundo funciona mejor con cada proyecto.

Como parte de mi trabajo, tengo que actuar como un investigador. Nadie puede saber dónde puedo obtener acceso a los datos pero necesito averiguarlo, hablar con la gente y encontrar a esa persona que puede darme acceso. Es posible que las partes interesadas no sepan lo que necesitan o quieren exactamente, depende de mí estudiar su área y entender qué es exactamente lo que está yendo mal y qué tipo de solución de ciencia de datos necesitan. También me corresponde a mí vigilar cualquier posible escollo en los datos, en el proceso de formación. Necesito asegurarme de que todo concuerda, no hay conflictos y no hay errores obvios. Esto requiere una gran atención al detalle y es muy satisfactorio.

Este trabajo no es un tipo de trabajo “necesitamos esto, así que por favor háganlo”. Yo, como científico de datos, estoy altamente incluido en el proceso de decisión. Esto se debe a que el científico de datos es el que tiene la experiencia, pero también porque lo que estoy haciendo tiene que alinearse perfectamente con la realidad. Si mi modelo no está perfectamente sintonizado con la realidad, es muy difícil usarlo en la vida real. Así que es importante, y divertido, para asegurarse de que usted habla con casi todos los involucrados en un proyecto y asegurarse de que usted tiene una buena comprensión general del problema a mano.

Sé que esto no es un favorito común de los científicos de datos. A muchas personas no les gusta mucho el proceso de limpieza de datos. Pero de alguna manera consigo una extraña sensación de satisfacción. Algo así como aspirar una superficie visiblemente muy sucia. No es muy difícil, pero muy gratificante ya que se ven los resultados inmediatamente. Tampoco es mundano, ya que es necesario encontrar soluciones inteligentes a problemas como la falta de puntos de datos o un conjunto de datos desequilibrado.

Es fascinante lo que podría desencadenar como científico de datos. Ni siquiera tienes que preparar un modelo avanzado para ello. Sólo la perspectiva basada en los datos sobre las cosas tiende a marcar una gran diferencia. Muchas veces las partes interesadas empresariales en las partes superiores de una organización descuidan el pensamiento en términos de datos. Es por eso que una vez que se les presenta una simple visualización de sus datos o algunas ideas que nunca han escuchado antes, se ve una chispa en sus ojos. Significa, sí, amigo mío, que te las arreglaste para cambiar o añadir a cómo piensan sobre esa cierta cosa.

A veces suena como si los científicos de datos fueran robots que realizan las mismas tareas una y otra vez. Datos limpios, modo de tren, modelo de prueba, siguiente... Es por eso que muchas personas creen (en lugar de incorrectamente) que el trabajo de un científico de datos puede ser fácilmente automatizado. Quiero decir, estoy seguro de que puede ser automatizado, pero no tan fácilmente. Creo que el trabajo de un científico de datos es creativo a veces. Hay reglas del pulgar y las mejores prácticas cuando se trata de lidiar con los problemas en los datos, pero muchas veces usted tiene que ir salvaje y dejar su pelo hacia abajo, probar algo que nunca había oído antes. Esos son los momentos en que mi trabajo se pone muy divertido.

Tengo que decir que detesto la frase “actitud de hacer cosas” pero hace un buen trabajo definiendo la actitud de un científico de datos. La mayoría de las veces la información que usted necesita no va a ser incluida y usted va a tener que encontrar una solución a esto en sus propios términos. Tienes que ser ingenioso y creativo.

¿No hay información de fecha en el conjunto de datos? Mira la mayoría de los artículos vendidos en ese período. ¿Encontró la mayoría de las ventas de dulces temáticos de Halloween? Ahora puedes estimar la fecha.

¿No hay información del día de la semana? Mira los números del día y cuando pasan a la nueva semana. El primer día debe ser el lunes. PERO los datos son de los EE.UU. tan probable Día 1 será el domingo. # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #

Un ejemplo que me gusta es de Twitter donde usaron la mención de las papas fritas para sugerir a la empresa de freídoras para ofrecer apoyo a los restaurantes.

Una cosa que no he mencionado aquí es, por supuesto, la comunidad de personas en AI que empujan los límites de esta profesión. Definitivamente hace que uno se sienta orgulloso. Por no hablar de la ventaja de entender lo que realmente está sucediendo cuando hay noticias sobre un cierto avance en la IA, en lugar de tener miedo de los “robots que se apoderan del mundo”.

Todas estas cosas y más hacen que sea emocionante ponerse delante de mi computadora y empezar a trabajar para mí. Creo que es especialmente muy satisfactorio ser un científico de datos para alguien a quien le encanta aprender cosas nuevas y le encanta resolver problemas. Esto puede que no seas tú y eso está bien. Antes de saltar en el vagón de la ciencia de los datos asegúrese de entender el viaje que viene antes de la glamurosa “Le digo a mi jefe qué hacer, todos en la empresa está esperando en mis ideas” fase. Podría ahorrarte un valioso tiempo pasado infelizmente en la oficina.

Además, publica artículos semanales, entrevistas con profesionales de datos y recursos gratuitos para ayudar a los profesionales a cambiar sus carreras a la ciencia de datos de manera eficiente. Si usted se siente perdido acerca de lo que necesita aprender, se confunde con todos los cursos que afirman que son los mejores y se siente como ninguno de ellos es lo suficientemente completo para sus propósitos, mi sitio web es para usted.

Artículos Relacionados:

Esta web usa cookies, puedes ver la política de cookies, aquí -
Política de cookies +