¿Cómo se ve un proyecto de ciencia de datos?

En el campo cada vez más amplio de la ciencia de los datos, la competencia para liderar y sobrevivir es más dura que nunca. Los proyectos de vanguardia que se están trabajando en todo el mundo sólo hacen que sea difícil para los científicos de datos mantenerse al día.

Ya sea que estés en la escuela trabajando en proyectos para un curriculum vitae/perfil estelar o reinventándose a ti mismo a mitad de carrera o por interés general; independientemente del propósito del proyecto, la declaración de problema que elijas es lo que hace un impacto en el proyecto y su calendario.

Durante mi tiempo en la escuela de posgrado, con cada nueva clase, me emocionaría tomar nuevas declaraciones de problemas de datos para trabajar y el mayor desafío era terminar esos proyectos. En los dos primeros semestres de mi programa de posgrado, identificaría 36 proyectos para trabajar en un mes, empezar 12 de ellos y completar ninguno.

Pero de nuevo, ¿por qué es tan importante trabajar en proyectos de Ciencia de Datos?

Si estás en la escuela ahora mismo, probablemente estés trabajando en un proyecto para cada clase que tomes. Si usted es un profesional que trabaja, usted no está preocupado por las luchas de encontrar un trabajo — ¿por qué preocuparse en absoluto de trabajar en proyectos de Ciencia de Datos?

  • POV estás en la escuela: Muchos de tus compañeros de clase mencionarían el mismo proyecto que hiciste para la clase y antes de darte cuenta, otros 38 currículums terminan pareciéndose al tuyo.
  • POV usted es un profesional de trabajo: La ciencia de los datos está en constante evolución porque los problemas a los que se enfrentan las empresas están evolucionando y eso hace que sea importante, incluso para los profesionales, mantenerse en sintonía con lo último y mejor de la ciencia de los datos (qué mejor que un proyecto de fin de semana a fin de semana para mantenerse actualizado)

Habiendo establecido la premisa de por qué los proyectos de Ciencia de Datos son importantes, a continuación se presenta un enfoque (probado, probado y exitoso) para trabajar en proyectos de Ciencia de Datos sin dejar de completarlos.

  • Identificar un nicho de datos Los proyectos de Data Science pueden incluir una gama de habilidades tales como exploración de datos, visualización de datos, pronóstico de series temporales, tableros de tablero o agrupación y clasificación
  • Crear un nicho de negocio Si te apasiona un área de negocio, trabaja en declaraciones de problemas para esa industria o crea un equilibrio de proyectos para cada industria (esto se vuelve especialmente útil para tu currículum cuando solicitas empleo. Usted puede cambiar entre sus proyectos por el papel y la empresa a la que está aplicando). Elija entre finanzas, atención médica, deportes, medios de comunicación y comunicaciones, software y servicios de TI, u otros
  • Establecer el objetivo ¿Qué quieres lograr con este proyecto?

Para mí, una vez que determino qué parte del ciclo de vida de la ciencia de datos quiero aprender práctica y el área de negocios, entonces determino cómo sería mi proceso:

  • El resultado es conocido: usted sabe los resultados esperados, qué modelo de datos a aplicar
  • El análisis decide los siguientes pasos: trabajar con un conjunto de datos aleatorio, realizar análisis de datos y desentrañar las percepciones implícitas de los datos

Otros tipos de proyectos:

  • Análisis descriptivo ( un equipo de ventas quiere ver las ventas por demografía por cliente, sexo, edad, territorio, región, mercado)
  • Análisis de los sentimientos ( puede incluir análisis de soporte al cliente o análisis de retroalimentación del cliente para determinar la afinidad de los clientes hacia un producto/marca )
  • Proyectos de detección ( Detectar anomalías en las ventas de productos )
  • Aprendizaje profundo o redes neuronales ( predecir las ventas de cada uno de los productos x para el año siguiente en cada uno de los diferentes puntos de venta )
  • Agrupación y clasificación ( qué cliente es el más probable o improbable para comprar un producto X )

Hace un año clasifiqué mis proyectos en las categorías anteriores y determiné el nivel de complejidad a partir de entonces. Dicho esto, los proyectos en los que se ha trabajado hoy deben reflejar su proceso de pensamiento y no limitarse a uno de los anteriores.

Ahora que has bloqueado el tipo de proyecto en el que quiero trabajar, crearía un plan de acción para el próximo número de días que trabajaría en este proyecto. No puedo enfatizar lo mucho que esto hizo mi vida fácil.

Divulgación completa: Los siguientes pasos parecerían un poco de un esfuerzo para mirar, pero me darías las gracias cuando sea el momento de documentar tus proyectos para tu perfil o GitHub.

  • Hipótesis y limitaciones de los documentos — no vivimos en un mundo perfecto. Cada proyecto tiene su conjunto de supuestos, limitaciones y dependencias
  • Herramientas necesarias — configurar el entorno en la versión requerida (Python 3.0 o superior, etc.), actualizar e instalar los paquetes y bibliotecas necesarios

Como empezaría por visualizar el proyecto en papel y construir un tablero de visión con mis objetivos, requisitos, resultados esperados, con el tiempo, me di cuenta — un proyecto de Ciencia de Datos es mejor mantener en jaque cuando trabajas como si estuvieras enviando una propuesta de proyecto a un senior y siguiendo un camino establecido.

  • Establecer el objetivo de la investigación: definir los objetivos del problema que hay que abordar
  • Haga una hipótesis: hacer preguntas relevantes y forma hipótesis sobre su problema definido mediante el análisis de los datos
  • Recopilar y preparar datos: recopilar y raspar los datos necesarios para el proyecto, corregir las inconsistencias dentro de los datos como el manejo de los valores faltantes y la alta multicolinealidad
  • Hipótesis de ensayo — seleccionar variables importantes y construir otras más significativas para demostrar las hipótesis con las que se inició (modelos de aprendizaje automático de formación y pruebas)
  • Analice sus resultados — evaluar el rendimiento de los modelos y utilizarlos para hacer predicciones
  • Refinar la hipótesis (si es necesario)
  • Representar los resultados — comunicar los resultados a un canal adecuado utilizando gráficos, visualizaciones interactivas e informes

Después de cada paso, regresas a ese documento de visión para validar, y ahí están tus momentos de éxito.

Documentar tu proyecto mientras estás en él también hace que sea más fácil mostrar en tu perfil tecnológico — una página de READ.me para GitHub o una descripción de proyecto para su cartera, la vida se vuelve fácil!

Usted puede elegir tomar notas en su planificador de destino como lo hice o utilizar herramientas de gestión de proyectos como JIRA, Atlassian, o Asana, o un simple Google Doc.

Eso es todo desde mi final para este blog. ¡Gracias por leer! Hazme saber en los comentarios en qué proyectos de ciencia de datos estás trabajando actualmente y si tú también sigues un proceso para tus proyectos!

Si te gusta leer historias como estas y quieres apoyarme como escritor, considera inscribirte para convertirte en un miembro medio usando este enlace (¡y puedo ganar una pequeña comisión sin costo adicional para ti!)

¡Feliz Data Tenting!

Rashi es un genio de los datos de Chicago que le encanta visualizar datos y crear historias perspicaces para comunicar ideas de negocios. Ella es una analista de datos de salud a tiempo completo y blogs sobre datos los fines de semana con una buena taza de chocolate caliente...

Artículos Relacionados:

Esta web usa cookies, puedes ver la política de cookies, aquí -
Política de cookies +