¿Debo aprender ML o ciencia de datos?

La ciencia de los datos y el aprendizaje automático son dos temas candentes en este momento y usted podría estar interesado en aprender acerca de ellos.

Muchos principiantes se preguntarán si deben empezar por aprender ciencias de los datos o aprendizaje automático y este post tratará de ayudarle con eso.

Entonces, ¿debería aprender aprendizaje automático o ciencia de datos primero? Si tu objetivo es convertirte en un científico de datos, lo mejor sería empezar aprendiendo habilidades como limpieza, procesamiento y análisis de datos utilizando cosas como la biblioteca Pandas como parte de un curso de ciencia de datos.

En realidad hay un montón de cosas a considerar al decidir si entrar en el aprendizaje automático o campo de la ciencia de los datos. Además, a pesar de que los dos campos están muy relacionados hay una serie de diferencias clave entre ellos.

Aprendizaje automático

El aprendizaje automático es donde las computadoras aprenden de los datos y los utilizan para hacer predicciones sin que se les diga explícitamente cómo hacerlo. Los algoritmos de aprendizaje automático también son capaces de ajustar las predicciones que hacen cuando se les dan nuevos datos y algunos de los algoritmos son capaces de ser utilizados para encontrar patrones en los datos que los seres humanos normalmente no serían capaces de.

Entre los ejemplos de cómo se puede utilizar el aprendizaje automático cabe citar los siguientes:

  • Recomendar vídeos en Youtube o Netflix basados en un historial de usuarios y el historial de otros usuarios
  • Recomendar productos en sitios web basados en el historial de compra de la persona
  • Predecir el precio de una casa basándose en datos sobre cosas como el número de pisos o dormitorios y los precios de otras casas en la zona

El aprendizaje automático también es aplicable en una amplia gama de campos, entre ellos:

  • Financiación
  • Atención de la salud
  • Educación
  • Negocios
  • Gobierno

Puede ver el siguiente video para ver más sobre lo que es el aprendizaje automático:

Trabajos de aprendizaje automático

Hay una serie de diferentes trabajos basados en el aprendizaje automático que usted puede obtener e incluyen:

  • Ingeniero de aprendizaje automático

El papel de un ingeniero de aprendizaje automático es desarrollar e implementar modelos de aprendizaje automático a escala.

Por lo general, los trabajos de ingeniero de aprendizaje automático requerirán un máster en un campo como la informática o las estadísticas. Sin embargo, algunas personas han sido capaces de conseguir trabajos en el campo con una licenciatura mediante la demostración de una gran cantidad de experiencia relevante. He hablado de cómo usted puede obtener experiencia relevante, en el pasado, aquí .

Según la escala de sueldos , el salario medio para un ingeniero de aprendizaje automático es de $110.000, el percentil 10 hace $76,000 y el percentil 90 hace $152,000.

Usted puede ver una entrevista con un ingeniero de aprendizaje automático a continuación:

  • Investigador de procesamiento de lenguaje natural

Un investigador de procesamiento de lenguaje natural trabaja en formas de mejorar los productos que involucran el lenguaje. Algunos ejemplos podrían incluir el trabajo en búsqueda autocompletado, ayuda domiciliaria o traducción.

Típicamente, los trabajos NLP requerirán que usted tenga un Phd en un campo cuantitativo. Según la escala de sueldos , el salario promedio para las personas con habilidades en NLP es de $108.000.

  • Investigador de visión informática

Un ingeniero de visión computarizada trabajará en cosas que implican trabajar con datos visuales. Ejemplos de dónde se utilizan los trabajos de visión computarizada son los coches autoconductores, el reconocimiento facial y la atención sanitaria.

Los trabajos de visión computarizada a menudo requieren que usted tenga un doctorado. Según la escala de sueldos , el salario promedio para un ingeniero de visión informática es de $91,000, el percentil 10 gana $74,000 y el percentil 90 gana $163,000.

Cómo aprender machine learning y las habilidades necesarias

Para aprender machine learning será necesario que usted tenga una serie de habilidades. Estas habilidades incluyen el conocimiento de álgebra lineal, cálculo, probabilidad, estadística y programación.

En realidad hay algunos cursos que le enseñarán el aprendizaje automático que no asumen ningún conocimiento previo. Uno de esos cursos es el más popular curso de aprendizaje automático disponible en este momento que es impartido por Andrew Ng de la Universidad de Stanford. Puedes encontrar el curso aquí . Le recomiendo que comience con este curso para que pueda ver si el aprendizaje automático es o no para usted.

Una vez que usted ha tomado ese curso y usted ha decidido que usted está interesado en persuar el aprendizaje automático entonces sería útil para usted aprender las matemáticas necesarias con el fin de entender plenamente los algoritmos y cómo utilizarlos estadísticamente.

Una vez que hayas aprendido lo anterior, te recomendaría Aprendizaje profundo y aprendizaje automático (MIT). En este curso, usted será capaz de aprender los detalles matemáticos de los algoritmos de aprendizaje automático y de aprendizaje profundo.

También valdría la pena que revisaras este libro. Manos en el aprendizaje automático ya que da una muy buena visión general de cómo implementar los algoritmos de aprendizaje automático en Python.

Si usted quiere conseguir un trabajo en el aprendizaje automático, entonces también será necesario que usted aprenda sobre bases de datos y complejidad computacional también.

Ciencias de los datos

La ciencia de los datos es el proceso de organizar, analizar y ayudar a las personas a tomar decisiones basadas en grandes cantidades de datos.

El aprendizaje automático es una parte clave del proceso de ciencia de datos. Sin embargo, la mayor parte del trabajo que hacen los científicos de datos va a otras áreas del proceso de ciencia de datos que es:

  • Adquisición y almacenamiento de datos
  • Preguntar acerca de cómo esos datos podrían ser útiles
  • Limpieza de los datos
  • Hacer análisis de datos exploratorios que es donde se resumen las principales características de los datos
  • Elegir y aplicar modelos de aprendizaje automático a los datos
  • Dar sentido a los resultados de los modelos y su precisión
  • Adopción de decisiones sobre la base de los resultados de los modelos ML

Puedes ver el siguiente video para ver más sobre lo que implica la ciencia de los datos:

Empleos en ciencias de los datos

Los puestos de trabajo en la ciencia de los datos tienen actualmente una gran demanda y se espera que la demanda de puestos de trabajo en la ciencia de los datos aumente, a un ritmo más rápido que la oferta de trabajadores, en los próximos años ( fuente ).

Según la escala de sueldos , un científico de datos ganará $91,000 en promedio, el percentil 10 gana $62,000 y el percentil 90 gana $131,000.

Por lo general, será necesario tener un máster en un campo cuantitativo para conseguir un trabajo en la ciencia de los datos. Sin embargo, hay algunas publicaciones para personas con sólo un título de licenciatura y la capacidad de demostrar que usted tiene experiencia relevante. He hablado de cómo se puede obtener esa experiencia relevante, en el pasado, aquí .

Cómo aprender la ciencia de los datos y las habilidades que se requieren

Para aprender la ciencia de los datos será necesario que usted aprenda el aprendizaje automático por lo que le recomiendo que siga los mismos pasos que he aconsejado anteriormente para aprender el aprendizaje automático.

También será necesario que usted tenga una muy buena comprensión de la analítica de datos. Te recomendaría que empezaras por ver esta serie de Youtube que le muestra cómo hacer análisis de datos en Python.

Cómo la ciencia de los datos y el aprendizaje automático son diferentes

Aunque mucho de lo que se hace en el aprendizaje automático y la ciencia de los datos son similares, no son la misma cosa.

El papel de un científico de datos será utilizar los datos para ayudar a la empresa a tomar mejores decisiones y el uso del aprendizaje automático a menudo ayudará a hacer esto.

Mientras que el papel del aprendizaje automático es aprender de los datos y hacer predicciones basadas en lo que aprende de los datos.

La ciencia de los datos generalmente se utilizará en un entorno empresarial, pero el trabajo en el aprendizaje automático se puede utilizar en una amplia gama de entornos y hay muchas oportunidades de investigación en el aprendizaje automático.

Cómo los ingenieros de aprendizaje automático son diferentes a los científicos de datos

Dos funciones muy similares son la de un ingeniero de aprendizaje automático y un científico de datos.

La principal diferencia entre ambos será normalmente que los ingenieros de aprendizaje automático se centrarán en la construcción y fabricación de modelos de aprendizaje automático que sean utilizables a escala. Mientras que, por lo general, un científico de datos será responsable de encontrar formas de utilizar los datos para mejorar el funcionamiento de una empresa.

He escrito más sobre cómo los ingenieros de aprendizaje automático y los científicos de datos son diferentes, en el pasado, aquí .

Por qué debe empezar aprendiendo análisis de datos

En ambos, el aprendizaje automático y la ciencia de los datos, será necesario para que usted haga un montón de análisis de datos y pre-procesamiento.

Esto es para que pueda tener sentido de lo que los datos están mostrando, para que pueda modificar los datos para que funcione con eficacia con los modelos de aprendizaje automático y para que pueda eliminar características innecesarias en los datos.

Además, cuando empieces a aprender machine learning, muchos de los materiales asumirán que tienes conocimiento de cómo hacer análisis de datos en un determinado lenguaje de programación (usualmente Python).

Por eso te recomiendo que empieces por aprender análisis de datos. Esta serie de Youtube es un buen lugar para empezar y yo recomendaría este libro en Amazon.

Artículos Relacionados:

Esta web usa cookies, puedes ver la política de cookies, aquí -
Política de cookies +