¿Qué habilidades matemáticas son necesarias para la ciencia de datos?
Mientras que los científicos de datos pueden trabajar en casi todas las industrias, una cosa clave que los une a todos es la comprensión de las matemáticas. Ya sea que estén trabajando en estadísticas, análisis de datos o aprendizaje automático, las matemáticas están en el corazón de todos ellos.
Aquí hay seis habilidades matemáticas esenciales que cada científico de datos necesita.
Aritmético
Las matemáticas que aprendemos en la escuela, aritmética , está en la base de casi todas las demás matemáticas y matemáticas esenciales para la ciencia de los datos. Aritmética es el estudio de los números y lo que hacemos a ellos, tales como suma, resta, multiplicación y división.
Logaritmos son también parte de la aritmética, y están detrás de la dinámica de los algoritmos de búsqueda binarios. En su forma más simple, un logaritmo es el pequeño número que se encuentra por encima de otro número para indicar cuántas veces ese número se multiplica por sí mismo, por ejemplo. 103 = 10 x 10 x 10 = 1000.
Un algoritmo de búsqueda binario es una herramienta valiosa que es utilizado en la programación para la depuración . Una vez que el programa está escrito, el algoritmo puede identificar el lugar donde ocurre un error rápidamente, en lugar de desplazarse a través de grandes trozos de código.
Álgebra lineal
Esta marca de álgebra se refiere a ecuaciones lineales, espacios vectoriales y matrices (eso es plural para matriz). El álgebra lineal toma aritmética y sobrecarga para su aplicación en geometría, ciencia e ingeniería.
La matriz también está detrás de redes neuronales que son modelos de aprendizaje automático inspirados en el cerebro humano. Científicos en América han recientemente redes neuronales utilizadas para mejorar la identificación de gases moleculares . En el futuro, esta aplicación podría utilizarse en la seguridad aeroportuaria para identificar un producto químico desconocido o para eliminar impurezas en la fabricación de drogas.
Geometría
Si alguna vez has usado un transportador, una brújula o un cuadrado fijo, entonces tienes algo de comprensión de geometría . Es la medida de la forma, el tamaño y la posición relativa de los objetos en términos de longitudes, áreas y volúmenes. Usted puede recordar algunos de los teoremas de la geometría -– tales como todos los ángulos rectos son iguales, o la distancia más corta entre cualquiera de dos puntos es una línea recta.
La geometría euclidiana se extiende sobre la geometría enseñada en las escuelas secundarias para dar el salto de medir la distancia entre los objetos a medir la distancia entre los datos.
Cálculo
En este punto, tendremos que tener cuidado de no salir en una tangente. Cálculo es el estudio del cambio continuo y mide tanto la tasa de cambio en la pendiente de una curva, como el área debajo de una curva. Una tangente es la mejor aproximación en línea recta de una curva en cualquier punto.
Comprender la relación entre tangentes y curvas es una parte integral del trabajo con el análisis de regresión en la estadística. Este método de modelado estadístico se encuentra detrás del algoritmo de regresión lineal, que se utiliza para explicar la relación entre múltiples variables continuas.
A algoritmo de regresión lineal fue utilizado en la investigación de recursos humanos identificar la posibilidad de que la innovación pueda generarse a través de un proceso. Los investigadores analizaron cinco años de datos de 154 empresas que utilizaron un agregador de innovación de estilo de redes sociales llamado Spigit. Las variables continuas necesarias para el éxito de la innovación resultaron ser más participantes, más ideas, más personas que evalúan esas ideas y más diversidad en las personas que contribuyen.
Cálculo también se alimenta en algoritmos de regresión logística, que son similares a algoritmos de regresión lineal, excepto que producen un valor de probabilidad en lugar de un número real.
Probabilidad
¿Qué es la probabilidad que usted estudiará un Master en Ciencias de los Datos en línea después de leer este blog? La probabilidad es un valor numérico expresado como fracción o porcentaje entre 0 y 1. Si la probabilidad es 1, entonces definitivamente vas a hacerlo, y te veremos en la Universidad James Cook pronto!
La probabilidad es uno de los elementos fundamentales de las estadísticas que es igual al número de resultados deseados (X) dividido por el número total de resultados posibles (T). Por lo tanto, cuando usted lanza una moneda y llama cabezas, el número de resultados deseados es uno y el número de resultados posibles es dos (cabezas o colas). La probabilidad de cabeza es de 1⁄2 o 0,5.
El mismo cálculo se puede utilizar repetidamente como parte de un árbol de decisiones para determinar resultados mucho más específicos. Los algoritmos de árbol de decisión se han utilizado en el deporte para mejorar el rendimiento de los jugadores en diferentes condiciones. Esto funciona particularmente bien en un deporte como béisbol donde gran parte del juego se reduce a la interacción entre el lanzador y el bateador.
Teorema de Bayes
Otro elemento de las estadísticas que son matemáticas esenciales para la ciencia de los datos es Teorema de Bayes , que entra en juego cuando usted ha calculado previamente probabilidades. Esto se puede utilizar para determinar la eficacia de una prueba médica para una enfermedad específica. Por ejemplo, digamos que sabemos:
- la probabilidad de que la prueba médica devuelva un resultado positivo correcto
- la probabilidad de que la prueba médica devuelva un resultado negativo incorrecto
- la probabilidad de que alguien en la población tenga la enfermedad.
Con estas tres probabilidades, podemos determinar la probabilidad de que alguien tenga la enfermedad si su examen médico da un resultado positivo.
Los Clasificadores de Naive Bayes son una familia de algoritmos basados en el Teorema de Bayes que utilizan lo que ya sabemos para predecir la probabilidad de que ocurra algo en particular. Además de las aplicaciones médicas, Naïve Bayes’ Clasificadores se están utilizando junto con otros plugins para una investigación muy detallada en el ADN .
Obtener las matemáticas necesarias para convertirse en un científico de datos con el Master en Ciencias de los Datos en línea. Hable con uno de nuestros asesores de matriculación en 1300 535 919.
Usted debe ser un Enfermera registrada (División 1) o Partera registrada con AHPRA para ser elegibles para este curso.
Reconocemos a los aborígenes australianos y a los isleños del Estrecho de Torres como los primeros habitantes de la nación, y reconocemos a los propietarios tradicionales de las tierras donde nuestro personal y nuestros estudiantes viven, aprenden y trabajan.
Artículos Relacionados: