¿Cuáles son los roles en la gestión de datos?
Estos 10 roles, con diferentes responsabilidades, son comúnmente una parte de los equipos de gestión de datos en los que las organizaciones confían para asegurarse de que sus datos están listos para usar.
Independientemente del tamaño de la empresa o de la industria, hay un atributo común que separa a las organizaciones de alto rendimiento de sus contrapartes menos exitosas: la toma de decisiones de alta calidad. Cada vez más, eso es impulsado por los datos. Desde las unidades operacionales de primera línea hasta el equipo ejecutivo superior, el análisis de datos ayuda a eliminar las conjeturas del proceso de adopción de decisiones en todos los niveles de una organización.
Pero los datos brutos, por sí solos, proporcionan un valor limitado. El valor de los datos para la toma de decisiones aumenta exponencialmente cuando las organizaciones los transforman en información que se puede visualizar e interpretar fácilmente. Los datos también deben ser de alta calidad, limpios, coherentes y correctos. La responsabilidad de garantizar que los datos puedan ser convertidos en información procesable recae en el gestión de datos equipo.
¿Por qué es importante para las empresas contar con un equipo de gestión de datos eficaz?
La gestión de datos es una práctica que se centra en la administración eficaz de los activos de datos de una organización. Desde la creación y recopilación de datos hasta su uso eficaz en toda la empresa, la gestión de los datos requiere una amplia gama de funciones y responsabilidades. En las organizaciones más pequeñas, un solo profesional de TI a menudo asume múltiples funciones. Pero a medida que aumentan las cargas de trabajo de gestión de datos, las organizaciones suelen distribuir esas actividades a un equipo de personas.
Sin un equipo experto de gestión de datos, una organización puede encontrarse con datos de baja calidad que dificultan la planificación estratégica, las operaciones empresariales y el BI, la presentación de informes y las aplicaciones de la ciencia de los datos que ayudan a orientar la toma de decisiones. Por ejemplo, errores, inconsistencias y otros problemas de datos podrían distorsionar las acciones operacionales y los resultados analíticos. Separar silos de datos ocultar los datos pertinentes de los usuarios de los distintos departamentos. En última instancia, obtener el valor de negocio esperado de los conjuntos de datos se convierte en un gran desafío.
Objetivos y obligaciones generales de un equipo de gestión de datos
El objetivo principal de un equipo de gestión de datos es asegurarse de que los activos de datos empresariales cumplan con los requisitos empresariales y las necesidades de información de los usuarios. Para lograrlo, el equipo trabaja para que los datos estén disponibles y sean accesibles para los usos planificados y asegurar que sean precisos, fiables y estén adecuadamente organizados. El equipo también combina conjuntos de datos de diferentes sistemas para ofrecer a los usuarios una visión completa de las operaciones, los clientes, el rendimiento financiero y otras áreas de interés empresarial.
A un alto nivel, las funciones de un equipo de gestión de datos son las siguientes:
Muchos equipos de gestión de datos también hacen análisis de datos ellos mismos, manejando tanto aplicaciones analíticas avanzadas como de BI en lugar de tener esas funciones como parte de equipos de análisis separados.
10 funciones que los equipos de gestión de datos incluyen
Ahora, echemos un vistazo a los roles de gestión de datos más comunes y sus responsabilidades. Sin embargo, es importante tener en cuenta que el tamaño de la organización y la cantidad de datos que recopila y almacena afectarán la forma en que las responsabilidades de gestión de datos se asignan a diferentes personal.
Además, las tecnologías que el departamento de TI despliegue para una organización afectarán las actividades específicas que algunas de estas funciones implican. No obstante, aunque la labor realizada por los miembros de un equipo de gestión de datos podría diferir en función de la plataforma que se utilice, las responsabilidades básicas descritas aquí son comunes a todas las tecnologías y productos.
1. Administrador de bases de datos
Como indica el título del trabajo, los administradores de bases de datos ( DBAs ) son responsables de la gestión de las bases de datos de la organización. Independientemente del sistema específico de gestión de la base de datos ( DBMS ) plataforma un administrador apoya, las responsabilidades básicas DBA son las mismas: disponibilidad del sistema y rendimiento de la base de datos, seguridad, supervisión y recuperación.
Además de sus funciones de apoyo de back-end, los DBA aseguran que los datos se organicen y almacenen de manera eficiente. Para las bases de datos que requieren un esquema predefinido, trabajan con desarrolladores de aplicaciones y administradores de datos para diseñar y crear los objetos físicos para almacenar los datos; también indexan estructuras y objetos lógicos para proporcionar un acceso eficiente a las bases de datos. Otras tareas para un DBA incluyen crear cuentas de usuario y asignar privilegios de acceso, así como ayudar a los desarrolladores y usuarios finales a depurar y optimizar aplicaciones.
A medida que aumenta el volumen de trabajo de la DBA, las organizaciones suelen separar las funciones en funciones separadas de apoyo a sistemas y aplicaciones. Los DBA de sistemas son responsables de apoyar la infraestructura DBMS de back-end, mientras que sus contrapartes de aplicaciones DBA trabajan con datos y objetos dentro de la plataforma y ayudan a desarrolladores y usuarios. El almacén de datos DBA es otro papel especializado.
Las principales responsabilidades de un DBA son las siguientes:
- Asumir la propiedad administrativa de los sistemas de base de datos de back-end de la organización.
- Organizar y mantener los datos de la base de datos a lo largo de su ciclo de vida.
- Ayuda a desarrolladores de aplicaciones y usuarios finales con depuración y acceso a datos.
2. Administrador de datos
Los administradores de datos ven los datos desde una perspectiva tanto empresarial como técnica e interactúan con los usuarios finales y los desarrolladores para definir, describir, organizar y categorizar los conjuntos de datos. Por ejemplo, una práctica estándar de un administrador de datos es entrevistar a los usuarios de negocios para identificar los datos con los que interactúan y entender cómo se aplica a la organización.
Con esa información, los administradores de datos construir modelos de datos que se basan en el significado comercial de los conjuntos de datos, las relaciones entre diferentes elementos de datos y las reglas de negocio que rigen los datos. El modelado crea el marco que permite a diferentes unidades de negocio compartir datos oportunos y precisos. Los administradores de datos también desarrollan convenciones de nombres, definiciones de almacenamiento y limitaciones de reglas comerciales para los elementos de datos.
En organizaciones que no tienen gobernanza de los datos a menudo, un administrador de datos tomará la iniciativa en el desarrollo y la aplicación de políticas, procedimientos y mejores prácticas de gobernanza diseñados para garantizar la seguridad, la calidad y el uso adecuado de los datos.
Las principales responsabilidades de un administrador de datos son las siguientes:
- Ayudar a las unidades de negocio a definir, organizar y categorizar los datos y documentar las reglas de negocio asociadas.
- Crear y mantener modelos de datos conceptuales, lógicos y físicos.
- Establecer y mantener las mejores prácticas de gestión y gobernanza de los datos.
3. Modelador de datos
Aunque los administradores de datos a menudo asumen la responsabilidad del modelado de datos, muchas empresas -- especialmente las más grandes -- crean un papel específico para esa actividad: modelador de datos . En tales casos, los modeladores de datos manejan el proceso de construcción de los modelos conceptuales, lógicos y físicos que se convierten en la base de las tiendas de datos de la organización.
Es un papel importante: la calidad de todos los procesos de desarrollo y gestión posteriores que interactúan con los elementos de datos modelados depende totalmente de la calidad del diseño lógico inicial y la implementación física. Además, un modelador de datos actualiza y revisa los modelos de manera continua para mantenerlos actualizados a medida que cambian los conjuntos de datos y las necesidades empresariales de una organización.
Las principales responsabilidades de un modelador de datos son las siguientes:
- Trabaje con la gestión de datos y los usuarios empresariales para recopilar la información necesaria para diseñar y documentar modelos de datos.
- Desarrollar las mejores prácticas para garantizar la coherencia permanente de los modelos de datos y verificar su relación con las operaciones empresariales en constante cambio.
4. Arquitecto de datos
Data architect es una posición de nivel senior que normalmente trabaja en toda una empresa. Los arquitectos de datos a menudo tienen títulos de tecnología avanzada y poseen una fuerte comprensión del negocio. Ellos son responsables de desarrollo de una arquitectura de datos , que es el plan para el marco de gestión de datos de una organización. Muchos también ayudan a seleccionar plataformas y sistemas de datos que mejor satisfagan las necesidades empresariales y técnicas de las aplicaciones.
Como resultado, los arquitectos de datos deben mantenerse al tanto de las tecnologías actuales y emergentes. Además de sus habilidades arquitectónicas, los arquitectos de datos suelen ser expertos en el diseño de sistemas y bases de datos y en el modelado de datos, y a menudo tienen una sólida comprensión del modelo de desarrollo de sistemas y las mejores prácticas de gestión de proyectos.
Las principales responsabilidades de un arquitecto de datos son las siguientes:
- Desarrollar y mantener el plan arquitectónico para el marco de gestión de datos de una organización a nivel empresarial.
5. Desarrollador de ETL
Integrar conjuntos de datos, convertirlos del tipo de datos de origen a otro objetivo, limpiar los datos y aplicar las reglas de negocio para estandarizarlos puede ser un proceso complejo . Como resultado, muchas organizaciones crean una función de integración de datos separada que se centra en el procesamiento de extracción, transformación y carga (ETL). Desarrollador de ETL es el título de trabajo más común, pero desarrollador de integración de datos y Ingeniero de integración de datos también se utilizan en algunos casos.
Esta función consiste a menudo en cargar datos de los sistemas fuente en un almacén de datos; también puede incluir la integración de diferentes fuentes de datos para aplicaciones operacionales. El código utilizado para limpiar y estandarizar los datos puede variar desde procesos simples y parametrizados integrados en herramientas ETL hasta complejas lógicas de programación. Transformación de datos requiere conocimiento de lenguajes de programación como Python, Perl y SQL, y los desarrolladores de ETL también deben tener una fuerte comprensión de análisis de datos y técnicas de acceso a los datos. También podría ser necesario conocer otros métodos de integración de datos además de ETL.
Las principales responsabilidades de un desarrollador de ETL son las siguientes:
- Utilice herramientas ETL para extraer y procesar datos de los sistemas fuente y cargarlos en los objetivos.
- Realizar la limpieza y validación de datos para garantizar que los niveles de calidad de los datos cumplan los requisitos.
- Crear documentación de ETL y otros procesos de integración de datos y actualizarla según sea necesario.
6. Analista de calidad de los datos
Las empresas están generando más datos que nunca. Como resultado, establecimiento y mantenimiento de altos niveles de calidad de los datos es un desafío constante para muchas organizaciones. Los analistas de calidad de los datos son responsables de identificar errores, anomalías y otros defectos que comprometen la calidad de los datos y, en última instancia, su valor comercial para la organización.
Evaluan conjuntos de datos sobre diversas dimensiones de la calidad de los datos , tales como exactitud, exhaustividad, coherencia, conformidad y falta de datos duplicados. Una vez identificados los problemas de datos, un analista de calidad de los datos trabaja para resolverlos con el fin de mejorar la fiabilidad de los datos y asegurar que los usuarios finales tengan acceso a datos de confianza. Este papel a menudo también implica el seguimiento de las métricas de calidad de los datos y la educación de los usuarios sobre las mejores prácticas para ayudar a prevenir problemas de calidad por adelantado.
Las responsabilidades clave de un analista de calidad de datos son las siguientes:
- Identificar las cuestiones relativas a los datos y determinar su gravedad y el alcance de su impacto empresarial para ayudar a planificar las iniciativas de mejora de la calidad de los datos.
- Tome las medidas necesarias para corregir los valores de datos incorrectos y otros problemas y abordar su causa raíz.
- Establecer directrices de calidad de los datos y mejores prácticas para los usuarios finales a fin de reducir al mínimo los problemas futuros.
7. Ingeniero de datos
Ingenieros de datos son los expertos en transferencia y almacenamiento de datos de la profesión informática. Son responsables de mover los datos a las tiendas de datos analíticos y prepararlos para su uso por los desarrolladores de aplicaciones, científicos de datos y otros analistas. Para ello, los ingenieros de datos utilizan software que abarca desde productos de tuberías de datos centrados en el traslado de datos de un sistema a otro a herramientas ETL más avanzadas.
Un ingeniero de datos debe tener una fuerte comprensión de los almacenes de datos y las plataformas de big data y de cómo almacenan los datos. Además, el trabajo requiere un conocimiento práctico de las API que permitan el acceso a los sistemas de macrodatos y de las mejores prácticas de administración y análisis de datos. Debido a que los ingenieros de datos son responsables de tuberías que mueven grandes volúmenes de datos a través de la empresa, también necesitan experiencia en monitoreo de rendimiento y solución de problemas.
Las principales responsabilidades de un ingeniero de datos son las siguientes:
- Construya tuberías de datos que recuperen datos de los sistemas de origen, los estandaricen y los transformen según sea necesario y los carguen en sistemas de destino.
- Evaluar, implementar, utilizar y administrar las herramientas de la tubería de datos y de ETL.
- Supervisar el rendimiento y la calidad de las transferencias de datos entre los sistemas fuente y destino.
Además de analizar los datos para mejorar las operaciones comerciales actuales, los científicos de datos desarrollan modelos predictivos para predecir las tendencias futuras y responder a preguntas. Para ayudar a los usuarios de negocios a comprender las percepciones de datos descubiertas por sus esfuerzos de análisis, la mayoría de los científicos de datos también utilizan herramientas de visualización de datos para crear gráficos, informes y tableros que presentan los resultados en formatos fáciles de digerir.
Las principales responsabilidades de un científico de datos son las siguientes:
- Elaborar modelos analíticos y estadísticos para analizar los datos y mejorarlos según sea necesario.
- Utilice el aprendizaje automático y otras tecnologías avanzadas de análisis para descubrir información oculta en los datos y predecir el comportamiento de los clientes y las futuras tendencias empresariales.
- Cree informes, tableros y visualizaciones de datos para presentar las ideas a los ejecutivos de negocios y otros consumidores de datos.
9. Analista de datos
Aunque a veces se considera que esta función es una posición de nivel inicial en el campo de la gestión de datos, un analista de datos suele ser el miembro del equipo cuando se necesita asistencia para convertir los datos brutos en información significativa. Al igual que los científicos de datos, los analistas de datos limpian, organizan y analizan conjuntos de datos y construyen paneles e informes para ayudar a los usuarios empresariales a comprender los resultados de las aplicaciones analíticas.
En algunos casos, los analistas de datos trabajan por su cuenta; en otros, apoyan y son supervisados por científicos de datos. Típicamente no son tan experimentados o técnicamente expertos como los científicos de datos. Para ser eficaz, sin embargo, un analista de datos necesita tener un fuerte conocimiento de las estadísticas y ser capaz de entender rápidamente cómo los datos se aplican a operaciones empresariales complejas, además de ser competente en el uso de análisis y herramientas de visualización de datos y lenguajes de programación como Python y R.
Las principales responsabilidades de un analista de datos son las siguientes:
- Modelar, limpiar, organizar y categorizar conjuntos de datos para su uso en aplicaciones analíticas.
- Cree informes, dashboards y visualizaciones de datos para ayudar a los usuarios de negocios a interpretar los resultados analíticos.
10. Analista de inteligencia empresarial
A Analista de inteligencia empresarial , o analista de BI para abreviar, se centra más en el análisis y visualización de datos que en el diseño inicial de datos y el modelado analítico. Los analistas de BI normalmente trabajan con datos estructurados almacenados en marts de datos y almacenes de datos , a diferencia de los lagos de datos más variados que utilizan los científicos de datos y los analistas de datos. En general, también realizan consultas menos complejas para hacer un seguimiento de los KPI comerciales, los hábitos de compra de clientes, la producción de plantas y otros problemas operacionales.
Sin embargo, los analistas de BI a menudo acceden y agregan grandes volúmenes de datos para identificar patrones que pueden ayudar a optimizar las operaciones e influir en las estrategias empresariales. Para que los datos sean útiles en el proceso de toma de decisiones, es necesario que comprendan su significado comercial. Además de su propio trabajo de análisis de datos, los analistas de BI a veces también ayudan a formar y apoyar a los usuarios de herramientas de autoservicio de BI en unidades de negocio.
Las principales responsabilidades de un analista de BI son las siguientes:
- Trabaje con los gerentes de negocios para identificar activos de datos que puedan ayudarles a mejorar las operaciones actuales y predecir las necesidades y tendencias futuras del negocio.
- Analice los datos para encontrar información que ayude a impulsar decisiones empresariales de alta calidad.
- Construye paneles, informes y visualizaciones de datos para comunicar los hallazgos a los usuarios de negocios.
Gestión de un equipo de gestión de datos
En la práctica, la forma en que las funciones descritas anteriormente se agrupan en equipos variará ampliamente. La composición real de un equipo de gestión de datos depende de la preferencia de la organización. Lo mismo ocurre con los niveles de gestión y la estructura de presentación de informes establecidos para supervisar al equipo.
El tamaño de la empresa puede ser un factor. En organizaciones de tamaño mediano, a menudo encontrarás DBAs, administradores de datos y modeladores de datos en el mismo equipo, que informa a un gestor de datos de nivel medio. En las organizaciones más grandes, estos tres roles podrían ser equipos separados, cada uno con su propio gerente; los tres reportan al gestor de datos.
Los ingenieros de datos, científicos de datos y analistas de datos a menudo son asignados a un equipo específico que se centra en apoyar y utilizar un lago de datos para análisis avanzados. En algunos comercios, los DBAs de almacén de datos, los desarrolladores de ETL y los analistas de BI también podrían ser asignados a ese grupo. En otros, pueden formar parte de un equipo separado de BI. En lugar del equipo de gestión de datos, los analistas de la calidad de los datos podrían ser incluido en un equipo de gobernanza de datos que tiene su propia estructura de presentación de informes.
Cuando revisa los organigramas de TI, los equipos de gestión de datos a menudo informan a los gerentes superiores de TI o de datos que podrían ser responsables de supervisar múltiples equipos en organizaciones grandes. Los directivos superiores, a su vez, probablemente informen directamente al CIO o al oficial jefe de datos , a diferencia de la OCT, que se centra más en la innovación en TI y la aplicación de nuevas tecnologías.
Artículos Relacionados: