¿Qué es el big data?

Qué es y por qué importa

Big data es un término que describe volúmenes grandes y difíciles de gestionar de datos –tanto estructurados como no estructurados– que inundan a las empresas en el día a día. Pero no es sólo el tipo o la cantidad de datos lo que es importante, es lo que las organizaciones hacen con los datos que importa. Los grandes datos se pueden analizar para obtener información que mejore las decisiones y dé confianza para hacer movimientos empresariales estratégicos.

Historia de los Big Data

Big data se refiere a datos tan grandes, rápidos o complejos que es difícil o imposible procesarlos utilizando métodos tradicionales. El acto de acceder y almacenar grandes cantidades de información para análisis ha existido durante mucho tiempo. Pero el concepto de big data ganó impulso a principios de los años 2000 cuando el analista de la industria Doug Laney articuló la definición actual de big data como los tres V:

Volumen. Las organizaciones recopilan datos de una variedad de fuentes, incluyendo transacciones, dispositivos inteligentes (IoT), equipos industriales, videos, imágenes, audio, redes sociales y más. En el pasado, almacenar todos esos datos habría sido demasiado costoso, pero un almacenamiento más barato utilizando lagos de datos, Hadoop y la nube han aliviado la carga.

Velocidad. Con el crecimiento en el Internet de las cosas , las corrientes de datos a las empresas a una velocidad sin precedentes y deben tratarse de manera oportuna. Las etiquetas RFID, los sensores y los medidores inteligentes impulsan la necesidad de hacer frente a estos torrentes de datos en tiempo casi real.

En SAS, consideramos dos dimensiones adicionales cuando se trata de big data:

Variabilidad

Además de las crecientes velocidades y variedades de datos, los flujos de datos son impredecibles, y cambian con frecuencia y en gran medida. Es un reto, pero las empresas necesitan saber cuándo algo está en tendencia en las redes sociales, y cómo gestionar cargas de datos pico diarias, estacionales y desencadenadas por eventos.

Veracidad

Veracity se refiere a la calidad de los datos. Debido a que los datos provienen de muchas fuentes diferentes, es difícil vincular, emparejar, limpiar y transformar datos entre sistemas. Las empresas necesitan conectar y correlacionar relaciones, jerarquías y múltiples vínculos de datos. De lo contrario, sus datos pueden salir rápidamente de control.

Big Data y análisis permiten el cuidado completo de la persona

Riverside County utiliza la gestión de datos y análisis de SAS para integrar datos de salud y no salud de su hospital público, sistema de salud conductual, cárcel de condado, sistemas de servicios sociales y sistemas de personas sin hogar. Al entender cómo los individuos interactúan con diferentes servicios, las vías de atención pueden ser cartografiadas a los resultados de salud, resultando en un cuidado coordinado y completo de la persona.

¿Por qué es importante el Big Data?

La importancia de los big data no gira simplemente en torno a la cantidad de datos que tiene. El valor reside en cómo lo usas. Al tomar datos de cualquier fuente y analizarlos, usted puede encontrar respuestas que 1) racionalizar la gestión de recursos, 2) mejorar la eficiencia operativa, 3) optimizar el desarrollo de productos, 4) impulsar nuevos ingresos y oportunidades de crecimiento y 5) permitir la toma de decisiones inteligentes. Cuando combinas big data con un alto rendimiento análisis , puede realizar tareas relacionadas con el negocio tales como:

Big Data en el mundo de hoy

Los grandes datos –y la forma en que las organizaciones gestionan y obtienen información de ellos– están cambiando la forma en que el mundo utiliza la información empresarial. Obtenga más información sobre el impacto de los big data.

Ser una organización basada en datos

Los grandes datos se generan a partir de muchas fuentes – vehículos, wearables, electrodomésticos y más. Aprenda los tres fundamentos de ser impulsados por datos, lea sobre soluciones de big data y descubra las mejores prácticas que otras organizaciones siguen para superar obstáculos.

Lago de datos vs. almacén de datos

¿El término "lago de datos" es sólo propaganda de marketing? ¿O un nuevo nombre para un almacén de datos? Phil Simon establece las reglas sobre data lake versus data store, explicando lo que es, cómo funciona y cuándo es posible que necesites uno.

Big data y nube

Los proyectos de macrodatos exigen intensos recursos para el procesamiento y almacenamiento de datos. Trabajando juntos, las tecnologías de big data y la computación en nube proporcionan una forma rentable de manejar todo tipo de datos, para una combinación ganadora de agilidad y elasticidad.

¿Quién se está centrando en los big data?

Los grandes datos son un gran problema para las industrias. La embestida de IoT y otros dispositivos conectados ha creado un aumento masivo en la cantidad de organizaciones de información que recopilan, gestionan y analizan. Junto con el big data viene el potencial para desbloquear grandes ideas – para cada industria, de grande a pequeña.

Comercio al por menor

La creación de relaciones con los clientes es fundamental para la industria minorista, y la mejor manera de gestionarlo es gestionar los big data. Los minoristas necesitan conocer la mejor manera de comercializar a los clientes, la forma más eficaz de manejar las transacciones y la forma más estratégica de recuperar el negocio caducado. Los grandes datos siguen siendo el corazón de todas esas cosas.

Fabricación

Armados con la percepción de que los big data pueden proporcionar, los fabricantes pueden aumentar la calidad y la producción, minimizando al mismo tiempo los residuos – procesos que son clave en el mercado altamente competitivo de hoy en día. Cada vez más fabricantes están trabajando en una cultura basada en análisis, lo que significa que pueden resolver problemas más rápido y tomar decisiones empresariales más ágiles.

Banca

Con grandes cantidades de información procedente de innumerables fuentes, los bancos se enfrentan a la búsqueda de formas nuevas e innovadoras de gestionar los macrodatos. Si bien es importante entender a los clientes y aumentar su satisfacción, es igualmente importante minimizar el riesgo y el fraude, manteniendo al mismo tiempo el cumplimiento de la normativa. Big data trae grandes perspectivas, pero también requiere que las instituciones financieras se mantengan un paso por delante del juego con análisis avanzados.

Educación

Los educadores con conocimientos basados en datos pueden tener un impacto significativo en los sistemas escolares, los estudiantes y los planes de estudio. Al analizar el big data, pueden identificar a los estudiantes en riesgo, asegurarse de que los estudiantes están progresando adecuadamente y pueden implementar un mejor sistema de evaluación y apoyo de maestros y directores.

Pequeñas y medianas empresas

Entre la facilidad de recopilar big data y las opciones cada vez más asequibles para gestionar, almacenar y analizar datos, las pymes tienen más posibilidades que nunca de competir con sus contrapartes más grandes. Las pymes pueden utilizar big data con análisis para reducir los costos, aumentar la productividad, fortalecer las relaciones con los clientes y minimizar el riesgo y el fraude.

Gobierno

Cuando las agencias gubernamentales son capaces de aprovechar y aplicar análisis a sus macrodatos, ganan terreno significativo cuando se trata de administrar servicios públicos, dirigir agencias, lidiar con la congestión del tráfico o prevenir la delincuencia. Sin embargo, aunque los macrodatos tienen muchas ventajas, los gobiernos también deben abordar cuestiones de transparencia y privacidad.

Obtenga más información sobre las industrias que utilizan esta tecnología

El aprendizaje profundo ansía los big data porque los big data son necesarios para aislar patrones ocultos y encontrar respuestas sin que los datos se ajusten demasiado. Con el aprendizaje profundo, cuanto más buena sea la calidad de los datos que tiene, mejores serán los resultados. Wayne Thompson SAS Investigación y Desarrollo

Cómo funciona el Big Data

Antes de que las empresas puedan poner los big data a trabajar para ellas, deben considerar cómo fluye entre una multitud de ubicaciones, fuentes, sistemas, propietarios y usuarios. Hay cinco pasos clave para hacerse cargo de este "tejido de datos grandes" que incluye datos tradicionales estructurados junto con datos no estructurados y semiestructurados:

  • Establecer una estrategia de macrodatos.
  • Identificar las fuentes de macrodatos.
  • Acceda, gestione y almacene los datos.
  • Analice los datos.
  • Tomar decisiones inteligentes, basadas en datos.

1) Establecer una estrategia de macrodatos

A un alto nivel, una estrategia de big data es un plan diseñado para ayudarle a supervisar y mejorar la forma de adquirir, almacenar, administrar, compartir y utilizar datos dentro y fuera de su organización. Una estrategia de macrodatos sienta las bases para el éxito empresarial en medio de una abundancia de datos. Al desarrollar una estrategia, es importante considerar los objetivos e iniciativas empresariales y tecnológicas existentes y futuros. Esto requiere el tratamiento de los big data como cualquier otro activo comercial valioso en lugar de sólo un subproducto de aplicaciones.

Haga clic en la infografía para ver rn más sobre big data.

2) Identificar las fuentes de macrodatos

  • Transmisión de datos viene de Internet de las Cosas (IoT) y otros dispositivos conectados que fluyen a los sistemas de TI de wearables, coches inteligentes, dispositivos médicos, equipos industriales y más. Usted puede analizar este big data a medida que llega, decidiendo qué datos guardar o no guardar, y que necesita un análisis más profundo.
  • Redes sociales los datos provienen de las interacciones en Facebook, YouTube, Instagram, etc. Esto incluye grandes cantidades de big data en forma de imágenes, vídeos, voz, texto y sonido, útiles para funciones de marketing, ventas y soporte. Estos datos a menudo se presentan en formas no estructuradas o semiestructuradas, por lo que plantean un reto único para el consumo y el análisis.
  • Datos de acceso público proviene de cantidades masivas de fuentes de datos abiertos como data.gov del gobierno de EE.UU., el World Factbook de la CIA o el Portal de Datos Abiertos de la Unión Europea.

Los sistemas informáticos modernos proporcionan la velocidad, la potencia y la flexibilidad necesarias para acceder rápidamente a cantidades y tipos masivos de big data. Junto con un acceso fiable, las empresas también necesitan métodos para integrar los datos, construir tuberías de datos, garantizar la calidad de los datos, proporcionar gobernanza y almacenamiento de datos y preparar los datos para el análisis. Algunos macrodatos pueden almacenarse in situ en un almacén de datos – pero también hay opciones flexibles y de bajo costo para almacenar y manejar big data a través de soluciones en la nube, lagos de datos, tuberías de datos y Hadoop.

4) Analizar los datos

Con tecnologías de alto rendimiento como la computación en red o análisis en memoria , las organizaciones pueden optar por utilizar todos sus big data para análisis. Otro enfoque es determinar por adelantado qué datos son relevantes antes de analizarlos. De cualquier manera, el análisis de big data es cómo las empresas obtienen valor e información de los datos. Cada vez más, los macrodatos alimentan los esfuerzos de análisis avanzados de hoy en día, como la inteligencia artificial (IA) y el aprendizaje automático.

5) Tomar decisiones inteligentes y basadas en datos

Los datos bien gestionados y de confianza conducen a análisis de confianza y decisiones de confianza. Para mantenerse competitivos, las empresas necesitan aprovechar todo el valor de los macrodatos y operar de una manera basada en los datos, tomando decisiones basadas en la evidencia presentada por los macrodatos en lugar del instinto intestinal. Los beneficios de ser impulsados por datos son claros. Las organizaciones basadas en datos tienen mejores resultados, son más previsibles desde el punto de vista operacional y son más rentables.

SAS ® Gobernanza de la información

Independientemente de la fuente, dónde se almacenan los datos, o lo grande y complejo que es, SAS Information Governance hace que sea más rápido y fácil para los usuarios de datos encontrar, catalogar y proteger el big data que es más valioso para el análisis. Los resultados de búsqueda orientados a metadatos muestran información detallada sobre cada activo de datos. A su vez, los usuarios de negocios pueden evaluar la aptitud de los datos para el propósito con menos dependencia de TI, evitando al mismo tiempo reelaborar y tomar decisiones más informadas.

Artículos Relacionados:

Esta web usa cookies, puedes ver la política de cookies, aquí -
Política de cookies +