El Big Data no es importante por sí mismo sino por lo que las empresas pueden hacer con esa ingente cantidad de datos.
El Big Data, o datos masivos en castellano, hace referencia al proceso de recopilación de enormes cantidades de datos y a su tratamiento y análisis. Big Data es un conjunto de datos tan descomunal que las aplicaciones informáticas de procesamiento de datos tradicionales no bastan para tratarlos y encontrar patrones entre la información procesada.
El progreso que estamos viviendo con las nuevas tecnologías, el desarrollo de las redes de comunicación y las características de Internet, están constantemente dejando un rastro digital. La idea es aprovecharnos de la huella que se va dejando para mejorar y que gracias al Cloud Computing ya seamos capaces de almacenarlos para generar conocimiento a partir de ellos.
Los datos, analizándolos adecuadamente, generan información de gran valor y nos llevan a conclusiones muy valiosas que nos permiten desarrollar nuestro negocio con una visión más estratégica.
El Big Data es una de las 8 tecnologías esenciales en la Industrial 4.0 y nos da un mecanismo para poder tratarla y explotarla, ya que la explotación de los datos nos aporta mayor conocimiento, mejores decisiones, ser más competitivos o innovar.
Pero, ¿por qué el Big Data es una disciplina con una tendencia alcista en instituciones tan dispares como aquellas pertenecientes al sector público y al privado?
La respuesta es bien sencilla y queda perfectamente resumida en la afirmación realizada por Forbes, en la que se indica que un aumento del 10% en la accesibilidad de los datos resultaría en un incremento de los beneficios de unos 65 millones de dólares netos para una compañía del Fortune 1000.
Sin embargo, la constante evolución tecnológica que incrementa la capacidad de cómputo y, la mayor eficiencia del poder computacional por la reducción de costes asociados al despliegue de tecnologías Cloud, hace que el concepto Big Data no quede limitado a la gran cantidad de datos, sino que adquiere otras dimensiones adyacentes al propio volumen como son la velocidad de generación de la información y la gran variedad de fuentes y tipos de datos.
Big Data puede analizar datos en diferentes formatos, tanto estructurados como no estructurados
Respecto al volumen de datos, un artículo didáctico publicado por The Telegraph menciona que el vuelo de un Boeing 787 genera aproximadamente 500GB de datos en forma de telemetría por cada trayecto. Este ejemplo posiciona la sociedad actual como una gran generadora de información y datos, lo que conduce a un movimiento natural hacia la implantación del Big Data en multitud de entornos.
Otros sistemas de información que se basan en el uso del Big Data son aquellos que gestionan la compraventa de acciones financieras y el tratamiento de los registros de las redes sociales. Estos sistemas, también son grandes fuentes de información que presentan importantes retos tecnológicos en el tratamiento del Big Data y la presentación de información.
El entorno empresarial es donde existe una mayor tendencia en el uso del Big Data, dado que está en constante evolución. Entre sus objetivos se encuentra la explotación de grandes cantidades de datos para la obtención de resultados productivos. Aqui teneis algunos datos sacados de la encuesta de uso de TIC y Comercio Electrónico (CE) en las empresas 2015-2016 del INE.
Hasta ahora el Business Intelligence (BI) actuaba como un agente estratégico para una empresa o negocio, produciendo una potencial ventaja competitiva como es la de proporcionar información relevante para responder a los problemas de la empresa pudiendo realizar una búsqueda en todo el historial de transacciones de una base de datos para generar informes, modelar tendencias y proporcionar estadísticas sobre el rendimiento del sistema.
Big Data bajando a tierra, inteligencia de negocio en Office 365
Si tienes el paquete de Microsoft Office 365, ya puedes de forma fácil y desde herramientas muy familiares analizar datos de Hadoop sin dificultad desde Excel, Power BI y Power Pivot y con conocimientos de SQL.
Convierte datos en bruto a información útil con diseños de gráficos y presentación clara. Podrás consultar y combinar datos estructurados (guardados en base de datos) con no estructurados (desde XML o desde bases de datos N0SQL). Además podrás analizar los datos generados desde redes sociales, datos texto y jpg de documentos powerpoint y word, archivos de video, audios…
La aplicación a la toma de decisiones es el verdadero secreto del BIGDATA
Pero el Big Data no solo amplía la cantidad de datos actualmente disponibles para BI sino que también agrega un nivel de complejidad sin precedentes que amplía las fronteras de los análisis, además el entorno es más seguro y flexible ya que los datos se almacenan en un sistema de ficheros distribuido.
El Warehouse o el «almacén de datos»
El Warehouse combina esencialmente información de varias fuentes dentro de una base de datos completa. Al combinar todas las diferentes informaciones en un solo lugar, es más fácil conseguir patrones en los datos que nos conduce a mejores ventas y beneficios.
Añadimos valor al negocio mediante el análisis de los datos. Dichos datos, en cantidades ingentes tal y como presenta el paradigma del Big Data, requieren el tratamiento por parte de sistemas de gran rendimiento y altamente escalables o, también, de aquellos que se basan en soluciones Cloud. Una vez el dato en bruto que toma forma de registro o log, dato social o social media, imagen, audio y vídeo es procesado; podrá ser presentado a la compañía en forma de información que aportará valor a la organización.
Bill Inmon, va un paso más alla y determina el Warehouse como la colección de información orientada al sujeto u organización, de datos actuales e históricos, de un modo integrado y prolongado en el tiempo que ayuda en la toma de decisiones directivas. Así pues, la toma de decisiones correctas aportará el valor que la organización desea.
La desventaja que presenta el Warehouse es que dependiendo de la necesidad que requiera la empresa pueden ser caros de diseñar e implementar, y a veces se necesita de un experto para manejarlos debido a su compleja construcción.
El Data Mart
El Data Mart, es un pequeño Warehouse centrado en datos específicos de un tema concreto, propios de un área de negocio o bien de un departamento aislado. Por ejemplo «ventas». Sin embargo, el propio Bill Inmon afirma que aun pescando un gran número de peces pequeños del mar no se podría formar nunca formar una ballena; estableciéndose una relación entre el tamaño de los Data Mart y la complejidad en cuanto a completitud de la información que presentan los ya conocidos Warehouse.
Se presenta como ejemplo de Warehouse toda la información referente a una compañía, que va desde su libro de visitas y sus correos electrónicos, hasta los datos financieros y los informes de ventas. Un Data Mart, por contra, puede ser el conjunto de logs generado por un Sistema de Prevención de Intrusiones o IPS instalado por el departamento de Tecnologías de la Información de la propia organización.
Es muy habitual que cada departamento de la empresa tenga su propio Data Mart, mientras que los datos en un Warehouse estan relacionados con toda la empresa.
Data Lake
Otra orientación en cuanto a recopilación de información es el llamado Data Lake, el cual permite retener todos los datos en bruto, sin ningún tipo de preprocesamiento y sin descartar ninguno de los datos generados. Este hecho permite disponer de un histórico que puede resultar altamente beneficioso, pero que requerirá disponer de soluciones de almacenaje de gran capacidad que deben verse respaldados por los servicios de copia de seguridad que se ajusten a las necesidades del negocio.
Conclusión
Las soluciones presentadas, pese a recoger datos con distintos formatos y objetivos, deben adaptarse a aquello que la sociedad requiere: la gestión de los datos y la presentación de información de un modo útil y diferenciador, que puede marcar las diferencias al satisfacer un determinado nicho de mercado.
El Big Data está creando valor diferencial en nuestra sociedad: en Salud, Ciencia, Industria, Servicios Públicos, Analítica financiera, etc.
El Big Data ofrece muchas soluciones a problemas relacionados con la ingeniería, la sociedad e incluso la salud. Sin embargo, también puede suscitar cuestiones morales y de índole legal, como el origen de la información.
Algo para reflexionar ¿Dónde se encuentra el límite del Big Data sin una legislación específica y global que regule esta tendencia?