El gran pensamiento promueve la estrategia de big data
El gran pensamiento promueve la estrategia de big data
Debes saber que todos los números son datos. El hardware y el software actuales ya no pueden hacer frente a las enormes cantidades de datos en diversas formas que se generan a velocidades tan altas. Los macrodatos se han vuelto tan complejos y cambian tan rápidamente que a las herramientas de datos tradicionales les resulta difícil procesarlos, almacenarlos, analizarlos y gestionarlos. La cantidad de datos es tan enorme que hacer las preguntas correctas y encontrar las respuestas correctas es tan difícil como encontrar una aguja en un pajar.
Afortunadamente, todos los datos se pueden transformar en información útil utilizando hardware, herramientas y algoritmos existentes. Los conocimientos extraídos de esta información se pueden utilizar para mejorar la toma de decisiones de su organización, aumentar su eficiencia, reducir sus costos y aumentar los ingresos. La revolución de los big data ha tenido un impacto generalizado y afectará a todas las empresas de diversos sectores.
Las siete V del Big Data
Generalmente se acepta que el big data se puede explicar mediante tres "V": velocidad, variedad y volumen (volumen). Sin embargo, también me gustaría agregar los conceptos de veracidad, variabilidad, visualización y valor para explicar mejor una estrategia de big data bien planificada.
Velocidad: La velocidad se refiere a la velocidad a la que se generan, almacenan, analizan y visualizan los datos. Los datos se generan a un ritmo que casi supera nuestra imaginación: cada minuto subimos un total de 100 horas de vídeo a YouTube. Además, las personas envían más de 200 millones de correos electrónicos cada minuto, ven aproximadamente 20 millones de fotografías y cargan 30.000 fotografías en álbumes de Flickr, envían casi 300.000 mensajes de Twitter y Google maneja casi 2,5 millones de solicitudes cada minuto.
Diversidad: Atrás quedaron los días en que todos los datos estaban estructurados y podían categorizarse fácilmente. Hoy en día, el 90% de los datos no están estructurados. Los datos pueden venir en muchos formatos diferentes, incluidos datos estructurados, semiestructurados, no estructurados e incluso estructurados complejos.
Cada tipo de datos requiere diferentes tipos de métodos de análisis y herramientas de interpretación. Las redes sociales como Facebook o Twitter pueden brindar información sobre lo que los clientes piensan de su marca, servicio o producto, mientras que los datos de los sensores brindan información sobre cómo se sienten los usuarios acerca de un producto o el uso de una máquina, brindándole información que puede utilizar para mejorar su producto.
Cantidad: Al ritmo actual de generación de datos, la cantidad de datos se duplicará cada dos años. En 2011, la cantidad total de datos que creamos fue asombrosa: totalizó 1,8 ZB. Según una investigación de IDC de 2011, en 2020 esta cifra será 50 veces mayor que la actual. Esta cantidad es considerable, y una fuente considerable de datos en este universo digital es el Internet de las Cosas. Los sensores instalados en varios dispositivos en todo el mundo transmiten datos cada minuto y segundo.
Veamos algunos ejemplos. Los sensores montados en motores de aviones generan aproximadamente 2.500 millones de terabytes de datos cada año. Los sensores instalados en los tractores agrícolas también generan y recopilan grandes cantidades de datos. John Deere utiliza datos de sensores para monitorear la optimización de la maquinaria, controlar su creciente flota de maquinaria agrícola y ayudar a los productores agrícolas a optimizar sus decisiones. Shell también utiliza sensores de alta sensibilidad en los pozos petroleros para encontrar más petróleo. Si la empresa instalara sensores de este tipo en los 10.000 pozos petroleros, recopilaría aproximadamente 10 exabytes de datos al año.
Autenticidad: Incluso recopilar grandes cantidades de datos generados a alta velocidad no tiene valor si los datos en sí son defectuosos. Los datos incorrectos pueden generar graves problemas para las organizaciones e incluso para los consumidores. Si desea que su organización se centre en la información, debe asegurarse de que sus datos y análisis sean correctos. Esto es especialmente crítico cuando se automatiza la toma de decisiones, ya que los humanos ya no participan en todo el proceso. Pero un sorprendente tercio de los líderes empresariales no confía en la información que utilizan para tomar decisiones. Por lo tanto, si desea desarrollar una estrategia de big data, debe prestar mucha atención a la exactitud de los datos y la precisión del análisis.
Variabilidad: Muchas veces se confunde la variabilidad con el concepto de diversidad. Podemos dar un ejemplo para ilustrar la diferencia entre ellos. Si una panadería vende diez tipos diferentes de pan, eso es variedad. Si el mismo pan sabe y huele diferente cada día, eso es variabilidad. Al realizar un análisis de sentimiento, la variabilidad está muy relacionada con los temas.
Variabilidad significa que las definiciones pueden cambiar (rápidamente). En mensajes similares de Twitter, la misma palabra puede tener significados muy diferentes. Para realizar un análisis de sentimiento correctamente, el algoritmo utilizado debe poder descifrar el significado preciso de una palabra según el contexto. Sin embargo, esto sigue siendo un problema técnico que debe resolverse.
Visualización: Esta es la parte más difícil del big data. Esto significa que debe ayudar a su audiencia a comprender grandes cantidades de datos de una manera que sea fácil de leer y comprender. Con la visualización adecuada, los datos sin procesar entran en juego. Por supuesto, la visualización mencionada aquí no se refiere a un gráfico ordinario o circular, sino a un gráfico complejo que contiene múltiples variables de datos y que es fácil de leer y comprender para las personas.
Puede que la visualización no sea la tarea técnicamente más difícil, pero sin duda es la más desafiante. Usar diagramas para contar una historia compleja es difícil, pero igualmente importante. Afortunadamente, hay un número creciente de nuevas empresas de big data centradas en resolver desafíos en esta área. En última instancia, la visualización juega un papel clave y puede ayudar a mejorar la legibilidad.
Valor: Todos los datos disponibles pueden crear un valor sustancial para las organizaciones, las comunidades y los consumidores. Big data significa muchos negocios y todos los ámbitos de la vida pueden beneficiarse de ellos. Por supuesto, los datos en sí mismos no tienen ningún valor. El valor radica en el análisis que se hace de los datos y cómo se transforman en información y, en última instancia, en conocimiento y sabiduría. El valor de los datos radica en cómo las organizaciones los utilizan para crear una empresa centrada en la información que toma decisiones basadas en conocimientos derivados del análisis de datos.
Cinco datos sobre big data
Ahora que hemos definido big data, es necesario comprender qué aspectos debe tener en cuenta su organización a la hora de desarrollar una estrategia de big data. Big Data requiere un cambio de paradigma y comprenderlo puede ayudar a su organización a avanzar en el aprovechamiento de Big Data.
1. El big data requiere una cultura corporativa diferente. Para aprovechar realmente el big data, su organización debe convertirse en una empresa centrada en la información.
Este cambio cultural pone un mayor énfasis en las decisiones basadas en datos y brinda a su gente la oportunidad de desarrollar nuevas operaciones, tácticas y estrategias basadas en datos reales en lugar de planes estimados. Una cultura corporativa que aprovecha el big data requiere que las empresas alienten a los empleados a capturar datos en cada punto de contacto con el cliente. Necesitan hacer las preguntas correctas y responderlas con datos precisos.
2. El talento dentro de la organización es el verdadero factor impulsor del big data. Si bien un cambio cultural es importante para aprovechar todo el potencial de Big Data, el desarrollo de una estrategia de Big Data lo realizan personas dentro de la organización. En particular, los mandos intermedios y los ejecutivos deben comprender qué es el big data y cómo se puede aplicar a la organización. Si más tomadores de decisiones son conscientes de los beneficios del big data, será más probable que desarrollen e implementen una estrategia exitosa de big data.
Para comenzar a desarrollar big data con éxito, hay que empezar por encontrar el patrocinador adecuado dentro de su organización, especialmente cuando los retornos iniciales son inciertos y los costos altos. El enfoque ideal es movilizar a un alto ejecutivo o miembro de la junta directiva que tenga suficiente poder para respaldar el proyecto de big data incluso si los resultados iniciales son desfavorables.
3. Los macrodatos requieren “grandes” medidas de seguridad. Si una organización recopila grandes cantidades de datos valiosos, necesita proteger esta información de malhechores. Por lo tanto, es extremadamente importante proteger todos los datos recopilados. Hay muchas formas de proteger sus datos, siendo la más común el cifrado adecuado de la información. Por supuesto, existen muchos otros métodos, por lo que su equipo de big data siempre debe considerar la seguridad de los datos como una responsabilidad.
Sin embargo, todas las organizaciones deben preparar planes de contingencia con antelación para evitar que los piratas informáticos roben datos. Sorprendentemente, muchas empresas se sienten completamente abrumadas cuando se enfrentan a un incidente de seguridad de la información relacionado con una computadora. Este tipo de incidente de seguridad puede tener consecuencias catastróficas para una empresa. Si la empresa carece de las medidas de seguridad necesarias y ni siquiera es consciente de que ha sido hackeada, las consecuencias serán aún más graves.
Por lo tanto, las empresas deben asignar personal interno o utilizar los servicios de agencias externas especializadas para desarrollar planes de contingencia ante posibles ataques a la seguridad de la información. Si una empresa no protege los datos de la organización y de sus clientes, tarde o temprano cerrará. Si hubieras planeado con anticipación, la situación sería muy diferente.
4. Los gobiernos de todo el mundo están aumentando su inversión en big data. Al igual que las organizaciones, los gobiernos están generando cada vez más datos. Muchos gobiernos también están atravesando una transformación digital. Tomemos como ejemplo a los Países Bajos. El gobierno del país espera transformar integralmente sus oficinas en oficinas digitales y eliminar por completo las comunicaciones en papel para finales de 2017. ¿Imagínese cuántos datos pueden generar 17 millones de ciudadanos que se comunican con los gobiernos a nivel nacional, regional, de condado y de ciudad?
Con este enfoque, las organizaciones tendrán un acceso más amplio a conjuntos de datos públicos, generando soluciones innovadoras a problemas en todo el mundo. También se está lanzando un número cada vez mayor de proyectos de conjuntos de datos en el sector privado. Existe un mercado para esta recopilación de conjuntos de datos públicos y privados para organizaciones. Los usuarios pueden comprar conjuntos de datos como invitados o descargarlos de forma gratuita. También hay organizaciones que venden sus propios conjuntos de datos en algunos sitios web.
5. La clave del big data no es la cantidad de datos. La gente suele pensar que el término "grandes datos" significa grandes cantidades de datos. Como resultado, mucha gente cree que las estrategias de big data sólo son útiles si se tienen petabytes o exabytes de datos. Esto no está bien. Big data es mucho más que grandes cantidades de datos recopilados. Big data se trata más bien de combinar conjuntos de datos de diferentes variables de diferentes fuentes y en diferentes momentos. En particular, combinar y posteriormente analizar conjuntos de datos dispares para encontrar nuevos conocimientos valiosos.
Además, big data se refiere al análisis en tiempo real de los datos disponibles y al uso de diversos algoritmos para predecir el comportamiento. La información en tiempo real es valiosa para las organizaciones, ya que les permite predecir el comportamiento de los clientes en el corto plazo.