¿Qué significa big data? ¿Qué incluye el big data?
La definición de big data: debido a la necesidad de medir, registrar y predecir los procesos de producción y vida, los humanos nunca han dejado de buscar datos, desde la aparición de datos en bruto hasta la formación de datos científicos y la nacimiento del big data.
En mayo de 2011, el Instituto McKinsey publicó un informe: "Big Data: La próxima frontera para la innovación, la competencia y la productividad". El informe dio por primera vez una definición relativamente clara de big data: "Big data se refiere a conjuntos de datos cuyo tamaño excede las capacidades de adquisición, almacenamiento, gestión y análisis de las herramientas de bases de datos convencionales".
El 31 de agosto de 2065438, el "Plan de acción para promover el desarrollo de Big Data" del Consejo de Estado Datos" declaró: "Big data es una colección de datos con gran capacidad, muchos tipos, velocidad de acceso rápida y alto valor de aplicación. Se está desarrollando rápidamente para recopilar, almacenar y correlacionar una gran cantidad de datos con fuentes dispersas y diversos formatos. descubrir nuevos conocimientos, crear nuevo valor y actualizar nuevos productos.
El "Libro blanco de Big Data 2016" decía: "Big data es una mezcla de nuevos recursos, nuevas tecnologías y nuevas ideas. Desde una perspectiva de recursos, big data es un recurso nuevo que incorpora una nueva perspectiva de recursos; desde una perspectiva técnica, big data representa una nueva generación de tecnología de gestión y análisis de datos; desde una perspectiva conceptual, big data abre una perspectiva de pensamiento completamente nueva; . ”
Los big data actualmente reconocidos por la industria tienen “características de 4V, a saber: volumen (gran capacidad), categoría (múltiples variedades), velocidad (alta velocidad) y valor (alto valor).
La función del big data es obtener resultados significativos a través de modelos algorítmicos basados en una enorme cantidad de datos, optimizando así la asignación de recursos, descubriendo fenómenos y prediciendo el futuro.
Contenido del big data El big data implica datos generados por diferentes dispositivos y aplicaciones, incluyendo principalmente las siguientes áreas:
1. Datos de caja negra: Son los datos de helicópteros, aviones y Componentes de los jets. Captura voces de la tripulación de vuelo, grabaciones de micrófonos y auriculares e información sobre el rendimiento de la aeronave.
2. Datos de redes sociales: Las redes sociales como Facebook y Twitter almacenan información y opiniones publicadas por millones de personas en todo el mundo.
3. Datos de transacciones de acciones: Los datos de transacciones de acciones almacenan información relacionada con las decisiones de “compra” y “venta” de los clientes sobre acciones de diferentes empresas.
4. Datos de la cuadrícula: Los datos de la cuadrícula retienen la información consumida por un nodo específico en relación con la estación base.
5. Datos de transporte: Los datos de transporte incluyen el modelo del vehículo, la capacidad, la distancia y la disponibilidad.
6. Datos de los motores de búsqueda: Los motores de búsqueda recuperan grandes cantidades de datos de diferentes bases de datos.
Por tanto, el big data contiene una gran cantidad de datos escalables y de alta velocidad, de los cuales existen tres tipos de datos:
(1) Datos estructurados: datos relacionales.
(2) Datos semiestructurados: datos XML.
(3) Datos no estructurados: Word, PDF, texto, registros multimedia.