Cómo actualizar la información de big data
Big data, un término de la industria de TI, se refiere a una colección de datos que no pueden ser capturados, administrados y procesados por herramientas de software convencionales dentro de un rango de tiempo determinado. Es un activo de información enorme, de alto crecimiento y diversificado que requiere un nuevo modelo de procesamiento para tener un mayor poder de toma de decisiones, capacidades de conocimiento y descubrimiento, y capacidades de optimización de procesos.
En la "Era de Big Data" escrita por Schoenberg y Cukier, big data significa que todos los datos se utilizan para análisis y procesamiento, y no hay atajos para el análisis aleatorio (encuesta de muestreo).
Información básica de big data
La importancia estratégica de la tecnología de big data no radica en dominar información de datos enormes, sino en el procesamiento profesional de estos datos significativos. En otras palabras, si se compara el big data con una industria, entonces la clave para la rentabilidad en esta industria es mejorar las "capacidades de procesamiento" de los datos y lograr el "valor agregado" de los datos a través del "procesamiento".
Técnicamente hablando, la relación entre big data y computación en la nube es tan inseparable como las dos caras de una moneda. Los big data no pueden ser procesados por una sola computadora y deben utilizar una arquitectura distribuida. Su característica es la minería de datos distribuida de datos masivos. Pero debe depender del procesamiento distribuido, las bases de datos distribuidas, el almacenamiento en la nube y las tecnologías de virtualización de la computación en la nube.