¿Cuáles son las tecnologías clave del big data?
Computación distribuida, bases de datos no estructuradas, clasificación, clustering y otros algoritmos.
Big data incluye datos estructurados, semiestructurados y no estructurados, y los datos no estructurados se están convirtiendo cada vez más en la parte principal de los datos. Según un informe de encuesta de IDC: el 80% de los datos de las empresas son datos no estructurados y estos datos crecen exponencialmente un 60% cada año.
Información ampliada:
Big data se suele utilizar para describir la gran cantidad de datos no estructurados y datos semiestructurados creados por una empresa, que se descargan en una base de datos relacional. Demasiado tiempo y el dinero se gasta en análisis.
El análisis de big data a menudo se asocia con la computación en la nube porque el análisis en tiempo real de grandes conjuntos de datos requiere un marco como MapReduce para distribuir el trabajo a decenas, cientos o incluso miles de computadoras.
Big data requiere tecnologías especiales para procesar eficientemente grandes cantidades de datos durante un período de tiempo tolerable. Las tecnologías aplicables a big data incluyen bases de datos de procesamiento masivo paralelo (MPP), minería de datos, sistemas de archivos distribuidos, bases de datos distribuidas, plataformas de computación en la nube, Internet y sistemas de almacenamiento escalables.
Enciclopedia Baidu-Big Data