Red de Respuestas Legales - Derecho de bienes - ¿Cuáles son las clasificaciones de los sistemas de recopilación de big data?

¿Cuáles son las clasificaciones de los sistemas de recopilación de big data?

1. El sistema de recopilación de registros del sistema

recopila y organiza información de datos de registro y luego realiza análisis de datos para explorar el valor potencial de los datos de registro del canal de transacciones de la empresa. En resumen, la recopilación de datos de registro proporciona análisis y aplicaciones en tiempo real, tanto en línea como fuera de línea. El sistema de recopilación de registros de código abierto más utilizado actualmente es Flume.

2. Sistema de recopilación de datos de red

Obtenga datos de sitios web a través de rastreadores web y API públicas (como Twitter y Sina Weibo API) proporcionadas por algunos canales de sitios web. Puede extraer datos no estructurados y datos semiestructurados de páginas web, extraerlos, limpiarlos y convertirlos en datos estructurados y almacenarlos como datos de archivos locales consistentes.

Los sistemas de rastreo web más utilizados actualmente incluyen Apache Nutch, Crawler4j, Scrapy, etc.

3. Sistema de recopilación de bases de datos

Después de que el sistema de recopilación de bases de datos se combina directamente con el servidor backend de transacciones empresariales, se almacena una gran cantidad de registros de transacciones que ocurren en cada momento en el backend de transacciones empresariales. escrito en la base de datos y, finalmente, los sistemas de permisos de procesamiento específicos analizan el sistema.

Actualmente, MySQL y Oracle se usan comúnmente para almacenar datos, y las bases de datos NoSQL como Redis y MongoDB también se usan comúnmente para recopilar datos.

Acerca de la clasificación de los sistemas de recopilación de big data, el editor Qingteng la compartirá con usted aquí. Si está interesado en la ingeniería de big data, espero que este artículo pueda ayudarle. Si desea saber más sobre las habilidades y la información de los analistas de datos y los ingenieros de big data, puede hacer clic en otros artículos de este sitio para obtener más información.