Red de Respuestas Legales - Asesoría legal - ¿Dónde encontrar datos para el análisis de datos?

¿Dónde encontrar datos para el análisis de datos?

1. Conjuntos de datos simples y abiertos

Primero, comparta algunos conjuntos de datos y sitios web de descarga de datos profesionales establecidos por algunas instituciones de investigación científica, empresas y gobiernos. Estos conjuntos de datos son generalmente relativamente completos, de calidad relativamente alta y requieren menos trabajo para limpiar los datos. Son adecuados para que los principiantes realicen algunos análisis básicos simples.

Red de Información Estadística de China: Información estadística anual sobre el desarrollo económico y social nacional de los gobiernos en todos los niveles en todo el país, algunos datos son gratuitos.

Oficina Nacional de Estadísticas: varios datos estadísticos relacionados con los medios de vida de las personas, y todos los datos son gratuitos, y este sitio web tiene muchos enlaces amigables a datos extranjeros y extranjeros.

2. Conjunto de datos del proyecto de visualización de datos

El proyecto de visualización de datos más común es crear una infografía de la diferencia en el ingreso per cápita en una determinada región. Cuando buscamos conjuntos de datos relevantes para un proyecto de visualización de datos, ¿queremos que el conjunto de datos sea lo más grande posible? ¿limpio? Para reducir el trabajo de limpieza de datos, los datos deben ser lo suficientemente interesantes como para admitir gráficos completos.

3. Conjuntos de datos para modelado de datos y aprendizaje automático

UCI: UCI es un conjunto de datos clásico abierto por la Universidad de California, Irvine, y también es el almacén de datos más famoso del mundo. campo del aprendizaje automático. Contiene varios conjuntos de datos, como los datos más recientes de las predicciones clásicas de supervivencia del Titanic (como la calidad del aire y las trayectorias GPS).

Alibaba Tianchi: como sitio web de competencia de big data propiedad de Alibaba, la principal empresa nacional de Internet, proporciona una gran cantidad de conjuntos de datos de competencia para practicar, y tal vez puedas ganar un premio y algunas bonificaciones.