01 Descripción general del análisis y visualización de datos
La minería de datos se refiere al proceso de aplicar agregación, clasificación, regresión, reglas de asociación y otras tecnologías para extraer valor potencial de una gran cantidad de datos de aplicaciones prácticas incompletos, ruidosos, confusos y aleatorios.
El análisis de datos se puede dividir en sentido estricto y sentido amplio. El análisis de datos en un sentido estricto se refiere al uso de análisis comparativo, análisis de grupo, análisis cruzado, análisis de regresión y otros métodos de análisis para procesar y analizar los datos recopilados, extraer información valiosa, aprovechar al máximo el papel de los datos y obtener un resultado estadístico característico. En términos generales, el análisis de datos es un análisis de datos en un sentido estricto. Los punteros de análisis de datos generalizados utilizan exploración básica, análisis estadístico, minería en profundidad y otros métodos para encontrar información útil y reglas y patrones desconocidos en los datos, proporcionando una base teórica y práctica para el siguiente paso de las decisiones comerciales.
Visualización de datos La visualización de datos es una de las tecnologías clave del análisis y la ciencia de datos. Codifica datos o información en gráficos o imágenes y permite la interpretación visual de datos a través de la representación, modelado y visualización de entidades, superficies, propiedades y animaciones utilizando procesamiento de imágenes gráficas, visión por computadora e interfaces de usuario.
Proceso de visualización de datos, procesamiento de datos, codificación visual y generación visual.
El procesamiento de datos se centra en la recopilación, limpieza, preprocesamiento, análisis y minería de datos.
La codificación visual se centra en la recepción de imágenes ópticas, la extracción de información, el procesamiento y conversión, el reconocimiento de patrones y el almacenamiento y visualización.
La producción visual se centra en la transformación de datos en gráficos y procesamiento interactivo.
(1)El rastreo de datos requiere Python.
(2)El análisis de datos requiere Python.
(3) El lenguaje Python es simple y eficiente
NumPy, Scipy, Pandas, Matplotlib, Seaborn, Scikit-learn,