¿Cuáles son los resúmenes de la capacitación en visualización de datos?
Un resumen es un material escrito que analiza y estudia la experiencia o situación en una determinada etapa del trabajo, estudio o pensamiento. Nos permite detectar errores rápidamente y corregirlos. Escribamos juntos un resumen cuidadosamente. ¿Cómo escribir un resumen para que no sea lo mismo? El siguiente es un resumen de la capacitación en visualización de datos que compilé cuidadosamente solo como referencia, espero que le resulte útil.
Resumen de capacitación en visualización de datos 1 La visualización de datos se refiere a mostrar visualmente la relación entre los datos a través de gráficos. A través de la visualización de datos, una gran cantidad de conjuntos de datos se convierten en imágenes de datos y todos los valores de atributos de los datos se expresan en forma de datos multidimensionales, de modo que los datos se pueden observar desde diferentes dimensiones, lo que permite los datos para ser observados y analizados más profundamente.
1. Los tipos de gráficos más utilizados para la visualización de análisis de datos son los siguientes:
1. Tabla
2. Figura de línea
4. Histograma
5. Gráfico de barras
Segundo análisis visual
2.1 Quiere analizar los 10 principales usuarios. ¿Se trata de negocios recurrentes o de una gran cantidad de clientes?
Este análisis utiliza análisis de tablas para analizar los 10 usuarios principales según el número de compras: todas son compras únicas, no clientes recurrentes. Las empresas deben encontrar formas de mantener estos grandes grupos de clientes.
2.2 Según los resultados del análisis del punto 2.1, ¿cuál es el poder adquisitivo de esos clientes recurrentes? Por lo tanto, volvimos a contar las fechas de compra y analizamos a los usuarios con más compras: se concluyó que en este * * * análisis había 29,944 usuarios, y solo 25 eran clientes recurrentes, lo que representa solo 1 usuario que compró cuatro veces; , y los 24 restantes El usuario solo compró dos veces. Los comerciantes deben atraer algunos clientes habituales y considerar si la calidad está a la altura y si la actividad no es lo suficientemente fuerte.
Utilice el gráfico circular para ver directamente que la proporción de clientes habituales es pequeña.
2.3 Según la categoría de producto cat_id, cuente las 10 categorías de ventas principales y utilice gráficos de barras para analizar visualmente:
2.4 Visualice las ventas totales de 20xx y 20xx mensualmente y trimestralmente respectivamente Del análisis, se ve claramente que la tendencia de cambio de ventas es la siguiente: el volumen de ventas es el más alto en noviembre y el volumen de ventas es el más alto en el cuarto trimestre.
2.5 Analiza los datos de la Tabla 2 y ¿quieres saber qué grupo de edad tiene mayores ventas de ropa infantil? Como se muestra a continuación, el análisis de gráficos intuitivo se realiza utilizando gráficos de columnas y diagramas de dispersión respectivamente (el diagrama de puntos es ligeramente mejor. Se puede ver que la tendencia de ventas de niños y niñas del mismo grupo de edad es consistente y se muestra el volumen de ventas). una tendencia a la baja con la edad.
Si tomamos como etapa los 3 años, 0-3 años es el periodo infantil con mayores ventas, y Taobao y Tmall tienen mayor demanda en el mercado.
En tercer lugar, como resumen de las responsabilidades del análisis de datos
En este artículo, resumí dos experiencias de la investigación preliminar sobre el análisis de datos: El análisis de datos primero debe dominar los métodos y herramientas de análisis de datos comunes. luego adaptados y combinados de forma flexible según los productos de la empresa. A continuación, quiero aprender sistemáticamente conocimientos sobre análisis de datos. El analista de datos es un puesto muy práctico y requiere formación continua en proyectos reales para convertirse en un maestro.
Como analista de datos, creo que mi principal responsabilidad es presentar los datos comerciales a los usuarios de datos y a los tomadores de decisiones de manera clara, precisa y clara, como predecir la rotación de usuarios y clasificarlos automáticamente. Lo que tienes para ofrecer es valioso. Los tomadores de decisiones y los gerentes pueden realizar ajustes oportunos y razonables a las actividades comerciales en función de los resultados de los datos presentados para maximizar las ganancias corporativas.
Resumen de capacitación en visualización de datos 2 I. Definición de visualización de datos
La visualización de datos es una disciplina multidisciplinaria que involucra tecnología de la información, ciencias naturales, análisis estadístico, gráficos, interacción, información geográfica, etc. Tecnología interdisciplinaria que expresa conceptos e información abstractos o complejos mediante la visualización de información no numérica. En pocas palabras, esta tecnología presenta datos en forma de cuadros y gráficos para transmitir información. Los seres humanos tienen cinco sentidos y pueden experimentar el mundo físico a través de cinco canales, entonces, ¿por qué sólo favorecemos la visualización para transmitir información? Esto se debe a que la cantidad de información que obtiene la visión humana es enorme. El ojo humano combinado con el cerebro forma un procesador paralelo de gran ancho de banda para una enorme entrada de señales visuales, con súper capacidades de reconocimiento de patrones. Más del 50% del cerebro se utiliza para el procesamiento relacionado con la percepción visual y una gran cantidad de información visual se procesa en la etapa subconsciente. Las imágenes del cuerpo humano se procesan 60.000 veces más rápido que el texto, por lo que la visualización de datos es una forma de intercambiar información con un gran ancho de banda.
Si ampliamos nuestros horizontes, la visualización de datos incluye a grandes rasgos tres ramas: visualización científica, visualización de información y análisis visual. La visualización científica es un campo interdisciplinario de investigación y aplicación que se centra en la visualización de fenómenos tridimensionales y se utiliza ampliamente en diversos sistemas en arquitectura, meteorología, medicina o biología. Los datos estudiados en este campo tienen estructuras geométricas naturales (como líneas de inducción magnética y distribución de fluidos).
Datos científicos.png
La visualización de información estudia la representación visual interactiva de datos abstractos para mejorar la cognición humana. Los datos abstractos incluyen datos numéricos y no numéricos, como información geográfica y texto. Los datos estudiados en este campo tienen estructuras abstractas, como histogramas, gráficos de tendencias, diagramas de flujo, diagramas de árbol, etc. Estos gráficos transforman conceptos abstractos en información visual, a menudo en forma de paneles de datos.
Information_data_viz .png
El análisis visual combina representaciones visuales interactivas y procesos de análisis básicos (procesos estadísticos y técnicas de minería de datos) para realizar actividades avanzadas y complejas (razonamiento y toma de decisiones).
i.e._analysis.png
En segundo lugar, el estado de todo el proceso de ciencia de datos
Los componentes principales de la ciencia de datos incluyen tres etapas principales: recopilación de datos, exploración análisis de datos y visualización de datos. Desde una posición superior, la visualización de datos tiene una posición relativamente atrasada en la ciencia de datos y pertenece a la etapa final de presentación de resultados. Si queremos empezar desde cero, primero en la etapa de procesamiento de datos, nuestra tarea principal es obtener y analizar datos, incluyendo una serie de limpieza y procesamiento de datos sin procesar. Esta área del conocimiento se ocupa principalmente de la informática. La segunda es la etapa de análisis exploratorio de datos, que requiere mucha experiencia en estadística y minería de datos, además de dibujar gráficos para explicar y explorar los datos. Las principales tareas en esta etapa son el filtrado y la minería. Pero en esta etapa, el análisis visual es sólo un "diálogo" entre usted y los datos, lo que los datos quieren decirle, mientras que la visualización de datos es un diálogo entre los datos y sus lectores, y lo que usted quiere decirles a los lectores a través del datos, esta es la mayor diferencia entre los dos. Después de completar el contenido de las dos etapas anteriores, llega nuestra etapa final de visualización de datos, que es un campo multidisciplinario que involucra diseño gráfico, visualización de información e interacción persona-computadora. Nuestra tarea principal es extraer información, expresarla visualmente e interactuar con los lectores. Pero sería un gran error entender estas tres etapas de la ciencia de datos como un modelo "lineal" estrictamente secuencial. Es un proceso iterativo y no lineal. Los siguientes pasos le darán más información sobre lo que ha hecho antes. Puede ser que cuando llegues a la etapa de visualización de datos, te des cuenta de que aún quedan demasiadas dudas que no están claras. Necesitamos volver al paso anterior y rehacer el trabajo anterior, como un pintor que da vueltas y vueltas antes de completar finalmente una obra maestra. El proceso de visualización de datos no es la guinda del pastel del análisis de datos recién horneado, sino un proceso de iteración repetida y optimización continua.
En tercer lugar, la pila tecnológica de visualización de datos
La visualización de datos es un campo interdisciplinario típico. Se puede decir que el conocimiento necesario para la visualización de datos es una silueta del enorme sistema de conocimiento de la ciencia de datos. Sentirás la racionalidad científica de los datos. Por un lado, también sientes su lado sensual. Puedes pasar toda la vida explorando este vasto campo, siempre aprendiendo y divirtiéndote.
Cuarto, proceso de visualización de datos
La esencia de la visualización de datos es realizar un análisis y extracción de datos en profundidad basándose en una comprensión completa del negocio, y luego utilizar la información obtenida. Al explorar los datos, la información y el conocimiento se presentan en forma visual. En otras palabras, lo que hacemos es en realidad un mapeo del espacio de datos al espacio de gráficos. El primer paso que debemos hacer es comprender completamente los datos según el negocio y luego seleccionar el tipo de gráfico apropiado a través de algunos métodos, lo que requiere que tengamos una comprensión relativamente completa de los tipos de gráficos. ¿Terminaste de dibujar el diagrama? No precisamente. También necesitamos optimizar el gráfico, y esto es para los distintos elementos del gráfico. Contamos con una serie de técnicas de diseño para esto, que veremos a continuación.
4.1 Entender los datos basados en el negocio
Hablar de análisis de datos sin entender el negocio es una cosa de canalla. Este artículo presenta un método para comprender rápidamente los datos y los negocios para una mayor exploración y análisis, llamado "método 5W2H".
Paso uno: ¿Qué, qué está pasando? ¿Qué tema empresarial describen los datos?
Paso 2: ¿Cómo, es decir, cómo recopilar datos? Las reglas de recopilación afectarán el análisis posterior.
Por ejemplo, si se trata de un punto de incrustación de datos de back-end, entonces los datos generalmente son en tiempo real; si es un punto de incrustación de datos de front-end, entonces es necesario comprender mejor el estado de la red en el que estarán los datos; subido. ¿Qué hacer cuando no hay internet? Estos afectarán la calidad de los datos finales y por tanto la calidad del análisis.
Paso 3: ¿Por qué, por qué necesitamos recopilar estos datos? ¿Qué queremos aprender de los datos? ¿Cuál es el objetivo del análisis de datos?
Paso 4: ¿Cuándo y cuándo los datos empresariales segmentan el mercado?
Paso 5: ¿Dónde están los datos comerciales?
Paso 6: ¿QUIÉN, quién recopiló los datos? En una empresa, es posible que le preocupe más de qué sistema empresarial proviene.
Paso 7: ¿Cuántos datos sustentan el análisis? Los métodos de análisis son diferentes cuando hay datos suficientes e insuficientes. Si la respuesta a una de las siete preguntas no es satisfactoria, significa que hay margen de mejora.
4.2 Seleccionar el tipo de gráfico
Puedes elegir el tipo de gráfico apropiado en tres sencillos pasos: mirar el tipo de datos, mirar las dimensiones de los datos y mirar el contenido que se va a mostrar. expresado.
Tenemos dos tipos de datos, cada uno con dos subcategorías. Primero, tenemos datos categóricos y cuantitativos. Los datos categóricos se utilizan para representar categorías, como manzanas, plátanos, peras y uvas. Estas son las cuatro categorías de frutas, llamadas clasificación y categorización. Algunas variables categóricas pueden tener un orden determinado. Dividido en bajo, medio y tres niveles superiores, la forma del cuerpo de la persona es delgada, normal u obesa. Esta variable categórica especial se llama rango categórico. Los datos cuantitativos se pueden dividir en dos categorías: una se denomina datos de valores continuos, como la edad de una persona; la otra se denomina datos de valores discretos, como el número de gatos.