Red de Respuestas Legales - Asesoría legal - Cinco formas de pensar sobre el análisis de datos

Cinco formas de pensar sobre el análisis de datos

Cinco formas de pensar sobre el análisis de datos

Descubrí que muchos de mis amigos no saben cómo manejar los datos. Este proceso se llama limpieza de datos y puede implicar programación. Los analistas deberían aprender algo de programación. Me tomaré el tiempo para presentárselo en el futuro, pero no hablaré de eso hoy.

Hoy vamos a hablar de las cinco formas de pensar en el análisis de datos.

En primer lugar, necesitamos saber qué es el análisis de datos. De hecho, el proceso de datos a información es análisis de datos. Los datos en sí no tienen valor, lo valioso es la información que extraemos de los datos.

Sin embargo, ¿cuál es el propósito del análisis de datos?

El propósito es resolver un problema de nuestra realidad o satisfacer una necesidad en la realidad.

Entonces, en este proceso de datos a información, debe haber algunos conceptos fijos o formas de pensar. Permítanme presentárselos uno por uno a continuación. (Los indicadores y dimensiones utilizados en este artículo tienen el mismo significado).

El primer contraste importante en el pensamiento

El contraste, comúnmente conocido como contraste, no se puede sentir con solo mirar un Un dato. Puedes sentirlo comparándolo con otros datos. Por ejemplo, la imagen A y la imagen B a continuación.

No siento lo mismo en la Figura A

Después de comparar el volumen de operaciones de ayer en la Figura B, encontrará que hoy es en realidad muy diferente de ayer.

Este es el concepto más básico y el más importante. Tiene una amplia gama de aplicaciones en la realidad, como la selección de moneda y el monitoreo de datos de tiendas. Estos procesos son sólo comparaciones. Una vez que los analistas obtienen los datos, si los datos son independientes y no se pueden comparar, no podrán juzgar, lo que significa que no podrán leer información útil de los datos.

La segunda división más grande en el pensamiento

El análisis de palabras significa literalmente dividir y analizar. Esto muestra la importancia de dividir en el análisis de datos. La palabra "división" también se puede ver en todas partes en las facciones, y muchos autores usarán este tono: Después de dividirnos, lo sabremos claramente. Sin embargo, creo que muchos amigos no han pensado en cómo dividirlo.

Volvamos a la primera comparación mental. Cuando se puede comparar una determinada dimensión, elegimos comparar. ¿Cuándo encuentra un problema después de la comparación y necesita descubrir la causa? O no hay comparación alguna. En este momento aparece la división.

Mira la siguiente escena.

El gerente Xiaomei comparó los datos de la tienda y descubrió que las ventas de hoy eran solo el 50% de las de ayer. En este momento, no tiene sentido para nosotros comparar la dimensión de ventas. En este momento, es necesario descomponer la dimensión de ventas y dividir los indicadores.

Ventas = número de usuarios * precio unitario por cliente, número de usuarios es igual a número de visitantes * tasa de conversión.

Consulte las figuras cyd para obtener más detalles.

La figura C es un desmontaje de la fórmula exponencial.

La figura b es una descomposición simple de los componentes del flujo (también se puede dividir en partes muy finas y completas)

El resultado después de dividir será mucho más claro que antes de dividir , lo cual es conveniente para analizar y encontrar detalles. Se puede ver que la división es uno de los pensamientos necesarios de los analistas.

La reducción del pensamiento en tercera dimensión

¿Alguna vez te has enfrentado a una gran cantidad de datos dimensionales pero no has podido hacer nada al respecto? Cuando hay demasiadas dimensiones de datos, nos resulta imposible analizar todas las dimensiones. Hay algunos indicadores relacionados de los cuales podemos filtrar dimensiones representativas. La siguiente tabla

tiene tantas dimensiones que no es necesario analizarlas una por una. Sabemos que número de usuarios/número de visitantes = tasa de conversión. Cuando esta dimensión existe, se puede convertir en las otras dos dimensiones mediante cálculo y podemos reducir la dimensionalidad.

Solo necesitas elegir dos de tres en cuanto a número de usuarios, número de visitantes y tasa de conversión. Además, número de usuarios * precio unitario = volumen de ventas, también puedes elegir dos de estos tres.

Además, generalmente sólo nos preocupamos por los datos que nos son útiles. Cuando hay algunas dimensiones en los datos que son irrelevantes para nuestro análisis, podemos filtrarlas para lograr la reducción de dimensionalidad.

La cuarta dimensión del pensamiento.

Las dimensiones crecientes y decrecientes se corresponden entre sí. Si hay una disminución, habrá un aumento. Cuando nuestras dimensiones actuales no pueden explicar bien nuestro problema, necesitamos realizar una operación con los datos y agregar un indicador adicional. Por favor vea la imagen a continuación.

Encontramos el índice de búsqueda y el número de bebé. Estos dos indicadores representan demanda y competencia. Muchas personas consideran el índice de búsqueda/número de productos como un múltiplo y utilizan múltiplos para representar el grado de competencia de una palabra (solo como referencia). Esto se hace para agregar dimensión. La dimensión agregada se llama columna auxiliar.

Debemos comprender completamente el significado de los datos para aumentar y reducir la dimensionalidad, y realizar operaciones de transformación intencionadas en los datos para facilitar nuestro análisis.

El quinto supuesto de pensamiento principal

Cuando estamos inseguros o confundidos acerca del futuro. Podemos aplicar hipótesis, que es un término técnico en estadística, comúnmente conocido como hipótesis. Cuando no conocemos el resultado, o hay varias opciones, lo llamamos hipótesis. Primero asumimos los resultados y luego utilizamos el pensamiento inverso.

Del resultado a la causa, qué tipo de razones se necesitan para producir ese resultado. Esto es un poco de búsqueda de raíces. Entonces, podemos saber cuántas razones se satisfacen y cuántas razones más se necesitan. En el caso de múltiples opciones, podemos encontrar el mejor camino (decisión) mediante este método.

Por supuesto, el poder de las hipótesis no termina ahí. Las suposiciones pueden ser caballos salvajes y, además de los resultados, también se pueden asumir procesos.

Cuando volvamos al propósito del análisis de datos, sabremos que sólo cuando los problemas y necesidades estén claros podremos elegir el método de análisis.

Por cierto, déjame hablarte de los tres tipos de datos principales. Esto pertenece al concepto de intercambio furtivo. En realidad, es una subdivisión de series de tiempo, no un tipo de datos real, pero esto es algo que se encuentra a menudo al procesar datos de la tienda. Los datos se colocan en ejes, divididos en pasado, presente y futuro.

El primer tipo de big data solía ser

Los datos pasados ​​se refieren a datos históricos, datos que ya sucedieron.

Función: Se utiliza para resumir, comparar y perfeccionar conocimientos.

Por ejemplo: datos históricos de operaciones de la tienda, datos de reembolsos, datos de pedidos.

Ahora el segundo tipo de datos más grande

El concepto es relativamente vago ahora. Hoy, este mes o este año pueden ser los datos actuales, dependiendo de nuestra unidad de tiempo. Si la unidad son días, entonces los datos de hoy son los datos actuales. Sólo comparando los datos actuales con los del pasado podemos saber dónde nos encontramos ahora. Los datos actuales por sí solos son inútiles.

Función: Se utiliza para comprender la situación actual y descubrir problemas.

Por ejemplo: datos de la tienda de hoy

El tercer tipo de datos más grande en el futuro

Los datos futuros se refieren a datos que aún no han sucedido y se obtienen mediante predicción. . Por ejemplo, hicimos planos, presupuestos, etc. , aún no ha llegado el momento, pero ya tenemos los datos. Estos datos son sólo de referencia, la predicción no es del 100% y siempre hay algunas discrepancias.

Función: utilizada para predicción.

Por ejemplo: planificación de tienda, plan de ventas

Tres tipos de datos fluyen en una dirección, y el futuro eventualmente se convertirá en presente hasta convertirse en pasado.

A otros no sé, pero a mí me gusta mucho poner datos en los ejes. Si se divide por período de tiempo, el papel de cada dato es muy claro.

Lo anterior es el contenido relevante sobre las cinco formas de pensar en el análisis de datos compartido por el editor. Para obtener más información, puede seguir a Global Ivy para compartir más información detallada.