Red de Respuestas Legales - Directorio de abogados - ¿Cuáles son los principios y métodos de agrupación de datos estadísticos?

¿Cuáles son los principios y métodos de agrupación de datos estadísticos?

La clave para la agrupación de datos estadísticos radica en la selección de marcadores de agrupación y la división de los límites del grupo.

(1) Selección de marcas de agrupación

La selección de marcas de agrupación es la cuestión central de la agrupación estadística, y la marca de agrupación es el estándar o base para la agrupación estadística general. Elegir la bandera de agrupación correcta es un requisito previo para que la agrupación estadística sea completamente efectiva. Una vez que se agrupan las unidades generales, las diferencias de cada unidad bajo la bandera de agrupación se resaltan, mientras que las diferencias de la unidad general bajo otras banderas se ocultan. Por lo tanto, un mismo grupo de personas puede sacar conclusiones diferentes o incluso opuestas debido a diferentes signos de agrupación. Para garantizar que la agrupación estadística sea científica y razonable, la selección de signos de agrupación debe seguir los principios de agotamiento, exclusión mutua y reflejo de la esencia de las cosas.

(2) Método de agrupación estadística

Una vez seleccionada la marca de agrupación, es necesario delinear los límites naturales y cuantitativos entre grupos adyacentes dentro del rango de variación de la marca de agrupación. Dependiendo de las diferentes características de las marcas de agrupación, la población estadística puede agruparse por marcas de calidad o marcas de cantidad.

1Agrupar por marca de calidad.

La agrupación por marca de calidad se basa en las características de los atributos de los objetos y se divide en agrupación de calidad simple y agrupación de calidad compleja.

(1) Agrupación de marcas de calidad simple Agrupación de calidad simple significa que una vez que se determina la marca de agrupación, también se determina el nombre y el número de los grupos, y está claro a qué grupo debe pertenecer cada unidad, y no hay distinción entre grupos. Difícil agrupación de límites. Por ejemplo, la población se divide en dos grupos: hombres y mujeres según el género, y está claro en qué grupo deberían dividirse todos.

(2) La agrupación de marcas de calidad es compleja. Algunos fenómenos son complicados de agrupar según marcas de calidad, como la clasificación del sector industrial, la clasificación de ocupaciones de la población, etc. La agrupación de estos problemas complejos se llama clasificación en estadística. La clasificación estadística implica no sólo técnicas de agrupación complejas sino también políticas nacionales y teoría científica. Para garantizar la cientificidad, unidad e integridad de las diversas clasificaciones y facilitar la comprensión y el uso de los distintos departamentos, la Oficina Nacional de Estadísticas, junto con los departamentos pertinentes, ha desarrollado un catálogo de clasificaciones unificado y lo ha implementado en todo el país. Como catálogo de clasificación de productos básicos, catálogo de clasificación de productos industriales, catálogo de clasificación del sector industrial, etc.

En la clasificación estadística, las clasificaciones básicas que reflejan la estructura de la economía nacional incluyen principalmente las siguientes categorías.

① La clasificación de formas económicas es una clasificación económica importante basada en la forma de propiedad de los medios de producción.

②Clasificación del sector económico (industria) nacional. China implementa un sistema de clasificación de cuatro niveles: departamentos, categorías principales, categorías medianas y categorías pequeñas.

③Tres clasificaciones de industrias, basadas en la clasificación de departamentos (industrias).

(4) Clasificación de los departamentos de producción social A y B. Clasificación basada en el principio de reproducción de Marx y el uso económico principal del producto.

⑤Clasificación de sectores industriales. Primero divide la industria en dos partes: industria minera e industria manufacturera, y luego divide la industria en tres niveles: categoría grande, categoría mediana y categoría pequeña.

⑤Clasificación de las relaciones de afiliación. Clasificados según afiliación empresarial y liderazgo administrativo de la empresa.

⑦Clasificación regional. Están clasificados según las divisiones administrativas actuales de mi país.

(8) Clasificación ocupacional de la población activa. Se clasifica según la identidad del trabajo realizado por la población trabajadora.

2 Agrupar por símbolos de cantidad

Agrupar por marcas de cantidad se refiere a seleccionar marcas de cantidad que reflejen la diferencia en la cantidad de cosas, distinguiendo los límites de cada grupo según su rango de cambios, y dividiendo el conjunto en varios ingredientes con diferentes propiedades.

Por ejemplo, al estudiar el nivel de riqueza de las familias, se agrupan según el coeficiente de Engel (es decir, la proporción del gasto en alimentos en todo el gasto de consumo del hogar). Las familias mayores de 60 años se clasifican como pobres. las familias de 50 a 60 años se clasifican como familias pobres. Las familias de 40 a 50 años son familias acomodadas; las de menos de 40 años son familias ricas.

Para poner otro ejemplo, cuando se estudia el crecimiento humano en China, se agrupan por edad: bebés y niños pequeños de 0 a 6 años; niños de 7 a 17 años; jóvenes y personas de mediana edad de 18 a 59 años; y las personas mayores tienen más de 60 años (incluidas las mujeres mayores de 55 años).

Los signos cuantitativos reflejan las características cuantitativas del contenido específico de las cosas, y sus conceptos son específicos y claros.

Sin embargo, agrupar según signos cuantitativos no consiste simplemente en determinar las diferencias cuantitativas entre grupos, sino en determinar la diferente naturaleza y tipos de fenómenos a través de los cambios cuantitativos reflejados por la agrupación. Por lo tanto, no es fácil dividir con precisión los límites de diferentes grupos en función de valores variables. Esto requiere que cuando se utilicen marcadores cuantitativos para agrupar, primero se analice cuántos componentes de diferentes propiedades pueden existir en el grupo y luego se estudien y determinen los cuantitativos. límites entre los componentes.

De acuerdo con las características cambiantes de un cierto número de valores de bandera en cada unidad, hay dos métodos de agrupación para elegir: agrupación de un solo elemento y agrupación de espaciado de grupo.

(1) Agrupación de un solo elemento La agrupación de un solo elemento se refiere a agrupar el fenómeno general según el valor de cada variable específica.

La agrupación de un solo elemento generalmente es adecuada para variables discretas, con pocos valores de variable y pequeños rangos de cambio. Cuando el rango de valores de las variables discretas es relativamente grande y hay muchas unidades en toda la población, si se utiliza la agrupación de un solo elemento y cada valor de la variable se trata como un grupo, inevitablemente conducirá a demasiados grupos y al tiempo de cada grupo. estará demasiado disperso y no podrá reflejar toda la población La naturaleza y las diferencias de cada parte de ella, perdiendo así el verdadero significado de agrupación estadística. Para las variables continuas, dado que los valores de las variables no se pueden enumerar, y mucho menos agrupar por elementos individuales, en estos casos se requiere el método de agrupación entre grupos.

(2) Agrupación por distancia de grupo La agrupación por distancia de grupo se refiere a agrupar grupos de fenómenos de acuerdo con un cierto rango de valores variables. Dentro del rango de cambio general del fenómeno, se divide en varios intervalos. Todos los valores variables en cada intervalo se consideran un grupo y tienen las mismas propiedades, pero las propiedades entre los grupos son diferentes. En comparación con la agrupación de un solo elemento, el valor variable de cada grupo no es un valor de punto específico, sino un intervalo. Por ejemplo, el grupo de ingresos promedio de las familias de trabajadores de una ciudad se muestra en el Cuadro 3.2.

Cuando los valores de las variables cambian significativamente, generalmente se utiliza el espaciado entre grupos. En la agrupación por distancia de grupo, hay elementos de agrupación como el límite de grupo, la distancia de grupo, el número de grupo y el valor de la mediana del grupo.

(1) Límite de grupo El límite de grupo es el valor de la variable que se utiliza para expresar el límite entre grupos, y es el límite cuantitativo que determina la calidad de las cosas. Entre ellos, el valor variable más pequeño en cada grupo es el límite inferior del grupo, denominado límite inferior; el valor variable máximo es el límite superior del grupo, denominado límite superior;

②El espaciado de grupo se refiere a la longitud del intervalo de un grupo de valores variables, es decir, la distancia entre el límite superior y el límite inferior de cada grupo. Es decir: distancia del grupo = límite superior - límite inferior.

En el espaciado de grupos, según si el espaciado de cada grupo es igual, se puede dividir en grupos de espaciado igual y grupos de espaciado desigual. Los grupos con intervalos de grupo iguales se denominan grupos equidistantes y los grupos con intervalos de grupo desiguales se denominan intervalos de grupo desiguales o intervalos de grupo desiguales.

③El número de matrices de grupos es el número de grupos. Bajo ciertas condiciones de grupos, el número de grupos está estrechamente relacionado con la distancia entre grupos. En términos generales, el número de grupos es inversamente proporcional a la distancia entre grupos, es decir, si el número de grupos es pequeño, la distancia entre grupos es grande; si el número de grupos es grande, la distancia entre grupos será pequeña; Si hay demasiados grupos y la distancia entre los grupos es demasiado pequeña, los datos agrupados serán complicados y difíciles de mostrar las características y patrones de distribución del fenómeno general; si hay muy pocos grupos y la distancia entre los grupos es demasiado grande; el significado de la agrupación puede perderse y no puede reflejar correctamente hechos objetivos. Al determinar la distancia del grupo y el número de grupos, se debe tener cuidado de garantizar que cada grupo tenga suficientes unidades. El número de grupos no debe ser ni demasiado ni demasiado pequeño, para reflejar de forma completa y precisa las características de distribución del fenómeno.

(4) Mediana del grupo La mediana del grupo es el valor del punto medio de la distancia del grupo y es el nivel representativo del valor de la variable de cada grupo. En la agrupación de límites de grupo superpuestos, es el promedio simple de los límites superior e inferior de cada grupo; en la agrupación de límites de grupo no superpuestos, es el promedio simple del límite inferior de este grupo y el límite inferior de; el siguiente grupo.

En la agrupación por intervalos de grupo, el intervalo de grupo enmascara los valores reales de las variables de cada unidad distribuida dentro del grupo. Por lo tanto, es necesario utilizar la mediana del grupo para representar el nivel aproximado del grupo. también la mediana del grupo en estadística. Razones por las que se utiliza mucho en el análisis.