¿Cuál es la fuente de los datos?
Herramientas estadísticas in situ. Las herramientas estadísticas disponibles actualmente en China incluyen: Baidu Statistics, Google, CNZZ, 51, etc. Baidu Statistics es relativamente sencillo para empezar y la experiencia no es mala. Se recomienda utilizar un sitio web pequeño. Las estadísticas de Google y Google Analytics son relativamente sólidas y requieren una cierta base. Utilice estas herramientas para obtener datos del usuario.
Análisis de las necesidades de los usuarios en los resultados de búsqueda del buscador. Esto requiere una comprensión de SEO: según las necesidades de los usuarios, las palabras clave de la industria de búsqueda o las palabras clave utilizadas por los usuarios se muestran en los resultados de búsqueda de Baidu. Podemos analizar las principales necesidades y deseos de los usuarios a través de los resultados de búsqueda.
Big data de la industria (o datos operativos). Estos datos suelen ser direccionales y nos dicen qué dirección tomar. Estos datos de la industria deben participar en la dinámica de la industria de este sitio web. (Comuníquese con el personal de ventas de primera línea: muchos sitios web tienen operaciones y ventas de productos. Comuníquese con el personal de ventas operativo para comprender los cambios y las necesidades de los usuarios. Se necesitan comunicación y conocimientos)
Datos de registro web. Datos del servidor web. Solicite acceso a los datos, mantenga el sitio web en funcionamiento, abierto y accedido a los motores de búsqueda.
Adjunto: Antes de analizar los datos recopilados, debe aclarar el propósito de esta recopilación y análisis, y utilizar los métodos correspondientes para recopilar datos para el análisis. Diferentes sitios web utilizarán diferentes datos para diferentes propósitos, por lo que antes del análisis, es necesario determinar: qué tipo de industria, qué tipo de sitio web se utilizará y qué problemas se resolverán.
Pregunta 2: ¿Cuál es la fuente principal de datos para los sitios web de análisis de datos? Herramientas estadísticas: Baidu Statistics, Google, CNZZ, 51, etc.
2. Buscadores: Baidu, Google, 360, etc.
En tercer lugar, los big data de la industria, que son datos recopilados por muchas personas o proporcionados por la industria.
Pregunta 3: Las fuentes de datos para la minería de datos se utilizan en muchas industrias, por lo que no está claro a qué parte se refiere la pregunta. Por ejemplo, en la industria de las comunicaciones, las fuentes de datos para la minería de datos son principalmente la señalización de comunicaciones y la recopilación de datos de comunicaciones, que básicamente se pueden completar en la red central del operador.
Pregunta 4: ¿Cuál es la principal fuente de datos de la consulta? La base de datos de Access consta de siete tipos de objetos, que son tablas, consultas, formularios, informes, macros, páginas y módulos. Tabla: la tabla es el objeto básico de la base de datos y la base para crear los otros cinco objetos. Las tablas se componen de registros y los registros se componen de campos. Las tablas se utilizan para almacenar datos en la base de datos, por eso también se denominan tablas de datos. Consulta: la consulta puede encontrar rápidamente los registros requeridos a través del índice, filtrar los registros según sea necesario y unir campos de varias tablas para formar una nueva tabla. Formularios: los formularios proporcionan una ventana conveniente para explorar, ingresar y cambiar datos. También puede crear un subformulario para mostrar el contenido de la tabla asociada. Un formulario también se llama tabla. Informe: la función del informe es clasificar y resumir los datos en la base de datos y luego imprimirlos para su análisis. Macro: la macro equivale al procesamiento por lotes en DOS y se utiliza para realizar automáticamente una serie de operaciones. Access enumera algunas operaciones comunes para que los usuarios elijan, lo cual es muy conveniente de usar. Módulo: la función de un módulo es similar a la de una macro, pero las operaciones que define son más sofisticadas y complejas que las macros. Los usuarios pueden escribir programas según sus propias necesidades. Este módulo se implementa utilizando programación Visual Basic. Página: es una página web especial que está directamente conectada a los datos de la base de datos. Los datos se pueden publicar en Internet o Intranet a través de la página de acceso a datos y se pueden mantener y operar a través del navegador.
Pregunta 5: ¿Cuáles son las fuentes de datos para la minería de datos? 1. Base de datos relacional.
2. Almacén de datos
3. Base de datos de transacciones
4. Base de datos avanzada y su aplicación
Pregunta 6: Datos de encuestas sociales es la fuente? Los datos de la Encuesta Social General de China son gratuitos. Simplemente envíe su solicitud y envíela por fax y podrá descargar la base de datos para la investigación y el análisis de su tesis de forma gratuita.
Según los estatutos de la CGSS, los datos de la CGSS de 2006 se divulgaron oficialmente a toda la sociedad el 6 de abril de 2008. Al igual que los datos CGSS2003 y 2005, el uso de datos CGSS 2006 requiere un registro adicional. La entrada de registro es: cssod/CGSS/register.php. Si ya se ha registrado como usuario de datos CGSS 2003 y 2005, no necesita registrarse nuevamente. Simplemente ingrese su correo electrónico registrado y contraseña a través de cssod/cgss/login.php para iniciar sesión y descargar los archivos de datos CGSS 2006 y los documentos relacionados.
CGSS 2006 consta de tres partes: cuestionario urbano, cuestionario rural y cuestionario de hogares. Además de los cuestionarios urbanos tradicionales y los cuestionarios rurales, la CGSS 2006 implementó conjuntamente por primera vez la Encuesta Social de Asia Oriental (EASS) con la JGSS japonesa, la KGSS coreana y la Encuesta de Cambio Social de Taiwán (TSCS). En 2006, el modelo de EASS era el familiar.
Los principales módulos del cuestionario CGSS 2006 son:
(1) Información personal básica;
(2) Experiencia laboral;
(3) Situación laboral actual ;
(4) Reestructuración empresarial y reforma económica;
(5) Actividades sociales y económicas;
(6) Actitudes y concienciación; Identificación y evaluación
p>
(7) Módulo de familia.
Pregunta 7: En estadística, ¿qué fuentes de datos estadísticos provienen principalmente de dos canales: uno es la fuente indirecta de datos; el primero es la fuente directa de datos?
Fuente directa de datos estadísticos:
? Censo: Encuesta integral única y especialmente organizada para obtener la cantidad total de fenómenos en un momento o período determinado.
? Encuesta por muestreo aleatorio: según el principio de aleatoriedad, se seleccionan algunas muestras del fenómeno general de la encuesta y la situación general se infiere de los resultados de la encuesta por muestreo.
Encuesta de muestreo no aleatorio: se refiere a un método de muestreo que no sigue el principio de aleatoriedad, sino que realiza un muestreo basado en la experiencia subjetiva del investigador u otras condiciones.
(1) Muestreo aleatorio simple
(2) Muestreo estratificado
(3) Muestreo por conglomerados
(4) Muestreo del sistema
(5) Muestreo multietapa
Muestreo no probabilístico
El muestreo no se basa en el principio de aleatoriedad, sino que se basa en los requisitos de datos para el Propósito de la investigación: Este método selecciona algunas unidades de la población para investigar.
Muestreo por conveniencia: Durante el proceso de investigación, el investigador debe determinar las unidades a incluir en el muestrario en función de la conveniencia.
Muestreo de juicio: basándose en la experiencia, el investigador selecciona intencionalmente algunas unidades como muestra.
Muestra voluntaria: Los recursos de este investigador participan como parte de la muestra.
Pregunta 8: ¿Baidu conoce la fuente de datos de Zhihu Big Data? La fuente de datos son los datos masivos acumulados por Baidu durante los últimos 10 años. Según informes de medios anteriores, Baidu sabe que actualmente hay más de 100 millones de usuarios registrados y 380 millones de personas utilizan Baidu para obtener conocimientos e información todos los días. Actualmente es uno de los pocos productos de plataforma que puede realizar análisis de "grandes datos".
Pregunta 9: ¿Cuál es la fuente de datos de Baidu Index? El índice Baidu se basa en más de 654,38 mil millones de búsquedas realizadas por internautas en Baidu todos los días. Analiza la atención de los usuarios, la atención de los medios y los datos de noticias candentes relacionados en función de las palabras clave que interesan a los usuarios y se los presenta en forma de tablas y gráficos de datos diarios, semanales, trimestrales y anuales, que pueden ayudar a las empresas a analizar sus Ideas para entender a competidores, clientes, empresas, industrias y productos.
Pregunta 10: ¿Cuáles son algunas buenas fuentes de datos o plataformas de big data? Redes avanzadas centradas en la recopilación y el análisis de big data. He estado usando su software para recopilar datos, que son básicamente millones de datos por día. Una vez completada la recopilación, los colocaré directamente en la base de datos y luego realizaré la extracción y el análisis a través de su sistema de análisis de datos para obtener un informe de análisis. Ahorre tiempo y problemas.