Red de Respuestas Legales - Leyes y reglamentos - ¿Puedo aprender a analizar big data por mi cuenta sin ninguna base básica?

¿Puedo aprender a analizar big data por mi cuenta sin ninguna base básica?

En la actualidad, existe una gran brecha de talento en la industria del análisis de datos. Se espera que el tamaño del mercado alcance los 200 mil millones en los próximos tres años y las perspectivas de empleo son buenas. Pero en comparación con otras industrias, el umbral de entrada es más alto y altamente profesional. Necesita una tecnología excelente para manejar grandes cantidades de datos. Puedes aprender de profesores profesionales en clases de formación, para que puedas dominar el contenido de forma más sistemática y evitar desvíos. Al mismo tiempo, el profesor también puede supervisarte.

1. ¿Cuánto tiempo lleva aprender a analizar datos?

La capacidad y los fundamentos de aprendizaje de cada persona son diferentes, por lo que el ciclo de aprendizaje del análisis de datos también es diferente. Si es mediante el autoestudio, este ciclo puede ser muy largo, porque no hay orientación de profesores profesionales ni aprendizaje sistemático. En términos generales, si un alumno de base cero recibe una formación sistemática, le llevará casi tres o cuatro meses como máximo. El aprendizaje del análisis de datos comienza con la familiaridad con las tablas y las estructuras de las tablas. La base debe basarse en la familiaridad con Excel y la capacidad de extraer números de bases de datos para mejorar las habilidades. Sus habilidades van desde poder extraer números de una base de datos, procesar datos pequeños con decenas de miles de filas usando Excel y BI, hasta procesar por lotes datos de tamaño mediano con cientos de miles o incluso millones de filas usando Python y, finalmente, usar datos relevantes. Los componentes de big data como hadoop, spark, flume y otros componentes manejan decenas de millones o incluso miles de millones de big data. Las herramientas y métodos necesarios para cada etapa son diferentes. En términos generales, los analistas autodidactas que pueden manejar datos moderados deben al menos comprender las bibliotecas de procesamiento de datos pandas, numpy y otras de Python. Este ciclo de cero autoestudio también se relaciona generalmente con la comprensión y la autodisciplina. Los estudiantes con alta comprensión y autodisciplina pueden dominarlo en 4 meses; si los estudiantes no tienen comprensión y autodisciplina, este ciclo puede abandonarse a la mitad y no se puede estimar el tiempo. Aquí hay una clase de empleo práctica de análisis de datos recomendada (Academia Juju), que se enfoca en cultivar las capacidades de procesamiento de datos, capacidades de análisis de datos y capacidades de minería de datos de los analistas de datos. El contenido del curso incluye gestión de bases de datos, teoría y métodos estadísticos, aplicación de software de análisis de datos convencional y algoritmos de minería de datos. Y explicó un conjunto de tecnología de proceso de análisis de datos utilizando un sistema de ejercicios prácticos. Después del aprendizaje, los alumnos pueden alcanzar directamente el nivel de analista de datos.

2. ¿Qué debes aprender sobre el análisis de datos?

(1) Excel

Hablando de Excel, algunas personas pueden pensar que es muy simple, pero Excel es de hecho un arma poderosa. Los analistas de datos sin ciencia básica deben comenzar con Excel, porque Excel es la herramienta más utilizada por las empresas de datos a pequeña escala y desempeña un papel extremadamente importante en los analistas de datos básicos y las operaciones de datos. Como herramienta central para los analistas de datos, el contenido de aprendizaje específico incluye habilidades funcionales de Excel (funciones de búsqueda, funciones estadísticas, funciones lógicas), habilidades de procesamiento rápido de Excel (ajuste de formato, posicionamiento de búsqueda, habilidades de teclas de acceso directo, etc.) y habilidades de visualización de Excel (combinación). gráfico, gráfico de barras, gráfico de burbujas de datos).

(2) Mysql

SQL también es el contenido central del análisis de datos de aprendizaje de base cero. Porque como analista de datos, el primer problema que tienes que resolver es tener datos para analizar. Por lo general, una empresa tendrá su propia base de datos y los analistas de datos primero deben saber qué datos quieren extraer de la base de datos empresarial según las necesidades comerciales. Si la empresa implementa una base de datos local, la extracción de datos debe realizarse en lenguaje SQL. SQL es fácil de entender y fácil de usar. Debes aprenderlo. El lenguaje SQL comienza con el aprendizaje de la base de datos MySQL, lo que implica agregar, eliminar, modificar y consultar datos de la estructura de la tabla. En las empresas reales, los analistas de datos generalmente no tienen derecho a agregar, eliminar o modificar, solo tienen derecho a inspeccionar. Los estudiantes deben concentrarse en dominar varios patrones de oraciones.

(3) Python

Los conceptos básicos de Python son muy importantes para los analistas de datos. Para un volumen de datos de 100.000 o 1 millón, Excel y BI quedarán completamente inutilizables debido al retraso. Sin embargo, en las aplicaciones empresariales reales, es muy común procesar cientos de miles o millones de datos a la vez. Python es una herramienta poderosa para manejar este tipo de datos de peso medio.

Porque Python tiene muchas bibliotecas potentes de terceros, como Numpy, Pandas, Matplotlib, Seaborn, etc. Estas bibliotecas permiten a los analistas de datos limpiar y analizar millones de datos. Python no solo puede limpiar datos y dibujar gráficos, sino que también puede usar sklearn para analizar algoritmos de big data. Aunque Python es una herramienta importante para el análisis de datos, el grado de dominio de Python varía en diferentes direcciones de desarrollo profesional.

(4) Herramientas de inteligencia empresarial de BI

BI puede entenderse como una versión avanzada de los gráficos y tablas dinámicas de Excel. BI consiste en conectar tablas entre sí y luego dibujar muchos gráficos de indicadores. Esta es una valla publicitaria de pantalla grande, como se muestra a continuación:

Gráfico de vallas publicitarias de BI

Indicadores de ventas empresariales, indicadores operativos, indicadores de logística, etc. Estos gráficos de curvas pueden mostrar el precio unitario de ventas promedio de la empresa en los últimos cinco meses, la curva de cambio de los envíos logísticos vendidos en los últimos 24 meses e incluso las ventas actuales en tiempo real. Son cuestiones que preocupan a las empresas. Con este tablero, el liderazgo tiene datos muy intuitivos para monitorear el negocio de la empresa, permitiéndoles tomar decisiones y ajustes oportunos. El software de BI más popular en el mercado ahora incluye FineBI, PowerBI, etc. Estos software de BI son en realidad muy similares y no son difíciles de aprender. Aprenda FineReport y FineBI desde el principio hasta el dominio, descubra rápidamente el valor de los datos, transforme estos datos en información útil, proporcione una base de datos para la toma de decisiones corporativas y, por lo tanto, impulse la toma de decisiones y las operaciones corporativas.

(5) Estadística matemática y operaciones de datos

La estadística matemática y las metodologías de operación de datos son las piedras angulares teóricas de los analistas de datos. La estadística matemática incluye teoría de la probabilidad, estadística, álgebra lineal y teoría del cálculo básico. Estos contenidos no requieren una comprensión profunda, pero sí es necesario dominar sus principios y connotaciones. Porque la fuente de todo el análisis de datos en realidad se deriva del análisis estadístico descriptivo. El análisis estadístico descriptivo consiste en contar el número total de muestras y los valores promedio; los algoritmos involucrados en el análisis de datos son un modelado arquitectónico más profundo en estadística. Por lo tanto, dominar los conocimientos relevantes de la estadística matemática es básico y necesario para los analistas de datos principiantes.

¿Cuál es la metodología de operación de datos? La metodología de las operaciones de datos consiste en aprender los modelos analíticos de operaciones en diversas industrias. Por ejemplo, para el comercio electrónico, el análisis de embudo puede analizar la cantidad de personas que ingresan a la página de inicio PV1, la cantidad de personas que ingresan a la sección de ropa PV2 y PV2/PV1 puede obtener una proporción de personas que ingresan a la sección de ropa. También existen muchos modelos de análisis generales: análisis de correlación, tests A/B, etc. Para los analistas de datos que desean desarrollar una ruta de gestión, las operaciones de datos son conocimientos que deben aprenderse. De hecho, el conocimiento del funcionamiento de los datos no es complicado: consiste en desglosar los indicadores hasta el más mínimo detalle según las necesidades de su propio negocio y luego utilizar dos métodos de análisis de datos: año tras año y mes a mes.

(6) Aprendizaje automático

El último nivel avanzado requiere que los analistas de datos dominen la capacidad de analizar grandes cantidades de datos. Este tipo de análisis no es solo análisis estadístico descriptivo y el uso de métodos de operación de datos, sino que también incluye análisis predictivo. La esencia del análisis predictivo es utilizar los datos existentes para calcular la relación entre un conjunto de variables X y el valor final predicho Y (es decir, una fórmula de algoritmo matemático), y luego usar este algoritmo para ingresar más No importa si aquí no entiendes. En resumen, el análisis de datos en esta etapa consiste en utilizar una gran cantidad de datos históricos para construir un conjunto de fórmulas matemáticas (es decir, algoritmos) y utilizar esta fórmula matemática para predecir el futuro. Por ejemplo, si una persona ve muchos vídeos cortos de deportes, se puede concluir, basándose en el algoritmo, que esta persona puede estar interesada en ver partidos de fútbol como miembro de Tencent Sports. Estas extrapolaciones y predicciones son de gran importancia para el mundo empresarial. Si desea convertirse en un analista de datos que pueda dominar los algoritmos, el aprendizaje automático es una introducción que no puede omitir. Los estudiantes deben aprender de la regresión univariada simple, la regresión múltiple y la regresión logística, y aprender gradualmente algoritmos más avanzados, como árboles de decisión, bosques aleatorios y SVM.

Si ve esto y siente que está mentalmente preparado para la dirección básica de analistas de datos, pero si no tiene ninguna base y realmente no sabe cómo ingresar a la industria, puede hacerlo. chatee en privado y obtenga datos de forma gratuita. Un resumen de los puntos de conocimiento de los analistas y una consulta introductoria gratuita para analistas de datos.