Red de Respuestas Legales - Ayuda legal - Minería de Big Data: acerca de la privacidad del usuario y el valor empresarial

Minería de Big Data: acerca de la privacidad del usuario y el valor empresarial

Minería de Big Data: acerca de la privacidad del usuario y el valor empresarial

Hoy en día, la industria y el mundo académico han estado discutiendo una palabra: big data. Ya sea en círculos académicos o en círculos de TI, siempre que pueda hablar sobre big data, tendrá mucho éxito. Sin embargo, la minería de big data, el análisis de big data y el marketing de big data son solo el comienzo. Para la mayoría de las empresas, los big data todavía tienen un fuerte sentido de misterio. Por lo tanto, antes de que comprendamos completamente cómo utilizar big data para la minería, ya se han escuchado varias opiniones públicas de que big data está demasiado divinizado. Por supuesto, también hay muchas personas que critican directamente las amenazas a la privacidad que representan el big data o el marketing de big data. También hay muchas personas que simplemente no entienden qué es el big data y qué valor tiene.

Entonces, desde un punto de vista objetivo, me gustaría compartir con ustedes algunas opiniones sobre big data y algunas cosas sobre big data en torno a los siguientes temas:

1. ¿Existe una relación causal y lógica entre el marketing y las filtraciones de privacidad personal?

2. ¿Qué tipo de valor puede aportar el marketing de big data a las empresas? ¿Qué valor puede aportar a los usuarios? ¿Los usuarios niegan u odian por completo el marketing de big data?

3. ¿Cómo visualizar correctamente el big data? ¿Cómo ve la relación entre big data y los métodos de encuestas o estadísticas tradicionales?

4. ¿A qué retos se enfrenta el marketing de big data?

En primer lugar, el rápido desarrollo del big data va acompañado de preocupaciones sobre la privacidad de los datos.

La aparición de las redes sociales ha permitido compartir datos de usuarios en un grado inconmensurable. Hoy en día, existen cada vez más tipos de redes sociales, y la mayor popularidad de los teléfonos inteligentes ha provocado que más usuarios se pasen a Internet móvil, aportando así más datos y contenidos. Este aumento de datos ha provocado que los ingresos globales de las redes sociales se disparen. Según los resultados de la investigación de Gartner2012, se espera que los ingresos globales de las redes sociales alcancen los 169 mil millones de dólares en 2012.

Por un lado, las redes sociales están llenas de big data. Por otro lado, los usuarios continúan entregando información personal a Internet sin reservas, incluida la edad, el sexo, la región, el estado de vida, la actitud, paradero, aficiones, comportamiento de consumo, salud e incluso orientación sexual. Durante un tiempo, la minería de big data, el análisis de big data, el marketing de precisión de big data y la publicidad de precisión basada en información masiva de los usuarios se incluyeron rápidamente en la agenda de las principales empresas.

Por ejemplo, una historia real en Estados Unidos nos dirá cómo utilizar la minería de datos para controlar nuestro propio paradero. Una familia estadounidense recibió una promoción en un centro comercial de productos de maternidad, aparentemente para su hija de 16 años. El padre de la niña se enojó mucho y fue al centro comercial a pedir explicaciones. Pero unos días después, el padre descubrió que su hija de 16 años estaba realmente embarazada. La razón por la que los centros comerciales son impredecibles es que utilizan una gran cantidad de datos de consumo de varios productos para predecir el estado de embarazo de los clientes.

Eventos similares de marketing y minería de big data son más frecuentes hoy en día, especialmente después de que las redes sociales generan grandes cantidades de datos. Como resultado, muchas personas comenzaron a preocuparse por los datos de privacidad personal y comenzaron a criticar el marketing de precisión de big data por infringir la privacidad personal. Les preocupa que hayamos entrado en una era de big data desbocado y culpan a las redes sociales.

En segundo lugar, ¡el marketing de big data y la filtración de la privacidad personal no pueden equipararse completamente! ¡La relación lógica no se sostiene!

Si analizas objetivamente las cuestiones anteriores, descubrirás que es difícil distinguir entre la gallina y el huevo. No es objetivo criticar ciegamente la filtración o el abuso de datos personales de los usuarios mediante el análisis de big data.

Debido a que la esencia de las redes sociales radica en compartir y comunicar, la aparición de las redes sociales ha satisfecho el deseo de las personas de compartir información personal y exponer diversos datos, lo que les permite pasar a una plataforma a la vez, permitiendo que mundo entero para que puedas verte a ti mismo en la vida silenciosa pasada. De esto la gente obtiene satisfacción interior y existencia. Por lo tanto, desde consideraciones psicológicas individuales, las redes sociales son beneficiosas para ellos. No consideran sus contribuciones como secretos ocultos. Ya que lo compartes, debes esperar o permitir que otros lo vean. Por lo tanto, este es un acuerdo tácito invisible. Los usuarios están dispuestos a exponer sus detalles triviales en las redes sociales. No hay nada de malo en clasificar y analizar ordenadamente los datos masivos y caóticos de los usuarios en las redes sociales.

Por supuesto, si una plataforma de redes sociales abusa o divulga arbitrariamente la información de antecedentes de los usuarios, como información de contacto personal, domicilio, banco y otra información extremadamente confidencial, es de hecho una invasión flagrante de la privacidad, extremadamente no es ético y debe ser castigado Condena y castigo legal.

Sin embargo, la premisa de muchos marketing de precisión de big data actual es clasificar y analizar la información pública y obvia que dejan los usuarios en Internet, para agrupar una gran cantidad de usuarios o subdividir aún más grupos de nicho. Incluso puede lograr una personalización personalizada para una sola persona hasta cierto punto y, en última instancia, lograr el propósito de publicar anuncios con precisión o llevar a cabo actividades de marketing específicas.

Así que, desde esta perspectiva, no hay contradicción entre el marketing de precisión de big data y la iniciativa de los individuos de compartir información y datos difundidos en Internet. La gente puede sorprenderse al principio: ¿por qué saben lo que quiero comprar? ¿Por qué saben lo que necesito? Sin embargo, a medida que el comportamiento de "adivinación" hace que la vida de las personas sea cada vez más cómoda, como ahorrar mucho tiempo en la búsqueda, búsqueda y comparación de productos o servicios, es posible que se acostumbren mucho a esta precisión y dependan de ella y no les importe. Cómo se extrae y utiliza la información desordenada que usted comparte libremente en Internet.

Por lo tanto, si la información publicada y compartida por los usuarios es privada o no, se considera y analiza cuidadosamente antes de que los usuarios compartan la información. Esto es muy importante. Es la línea entre una invasión de la privacidad y una no invasión de la privacidad. La información que los usuarios deciden no publicar o no quieren que otros sepan se considera privada, mientras que la información que se ha publicado públicamente en las redes sociales o en Internet se considera difundible.

Por lo tanto, el comportamiento común de big data de analizar, extraer y clasificar cantidades masivas de información pública para llevar a cabo un marketing de precisión no puede criticarse ciegamente por dañar los intereses de los usuarios. Si la información que los usuarios almacenan en ubicaciones específicas y no quieren que otros la sepan (información almacenada de forma privada) es filtrada o utilizada por personas con motivos ocultos, se trata de una invasión de la privacidad. Pero esto no se puede achacar al big data, sino que se debe cuestionar la seguridad de la plataforma de almacenamiento.

Así que no sobreinterpretes el marketing de precisión de big data. De hecho, la esencia del problema es si a la gente realmente le importa dónde va la información confusa (lo que implica la psicología y las motivaciones detrás de compartir información). ¿Y el marketing de big data realmente toca los secretos ocultos o los resultados finales de las personas (es necesario redefinir los secretos y los resultados finales)? Porque si lo que la gente comparte es público por defecto, entonces el concepto de invasión de la privacidad no se sostiene. Si las personas tienen información que no quieren que otros sepan, no la compartirán ni la difundirán precipitadamente en línea.

3. ¿Qué valor aportará el marketing de big data a las empresas y a los usuarios?

Después de discutir los temas anteriores, ¿deberíamos ser sinceros en el marketing de precisión de big data? Entonces, ¿cuál es el valor del marketing de big data para las empresas y los usuarios?

1. Valor para la empresa

Veamos primero un caso extranjero:

Todos conocemos la serie de televisión estadounidense "House of Cards". Cuando se trata del éxito de "House of Cards", la mayor contribución es el análisis de big data. Por tanto, "House of Cards" se ha convertido casi en un caso clásico de marketing de big data, y también es un intento exitoso de Netflix en Estados Unidos de determinar la producción de contenidos basándose en la extracción de información del usuario.

Netflix tiene alrededor de 30 millones de suscriptores y la mayoría de las películas que ven los usuarios están relacionadas con el preciso sistema de recomendación. Netflix recopila y analiza periódicamente el comportamiento de los usuarios al ver películas o series de televisión. Por ejemplo, analiza los hábitos de visualización de los usuarios en función de las calificaciones de las películas de los usuarios, el comportamiento de los usuarios al compartir, los registros de visualización de los usuarios y otra información, infiriendo así qué tipo de contenido. A los usuarios de series de televisión les gustan y qué tipo de series de televisión les gustan. Qué tipo de estilo, qué tipo de directores y actores les gustan. Sobre esta base, el algoritmo se utiliza para recomendar y ordenar los vídeos que le interesan al usuario hasta que encuentra su serie de televisión favorita. El director y la estrella de "House of Cards" fueron predichos por Netflix después de extraer información de los usuarios.

Entonces veamos otro caso interno:

Todos conocemos la cooperación entre Alibaba y Sina Weibo. Alibaba invirtió 586 millones de yuanes en Sina Weibo. Además de las razones por las que Alibaba, analizadas por los principales medios online, espera construir un ecosistema, fortalecer las entradas de tráfico y desafiar a Tencent, otra razón importante puede ser la estrategia de marketing de big data.

Hoy en día, todos los grandes gigantes de Internet están rodeando a los usuarios. Quien pueda rodear a los usuarios y activarlos en su propia plataforma tendrá una gran cantidad de información del usuario (incluida información de front-end explícita e información de back-end implícita). Sina Weibo tiene cientos de millones de usuarios en China y es enorme. Sin embargo, si Sina no puede hacer un uso razonable de la información generada por estos usuarios, estos recursos serán un enorme desperdicio. Miremos a Alibaba, la plataforma de comercio electrónico más grande de China.

Tiene productos, pero no tiene información completa sobre los comportamientos de la vida diaria de los usuarios. Solo tiene información de compra, pero esta información de compra no es suficiente para comprender las características y preferencias de la multitud. Por lo tanto, solo podemos cooperar con Sina Weibo para dominar una gran cantidad de información sobre el comportamiento del usuario, clasificarla y conocer las preferencias, preferencias, intereses, pasatiempos, hábitos, hábitos de comunicación, rutas de intercambio, etc. ¿Pueden diferentes personas o incluso diferentes individuos lograr un marketing preciso a través de las reglas de difusión de información de diferentes usuarios, e incluso formular la mejor ruta de comunicación de marca para los productos? Esta es una enorme mina de oro.

Después de que Sina Weibo cooperara con Alibaba, apareció información de recomendación de productos en Weibo y Sina Weibo lanzó una función de pago. Es posible que en el futuro, si ve productos recomendados relevantes en Weibo y resulta ser el producto que le gusta, pueda pagar y comprar directamente en Weibo. Así, Sina Weibo y Alibaba obtienen cada uno lo que necesitan y disfrutan de las ganancias. Por supuesto, esta es mi observación y análisis personal, pero la estrategia de big data de Alibaba también es obvia.

2. Valor para los usuarios

Los dos ejemplos anteriores tratan sobre el valor que aporta el big data a las empresas. Entonces, ¿el marketing de big data es valioso para los usuarios? ¿Están los usuarios disgustados con el marketing de precisión? Echemos un vistazo a los nuevos datos de una encuesta:

El Instituto Nacional de Investigación de Publicidad de la Universidad de Comunicaciones de China acaba de publicar el Informe sobre el desarrollo de Internet móvil entre China y Estados Unidos de 2014, que compara los hábitos y actitudes de uso de Internet móvil. hacia los teléfonos móviles en China y Estados Unidos actitud publicitaria.

La encuesta muestra que el contenido publicitario al que es más probable que respondan los usuarios de terminales inteligentes es: (1) Anuncios relacionados con los artículos que el usuario desea comprar (2) Cupones relacionados con los artículos que desea comprar; comprados (3) anuncios divertidos; (4) anuncios relacionados con las marcas favoritas del usuario; (5) anuncios relacionados con los sitios web que los usuarios visitan en línea o las aplicaciones que utilizan; Anuncios publicitarios relacionados con la ubicación del usuario. (Proporción > =20%)

De estos datos podemos ver que 6 de los 8 resultados están relacionados con marketing de precisión de big data. Por ejemplo, los anuncios relacionados con artículos que el usuario quiere comprar pueden provocar una respuesta o interacción por parte del usuario. ¿Cómo entender? La premisa del marketing de big data es calcular y adivinar las necesidades reales de los usuarios, ver qué productos relacionados necesitan comprar los usuarios y luego impulsar directamente lo que los usuarios quieren y les gusta para lograr una llegada precisa. ¿Qué pasa con los usuarios? Los usuarios están dispuestos a responder a dichos anuncios o productos promocionales porque estos anuncios son menos intrusivos para los usuarios, reducen el proceso de toma de decisiones de comparación o comparación antes de comprar, ahorran tiempo y permiten a los usuarios encontrar directamente los productos o servicios que realmente necesitan. .

Así que este resultado muestra que el marketing de precisión de big data no disgusta completamente a los usuarios, sino que depende de hasta qué punto se pueden adivinar los pensamientos del usuario. Entonces, si el contenido que envías está relacionado con los artículos que el usuario quiere comprar, la marca que le gusta, etc. Entonces, este tipo de minería precisa no disgustará a los usuarios, pero les brindará comodidad.

En cuarto lugar, no seas demasiado supersticioso con respecto al big data; ¿cuál es la esencia del big data?

Después de leer el análisis anterior, es posible que sienta que el análisis de big data es realmente omnipotente. Sin embargo, no podemos ser demasiado supersticiosos con los big data, entonces surgirá el siguiente problema.

1. ¿Cuál es la relación entre el análisis de big data y los métodos estadísticos tradicionales?

Lo siguiente son los macrodatos: se basan en una gran cantidad de datos, o incluso en todos los datos, y luego se utilizan algoritmos para calcular y analizar, a fin de encontrar con mayor precisión la correlación entre varios factores (en lugar de la causalidad). descubrir patrones entre datos.

Entonces veamos los métodos estadísticos tradicionales. El análisis estadístico resuelve el problema de cómo seleccionar una pequeña cantidad de muestras, analizarlas y luego inferir tendencias y patrones generales. Entonces, usa la probabilidad. La regla general es inferir la población en la mayor medida con un nivel de confianza (precisión) del 90%, 95% o 98%. Si el propósito es claro, las muestras se seleccionan adecuadamente y la operación es científica, entonces los patrones se pueden analizar sin una gran cantidad de datos, infiriendo así los patrones generales y encontrando la relación causal entre diferentes factores. Por ejemplo, después de determinar el método de muestreo, se puede determinar el número de muestras. Si el muestreo se realiza correctamente, no existe mucha relación directa entre el tamaño de la muestra y el número total.

Tomemos un ejemplo inapropiado para entenderlo: suponiendo que se seleccionan 1.000 muestras, la regla de inferencia es A; si se seleccionan 2.000 muestras, también se muestra la regla A, y si se seleccionan 3.000 muestras, es similar. Luego, mediante la selección científica de más de 1.000 muestras, podremos lograr nuestro propósito.

Por lo tanto, los métodos estadísticos y de muestreo tradicionales resuelven en gran medida el problema de los costos. Aunque habrá errores, todavía se pueden encontrar patrones obvios.

Entonces, desde esta perspectiva, el resultado final del análisis de big data probablemente sea similar al de los métodos estadísticos tradicionales, excepto que la pequeña muestra original se ha convertido en un análisis de muestra grande. Aunque el análisis de big data es teóricamente más preciso y puede compensar las deficiencias de los errores tradicionales, es posible que la precisión no mejore tanto como pensamos (porque el análisis de big data se verá gravemente afectado por la fuente de datos). Además, no se pueden encontrar más leyes nuevas. Si es así, no podemos evitar preguntarnos ¿por qué existen los big data?

Además, en el análisis estadístico tradicional, como el análisis de las condiciones del mercado, los datos deben interpretarse y analizarse en función del entorno y los antecedentes reales, y no deben utilizarse como guía única y omnipotente. Por tanto, existe un proceso de análisis de datos basado en la experiencia y las condiciones reales, y la capacidad de las personas para participar en el análisis es muy importante.

2. ¿Qué tipo de cosas no se pueden hacer con big data pero sí con métodos tradicionales de encuestas y análisis?

La premisa del marketing de big data es el análisis de big data. El análisis de big data se basa en algoritmos y es un modelo solidificado por computadora. En otras palabras, la parte del análisis de datos que originalmente realizaban humanos ahora está acordada en el algoritmo. Y el marketing de precisión de big data consiste en analizar la información de comportamiento generada por los usuarios, como datos de navegación web, datos compartidos, datos de búsqueda, etc. , clasificando así personas o cosas, y luego infiriendo las preferencias e intereses de las personas.

Sin embargo, las preferencias no representan necesidades reales y hacer clic no significa necesariamente que te guste. Una persona dijo hoy en las redes sociales: "Este producto es bueno". ¿Crees que le debe gustar o necesitar este producto?

Las máquinas pueden clasificar comportamientos, pero no pueden detectar verdaderamente la psicología y las necesidades reales de las personas. Entonces, ¿cómo detectamos la verdadera psicología y necesidades de las personas? En este momento, los métodos tradicionales de investigación y análisis de mercados son insustituibles. Como entrevistas en profundidad, como entrevistas de grupos focales, proyecciones, etc. Estos métodos pueden analizar y descubrir los verdaderos deseos y necesidades esenciales de las personas desde una perspectiva psicológica en la mayor medida posible. Por lo tanto, hasta el día de hoy, muchas grandes empresas de publicidad y marketing todavía utilizan este método tradicional para comprender las historias y las razones detrás de los datos superficiales. En cuanto a estas historias y verdades, los algoritmos actualmente no pueden hacerlo y deben ser realizados por humanos. La comunicación entre personas puede sondear los corazones de las personas.

Desde esta perspectiva, el big data no es omnipotente ni puede ser un mito ciego. Debemos entender su naturaleza, para qué se puede utilizar y para qué no. Podemos entender que los cálculos humanos y el análisis de datos ahora puedan ser reemplazados por máquinas, pero otra parte del trabajo humano (la capacidad de detectar los corazones de las personas) no puede ser reemplazada por algoritmos.

Por ejemplo, hace dos años, informé sobre la nueva tecnología "La escritura de libros se puede automatizar mediante algoritmos. ¿Qué puedo hacer para ahorrar en la publicación? Se dice que una gran cantidad de libros en Amazon están disponibles". escrito mediante algoritmos, y el algoritmo El escritor utiliza el pensamiento lógico para organizar el lenguaje. Pero estos libros no pueden compensar las deficiencias de las emociones humanas y no pueden expresar las fluctuaciones emocionales provocadas por el entorno social y el entorno del autor.

5. ¿Cuáles son los verdaderos retos a los que se enfrenta el análisis de big data o el marketing de big data?

1. Redundancia de datos.

Problemas con el origen de los datos, ¿está garantizada la calidad de los datos?

Siempre se ha elogiado la ventaja del análisis big data: la aplicación de datos masivos. ¿Pero es mejor tener más datos? ¿Cómo filtrar estos datos? ¿Cómo encontrar datos valiosos y útiles? ¿Qué impacto tendrán los datos enormes y redundantes en el análisis de big data?

Para big data, las enormes fuentes de datos son la garantía fundamental para la precisión del análisis. Pero cuando la cantidad de datos alcanza un cierto nivel, también se enfrenta a un gran problema: la precisión se vuelve difícil de garantizar. Esto dificulta garantizar la precisión de los resultados analíticos. Hay muchos ejemplos de fallos en el análisis de big data en la predicción. Por ejemplo, el caso más típico y famoso es el de Google que no pudo predecir la tendencia de la gripe.

El informe decía que el análisis de Google basado en el análisis de los datos del motor de búsqueda era casi el doble de la diferencia con los datos de seguimiento de los Centros para el Control y la Prevención de Enfermedades de EE. UU. Aunque Google ajusta continuamente su algoritmo, todavía no puede garantizar la exactitud de los resultados. Esto explica una cuestión importante: la cuestión de la fuente de datos. Los análisis de Google se basan en los términos de búsqueda del motor de búsqueda. Muchos términos de búsqueda no son válidos, no tienen sentido y en realidad no representan las tendencias de la gripe, pero cuentan. Esto provocó un grave sesgo en los resultados.

Entonces, ¿cómo te aseguras de que los datos que obtienes son realmente los que necesitas? ¿Realmente importa? Si la fuente de datos está seriamente sesgada, entonces su análisis será en vano, sin importar cuán preciso sea. Por ejemplo, gastas mucha energía recopilando información compartida diariamente generada por los usuarios de Internet, analizas toda su información y finalmente predices varias tendencias de consumo. Sin embargo, hay mucha información redundante en esta información compartida y la precisión de los datos es deficiente. Muchos no tienen nada que ver con el consumo, por lo que es probable que los resultados de este análisis sean inexactos. Por supuesto, su próxima estrategia de marketing basada en este resultado puede fracasar.

2. Para los juegos en la plataforma Daxie, es difícil para las empresas comunes dominar una gran cantidad de datos y es difícil probar la credibilidad

Las plataformas de las principales empresas de Internet; controlar los recursos de los usuarios y la información generada por los usuarios. Por supuesto, la información se recopila en varias plataformas. Sin embargo, los datos de cada empresa o plataforma no serán divulgados en su totalidad. Solo podemos capturar información dispersa en Internet a través de algunas herramientas, pero no podemos captar con precisión los datos de fondo completos y la información con valor e importancia prácticos.

Esta enorme cantidad de información supone una fortuna para las grandes empresas de Internet como Google. Big data puede ser solo un juego para estas grandes plataformas, y será más difícil para las empresas comunes participar.

Además, estas plataformas no son interoperables ni abiertas, y los resultados de los datos que analizan no pueden pasar la verificación e inspección de terceros, por lo que no podemos conocer la validez y credibilidad de los resultados de sus análisis de big data. Por supuesto, su análisis de estos datos sigue siendo muy valioso para el desarrollo personal y el desarrollo de productos de los propios usuarios. Por lo tanto, el deseo de la gente corriente o de las empresas corrientes de disponer de big data puede ser un lujo. Es muy posible que las empresas de plataformas de Internet vendan servicios de análisis de big data en el futuro. Además, en el futuro habrá cada vez más innovaciones y emprendimiento en el campo de la gestión de datos personales, y habrá cada vez más aplicaciones.

Lo anterior es lo que el editor compartió sobre big data: sobre la privacidad del usuario y el valor corporativo. Para obtener más información, puede seguir a Global Ivy para compartir más información detallada.