Investigación sobre Big Data y Transformación de Modelos de Investigación (1)
Big data se utiliza ampliamente en Occidente para la predicción de elecciones presidenciales, marketing empresarial, prevención de enfermedades, análisis financiero, reforma educativa, monitoreo y predicción social. , gestión de la seguridad pública, atentados terroristas, etc.
El uso de grandes cantidades de datos para la investigación y el control criminal comenzó en 1994 con un nuevo sistema de gestión de información de seguridad pública, CompStat (denominado COMPSTAT (estadísticas informáticas)), puesto en uso por el Departamento de Justicia de Nueva York. Departamento de Policía. CompStat determina la asignación de recursos policiales, la prevención del delito y las contramedidas comparando informes estadísticos [5]. Con el advenimiento de la era de los big data, Occidente está construyendo vigorosamente un sistema de investigación y control de delitos basado en big data. El sistema de investigación y control de delitos basado en big data utiliza big data para ayudar a la policía a analizar casos históricos y descubrir tendencias y patrones delictivos para predecir delitos mediante el análisis de fuentes de datos urbanos y datos de redes sociales para optimizar la asignación de recursos policiales; mejorando así el nivel de seguridad pública social [6]. Big data ha cambiado fundamentalmente el modelo de investigación y control de delitos, y utilizar big data para mejorar las capacidades de investigación y control de delitos es la dirección del desarrollo futuro.
El ministro de Seguridad Pública, Guo Shengkun, enfatizó la necesidad de fortalecer vigorosamente la capacidad y el nivel de mantener la seguridad pública y servir a la gente en la era del big data [7]. Los organismos de seguridad pública de todos los niveles de nuestro país han comenzado a utilizar conscientemente el big data para promover la investigación y el control criminal. Sin embargo, los big data no son sólo una cuestión técnica, sino que también provocan cambios en los conceptos, métodos y mecanismos de investigación. La investigación en la comunidad académica de nuestro país se centra principalmente en la aplicación de la tecnología de big data. La investigación sobre los cambios en los conceptos, métodos y mecanismos de investigación provocados por big data es menor y no lo suficientemente profunda, y existe una necesidad urgente de una investigación más sistemática. e investigación en profundidad.
En primer lugar, la compleja situación delictiva y la ecología digital criminal en la era del big data
Actualmente, la situación delictiva es más grave y compleja. En primer lugar, la cantidad total de delitos es grande y la tasa de criminalidad aumenta año tras año. Según las estadísticas, sólo en 2012, los órganos de seguridad pública abrieron 6.551.440 causas penales para su investigación y la Fiscalía aprobó o decidió arrestar a 680.539 sospechosos de delitos, es decir, 986.056 casos [8]. En las últimas dos décadas, la tasa de criminalidad de China ha aumentado año tras año y el número de casos penales ha aumentado en un promedio de más del 22% anual, superando el crecimiento del PIB nacional. ① En segundo lugar, la inteligencia del crimen. El delito es una existencia social y el desarrollo de la ciencia ha penetrado en todos los aspectos del delito, mejorando sus capacidades y daños. Esto se manifiesta en dos aspectos: en primer lugar, los delitos cometidos utilizando el pensamiento científico se reflejan principalmente en un pensamiento criminal riguroso, un despliegue y planificación cuidadosos antes de cometer delitos, y el pensamiento y las estrategias científicas están impregnados en el proceso penal. El segundo son los delitos tecnológicos, especialmente los delitos digitales. Tomando como ejemplo el uso del delito cibernético, en 2012, las agencias de seguridad pública de todo el país resolvieron más de 118.000 casos de delito cibernético y arrestaron a más de 216.000 sospechosos. El Informe de Seguridad Norton publicado por Symantec en septiembre de 2012 mostró que desde julio de 2011, más de 257 millones de personas en China han sido víctimas de delitos cibernéticos. La pérdida económica directa causada por el delito cibernético alcanza los 289 mil millones de yuanes, y la pérdida económica directa sufrida por cada víctima es de aproximadamente 1.200 yuanes [9]. En tercer lugar, la complejidad del tiempo y el espacio del crimen. Con el desarrollo de la ciencia y la tecnología modernas, el tiempo del crimen no es lineal, el espacio del crimen está ausente y la combinación de tiempo y espacio es multidimensional, diversa y arbitraria [10]. Cuarto, la relación causal del caso es compleja. En comparación con la sociedad única estática tradicional, la sociedad moderna es una sociedad dinámica y compleja. En una sociedad dinámica y compleja, la relación causal no es lineal, está acoplada, es multifactorial y está fracturada, lo que a menudo dificulta determinar la relación causal del delito.
Con el desarrollo de la tecnología informática y de redes, la sociedad ha entrado en la era del big data. La era del big data es, ante todo, la era del registro de datos. En la era del registro de datos, el registro de datos se ha convertido en el modo predeterminado [11], y la sociedad humana está bajo el registro de redes de datos, que están compuestas por sensores y microprocesadores ubicuos. Los teléfonos móviles, Internet, las sondas de vigilancia, la tecnología de radiofrecuencia, etc., están por todas partes registrando nuestros comportamientos e incluso nuestros pensamientos. “Cuando salimos por la mañana, las cámaras en el ascensor registran nuestro tiempo de viaje; cuando conducimos al trabajo, las cámaras en la carretera registran nuestra ubicación y velocidad; mientras estamos en el trabajo, la página web registra nuestros hábitos de navegación y nuestro historial de búsqueda. y el teléfono registra las personas con las que nos conectamos y la duración de nuestras llamadas "Cuando llegamos a casa después del trabajo, nuestros registros de compras definen nuestra identidad profesional, antecedentes familiares e incluso rasgos de personalidad. El decodificador de TV registra lo que miramos. hábitos y gustos de valor..." [12] "En el mundo digital, todos dejaremos huellas electrónicas o huellas digitales electrónicas "Estamos en un estado en constante cambio pero cada vez más monitoreado, donde cada movimiento que hacemos ahora puede ser rastreado. a una base de datos."[14]12
Astucia. ¿Pueden los delincuentes convertirse en excepciones a convertirse en “ermitaños de datos”? Ser un "ermitaño de los datos" significa que hay que romper completamente con el sistema social moderno. No sólo no se pueden utilizar productos digitales, sino que tampoco se pueden comer los "fuegos artificiales del mundo" en el sentido pleno. Debido a que la sociedad moderna es casi digital, una vez que se comunica con los sistemas sociales modernos, es probable que sea capturado y registrado por datos. Pero esto no significa ningún elemento o fragmento del delito específico del delincuente, como el tiempo del delito, el espacio del delito, la conducta delictiva, las herramientas delictivas, etc. , será registrado y almacenado directa y completamente por los datos, lo que significa que la información criminal oculta por los delincuentes siempre se registra desde diferentes aspectos mediante datos masivos relevantes;
Incluso si faltan algunos elementos o fragmentos delictivos, o incluso los principales o claves, el proceso criminal se puede conectar, analizar, unir o mapear a través de datos masivos relevantes de diferentes aspectos. Por tanto, en la era del big data, no hablemos de delitos digitales. Incluso se puede decir que los delitos cometidos por medios tradicionales han caído en un sistema de almacenamiento de grabaciones en red donde "el cielo está lleno y la red está llena de omisiones". La digitalización es la realidad actual del crimen.
En segundo lugar, el modelo de investigación basado en big data es una elección inevitable de los tiempos.
Los patrones hacen referencia a estilos estándar refinados y abstractos. El modo de investigación refleja la relación estructural y la lógica operativa de los elementos de investigación. Los modos de exploración se pueden clasificar según diferentes criterios. Según se utilice tecnología de la información en la investigación, la comunidad académica divide el modo de investigación en el modo de investigación tradicional y el modo de investigación basada en información. Sin embargo, desde la perspectiva de la teoría de la información, la diferencia esencial entre el modelo de investigación tradicional y el modelo de investigación basada en información no radica en si se utiliza la información, sino en la forma de registrarla, almacenarla, extraerla y analizarla. Según los métodos de registro, almacenamiento, extracción y análisis de la información que se pueden utilizar en la investigación, el modo de investigación se puede dividir en modo de investigación tradicional, modo de investigación basado en información empresarial y modo de investigación basado en big data. La comunidad académica generalmente se refiere al modelo de investigación basado en información empresarial y al modelo de investigación basado en big data como el modelo de investigación basado en información. Sin embargo, los dos no solo tienen diferentes etapas de desarrollo (el modelo de investigación basado en big data se desarrolló en). la base de la investigación basada en información empresarial), pero también existen diferencias esenciales en los tipos de información, la extracción de información y los métodos de juicio. Lo más importante es que esta diferencia provoca cambios fundamentales en los conceptos, características y mecanismos de investigación.
El modelo de investigación tradicional tiene un bajo contenido tecnológico en el almacenamiento, extracción y análisis de información. En las sociedades tradicionales, las principales formas en que los humanos registran y almacenan información son el cerebro humano y el sistema de escritura (debido a la necesidad de registrar información, las sociedades tradicionales desarrollaron un conjunto completo de sistemas de escritura, lo que resultó en muchos archivos de escritura clasificados recopilados por el tiempo). En el caso de los registros de información criminal, además de los archivos cerebrales y de texto, las escenas del crimen también registran información criminal en forma de intercambio de material. Por lo tanto, los principales métodos de investigación tradicionales son las entrevistas de investigación (extracción de información almacenada en el cerebro) y el interrogatorio de archivos escritos. ② Las características del almacenamiento y recuperación de información en el cerebro humano son: está dispersa entre diferentes personas, la precisión de la información es deficiente y se ve afectada no sólo por el entorno externo, sino también por las capacidades de percepción y memoria de la información. almacenista. La información carece de estabilidad, y la cantidad y precisión de la información disminuyen con el tiempo; si la información se puede extraer y la calidad de la extracción depende, en primer lugar, de si se puede encontrar a la persona que almacenó la información y, en segundo lugar, de las habilidades para interrogar (experiencia). de los investigadores, los entrevistados factores como la capacidad expresiva, la emoción y la actitud cooperativa. Las ventajas de escribir información en archivos son una alta precisión y una buena estabilidad, pero tiene dos defectos principales: primero, es difícil de extraer. Si la gente quería encontrar información útil, tenía que explorar toda la información; aunque más tarde se establecieron índices de catálogos al estilo de las bibliotecas, la búsqueda todavía era laboriosa y consumía mucho tiempo. En segundo lugar, no puede proporcionar información criminal directa. La redacción de un expediente no puede ser un registro en tiempo real de un delito. Es simplemente un registro posterior al evento una vez resuelto el caso. Un expediente de este tipo no puede proporcionar información criminal directa sobre el delito que debe resolverse. El análisis de la información y el juicio en las investigaciones tradicionales se basan principalmente en la experiencia de los investigadores, y los investigadores experimentados a menudo se convierten en la clave para resolver delitos. En resumen, este modelo tiene bajo contenido tecnológico y amplias características. Que pueda resolver el caso depende principalmente de la experiencia y la mano de obra invertida por los investigadores. No sólo eso, también depende de la suerte de los investigadores. Esto puede ser adaptable a una sociedad tradicional estática y unitaria y sus crímenes, pero es casi completamente incompatible con una sociedad dinámica y compleja y sus crímenes.
El modelo de investigación basado en información empresarial es un modelo de investigación basado en el almacenamiento, extracción y juicio de información empresarial bajo la guía de la tecnología de la información. Con el desarrollo de la tecnología de la información, se utilizan ampliamente diversos dispositivos de registro y almacenamiento de información. El registro y almacenamiento de información ya no depende completamente del cerebro humano y de los documentos escritos, sino que los dispositivos de almacenamiento electrónicos se han convertido en la principal forma que tienen los humanos de registrar y almacenar información. Estos dispositivos reemplazan los cerebros humanos y escriben archivos para registrar el comportamiento humano, así como el comportamiento criminal, en tiempo real. Desde la perspectiva de la fuente y la distribución del almacenamiento, la información registrada y almacenada se forma en diferentes operaciones comerciales y se distribuye en diferentes bibliotecas de información comercial, como registros comerciales y almacenamiento de información de consumo de personas, registros bancarios y almacenamiento de información de transacciones financieras de personas, registros hospitalarios. información del paciente, etc. Estas bases de datos carecen de integración y forman islas de información entre sí. La redundancia de información y las islas de información se han convertido en la ecología básica de la existencia de la información. En cuanto al modelo de investigación basado en información empresarial, sus principales características son: Primero, el departamento de investigación se basa en la base de datos estructurada acumulada por la plataforma de seguridad pública, que se utiliza principalmente para la verificación y comparación de personas, cosas y objetos. La información criminal en tiempo real todavía se recopila principalmente de forma manual. En segundo lugar, la extracción de información sigue siendo difícil. Es innegable que, en comparación con el modelo de investigación tradicional, el modelo de investigación que se centra en la información empresarial ha mejorado enormemente la eficiencia de consulta y comparación de la información estructurada acumulada por los organismos de seguridad pública. Sin embargo, frente a cada vez más datos acumulados de diferentes fuentes y estructuras, especialmente una gran cantidad de datos semiestructurados y no estructurados, faltan tecnologías y mecanismos de integración de datos, así como tecnologías de extracción de información. Los datos estructurados son un modelo anterior a los datos, la mayoría de los cuales se registran después del hecho (también hay algunos datos registrados en tiempo real, como el alojamiento en hoteles), por lo que es difícil tener información de antecedentes penales en tiempo real. El valor radica en la identificación de personas, cosas y cosas. Son estos datos semiestructurados y no estructurados de diferentes fuentes los que registran las "pistas" de los delitos en tiempo real.
En tercer lugar, el análisis y el juicio de la información todavía dependen principalmente de la experiencia de los investigadores. Los sistemas de información empresarial se utilizan principalmente para consultas y comparaciones simples y no pueden realizar análisis de algoritmos inteligentes. En general, ante la situación criminal actual, especialmente los delitos cometidos con teléfonos móviles y los delitos digitales, este modelo de investigación es difícil de trabajar.
El modelo de investigación basado en big data se basa en big data y plataformas de computación en la nube, y es una actualización del modelo de investigación basado en información en la era de big data. En la era del big data, el modelo de investigación basado en big data es una elección inevitable. Esto no sólo se debe a la compleja situación criminal y su ecología digital, sino también a que la tecnología de big data hace que esta elección sea una realidad.
En primer lugar, la ecología digital del crimen es la base realista para el modelo de investigación basado en big data. Ante la compleja situación criminal, la gente parece un poco perdida. Hasta cierto punto, el control del delito es una técnica de investigación que tiene ventajas sobre las técnicas criminales. Sin embargo, el desarrollo de la modernidad ha hecho que los delincuentes sean más anónimos y móviles, lo que alguna vez rompió las ventajas de los órganos de seguridad pública. Esta es también una de las razones del crecimiento explosivo de la delincuencia en la actualidad. Sin embargo, el crimen, como existencia social, también brindará a los humanos oportunidades para restringirlo cuando la sociedad alcance las condiciones para el crimen. La ecología digital del crimen ha cambiado fundamentalmente la forma en que se registra y almacena la información criminal, ampliando enormemente la "memoria social". La tecnología de big data cambiará por completo la comparación entre la tecnología de investigación y la tecnología criminal. Por lo tanto, debemos cambiar el modelo de investigación tradicional y adoptar un modelo de investigación basado en big data para controlar y combatir la delincuencia.
En segundo lugar, en la era del big data, los datos que la investigación enfrenta y puede procesar ya no son pequeños datos, sino grandes datos. Hoy en día, los datos que la investigación enfrenta y puede procesar se caracterizan por un gran volumen de datos, múltiples tipos y una baja densidad de valor. Lo más fácil de distinguir entre "estanque" y "mar" es la escala [15]. En el pasado, incluso en la fase de investigación dominada por información empresarial, la cantidad de datos enfrentados o procesados equivalía a un "estanque". En cambio, la cantidad de datos enfrentados y procesados en las investigaciones modernas es un "océano". Además, la investigación moderna se enfrenta a la diversidad de datos: estructuralmente, no sólo hay datos estructurados, sino también una gran cantidad de datos semiestructurados y no estructurados, en términos de tipo de datos, hay datos comerciales, datos generados por el usuario y datos generados por los usuarios; datos de detección de sensores de En términos de expresión de datos, hay texto, imágenes, audio, video, enlaces, etc. Desde la perspectiva de la composición de una causa penal, existen personas y sus relaciones, comportamientos, cosas, tiempo, espacio e información subjetiva intencional. La densidad de valor de los datos es baja. En el vasto mar de datos, los datos sobre delitos relevantes son sólo una pequeña "aerosol", pero son extremadamente valiosos. Tomando el vídeo como ejemplo, en el proceso de monitoreo continuo, los datos potencialmente útiles son solo uno o dos segundos [16].
En tercer lugar, la tecnología de big data puede extraer, analizar, juzgar y predecir el futuro a partir de cantidades masivas de datos. Big data son datos cuyo tamaño o complejidad exceden las tecnologías comúnmente utilizadas y que se capturan y procesan a un costo y limitaciones de tiempo razonables. La tecnología de big data basada en la computación en la nube puede superar los requisitos de las limitaciones de tiempo y costos de la tecnología convencional. Específicamente, en primer lugar, la tecnología de big data puede extraer, analizar y procesar datos multiestructurados y de múltiples fuentes de manera oportuna, especialmente datos semiestructurados y no estructurados, y puede extraer una gran cantidad de detalles relacionados con el crimen a partir de datos masivos y caóticos. Los sistemas, los datos y la información pueden "conectar datos, puntos y piezas de información" [13] 29-30. Quizás sólo cuatro puntos de información sean suficientes para identificar a un sospechoso. En segundo lugar, al basarse en la computación en la nube, los big data pueden extraer y analizar información en un tiempo razonable. Tomando el caso de Zhou como ejemplo, la policía de Nanjing pasó varios días y desplegó a cientos de agentes de policía para buscar datos de videovigilancia, pero utilizando tecnología de big data, puede que solo lleve unas pocas horas. En tercer lugar, el avance más fundamental de la tecnología de big data es la capacidad de utilizar datos masivos para el análisis de algoritmos y la investigación de información, ayudándonos así a comprender el pasado, analizar las causas y revelar patrones criminales. Finalmente, los macrodatos pueden encontrar patrones significativos al analizar el pasado para predecir el futuro, brindándonos oportunidades para optimizar la asignación de recursos policiales y luchar contra el crimen.
En tercer lugar, el cambio conceptual en el modelo de investigación impulsado por el big data
Hegel señaló que “la idea es la racionalidad de cualquier conocimiento” [17], creyendo que la idea contiene “cosas esperadas””, que es mirar hacia el futuro, guiar y diseñar [18]. El cambio de modelo de investigación es ante todo un cambio de conceptos. Los conceptos del modelo de investigación se refieren a los puntos de vista, opiniones y creencias que reflejan la ley de la investigación y tienen la capacidad de guiar, dominar y decidir las actividades de investigación. El modelo de investigación basado en big data no es solo un nuevo modelo de trabajo, sino también una nueva forma de pensar y filosofía. En la era del big data los conceptos que es necesario establecer para la investigación son:
Conceptos online y abiertos. Big data son, ante todo, datos en línea. Los big data no sólo son masivos, sino que también registran datos dinámicos complejos de la sociedad en tiempo real: datos generados por los usuarios y captados por diversos sensores, que se mezclan con "pistas" de delincuencia. Para la investigación, los datos estructurados acumulados por la plataforma de seguridad pública son importantes, especialmente para la verificación de personas, cosas y objetos, pero es difícil tener antecedentes penales en tiempo real. La investigación basada en big data se basa en los datos estructurados acumulados por la plataforma de seguridad pública, extrayendo, analizando y procesando los datos en constante cambio generados por los usuarios y detectados por varios sensores para obtener información. Por lo tanto, para una investigación basada en big data, debemos adherirnos al concepto de datos abiertos y en línea, obtener los datos masivos que necesitamos y luego analizarlos y procesarlos.
El concepto de investigación guiada por datos.
En la era del big data, los datos son el ecosistema del crimen y el proceso de investigación es el proceso de almacenamiento, extracción y análisis de datos. Los datos atraviesan todos los aspectos de la investigación, y “dejar que los datos hablen” se ha convertido en el pensamiento básico de la investigación. El concepto de investigación basada en datos incluye al menos los tres aspectos siguientes: En primer lugar, todos los fenómenos relacionados con la delincuencia pueden digitalizarse. Todo se puede cuantificar y digitalizar[19]25-26. No se trata sólo de las cosas tangibles relacionadas con el crimen, como el tiempo, el espacio, las características del cuerpo humano (características biológicas, hábitos de comportamiento, etc.), comportamientos, medios, cosas, etc. , pueden cuantificarse, digitalizarse o pueden ser cosas intangibles relacionadas con el crimen, como valores, actitudes, emociones, etc. En segundo lugar, los macrodatos son un recurso básico y una caja de herramientas para la investigación. La investigación es la extracción y análisis de datos. El éxito de la investigación depende en cierta medida de la capacidad de extraer y analizar recursos de big data, utilizando diversas técnicas de análisis de big data, podemos obtener la información criminal que necesitamos. Finalmente, en la era del big data, los datos son el núcleo del proceso de investigación y dominan el funcionamiento de la investigación. La reconstrucción de la escena del crimen, la toma de decisiones de investigación, la selección de rutas de investigación, el análisis de la investigación, la clasificación de datos, la predicción de la investigación, etc., se realizan en torno a datos.
El concepto de relevancia. Big data determina la correlación cuantificando la relación matemática entre dos valores de datos. Una fuerte correlación significa que cuando el valor de un dato aumenta, es probable que el otro valor de los datos aumente [3]71. Las encuestas tradicionales recopilan y analizan datos según criterios de causa y efecto y estructura de datos. En la era del big data, podemos analizar y utilizar casi todos los datos relevantes. No tenemos que cumplir con los estándares de causalidad y estructura de datos para recopilar datos, sino cumplir con los estándares de correlación y recopilar no solo datos estructurados, sino también datos semiestructurados y no estructurados. Aunque esta correlación no puede revelar directamente la relación causal inherente, todavía tiene un gran valor práctico para la investigación y el control criminal.
La correlación permite a los investigadores pensar y analizar el caso de forma integral y desde múltiples ángulos. Aunque la correlación no persigue la precisión, busca la riqueza, no rechaza ninguna oportunidad y trata de crearla y utilizarla tanto como sea posible. A través de la correlación, información aparentemente no relacionada puede vincularse intrínsecamente para obtener una comprensión más completa del caso. Esto puede ayudarnos a encontrar pistas para resolver el caso, aclarar las ideas para resolverlo y delinear el alcance del caso.
La correlación puede darnos más orientación para determinar la relación causal, determinando así la causa del delito y probando el delito. El análisis de correlación es la base del análisis causal. La correlación no es necesariamente causalidad, pero la causalidad debe ser muy relevante. A través de la correlación, se puede explorar más a fondo si existe una relación causal, demostrando así un delito.
Un valor importante de la correlación es la capacidad de monitorear el crimen. Como se mencionó anteriormente, los factores actuales que afectan el crimen son complejos y no es fácil o incluso imposible determinar las causas del crimen. Para los investigadores, lo importante no es descubrir la causa de un delito sino controlarlo. A través de la correlación, se pueden identificar objetos relevantes y monitorear situaciones delictivas, asignando así recursos policiales de manera efectiva para combatir el crimen.
A través de la correlación se puede predecir la delincuencia. El valor central del big data es la predicción. Al recopilar datos relevantes y establecer un modelo de big data, podemos predecir cuándo, dónde, quién y qué tipo de delitos es probable que ocurran desde una perspectiva microscópica. También podemos predecir las tendencias delictivas desde una perspectiva macroscópica, lo que nos proporciona una mejor perspectiva. manera de prevenir y combatir la delincuencia. Buena oportunidad.
El concepto de combinar la investigación criminal en línea con evidencia fuera de línea. Los macrodatos hacen que sea muy fácil encontrar e identificar sospechosos de delitos. Pero los datos son solo un reflejo de los hechos, lo que no significa que sean un hecho; ④ Además, la lógica algorítmica de los grandes datos (énfasis en la correlación, solo determina una probabilidad, e incluso errores fatales debido al ruido y otros factores) y la lógica de la prueba legal (énfasis en la causalidad, eliminación del estándar de sospecha razonable) es diferente. Por lo tanto, la investigación penal requiere pruebas adicionales según lo exige el funcionamiento del sistema legal. Incluso si es posible identificar a sospechosos de delitos a través de big data y cumplir con el estándar de eliminar dudas razonables, el sistema algorítmico de big data debe transformarse en un sistema de prueba que cumpla con los requisitos de las regulaciones legales, y la identificación de datos debe transformarse en identificación jurídica. Pero no existe separación entre resolver crímenes en línea y producir pruebas fuera de línea. Los macrodatos pueden guiar nuestras pruebas, ayudarnos a encontrar evidencia y determinar causa y efecto. Por lo tanto, en la era del big data, no podemos abandonar la correlación y perseguir únicamente la causalidad, pero también debemos evitar que la correlación reemplace a la causalidad y que las predicciones reemplacen a los hechos.
Lo anterior es el contenido relevante de "Investigación sobre Big Data y cambio de modelo de investigación" (1) compartido por el editor. Para obtener más información, puede seguir a Global Ivy para compartir más información detallada.