Extracción de información apoyada en sistemas integrados
Los SIG a menudo se combinan con métodos de procesamiento de imágenes de teledetección para mejorar y extraer información de teledetección de manera más efectiva. Esto se manifiesta principalmente en dos aspectos.
Por un lado, los SIG se utilizan como un importante medio auxiliar para la interpretación visual de imágenes de teledetección para mejorar la precisión de la interpretación. El método específico es mostrar capas temáticas vectoriales (como mapas geológicos, mapas topográficos, mapas de uso de la tierra y cobertura vegetal, desarrollo de sistemas hídricos, etc.) para facilitar la interpretación de imágenes superpuestas a la imagen a interpretar, siempre que estas capas vectoriales han sido registrados con la imagen y tienen coordenadas unificadas. Esto se puede utilizar para la interpretación de imágenes de interacción persona-computadora, dibujando los resultados de la interpretación de imágenes directamente en la pantalla y seleccionando el área de muestra de entrenamiento correcta antes de supervisar la clasificación de imágenes para mejorar la precisión de la clasificación. En esta aplicación, también se debe prestar atención a la diferencia horaria entre estas capas temáticas y las imágenes. Por ejemplo, la cobertura de vegetación está altamente correlacionada con la fase temporal. Además, si la diferencia horaria es larga, se deben considerar plenamente los cambios en algunas condiciones objetivas, como los cambios en los tipos de uso del suelo, edificios y carreteras.
Por otro lado, la combinación de SIG y procesamiento de imágenes de teledetección se refleja en el hecho de que con el apoyo de la tecnología SIG, la geociencia y otros conocimientos intervienen directamente en el procesamiento de imágenes de teledetección. Por ejemplo, en la clasificación de imágenes de teledetección, conocimientos como DEM y NDVI pueden usarse directamente como nuevas bandas de imágenes de teledetección y clasificarse junto con otras bandas, de modo que la distribución de esta información temática se reflejará en los resultados de la clasificación. . Por ejemplo, la aplicación de sistemas expertos también es el resultado de la combinación de sistemas de información geográfica y tecnología de teledetección.
(B) Extracción de información temática respaldada por un sistema de información geográfica
1 El progreso de la investigación en métodos de extracción de información temática de teledetección
La extracción de información temática de teledetección proviene de. Datos de imágenes de teledetección Para obtener información sobre una característica específica, el propósito es distinguir objetivos temáticos contenidos en la imagen. La clasificación también es un método para extraer información temática, pero la extracción de información temática es diferente de la clasificación de imágenes por teledetección en el sentido general. Primero establezca el objetivo y luego realice conscientemente el reconocimiento orientado a objetos, y la clasificación consiste en asignar valores y clasificar los píxeles existentes en la imagen. Con la mejora de la tecnología de teledetección y la profundización de las aplicaciones de teledetección, sus métodos mejoran constantemente y han pasado por múltiples etapas, como interpretación visual, clasificación automática, extracción de información de características espectrales y extracción de información de características espectrales y espaciales.
La interpretación visual es la forma original de reconocimiento de imágenes. El reconocimiento de imágenes se está desarrollando ahora en dos direcciones: una es la automatización del reconocimiento de información provocada por la aparición de las computadoras y la otra es la exploración de la alta precisión del reconocimiento de información siguiendo la esencia de la transmisión de información por teledetección. No tienen límites estrictos y se penetran mutuamente con sus respectivos desarrollos. Los métodos de clasificación automática por computadora existentes solo utilizan datos de imágenes y no agregan automáticamente otros aspectos del contenido, como el conocimiento geológico. No utilizan completamente el conocimiento aplicado por el cerebro humano al analizar imágenes, por lo que no pueden lograr una alta precisión. La clasificación basada en conocimientos y sistemas expertos mejora la precisión de la clasificación. De manera similar, la extracción preliminar de información temática también consiste en analizar las características espectrales de objetivos específicos, formar reglas y operar sobre la imagen. La aparición de la inteligencia artificial en el campo de la informática permite extraer información temática basada en conocimientos o información. Las imágenes de teledetección son un mapeo de más a menos, lo cual es un proceso determinista. La interpretación de imágenes es un mapeo de menos a más, lo cual es un proceso incierto. Por lo tanto, la interpretación de la teledetección implica un importante proceso de procesamiento de las geociencias, que incluye dos aspectos: uno es complementar la información que la teledetección no recupera, es decir, complementar la información relacionada con las geociencias y el otro es inferir la información de la imagen; Basado en el análisis geocientífico de la información de la imagen, no hay información reflejada, lo que requiere un fuerte apoyo del conocimiento geocientífico. Cómo utilizar a los geocientíficos para expresar cuantitativamente el conocimiento de la interpretación visual, permitirles participar en el procesamiento informático y, fundamentalmente, realizar la extracción automática de la participación del conocimiento es el foco de la investigación actual sobre la extracción automática de información temática.
Antes de la clasificación automática por ordenador, entrenar el área de entrenamiento es en realidad un proceso estadístico. Este proceso estadístico es sólo para esta imagen. Luego utilice los resultados estadísticos para realizar una regresión y establecer un modelo de determinación de categorías que sea básicamente adecuado para la imagen. Al extraer información temática, generalmente hay primero un conjunto de modelos de información de teledetección, que luego se modifican continuamente de acuerdo con la situación real de una imagen específica. La esencia es ajustar los parámetros del modelo y finalmente hacer que el modelo se ajuste a la imagen. El modelo de información de teledetección es un modelo de inversión de objetos terrestres extraídos de experimentos terrestres existentes. Sin embargo, la reflexión de los objetos terrestres en las imágenes de satélite no se corresponde uno a uno con los datos medidos en el suelo. tienen ciertas limitaciones debido a varias razones. Hay mucha aleatoriedad, lo que implica el problema de la corrección de la radiación espectral.
Por lo tanto, es necesario combinar eficazmente la teoría de la información de teledetección con imágenes de mapas reales para extraer información temática.
2. Extracción de información geológica especial de teledetección
Hoy en día, los satélites de teledetección son "brillantes" y los datos de teledetección son sin precedentes. Sin embargo, la tasa de utilización de la información de teledetección es extremadamente baja. La razón es que carecemos de métodos y modelos para extraer información temática de teledetección. En comparación con la extracción de información de teledetección sobre el uso y la cobertura del suelo, la extracción de información geológica por teledetección es más difícil. En términos generales, existen tres formas principales de extraer información de teledetección: extracción de interpretación visual, extracción de información basada en clasificación y extracción de información de teledetección basada en descubrimiento de conocimientos. Hay tres formas de extraer información temática geológica mediante teledetección.
(1) Interpretación y extracción visual
El principal método para extraer información de imágenes de teledetección en los primeros días era la interpretación y extracción visual. Debido a que la interpretación visual puede utilizar de manera integral el conocimiento de las características de la imagen, como el tono o color, la forma, el tamaño, la sombra, la textura, el patrón, la ubicación, el diseño, etc. de los objetos terrestres, así como el conocimiento experto de los objetos terrestres, y combinarlo con otros datos que no son de teledetección para un análisis y lógica integrales. La inferencia puede lograr una extracción de información temática de mayor precisión, especialmente cuando se extraen características con características de estructura de textura fuerte. Es una tecnología actualmente en producción comercial y tiene claras ventajas sobre los métodos tradicionales que no son de detección remota. Aunque este método requiere mucha mano de obra y tiempo, debido a la dificultad de extraer automáticamente información geológica de teledetección mediante computadoras, seguirá existiendo durante mucho tiempo en la extracción de información geológica de teledetección.
(2) Extracción automática de información de teledetección basada en métodos de clasificación.
En términos de extracción automática de información de teledetección, los métodos de clasificación tienen la historia más larga de investigación. El núcleo es la segmentación de imágenes de teledetección, y sus métodos incluyen clasificación supervisada y clasificación supervisada. En lo que respecta a la clasificación no supervisada, existen el método K-MEANS, el método de agrupamiento dinámico, el método de agrupamiento difuso y el método de red neuronal artificial. En la clasificación supervisada, existen el método de distancia mínima, el método de máxima verosimilitud, el método de clasificación difusa y el método de red neuronal artificial. El método de máxima verosimilitud requiere un conocimiento a priori de todos los tipos y sus probabilidades. En particular, requiere la suposición de que todos los tipos de distribuciones. son de distribución positiva, por lo que es un clasificador con parámetros. En el caso de conocimiento de probabilidad previo y varios tipos de distribuciones normales, el efecto de clasificación es bueno y el clasificador tiene la ventaja de una velocidad de clasificación rápida. La clasificación difusa es un clasificador basado en matemáticas difusas. Se basa en el supuesto de que un píxel se compone de varios tipos, pero cada tipo tiene un grado diferente de pertenencia. Al entrenar un clasificador, es necesario determinar el grado de pertenencia de cada tipo en los píxeles de la muestra de entrenamiento. No requiere conocimiento previo de la probabilidad de cada tipo, ni requiere que cada tipo obedezca una distribución normal. Es un clasificador no paramétrico. Sin embargo, es difícil determinar la pertenencia de cada tipo a los píxeles de entrenamiento. Este método es adecuado para extraer información de subpíxeles. El clasificador de redes neuronales artificiales es un clasificador construido utilizando tecnología de redes neuronales artificiales. Las redes neuronales artificiales son una ciencia no lineal que se ha desarrollado rápidamente en los últimos años. Es una tecnología de inteligencia artificial que simula redes neuronales biológicas y ha sido ampliamente utilizada en análisis de tendencias, reconocimiento de patrones y clasificación de imágenes de teledetección. Las redes neuronales artificiales son clasificadores no paramétricos que no requieren conocimiento previo de probabilidad de todos los tipos, ni requieren que todos los tipos obedezcan a una distribución normal. Aunque la clasificación con un clasificador lleva poco tiempo, entrenar un clasificador lleva mucho tiempo.
En lo que respecta a la clasificación no supervisada, los resultados de la clasificación requieren que expertos interpreten y clasifiquen las categorías, para finalmente determinar el tipo al que pertenecen. En lo que respecta a la clasificación supervisada, es necesario seleccionar una gran cantidad de áreas de muestra de capacitación, lo que no solo requiere mucho tiempo y mano de obra, sino que también afecta directamente el efecto de clasificación. Al mismo tiempo, la clasificación implica segmentar toda la imagen, lo que requiere la mayor precisión general, por lo que es imposible garantizar completamente la mayor precisión de la información temática que necesitamos. La clasificación se basa en estadísticas matemáticas, no en el análisis de mecanismos de la información de teledetección ni en la extracción de conocimientos, lo que dificulta lograr la automatización total de la extracción de información temática a partir de imágenes de teledetección. Al mismo tiempo, la clasificación basada en características espectrales dificulta la solución del problema de los espectros idénticos de objetos extraños. El conocimiento adquirido en la clasificación a menudo no es transferible ni fácilmente interpretable. Por eso conocemos el efecto pero no la causa. Tenemos que repetir el trabajo de seleccionar muestras de entrenamiento para imágenes en cualquier momento y en cualquier lugar. De esta manera, es obvio que la automatización de la extracción de información por teledetección es muy limitada. Por lo tanto, la extracción de información temática mediante teledetección basada en el descubrimiento de conocimientos se convertirá en otra dirección muy prometedora.
3. Extracción de información sobre temas de teledetección basada en el descubrimiento de conocimiento.
La extracción de información temática por teledetección basada en el descubrimiento de conocimientos es la tendencia de desarrollo de la extracción de información temática por teledetección. Su contenido básico incluye descubrir conocimientos, aplicar conocimientos para establecer modelos de extracción y utilizar datos y modelos de teledetección para extraer información temática de teledetección.
En términos de descubrimiento de conocimiento, incluye conocimientos tales como características espectrales, estructura y forma espacial, y relaciones espaciales entre objetos en una única imagen de teledetección. Entre ellos, la estructura espacial y el conocimiento morfológico incluyen el conocimiento de la textura espacial, la forma y las características de la forma de los bordes de los objetos terrestres a partir de imágenes de detección remota de períodos múltiples; no solo se puede descubrir el conocimiento anterior, sino también el conocimiento del proceso de cambio dinámico de los objetos terrestres; se pueden descubrir más; varios conocimientos relevantes se pueden encontrar en la base de datos SIG. En términos de utilizar el conocimiento para construir modelos, se trata principalmente de utilizar la parte encontrada del conocimiento, parte del conocimiento o todo el conocimiento para establecer el modelo de extracción de información del tema de teledetección correspondiente, como se muestra en la Figura 3-8. Cuando se utilizan datos y modelos de teledetección para extraer información temática de teledetección, el proceso debe ser de simple a complejo, desde la aplicación de un conocimiento único y un modelo único hasta la aplicación integral de múltiples conocimientos y modelos. Del uso de un solo dato al uso integral de múltiples datos.
4. Extracción de información sobre temas de teledetección basada en conocimiento espectral.
El conocimiento espectral de los objetos terrestres es el conocimiento más importante en la extracción de información temática de teledetección. El estudio de las características espectrales de los objetos terrestres ha sido muy valorado durante mucho tiempo por varios países. China ha llevado a cabo investigaciones en profundidad sobre el espectro de objetos terrestres y ha publicado libros como "Análisis del espectro y características de objetos terrestres típicos en China" y "Pruebas y aplicaciones del espectro de reflectancia de teledetección". Zhou Chenghu y Du Yunyan establecieron un modelo eficaz de extracción de agua AVHRR de la NOAA basado en el análisis de las características espectrales del agua. Con base en las características espectrales del arroz y el fondo, Chen Mingzhen estableció el modelo de extracción del área de siembra de arroz (TM4/TM1, TM4/TM3, TM4/TM2). Helmut Mayer Carsten Steger analizó el método de extraer carreteras a partir de imágenes de teledetección mediante el análisis del conocimiento del espectro de carreteras. Jinfei Wang, Paul M. Treitz y Philip J. Howarth analizan métodos para extraer nuevas carreteras a partir de imágenes SPOT PAN mediante análisis de perfiles orientados a gradientes y utilizarlas para actualizar redes de carreteras en bases de datos SIG urbanas. V.Lacroix y M.Acheroy utilizaron el método de gradiente restringido para extraer las esquinas de las casas.
R.Haralick, S.Wang, G.Shapiro y J.B.Campbell analizaron el uso de tecnología de etiquetado consistente para extraer redes fluviales y sus direcciones de flujo. Moller-Jenson propuso utilizar el AVHRR de la NOAA de CH4 <45 y CH5 <35 para establecer un modelo de extracción de agua. Upp et al. propusieron una vez utilizar la banda TM7 para extraer agua mediante el método del umbral.
Figura 3-8 Modelo de extracción de información sobre temas de teledetección basado en el descubrimiento de conocimiento
El conocimiento espectral descubierto incluye el método de muestreo típico, el método de curva espectral y el método de perfil espectral. Tomemos como ejemplo la imagen de teledetección del Landsat estadounidense en la región de Vashisha en Xinjiang. El tamaño de la imagen es de 512 × 512 píxeles y las principales características típicas son rocas expuestas, nieve y sombras. Para utilizar el conocimiento espectral de estas características, primero se realiza un muestreo espectral de estas características típicas. Los resultados del muestreo espectral se muestran en la Figura 3-9. Se puede encontrar que estos objetos tienen diferencias espectrales obvias.
A través de la comparación, se puede encontrar que las características espectrales de las áreas rocosas expuestas, las áreas cubiertas de nieve y las sombras de las montañas son significativamente diferentes:
(1) En general, la reflectividad de las áreas expuestas Las áreas rocosas son más altas y las sombras tienen una reflectividad baja. El área de roca expuesta en el medio es ligeramente más alta o cercana al área de nieve en las bandas TM1, TM2, TM3 y TM4, pero mucho más alta que el área de nieve en las bandas TM5 y TM7.
(2) El área del manto de nieve es superior a la sombra en las bandas TM1, TM2, TM3 y TM4, y está cerca o ligeramente superior a la sombra en las bandas TM5 y TM7.
Figura 3-9 Curvas de muestreo espectral típicas de objetos terrestres en el área de Washixia
(3) En la banda TM 1 ~ TM7, el área expuesta de la roca es mucho mayor que el área de sombra.
(4) A partir de la relación espectral, la reflectancia del área de sombra disminuye gradualmente de TM1 a TM7, es decir, TM 1 > Tm2 > Tm3 > Tm4 > Tm5 > Tm6 > TM7. A partir de la relación espectral, el área de exposición de la roca alcanza su punto máximo en TM4, es decir, TM3 y TM5. La relación espectral entre las áreas de nieve también es obvia, es decir, hay una tendencia descendente obvia de TM4 a TM5.
A través del análisis espectral anterior, se establecieron modelos de extracción basados en el conocimiento espectral para roca desnuda, nieve y sombra:
Nieve:
1: 250.000 sensores remotos Métodos y técnicas de mapeo geológico
Sombra:
1: 250.000 métodos y técnicas de mapeo geológico por teledetección
Roca:
1 ∶ 250.000 Métodos y tecnologías de mapeo geológico de teledetección
La nieve, las sombras y las rocas expuestas se pueden extraer de acuerdo con el modelo anterior.
La extracción de información temática basada en el conocimiento espectral requiere que los objetos terrestres y el fondo sean espectralmente separables, que haya poco isomorfismo entre los dos y que los espectros dentro de los objetos terrestres deben ser consistentes. Cuando el espectro dentro del objeto es inconsistente, se puede extraer el espectro de los componentes característicos dentro del objeto. Cuando hay muchos isomorfismos entre el espectro de los componentes internos de un objeto local y el fondo, es necesario extraerlos con la ayuda de otros conocimientos del objeto local.
5. Extracción de información temática basada en el conocimiento de la textura del objeto terrestre.
Cuando la composición del objeto es compleja y mayor que la resolución espacial del sensor, la estructura y composición del objeto se pueden detectar remotamente. La imagen tiene características de textura obvias. Cuando hay características de textura que son diferentes del objeto de fondo y es difícil resolver completamente el problema de extracción de información temática basándose únicamente en la extracción del conocimiento de características espectrales, el conocimiento espectral y el conocimiento de textura del objeto deben usarse para extraer conjuntamente información temática. . La textura se refiere al cambio espacial del valor de gris, que es un patrón compuesto por algunas primitivas de textura según diferentes configuraciones espaciales. La configuración espacial de las primitivas de textura puede ser aleatoria, determinista, probabilística y funcional. La textura se puede dividir en textura estructural y textura no estructural, también llamada textura aleatoria. En la interpretación visual, la textura generalmente se describe y expresa en términos de espesor, suavidad, granularidad, aleatoriedad, direccionalidad, linealidad, periodicidad y repetición. Cuando se utiliza la textura para identificar objetos terrestres, es necesario comparar y analizar las características de la textura de un sujeto y los objetos terrestres circundantes. Hay cuatro algoritmos principales de reconocimiento de texturas en ERDAS IMAGINE: método de distancia euclidiana promedio (primer orden), método de varianza (segundo orden), pendiente (tercer orden) y curtosis (cuarto orden). Sus métodos de cálculo son los siguientes:
(1) Método de distancia euclidiana promedio (primer orden)
1: 250.000 métodos y tecnologías de mapeo geológico de teledetección
Entre ellos: xijλ: el valor digital del píxel de la banda λ (I, j) de la imagen multibanda;
El valor digital de la banda XC λ-λ del píxel en el centro de la ventana activa;
n-en el número de píxeles de la ventana.
(2) Método de varianza (segundo orden)
1: 250.000 métodos y técnicas de mapeo geológico de teledetección
donde xij——es el píxel (I, El valor numérico de j);
n-el número de píxeles en la ventana activa;
m-el valor promedio de la ventana activa.
(3) Pendiente (tercer orden)
1: 250.000 métodos y tecnologías de mapeo geológico de teledetección
donde xij——es el píxel (I, j );
n: el número de píxeles en la ventana activa;
M: el valor medio de la ventana activa;
varianza.
(4)Kurthood (cuarto orden)
1: 250.000 métodos y técnicas de mapeo geológico por teledetección
donde xij——es el píxel (I, The valor numérico de j);
n-el número de píxeles en la ventana activa;
M-el valor promedio de la ventana activa;
varianza.
Además, un método común de detección de textura es el método ** de generación de matrices.
Este proyecto utiliza principalmente el método de varianza de segundo orden del software ERDAS IMAGEINE para calcular las características de textura de la imagen. La ventana móvil utilizada en el cálculo es 5×5. Del mapa de textura de la imagen de TM en el área de Washixia en Xinjiang, se puede encontrar que el índice de textura (varianza de segundo orden) del área de roca expuesta es mayor y la imagen parece más brillante, mientras que el índice de textura de la El área de roca no expuesta es más baja y la imagen es más oscura. Al utilizar un umbral apropiado para extraer el área de roca expuesta, se puede encontrar que los resultados son básicamente consistentes con la situación real.
6. Extracción de información temática basada en el conocimiento de la forma del objeto terrestre.
A veces, no sólo las características espectrales del objeto y el fondo son iguales o similares, sino que las características de la textura también son similares. En este caso, es necesario realizar una extracción adicional basada en el conocimiento de la forma de los objetos terrestres.
En cuanto a la litología geológica, las diferentes litologías suelen tener diferentes características espaciales:
(1) Rocas intrusivas
Las rocas intrusivas generalmente tienen formas geométricas planas regulares, como círculos y elipses Forma, forma de lente, forma de vena, etc. , y la mayoría de ellos carecen de las características de las imágenes en capas. Las grandes rocas intrusivas a menudo tienen sistemas de agua, juntas o grupos de venas en forma de anillo, radiales y de otro tipo en la imagen.
(2) Rocas sedimentarias
La forma plana es similar a una tira o una cinta, con características obvias de imagen de lecho. Un grupo de rocas sedimentarias ordenadas a menudo forma imágenes en capas de diferentes colores.
(3) Rocas metamórficas
Las características de imagen de las rocas metamórficas generalmente están relacionadas con la composición de la roca original, la adición de nuevos materiales durante el proceso metamórfico y los cambios en la estructura. . Si es una roca metamórfica, sus características de imagen son similares a las de la roca magmática; si es una roca metamórfica negativa, sus características de imagen son similares a las de la roca sedimentaria.
Existen tres métodos para descubrir el conocimiento morfológico de los objetos terrestres: métodos basados en el perímetro y el área, métodos basados en el área y métodos basados en el área y la longitud del área.
Métodos basados en perímetro y área
Índice de forma
1: 250.000 métodos y técnicas de mapeo geológico de teledetección
Para círculos Para formas , k es mayor que 0,25, para cuadrados, k es igual a 0,25 y para rectángulos, k es menor que 0,25. Los objetos lineales, como carreteras, aeropuertos, ríos, etc., tienen valores K pequeños. Para objetos irregulares, cuanto más compleja es la forma, menor es su k.
Redondez:
1: 250.000 métodos y técnicas de mapeo geológico de teledetección
Compacidad:
1: 250.000 métodos de mapeo geológico de teledetección y tecnologías
Tasa delgada:
1: 250.000 Métodos y tecnologías de cartografía geológica mediante teledetección
Medición basada en áreas
Índice compacto:
1: 250.000 métodos y tecnologías de mapeo geológico por teledetección
1: 250.000 métodos y tecnologías de mapeo geológico por teledetección
Basado en el área y la longitud del área
Relación de forma
1: 250.000 Métodos y técnicas de mapeo geológico por teledetección
Índice de elipse
1: 250.000 Métodos y técnicas de mapeo geológico por teledetección
En todas las fórmulas anteriores:
a-el área del objeto;
AC-el área del círculo mínimo circunscrito; p >
P——Perímetro de la característica;
La longitud del eje principal.
El conocimiento de la forma se puede utilizar para localizar o extraer características cualitativamente. Cuando se utiliza para la extracción de posicionamiento cualitativo, primero se mejoran los límites entre las características extraídas y luego se determinan los indicadores de forma para lograr la extracción de posicionamiento cualitativo. Cuando se utiliza para extracción cualitativa, es principalmente para confirmar aún más los atributos de la información temática extraída.
(C) Análisis integral de información de múltiples fuentes con el apoyo de sistemas de información geográfica
En la extracción de información temática geológica de teledetección, además de los datos de teledetección, existen también una gran cantidad de datos relacionados, como mapas geológicos, datos físicos y geoquímicos, etc. , generalmente utilizado. Cuando se utilizan estos datos, hay dos pasos: el primer paso es extraer conocimiento; el segundo paso es utilizar este conocimiento para conectar datos gráficos con imágenes de detección remota para respaldar la extracción de información temática. Este conocimiento es un conocimiento de correlación positiva y un conocimiento anticorrelación. Estos dos tipos de conocimiento se pueden dividir a su vez en conocimiento determinista y conocimiento probabilístico.
La teledetección por satélite en el siglo XXI proporcionará datos de observación de la Tierra multiespectrales, multitemporales, de multiresolución y en todas las condiciones climáticas para la investigación en geociencias, promoviendo aplicaciones más amplias y profundas de la teledetección. Sin embargo, en las últimas dos o tres décadas, el pensamiento de las ciencias de la tierra ha guiado la dirección del desarrollo de la tecnología de teledetección; al mismo tiempo, el nivel de aplicación de la teledetección va a la zaga del desarrollo de la tecnología de teledetección espacial; El rendimiento sobresaliente es que los datos de teledetección enviados por los satélites no se utilizan en su totalidad, y el retraso en el nivel de extracción de información hace que el rico conocimiento oculto en los datos de teledetección esté lejos de ser plenamente explotado y utilizado, lo que resulta en un enorme desperdicio de información remota. detección de recursos de información y una reducción en el valor de la aplicación. Por lo tanto, la capacidad y eficiencia de la extracción de información se convertirá en una de las cuestiones más importantes a las que se enfrentarán las futuras aplicaciones de teledetección.
Las teorías técnicas de minería de datos (DM) y descubrimiento de conocimiento a partir de bases de datos (KDD) aparecieron a finales de los años 1980 y se han desarrollado rápidamente en los últimos años. Son producto de la combinación de inteligencia artificial y aprendizaje automático. y tecnología de bases de datos. Es diferente de simplemente recuperar y consultar información de los sistemas de gestión de bases de datos. Enfatiza el extraordinario proceso de "descubrir información potencialmente útil oculta y previamente desconocida de las bases de datos" e "identificar patrones eficientes a partir de los datos".
Este modelo es "nuevo, potencialmente útil y, en última instancia, comprensible" y su propósito es transformar grandes cantidades de datos sin procesar en conocimiento valioso. Este es el problema del cuello de botella para el procesamiento de información de teledetección satelital actual y futuro, aprovechando la extracción de datos y el descubrimiento de conocimientos. La teoría y la tecnología ayudarán a resolver la contradicción entre el rápido crecimiento de los datos de teledetección y las dificultades de las personas en el procesamiento y la comprensión de datos
1. La minería de datos espaciales y el descubrimiento de conocimientos
KDD y The. El surgimiento y desarrollo de la tecnología de minería de datos se basa en el hecho de que, por un lado, los datos y las bases de datos se están expandiendo rápidamente, por otro lado, la aplicación de las bases de datos aún se encuentra en la etapa de consulta y recuperación, y el rico conocimiento oculto en ellas; Las bases de datos están lejos de ser plenamente explotadas y Utilización El aumento masivo de las bases de datos contrasta marcadamente con las dificultades de las personas para procesar y comprender las bases de datos. El término KDD apareció por primera vez en el simposio de la 11ª Conferencia Internacional Conjunta sobre Inteligencia Artificial celebrada en Detroit, EE. UU. , en agosto de 1991, 1993. En 1994, el simposio KDD continuó celebrándose. Con el continuo aumento del número de participantes, desde 1995 se ha celebrado cada año una conferencia internacional sobre KDD. Además de la investigación teórica, un número considerable de participantes. Los productos y sistemas de aplicación KDD han surgido y se han logrado en aplicaciones prácticas.
Según la definición de Fayyad, KDD es “el proceso extraordinario de identificar patrones válidos, novedosos, potencialmente útiles y, en última instancia, comprensibles a partir de un conjunto de datos. ” (Figura 3 -10) Incluyendo preparación de datos, extracción de datos e interpretación y evaluación de resultados
Figura 3-3-10 Diagrama de proceso KDD
La preparación de datos incluye selección de datos, datos. preprocesamiento y conversión de datos. El propósito de la selección de datos es determinar el objeto de operación de la tarea de descubrimiento, es decir, los datos de destino son un conjunto de datos extraídos de la base de datos original de acuerdo con las necesidades del usuario. El preprocesamiento de datos es eliminar el ruido, etc. Al construir un almacén de datos, en términos generales, la selección de datos y el preprocesamiento de datos se han completado al generar el almacén de datos. El objetivo principal de la transformación de datos es reducir la dimensionalidad o dimensionalidad de los datos. es decir, encontrar las características verdaderamente útiles a partir de las características iniciales para reducir la cantidad de características o variables que deben considerarse en la minería de datos.
En la etapa de minería de datos, primero debemos determinar cuál es. cuál es la tarea o el propósito de la minería, y considerar y decidir qué algoritmo de minería se puede usar para la misma tarea implementado con diferentes algoritmos, se deben considerar dos factores al elegir un algoritmo de implementación: Primero, diferentes datos tienen diferentes características y deben ser extraído utilizando algoritmos relevantes; en segundo lugar, los requisitos de los usuarios o sistemas operativos reales, como la precisión y la comprensibilidad
2. Principales tipos y métodos de extracción de datos y descubrimiento de conocimiento. La minería de datos en bases de datos es la más temprana y madura. La minería y el descubrimiento de conocimiento se pueden dividir en los siguientes tipos (Fayyad, 1997):
(1) Clasificación: funciones de aprendizaje que asignan elementos de datos a uno o varios elementos definidos. clases.
(2) Regresión: una función de aprendizaje que asigna elementos de datos a variables predictivas de valor real.
(3) Agrupación: método para encontrar categorías limitadas para describir un conjunto de datos.
(4) Generalización (o generalización): encuentre una manera de describir las propiedades * * * de cada subconjunto de datos.
(5) Patrón de dependencia: busque patrones que describan dependencias significativas entre variables.
(6) Detección de cambios y desviaciones: Comparar con datos anteriores y encontrar cambios significativos.
En la actualidad, han surgido una gran cantidad de nuevos métodos y combinaciones de métodos en la investigación de minería de datos y descubrimiento de conocimiento. Entre los métodos más famosos se encuentran:
(1) Decisión. Métodos ID3 y C4.5 basados en clasificación de árboles.
(2) Método resumen AQ15 y CN2.
(3) El método aproximado resuelve conocimientos imprecisos e inciertos.
(4) Una gran cantidad de métodos de redes neuronales artificiales, como el algoritmo clásico de retropropagación [[BP]], el mapa autoorganizado (SOM) y la teoría de resonancia adaptativa (ART).
(5) Método de aprendizaje de redes de probabilidad bayesiana.
(6) Método para generar reglas de asociación a priori.
La minería de datos y el descubrimiento de conocimientos, como uno de los puntos críticos actuales de la investigación extranjera, no son solo los puntos críticos de investigación de los académicos de inteligencia artificial, sino también los objetos de exploración de los expertos en bases de datos. Su trabajo abarca medicina, aprendizaje automático, inteligencia artificial, matemáticas, marketing y otros campos.
Obtuve muchos conocimientos útiles. Hasta ahora, no hay muchas unidades nacionales dedicadas a la investigación en esta área, y la aplicación de KDD y tecnología de extracción de datos al procesamiento de información de teledetección por satélite sigue siendo un tema completamente nuevo.
3. Minería de datos y descubrimiento de conocimiento en imágenes de teledetección.
Como tipo de base de datos, la base de datos de teledetección satelital puede naturalmente recurrir a la minería de datos generales y a la tecnología KDD para procesar e identificar la información almacenada en ella. Como base de datos especial y base de datos de imágenes, tiene un contenido de información que es diferente de las bases de datos relacionales generales y las bases de datos de transacciones, y contiene información temporal, espectral y espacial enriquecida. Entonces, en términos de descubrimiento de conocimiento en esta biblioteca de clases, la minería de datos también debería tener procesos y métodos especiales.
De acuerdo con el diagrama de flujo técnico de DM y (Figura 3-11) y teniendo en cuenta la particularidad de los datos de teledetección satelital, He et al. de la Academia China de Ciencias propusieron la teoría y la tecnología de marco de extracción de datos de teledetección por satélite y descubrimiento de conocimientos para aplicaciones geológicas. En este marco, la minería de datos juega un papel sumamente importante. Incluye selección de fase, preprocesamiento de aplicaciones, análisis de características, identificación de información e interpretación del conocimiento de datos de teledetección. En la vida real, muchos usuarios de teledetección ignoran el papel especial de este proceso y utilizan directamente los resultados de la interpretación de imágenes originales de teledetección como base para la aplicación (aunque también se añade conocimiento humano en el proceso de interpretación), por lo que el conocimiento obtenido a menudo es Es superficial, superficial e inexacto. Sólo considerando plenamente las características espectrales, espaciales y temporales de los datos originales en el proceso de extracción de datos de teledetección se podrá lograr un mejor descubrimiento de conocimientos valiosos, precisos y de alto nivel para aplicaciones de teledetección.
Figura 3-Minería por teledetección y descubrimiento de conocimiento de datos satelitales+01