Red de Respuestas Legales - Asesoría legal - ¿Qué es una base de datos y otro software?

¿Qué es una base de datos y otro software?

La siguiente información se encontró en Baidu. Puede consultarla cuando tenga tiempo.

Estoy en ello. Sólo te digo lo que siento.

Las bases de datos se utilizan para facilitar el almacenamiento y manipulación de datos. Está bien si no lo necesitas. A veces,

los datos también se pueden registrar en un archivo (como txt), pero si la cantidad de datos es grande, será más problemático operar.

Hoy en día existen muchos tipos de bases de datos, algunas grandes y otras pequeñas. Sería más conveniente si se pudieran utilizar.

Definición 1

Cuando las personas describen este concepto desde diferentes perspectivas, tienen diferentes definiciones (descriptivas por supuesto). Por ejemplo, una base de datos se denomina "sistema de mantenimiento de registros" (esta definición enfatiza que una base de datos es una colección de registros). Para otro ejemplo, una base de datos es "una colección de datos relacionados que las personas almacenan juntos de cierta manera organizativa para resolver tareas específicas" (esta definición se centra en la organización de datos). Es más, las bases de datos se denominan "almacenes de datos". Por supuesto, aunque esta afirmación es vívida, no es rigurosa.

Estrictamente hablando, una base de datos es un "almacén que organiza, almacena y gestiona datos según la estructura de datos". En el trabajo diario de la gestión económica, a menudo es necesario colocar algunos datos relevantes en dicho "almacén" y procesarlos de acuerdo con las necesidades de la gestión. Por ejemplo, el departamento de recursos humanos de empresas e instituciones suele almacenar la información básica de los empleados (número de empleado, nombre, edad, sexo, lugar de origen, salario, currículum, etc.) en una tabla, que puede considerarse como una base de datos. Con este "almacén de datos", podemos consultar la situación básica de un empleado en cualquier momento según sea necesario, y también podemos consultar el número de empleados cuyo salario está dentro de un determinado rango, etc. Si estas tareas se pueden automatizar en los ordenadores, entonces nuestra gestión de personal podrá alcanzar un nivel muy alto. Además, en la gestión financiera, la gestión de almacenes y la gestión de producción, es necesario establecer muchas "bases de datos" de este tipo para utilizar computadoras para realizar la gestión automatizada de las finanzas, el almacén y la producción.

J. Martin dio una definición relativamente completa de una base de datos: una base de datos es una colección de datos relacionados almacenados juntos, está estructurada, no tiene redundancia dañina o innecesaria y sirve para una variedad de aplicaciones; se almacena independientemente del programa que lo utiliza; la inserción de nuevos datos en la base de datos, la modificación y la recuperación de datos originales se pueden realizar de forma general y controlada. Cuando en un sistema hay varias bases de datos estructuralmente completamente separadas, el sistema contiene una "colección de bases de datos".

Definición 2

Una base de datos es una colección de datos organizados según un modelo de datos específico y almacenados en un almacenamiento secundario. Este tipo de conjunto de datos tiene las siguientes características: es lo menos duplicado posible y sirve para múltiples aplicaciones de una organización específica de manera óptima. Su estructura de datos es independiente de la aplicación que la utiliza, y la adición, eliminación, modificación y recuperación de datos se gestiona y controla mediante un software unificado. Desde la perspectiva de la historia del desarrollo, la base de datos es una etapa avanzada de la gestión de datos y se desarrolló a partir del sistema de gestión de archivos.

[Editar este párrafo]Estructura básica de la base de datos

La estructura básica de la base de datos se divide en tres niveles, lo que refleja tres perspectivas diferentes de observación de la base de datos.

(1) Capa de datos físicos.

Es la capa más interna de la base de datos y es una colección de datos realmente almacenados en un dispositivo de almacenamiento físico. Estos datos son datos sin procesar, procesados ​​por el usuario, que consisten en cadenas de bits, caracteres y palabras procesadas mediante las operaciones de instrucción descritas por el esquema interno.

(2) Capa de datos conceptuales.

Es la capa intermedia de la base de datos y la representación lógica general de la base de datos. Señalar la definición lógica de cada dato y la relación lógica entre los datos es una colección de registros almacenados. Implica la relación lógica de todos los objetos en la base de datos, más que sus condiciones físicas, y es una base de datos bajo el concepto de administrador de base de datos.

(3) Capa de datos lógica.

Es la base de datos que ven y utilizan los usuarios, y representa el conjunto de datos utilizados por uno o varios usuarios específicos, es decir, un conjunto de registros lógicos.

Las relaciones entre bases de datos en diferentes niveles se transforman mediante el mapeo.

[Editar este párrafo] Las funciones principales de la base de datos

(1) Realizar el intercambio de datos.

El intercambio de datos incluye que todos los usuarios puedan acceder a los datos de la base de datos al mismo tiempo. Los usuarios pueden usar la base de datos de varias maneras a través de la interfaz y compartir datos.

(2) Reducir la redundancia de datos.

En comparación con el sistema de archivos, debido a que la base de datos permite compartir datos, evita que los usuarios creen archivos de aplicaciones por separado. Reduzca una gran cantidad de datos duplicados, reduzca la redundancia de datos y mantenga la coherencia de los datos.

(3) Independencia de los datos.

La independencia de los datos incluye que las estructuras lógicas de la base de datos y la aplicación son independientes entre sí, y los cambios en la estructura física de los datos no afectan la estructura lógica de los datos.

(4) Control centralizado de datos.

En el modo de gestión de archivos, los datos están en un estado descentralizado y diferentes usuarios o el mismo usuario no hacen nada con sus propios archivos en diferentes procesos. Las bases de datos se pueden utilizar para controlar y gestionar datos de forma centralizada, y los modelos de datos se pueden utilizar para expresar la organización de diversos datos y las relaciones entre datos.

(5) La coherencia y la capacidad de mantenimiento de los datos garantizan la seguridad y confiabilidad de los datos.

Incluyen principalmente: ① Control de seguridad: evita la pérdida de datos, actualizaciones incorrectas y uso no autorizado; ② Control de integridad: garantiza la exactitud, validez y compatibilidad de los datos; ③ Control de concurrencia: en el mismo período de tiempo dentro de la base de datos; , se permiten múltiples accesos a los datos para evitar interacciones anormales entre los usuarios; ④ Descubrimiento y recuperación de fallas: el sistema de administración de bases de datos proporciona un conjunto de métodos para detectar y reparar fallas de manera oportuna, evitando así la destrucción de datos.

[Editar este párrafo] Etapa de desarrollo de la base de datos

La etapa de desarrollo de la base de datos se puede dividir a grandes rasgos en las siguientes etapas:

Etapa de gestión manual

Etapa del sistema de archivos;

Etapa del sistema de base de datos;

Etapa de base de datos avanzada.

[Editar este párrafo] Estructura de la base de datos y tipos de base de datos

Las bases de datos generalmente se dividen en tres tipos: bases de datos jerárquicas, bases de datos en red y bases de datos relacionales. Diferentes bases de datos están conectadas y organizadas según diferentes estructuras de datos.

1. Modelo de estructura de datos

(1) Estructura de datos

La llamada estructura de datos se refiere a la forma organizativa de los datos o la relación entre los datos. Si D representa datos y R representa un conjunto de relaciones entre objetos de datos, entonces DS = (d, R) se denomina estructura de datos. Por ejemplo, hay una guía telefónica que registra los nombres y números de teléfono correspondientes de n personas. Para que sea más fácil encontrar el número de teléfono de alguien, los nombres y números están ordenados en el diccionario, con el número de teléfono correspondiente seguido del nombre. De esta manera, si desea encontrar el número de teléfono de una persona (digamos que la primera letra de su nombre es Y), solo necesita encontrar los nombres que comienzan con Y. En este ejemplo, el conjunto de datos D es el nombre y el teléfono. Números, la relación R entre ellos está ordenada en el orden del diccionario y su estructura de datos correspondiente es DS = (d, R), que es una matriz. (2) Tipos de estructuras de datos

Las estructuras de datos se dividen en estructuras lógicas y estructuras físicas de datos. La estructura lógica de los datos consiste en observar y analizar datos desde una perspectiva lógica (es decir, la conexión y organización de los datos), independientemente de la ubicación de almacenamiento de los datos. La estructura física de los datos se refiere a la estructura de los datos almacenados en la computadora, es decir, la forma de implementación de la estructura lógica de los datos en la computadora, por lo que la estructura física también se denomina estructura de almacenamiento. Aquí solo se estudia la estructura lógica de los datos, y el método para reflejar y realizar la conexión de datos se denomina modelo de datos.

Actualmente existen tres modelos de datos populares: el modelo de estructura jerárquica y el modelo de estructura de red basados ​​en la teoría de grafos, y el modelo de estructura de relaciones basado en la teoría de relaciones.

2. Sistemas de bases de datos jerárquicos, en red y relacionales

(1) Modelo de estructura jerárquica

El modelo de estructura jerárquica es esencialmente un árbol con nodos raíz Árbol ordenado dirigido (Matemáticamente "árbol" se define como un gráfico conectado acíclico). Por ejemplo, la Figura 20.6.4 es el organigrama de una institución de educación superior. Este organigrama es como un árbol.

El departamento de la escuela es la raíz (llamado nodo raíz), y el departamento, la especialidad, el maestro y el estudiante son las ramas (llamadas nodos). La conexión entre la raíz y la rama se llama la relación de la raíz. hasta el borde es 1:N, es decir, solo hay una raíz.

Un sistema de base de datos establecido según un modelo jerárquico se denomina sistema de base de datos de modelo jerárquico. El IM (sistema de gestión de la información) es su representante típico.

(2) Modelo de estructura de red

El sistema de base de datos establecido de acuerdo con la estructura de datos de la red se denomina sistema de base de datos de red y su representante típico es DBTG (Grupo de tareas de base de datos). Las estructuras de datos de cuadrícula se pueden convertir matemáticamente en estructuras de datos jerárquicas.

(3) Modelo de estructura relacional

La estructura de datos relacional simplifica algunas estructuras de datos complejas en relaciones binarias simples (es decir, forma de tabla bidimensional). Por ejemplo, la relación de los empleados en una determinada unidad es una relación binaria.

Un sistema de base de datos compuesto por estructuras de datos relacionales se denomina sistema de base de datos relacional.

En una base de datos relacional, casi todas las operaciones sobre datos se basan en una o más tablas relacionales. La gestión de datos se logra mediante operaciones como clasificación, fusión, unión o selección de estas tablas relacionales. DBASEII es un representante típico de este tipo de sistema de gestión de bases de datos. Para un problema de aplicación práctica (como la gestión de personal), a veces se necesitan múltiples relaciones para lograrlo. La relación establecida con dBASEII se denomina base de datos (o archivo de base de datos), y varias bases de datos establecidas correspondientes a múltiples relaciones se denominan sistemas de bases de datos. Otra función importante de dBASEII es utilizar y administrar la base de datos mediante el establecimiento de archivos de comandos. El archivo de secuencia de comandos correspondiente al sistema de base de datos se denomina sistema de aplicación de base de datos. En pocas palabras, una relación se llama base de datos y varias bases de datos pueden formar un sistema de base de datos. El sistema de base de datos puede derivar varios tipos de archivos auxiliares para establecer su sistema de aplicación.

[Editar este párrafo] Base de datos pública

1. IBM

Como pionero y pionero en el campo de las bases de datos relacionales, IBM completó en 1997 el prototipo del System R. y comenzó a ofrecer un servidor de base de datos integrado: System/38 en 1980, seguido de SQL/DS para VSE y VM. Su versión inicial está estrechamente relacionada con el prototipo de investigación del System R, DB2 para MVSV1, que se lanzó en 1983. El objetivo de esta versión es ofrecer la simplicidad, la independencia de los datos y la productividad del usuario que promete este nuevo enfoque. DB2 para MVS proporcionó un potente soporte de procesamiento de transacciones en línea (OLTP) en 1988 y soporte de bases de datos distribuidas en 1989 y 1993 respectivamente. DB2 Universal Database 6.1, lanzado recientemente, es un modelo de Universal Database. Es el primer sistema de gestión de bases de datos relacionales multimedia con capacidades en línea y admite una variedad de plataformas, incluido Linux.

2. Oracle

Oracle, anteriormente conocido como SDL, fue fundado en 1977 por Larry Ellison y otros dos programadores. Desarrollan sus propios productos de éxito y los venden en grandes cantidades en el mercado. En 1979, Oracle lanzó el primer sistema comercial de gestión de bases de datos relacionales SQL. Oracle es uno de los primeros proveedores en desarrollar bases de datos relacionales y sus productos admiten la más amplia gama de plataformas de sistemas operativos. Actualmente, los productos de bases de datos relacionales de Oracle tienen la mayor cuota de mercado.

3.Informix

Informix se fundó en 1980 y ofrece productos de bases de datos relacionales profesionales para Unix y otros sistemas operativos abiertos. El nombre de la empresa Informix se deriva de la combinación de Information y Unix. El primer producto de base de datos relacional de Informix que realmente soporta el lenguaje SQL es Informix SE (StandardEngine). InformixSE era el principal producto de base de datos en el entorno de microcomputadoras Unix en ese momento. También es el primer producto de base de datos comercial portado a Linux.

4. Sybase

Sybase fue fundada en 1984. El nombre de la empresa "Sybase" proviene de la combinación de "sistema" y "base de datos". Bob Epstein, uno de los fundadores de Sybase, es el diseñador principal de Ingres University Edition (un producto modelo de base de datos relacional al mismo tiempo que System/R). El primer producto de base de datos relacional de la empresa fue Sybase SQLServer 1.0, lanzado en mayo de 1987. Sybase propuso por primera vez la idea de una arquitectura de base de datos cliente/servidor y fue el primero en implementarla en Sybase SQLServer.

5.SQL Server

En 1987, Microsoft cooperó con IBM para desarrollar OS/2, IBM incluyó OS/2Database Manager en su sistema OS/2 ExtendedEdition, pero la línea de productos de Microsoft. Todavía faltan productos de bases de datos. Por lo tanto, Microsoft puso su mirada en Sybase y firmó un acuerdo de cooperación con Sybase para utilizar la tecnología Sybase para desarrollar una base de datos relacional basada en la plataforma OS/2. En 1989, Microsoft lanzó la versión 1.0 de SQL Server.

6. Un sistema de base de datos

PostgreSQL es un objeto de software gratuito con funciones completas: un sistema de gestión de bases de datos relacionales (ORDBMS). Muchas de sus funciones son utilizadas por muchas bases de datos comerciales en la actualidad. predecesor. PostgreSQL comenzó originalmente como el proyecto Ingres de BSD. Las características de PostgreSQL cubren SQL-2/SQL-92 y SQL-3. En primer lugar, incluye soporte para los tipos de datos más completos del mundo. En segundo lugar, PostgreSQL es actualmente el único sistema de gestión de bases de datos de software gratuito que admite transacciones, subconsultas, sistemas de control paralelo de múltiples versiones y comprobaciones de integridad de datos.

7.mySQL

MySQL es un pequeño sistema de gestión de bases de datos relacionales desarrollado por la empresa sueca MySQL AB. Fue adquirida por Sun Company el 16 de junio de 2008. Actualmente, MySQL se utiliza ampliamente en sitios web pequeños y medianos en Internet. Debido a su pequeño tamaño, alta velocidad y bajo costo total de propiedad, especialmente de código abierto, muchos sitios web pequeños y medianos eligen MySQL como su base de datos para reducir el costo total de propiedad. El sitio web oficial de MySQL es www.mysql.com.

[Editar este párrafo] Historia del desarrollo de bases de datos

En menos de medio siglo, la tecnología de bases de datos ha formado una base teórica sólida y prácticas comerciales maduras y una amplia gama de campos de aplicación. han atraído cada vez a más investigadores a unirse. El nacimiento y desarrollo de las bases de datos ha supuesto una gran revolución en la gestión de la información informática. Durante los últimos 30 años, se han desarrollado y construido miles de bases de datos en el país y en el extranjero, convirtiéndose en la infraestructura para el trabajo, la producción y la vida diaria de empresas, departamentos e incluso individuos. Al mismo tiempo, con la expansión y profundización de las aplicaciones, el número y la escala de las bases de datos también están aumentando, y el campo de investigación de las bases de datos también se ha ampliado y profundizado enormemente. En los últimos 30 años, tres Turings informáticos (C.W. Bachman, E.F. Codd, J. Gray) han sido premiados en el campo de las bases de datos, lo que demuestra plenamente que las bases de datos son un campo lleno de vitalidad y espíritu innovador. Sigamos el desarrollo de las bases de datos a lo largo de la trayectoria histórica.

Una breve historia del desarrollo de las bases de datos

1. El nacimiento de la gestión de datos

La historia de las bases de datos se remonta a hace cincuenta años, cuando se inició la gestión de datos. fue muy simple. Los datos se procesan a través de una amplia gama de máquinas que clasifican, comparan y tabulan, procesan millones de tarjetas perforadas e imprimen los resultados en papel o fabrican nuevas tarjetas perforadas. La gestión de datos es el almacenamiento físico y el procesamiento de todas estas tarjetas perforadas. Sin embargo, en 1951, una computadora de Remington Rand Corporation llamada Univac I lanzó una unidad de cinta que podía ingresar cientos de registros en un segundo, lo que provocó una revolución en la gestión de datos.

1956 IBM produce la primera unidad de disco, el modelo 305 RAMAC. La unidad tiene 50 discos, cada uno de 2 pies de diámetro y puede almacenar 5 MB de datos. La mayor ventaja de utilizar discos es que se puede acceder a los datos de forma aleatoria, mientras que las tarjetas perforadas y las cintas sólo pueden acceder a los datos de forma secuencial.

1951: El sistema Univac utiliza cinta magnética y tarjetas perforadas para el almacenamiento de datos.

El germen de los sistemas de bases de datos apareció en los años 60. En ese momento, las computadoras comenzaron a usarse ampliamente en la gestión de datos, lo que planteaba requisitos cada vez más altos para el disfrute de los datos. Los sistemas de archivos tradicionales ya no pueden satisfacer las necesidades de las personas. Surgieron sistemas de gestión de bases de datos que pueden gestionar y compartir datos de manera uniforme. El modelo de datos es el núcleo y la base del sistema de base de datos, y varios software DBMS se basan en un determinado modelo de datos. Por tanto, según las características del modelo de datos, los sistemas de bases de datos tradicionales suelen dividirse en tres categorías: bases de datos en red, bases de datos jerárquicas y bases de datos relacionales.

Apareció el primer DBMS de red, que fue el IDS (Integrated DataStore) desarrollado con éxito por Bachman y otros de General Electric Company en Estados Unidos en 1961. En 1961, Charles Bachman de General Electric Company en los Estados Unidos desarrolló con éxito el primer DBMS de malla del mundo y el primer sistema de gestión de bases de datos: DataStore IDS integrado, que sentó las bases para las bases de datos de malla y se distribuyó y utilizó ampliamente en ese momento. IDS tiene las características de esquema y registro de datos. Pero solo se puede ejecutar en el host GE, la base de datos tiene un solo archivo y todas las tablas de la base de datos deben codificarse y generarse manualmente. Más tarde, el cliente de GE, BF Goodrich Chemical, tuvo que reescribir todo el sistema. El sistema reescrito se denominó Sistema Integrado de Gestión de Datos (IDMS).

El modelo de base de datos en malla puede modelar naturalmente elementos tanto jerárquicos como no jerárquicos. Antes de la llegada de las bases de datos relacionales, los DBMS de red se utilizaban más que los DBMS jerárquicos. En la historia del desarrollo de bases de datos, las bases de datos en red ocupan una posición importante.

Después del sistema de gestión de bases de datos jerárquicas se encuentra la base de datos en red. El sistema de base de datos jerárquico más famoso y típico es el IMS desarrollado por IBM en 1968.

(Sistema de Gestión de la Información), una base de datos jerárquica adecuada a su anfitrión. Este es el primer producto de programa de sistema de base de datos a gran escala desarrollado por IBM. Se produjo a fines de la década de 1960 y ahora se ha desarrollado para IMSV6, brindando soporte para funciones avanzadas como agrupación en clústeres, intercambio de datos de N vías y uso compartido de colas de mensajes. Este producto de base de datos de 30 años desempeña un nuevo papel en las aplicaciones de conectividad de aplicaciones WWW y de inteligencia empresarial de hoy.

En 1973, Cullinane Company (más tarde Cullinet Software Company) comenzó a vender una versión mejorada del IDMS de Goodrich y gradualmente se convirtió en la empresa de software más grande del mundo en ese momento.

2. El origen de las bases de datos relacionales

Las bases de datos en red y las bases de datos jerárquicas han resuelto bien los problemas de concentración e intercambio de datos, pero aún carecen de independencia y abstracción de los datos. Cuando los usuarios acceden a estas dos bases de datos, aún necesitan aclarar la estructura de almacenamiento de los datos e indicar la ruta de acceso. La aparición posterior de bases de datos relacionales resolvió muy bien estos problemas.

En 1970, el investigador de IBM Dr. E.F. Codd publicó un artículo titulado "Modelo relacional de datos para grandes bases de datos compartidas" en la revista "Communications" de ACM, proponiendo el concepto de modelo relacional y sentando las bases para el desarrollo teórico. Fundamentos del modelo relacional. Aunque Childs propuso el modelo orientado a conjuntos en 1968, este artículo generalmente se considera un hito que marcó una época en la historia de los sistemas de bases de datos. El deseo de Codd es construir un hermoso modelo de datos para la base de datos. Más tarde, Codd publicó muchos artículos uno tras otro, discutiendo la teoría del paradigma y 12 estándares para medir sistemas relacionales, y utilizó la teoría matemática para sentar las bases de las bases de datos relacionales. El modelo relacional tiene una base matemática estricta, es muy abstracto, simple y claro, y fácil de entender y usar.

Pero en ese momento, algunas personas creían que el modelo relacional era un modelo de datos idealizado y no era realista usarlo para implementar un DBMS. Estaban particularmente preocupados de que el rendimiento de la base de datos relacional fuera inaceptable. una seria amenaza para la estandarización en curso de las bases de datos en malla. Para promover la comprensión del problema, en 1974 la ACM dirigió un simposio en el que se llevó a cabo un debate entre las facciones a favor y en contra de las bases de datos relacionales, lideradas por Codd y Bachman respectivamente. Este famoso debate impulsó el desarrollo de bases de datos relacionales y finalmente las convirtió en la corriente principal de los productos de bases de datos modernos.

1969: Edgar F. "Ted" Codd inventa la base de datos relacional.

Después del establecimiento del modelo relacional en 1970, IBM incorporó más investigadores al laboratorio de San José para estudiar este proyecto, también conocido como System R. Su objetivo es demostrar la viabilidad de un DBMS relacional completamente funcional. El proyecto finalizó en 1979 con la finalización del primer DBMS que implementaba SQL. Sin embargo, el compromiso de IBM con IMS impidió que System R se pusiera en producción. No fue hasta 1980 que System R se lanzó oficialmente al mercado como producto. Hay tres razones para el lento ritmo de producción de IBM: IBM valora la credibilidad, la calidad y la minimización de fallas; IBM es una gran empresa con una enorme burocracia. IBM ya tiene productos de bases de datos jerárquicos, pero el personal relevante no está activo o incluso se opone.

Pero al mismo tiempo, en 1973, Michael Stonebraker y Eugene Wong de la Universidad de California, Berkeley, comenzaron a desarrollar su propia base de datos relacional utilizando la información publicada por System R. System Ingres, el proyecto Ingres. que desarrollaron fue finalmente comercializado por Oracle, Ingres y otros fabricantes en Silicon Valley. Más tarde, tanto System R como Ingres ganaron el "Premio al sistema de software" de 1988 otorgado por ACM.

De 65438 a 0976, Honeywell desarrolló el primer sistema de base de datos relacional comercial: el almacenamiento de datos relacionales Multics. Los sistemas de bases de datos relacionales se basan en álgebra relacional. Después de décadas de desarrollo y aplicación práctica, la tecnología se ha vuelto cada vez más madura y perfecta. Sus productos representativos incluyen Oracle, DB2 de IBM, MS SQL Server de Microsoft, Informix, ADABASD, etc.

3. Lenguaje de consulta estructurado (SQL)

En 1974, Ray Boyce y Don Chamberlin de IBM utilizaron una gramática de palabras clave simple para expresar la definición matemática de los 12 criterios de Codd para bases de datos relacionales. propuso SQL (lenguaje de consulta estructurado) como un hito. Las funciones del lenguaje SQL incluyen consulta, operación, definición y control. Es un lenguaje de base de datos relacional general y completo, y también es un lenguaje altamente no procedimental. Solo requiere que el usuario diga qué hacer sin decir cómo hacerlo. La integración SQL implementa todas las operaciones en el ciclo de vida de la base de datos. SQL proporciona una forma de interactuar con bases de datos relacionales que funciona con lenguajes de programación estándar. Desde su nacimiento, el lenguaje SQL se ha convertido en una piedra de toque para probar bases de datos relacionales. Cada cambio en el estándar del lenguaje SQL guía la dirección de desarrollo de los productos de bases de datos relacionales. Sin embargo, no fue hasta mediados de la década de 1970 que la teoría relacional se utilizó en las bases de datos comerciales Oracle y DB2 vía SQL.

En 1986, ANSI adoptó SQL como estándar americano para lenguajes de bases de datos relacionales y publicó el texto SQL estándar ese mismo año. Actualmente, existen tres versiones del estándar SQL. La definición básica de SQL es ANXIX 3135-89, "SQL mejorado con integridad del lenguaje de base de datos" [ANS 89], comúnmente conocido como SQL-89. SQL-89 define la definición de esquemas, las operaciones de datos y el procesamiento de transacciones.

SQL-89 y posterior ANXIX 3168-1989, "Lenguaje de Base de Datos - SQL Embebido" constituyeron la primera generación de estándares SQL.

ansix 3135-1992 [ANS 92] describe un SQL mejorado, ahora conocido como estándar SQL-92. SQL-92 incluye funciones mejoradas como manipulación de esquemas, creación dinámica y ejecución dinámica de sentencias SQL y soporte de entorno de red. Después de completar el estándar SQL-92, ANSI e ISO comenzaron a cooperar para desarrollar el estándar SQL3. La característica principal de SQL3 es su soporte para tipos de datos abstractos, lo que proporciona un estándar para una nueva generación de bases de datos relacionales de objetos.

1969: Edgar F. Codd inventa la base de datos relacional.

En 1976, IBM E.F. Codd publicó un artículo histórico "R System: Database Relational Theory", que introdujo la teoría de bases de datos relacionales y el lenguaje de consulta SQL. Ellison, el fundador de Oracle, leyó este artículo con mucha atención y quedó impactado por su contenido. Esta es la primera vez que alguien utiliza un enfoque integral y consistente para gestionar datos. El autor E.F. Codd publicó la teoría de las bases de datos relacionales hace diez años y desarrolló un prototipo en IBM Research. Este proyecto es un sistema R y el lenguaje utilizado para acceder a la tabla de datos es SQL. Después de leerlo, Ellison se dio cuenta de que se podían desarrollar sistemas de software basándose en esta investigación. En ese momento, la mayoría de la gente creía que las bases de datos relacionales no tendrían valor comercial. Ellison vio esto como su oportunidad: decidieron desarrollar un sistema de base de datos comercial de propósito general, Oracle, llamado así por un proyecto en el que habían trabajado para la CIA. Unos meses más tarde, desarrollaron Oracle 1.0. Pero es sólo un juguete. No pueden hacer nada más que completar consultas relacionales simples. Les llevó mucho tiempo hacer que Oracle estuviera disponible. El mantenimiento de las operaciones de la empresa se basa principalmente en la realización de algunos proyectos de gestión de bases de datos y trabajos de consultoría. Sin embargo, IBM no tiene planes de desarrollarlo. Hay muchas razones por las que Big Blue abandonó este producto valorado en decenas de miles de millones: los investigadores de IBM tienen en su mayoría formación académica y lo que más les interesa es la teoría, no los productos del mercado. Desde un punto de vista académico, los resultados de la investigación deben hacerse públicos y puedes hacerte famoso publicando artículos y pronunciando discursos. ¿por qué no? Otra razón principal fue que IBM tenía un producto de base de datos jerárquico, IMS, que se vendía bien en ese momento. Hasta 1985, IBM publicó la base de datos relacional DB 2 y Ellison se había convertido en multimillonario. Ellison comparó una vez la elección por parte de IBM del MS-DOS de Microsoft como sistema operativo del IBM-PC con: "el error más grave en la historia de los negocios mundiales, valorado en más de cientos de miles de millones de dólares, pero IBM publicó un artículo sobre el sistema R". no lo lanzó pronto. Los productos de bases de datos son probablemente los siguientes con más errores. La capitalización de mercado de Oracle alcanzó los 28 mil millones de dólares en 1996.

Actualmente existen tres versiones del estándar SQL. La definición básica de SQL es ANXIX 3135-89, "Lenguaje de base de datos - SQL con mejoras de integridad" [ans 89], comúnmente conocido como SQL-89. SQL-89 define la definición de esquemas, las operaciones de datos y el procesamiento de transacciones. SQL-89 y el posterior ANXIX 3168-1989 "Lenguaje de base de datos - SQL incorporado" constituyen la primera generación de estándares SQL. ansix 3135-1992 [ANS 92] describe un SQL mejorado, ahora conocido como estándar SQL-92. SQL-92 incluye funciones mejoradas como manipulación de esquemas, creación dinámica y ejecución dinámica de sentencias SQL y soporte de entorno de red. Después de completar el estándar SQL-92, ANSI e ISO comenzaron a cooperar para desarrollar el estándar SQL3. La característica principal de SQL3 es su soporte para tipos de datos abstractos, lo que proporciona un estándar para una nueva generación de bases de datos relacionales de objetos.

4. Base de datos orientada a objetos

Con el desarrollo de la tecnología de la información y el mercado, la gente ha descubierto que aunque la tecnología del sistema de base de datos relacional ha madurado, sus limitaciones también son obvias: Puede manejar muy bien los llamados "datos tabulares", pero no hace mucho con los tipos de datos cada vez más complejos que están surgiendo en el mundo de la tecnología. Desde la década de 1990, la comunidad técnica ha estado investigando y buscando nuevos sistemas de bases de datos. Sin embargo, la industria alguna vez estuvo bastante confundida en cuanto a la dirección de desarrollo del nuevo sistema de base de datos.

Afectadas por las tendencias tecnológicas de la época, la gente dedicaba mucha energía a la investigación de "sistemas de bases de datos orientados a objetos" o, para abreviar, "sistemas de bases de datos orientados a objetos". Vale la pena mencionar que la teoría de la base de datos relacional orientada a objetos propuesta por el profesor estadounidense Stonebraker alguna vez fue favorecida por la industria. En ese momento, Informix contrató al propio Stonebraker como director de tecnología por un alto precio.

Sin embargo, varios años de desarrollo han demostrado que el desarrollo del mercado de productos de sistemas de bases de datos relacionales orientados a objetos no es ideal. La mejora teórica no provocó una respuesta entusiasta del mercado. La razón principal de su fracaso es que la idea principal de diseño de este producto de base de datos es intentar reemplazar el sistema de base de datos existente con un nuevo sistema de base de datos. Para muchos clientes, especialmente los grandes, que han utilizado sistemas de bases de datos durante muchos años y han acumulado una gran cantidad de datos de trabajo, la enorme carga de trabajo y los gastos causados ​​por la conversión de datos antiguos y nuevos son insoportables. Además, los sistemas de bases de datos relacionales orientados a objetos hacen que los lenguajes de consulta sean extremadamente complejos, lo que hace que las tecnologías de aplicaciones complejas sean un camino desalentador tanto para los desarrolladores de bases de datos como para los clientes de aplicaciones.

5. Cambios en la gestión de datos

A finales de la década de 1960, surgió un nuevo software de base de datos: el sistema de soporte de decisiones (DSS), que fue diseñado para permitir a los gerentes tomar decisiones más efectivas. uso de la información de datos en el proceso. Así, en 1970 nació Express, la primera herramienta de análisis y procesamiento en línea. Siguieron otros sistemas de apoyo a la toma de decisiones, muchos de ellos desarrollados por los departamentos de TI de las empresas.

En 1985, el primer sistema de inteligencia empresarial fue desarrollado como Procter por Metaphor Computer Systems Ltd.; desarrollado por Gamble Corporation, se utilizó principalmente para conectar información de ventas y datos de escáneres minoristas. Ese mismo año, Pilot Software comenzó a vender Command Center, el primer sistema comercial de información de ejecución cliente/servidor. También este año, el proyecto Ingres de la Universidad de California, Berkeley, evolucionó a Postgres, con el objetivo de desarrollar una base de datos orientada a objetos. Al año siguiente, Graphael desarrolló el primer sistema de base de datos de objetos comerciales: Gbase.

En 1988, los investigadores de IBM Barry Devlin y Paul Murphy inventaron un nuevo término: almacén de información. Después de eso, los proveedores de TI comenzaron a construir almacenes de datos experimentales. En 1991, W.H. "Bill" Inmond publicó el libro "Cómo construir un almacén de datos", que realmente comenzó a poner en práctica el almacén de datos.

1991: W.H. "Bill" publicó "Building Data Warehouses" el lunes.

En la década de 1990, con la adopción generalizada de modelos informáticos cliente/servidor basados ​​en PC y paquetes de software empresarial, la transformación de la gestión de datos prácticamente se completó. La gestión de datos ya no se trata solo de almacenar y gestionar datos, sino que se ha transformado en varios métodos de gestión de datos que los usuarios necesitan. El repentino auge de Internet y la aparición del lenguaje XML han abierto un nuevo mundo para el desarrollo de sistemas de bases de datos.

[Editar este párrafo] Tendencias futuras de desarrollo de las bases de datos

Con la continua expansión del contenido de gestión de información, varios modelos de datos (modelo jerárquico, modelo de cuadrícula, modelo relacional, modelos orientados a objetos) , modelos semiestructurados, etc.), y han surgido una tras otra nuevas tecnologías (flujo de datos, gestión de datos web, minería de datos, etc.). Actualmente, cada pocos años, algunos expertos internacionales de alto nivel en bases de datos se reúnen para discutir el estado actual de la investigación de bases de datos, los problemas existentes y los nuevos enfoques tecnológicos que necesitan atención en el futuro. Varios informes similares en el pasado incluyen: 1989 Direcciones futuras en la investigación de DBMS - Participantes de Laguna Beach, 1990 Sistemas de bases de datos: logros y oportunidades, 1995 Base de datos 1991: Construyendo un almacén de datos publicado por W. H. Inmon.