¿Qué tipo de análisis se puede hacer en la base de datos del People's Daily?
La base de datos no se imagina, sino que se diseña según las necesidades del departamento comercial. Por lo tanto, antes de formar una base de datos, es necesario comprender completamente las necesidades comerciales. 1. Comprender completamente las necesidades comerciales. El análisis de requisitos es la base de todo el proceso de diseño y también es el paso más difícil y que requiere más tiempo. Durante este período, a través de la comunicación con los departamentos comerciales, entendemos las ideas y los procesos de trabajo de los usuarios. Mediante comunicaciones repetidas entre las dos partes, se formará un modelo de datos preliminar. Por supuesto, el modelo de datos en este momento no será el modelo final. Necesitamos comunicarnos con los usuarios y será revisado repetidamente en el futuro proceso de desarrollo del sistema de información. 2. Preste atención a las entradas y salidas. Al definir los requisitos de campos y tablas de la base de datos (entrada), primero debe comprender la fuente y el flujo de datos de la generación de datos, es decir, debe saber dónde se genera cada dato, dónde se representan los datos y en qué forma, y luego en base a ellos. en los informes proporcionados por el usuario o en los informes, consultas y vistas (salidas) diseñados por el usuario, determine qué tablas y campos son necesarios para respaldar estas salidas. 3. Cree un diccionario de datos y un diagrama ER. Los diagramas ER y los diccionarios de datos pueden dejar claro a cualquiera que conozca las bases de datos cómo obtener datos de la base de datos. Los diagramas ER son útiles para mostrar las relaciones entre tablas, mientras que el diccionario de datos muestra el propósito de cada campo y los posibles alias. Esto es absolutamente necesario para la documentación de expresiones SQL. Cabe señalar que el proceso de análisis e investigación de la demanda no siempre es fácil, porque el personal empresarial tiene diferentes comprensiones del negocio y la falta de conocimiento de la información afectará la calidad del análisis de la demanda. Para mejorar la calidad, todas las partes deberían dedicar más tiempo a comunicarse y comprenderse entre sí. Los departamentos comerciales deben cooperar plenamente con los profesionales comerciales de principio a fin, mientras que los desarrolladores deben intentar comunicarse en términos comerciales que los usuarios comprendan. por diferencias de comprensión. En tercer lugar, diseñe una estructura de tabla razonable
Por lo general, una estructura de tabla razonable reducirá la redundancia de datos y mejorará el rendimiento de la base de datos. El diseño de una estructura de tabla razonable debe seguir los dos puntos siguientes. 1. La estandarización y normalización de los datos ayudan a eliminar la redundancia de datos en la base de datos. La normalización se presenta en varias formas, pero generalmente se considera que 3NF (tercera forma normal) proporciona el mejor equilibrio entre rendimiento, escalabilidad e integridad de los datos. En pocas palabras, el principio de diseño de tablas de una base de datos que cumple con el estándar 3NF es que una tabla solo contiene sus propios atributos básicos. Cuando no son sus propios atributos, es necesario descomponerlos. Las relaciones entre tablas están conectadas por claves foráneas. Tiene las siguientes características: Existe un conjunto de tablas dedicadas a almacenar datos relacionados, conectadas por claves. Por ejemplo, la base de datos 3NF que almacena información de un solo pozo e información de producción diaria de pozos de petróleo tiene dos tablas: información básica de un solo pozo e información diaria de pozos de petróleo. La información diaria no contiene información de un solo pozo, pero se almacena un valor clave en la tabla que apunta a la fila que contiene la información del pozo de petróleo en la información básica de un solo pozo. Pero hay excepciones y, a veces, es necesario no estandarizar la forma en aras de la eficiencia. 2. Considere variaciones. Al diseñar su base de datos, considere qué campos de datos pueden cambiar en el futuro. Haga que la base de datos sea más escalable, reduciendo así el daño causado por futuros cambios de datos. Por ejemplo, para los campos de fecha, a veces consideraremos usar tipos de caracteres en lugar de tipos de fecha. Debido a que es probable que ocurran errores de datos al procesar campos de fecha, usamos tipos de caracteres. Hay muchos ejemplos de este tipo que deben considerarse al realizar el diseño preliminar. El diseño de una estructura de mesa no puede tener éxito la primera vez. Durante el desarrollo de los sistemas de información surgen dificultades para leer, ingresar o contar datos. Para solucionar estos problemas, se modificará la estructura de la tabla, se agregarán algunos campos o se modificarán los atributos de algunos campos. Este proceso es iterativo, así que no creas que tendrás éxito todo a la vez. Se recomienda utilizar herramientas de diseño especiales para realizar estas tareas. A menudo uso SYBASE PowerDesigner y, por supuesto, existen otras herramientas: ORACLE Designer 2000, ROSE, etc. Esto obtendrá el doble de resultado con la mitad de esfuerzo. Cuarto, elija un índice razonable
El índice es una de las formas más efectivas de obtener datos de la base de datos. El 95% de los problemas de rendimiento de las bases de datos se pueden resolver mediante tecnología de indexación. 1. Utilice un índice agrupado único en la clave primaria lógica, un índice desagrupado único en la clave del sistema (como procedimiento almacenado) y un índice desagrupado en cualquier columna de clave externa. Considere cuánto espacio tiene la base de datos, cómo se accede a las tablas y si esos accesos son principalmente para lectura y escritura. 2. La mayoría de las bases de datos indexan campos de clave principal creados automáticamente, pero no olvide indexar claves externas, que también son claves de uso común, como ejecutar una consulta para mostrar registros de la tabla principal y todas las tablas relacionadas. 3. No indexe campos grandes (con muchos caracteres), ya que esto hará que el índice ocupe demasiado espacio de almacenamiento. Como notas y mensajes de texto. 4. No indexe tablas pequeñas de uso común. No establezca ninguna clave para tablas de datos pequeñas, especialmente si tienen inserciones y eliminaciones frecuentes.
El mantenimiento del índice para estas operaciones de inserción y eliminación puede llevar más tiempo que escanear el espacio de la tabla. Por ejemplo, tabla de códigos o tabla de parámetros del sistema. 5. Garantizar la integridad de los datos
La integridad de los datos es muy importante y está relacionada con la precisión de los datos. Los datos inexactos no tienen valor, por lo que es importante garantizar la integridad de los datos. 1. Mecanismo de implementación de integridad: integridad de la entidad: integridad referencial de la clave principal: eliminación de datos en la tabla principal: eliminación en cascada; eliminación restrictiva; inserción de datos en una tabla principal vacía: inserción limitada de datos actualizados en la tabla principal: actualización en cascada; actualización restringida; DBMS nulo puede lograr la integridad referencial de dos maneras: mecanismo de implementación de clave externa (reglas de restricción) y mecanismo de implementación del activador integridad personalizada: no NULL; verificación de integridad de los activadores anteriores Los mecanismos sexuales requieren familiaridad y dominio, y son muy importante para la integridad de los datos. 2. Utilice restricciones en lugar de reglas comerciales para hacer cumplir la integridad de los datos y utilice el sistema de base de datos para lograr la integridad de los datos. Esto incluye no sólo la integridad lograda mediante la estandarización, sino también la funcionalidad de los datos. También puede agregar activadores al escribir datos para garantizar la exactitud de los datos. No depende de la capa empresarial para garantizar la integridad de los datos; no puede garantizar la integridad entre tablas (claves externas), por lo que no se puede imponer a otras reglas de integridad. 3. La integridad impuesta dirige la eliminación de datos dañinos antes de que ingresen a la base de datos. Activa la característica de integridad indicada por el sistema de base de datos. Esto mantiene los datos ordenados y obliga a los desarrolladores a dedicar más tiempo a manejar las condiciones de error. 4. Controle la integridad de los datos mediante la búsqueda La mejor manera de controlar la integridad de los datos es limitar la entrada del usuario. Siempre que sea posible, los usuarios deben recibir una lista clara de valores para elegir. Esto reducirá errores y malentendidos al escribir código y proporcionará coherencia en los datos. Algunos datos públicos son especialmente adecuados para la búsqueda: código de género, código de unidad, etc. 5. Una vista es una tabla virtual cuyo contenido está definido por sentencias SQL. Las vistas no solo pueden simplificar la comprensión de los datos por parte de los usuarios, sino también simplificar las operaciones de los usuarios. Las consultas utilizadas con frecuencia se pueden definir como vistas para que el usuario no tenga que especificar todas las condiciones para operaciones futuras cada vez. Además, los usuarios sólo pueden consultar y modificar los datos que pueden ver a través de las vistas. Otros datos de la base de datos no son visibles ni recuperables. Los comandos de autorización de la base de datos pueden limitar la recuperación de la base de datos de cada usuario a objetos de base de datos específicos y mejorar la seguridad de los datos. Conclusión de los verbos intransitivos
El funcionamiento eficiente de la base de datos requiere no sólo soporte técnico, sino también soporte de plataforma de hardware y red, así como una gestión eficaz por parte de los administradores de la base de datos. Este artículo solo explica cómo mejorar la eficiencia de la base de datos desde una perspectiva técnica, pero el soporte en otros aspectos también es indispensable en el proceso de solicitud real, especialmente en la gestión de la base de datos. La construcción de bases de datos es "tecnología de tres puntos, administración de siete puntos y datos básicos de doce puntos", por lo que debemos prestar atención a la administración de la base de datos, y solo cuando la administración esté implementada, la tecnología podrá desempeñar el papel que le corresponde.