Bases de datos: Modelos de datos
Los modelos de datos aportan la base conceptual para diseñar aplicaciones que hacen un uso intensivo de datos, así como la base formal para las herramientas y técnicas empleadas en el desarrollo y uso de sistemas de información. Con respecto al diseño de bases de datos, el modelado de datos puede ser descrito así (Brodie 1984:20): "dados los requerimientos de información y proceso de una aplicación de uso intensivo de datos (por ejemplo, un sistema de información), construir una representación de la aplicación que capture las propiedades estáticas y dinámicas requeridas para dar soporte a los procesos deseados (por ejemplo, transacciones y consultas). Además de capturar las necesidades dadas en el momento de la etapa de diseño, la representación debe ser capaz de dar cabida a eventuales futuros requerimientos".
Los modelos de datos aportan la base conceptual para diseñar aplicaciones que hacen un uso intensivo de datos, así como la base formal para las herramientas y técnicas empleadas en el desarrollo y uso de sistemas de información. Con respecto al diseño de bases de datos, el modelado de datos puede ser descrito así (Brodie 1984:20): "dados los requerimientos de información y proceso de una aplicación de uso intensivo de datos (por ejemplo, un sistema de información), construir una representación de la aplicación que capture las propiedades estáticas y dinámicas requeridas para dar soporte a los procesos deseados (por ejemplo, transacciones y consultas). Además de capturar las necesidades dadas en el momento de la etapa de diseño, la representación debe ser capaz de dar cabida a eventuales futuros requerimientos".
Un modelo de datos es por tanto una colección de
conceptos bien definidos matemáticamente que ayudan a expresar las propiedades estáticas
y dinámicas de una aplicación con un uso de datos intensivo. Conceptualmente, una
aplicación puede ser caracterizada por:
- Propiedades estáticas: entidades (u objetos), propiedades (o atributos)12 de esas entidades, y relaciones entre esas entidades.
- Propiedades dinámicas: operaciones sobre entidades, sobre propiedades o relaciones entre operaciones.
- Reglas de integridad sobre las entidades y las operaciones (por ejemplo, transacciones).
Así, un modelo de datos se distingue de otro por el
tratamiento que da a estas tres categorías. El resultado de un modelado de datos es una
representación que tiene dos componentes: las propiedades estáticas se definen en un
esquema y las propiedades dinámicas se definen como especificaciones de transacciones,
consultas e informes. Un esquema consiste en una definición de todos los tipos de
objetos de la aplicación, incluyendo sus atributos, relaciones y restricciones
estáticas. Correspondientemente, existirá un repositorio de información, la base de
datos, que es una instancia del esquema. Un determinado tipo de procesos sólo
necesita acceder a un subconjunto predeterminado de entidades definidas en un esquema, por
lo que este tipo de procesos puede requerir sólo un subconjunto de las propiedades
estáticas del esquema general. A este subconjunto de propiedades estáticas se le
denomina subesquema. Una transacción consiste en diversas operaciones o
acciones sobre las entidades de esquema o subesquema. Una consulta se puede
expresar como una expresión lógica sobre los objetos y relaciones definidos en el
esquema; una consulta identifica un subconjunto de la base de datos. Las herramientas que
se usan para realizar las operaciones de definición de las propiedades estáticas y
dinámicas de la base de datos son los lenguajes de definición y manipulación de datos
(DDL, DML), junto con los lenguajes de consulta (QL) que ya hemos mencionado.
La investigación moderna sobre modelos de datos se ha
centrado en los aspectos lógicos de las bases de datos y sobre los conceptos,
herramientas y técnicas para el diseño de las mismas (Brodie 1984). Aspectos relativos a la
implementación de los modelos, tales como velocidad de ejecución, concurrencia,
integridad física y arquitecturas no son factores relevantes en el estadio de análisis
de modelos de datos. La investigación más temprana sobre modelos de datos sí estaba
más centrada en los aspectos de representación física. Cuando hablamos de modelos de
datos clásicos, nos estamos refiriendo a la segunda de las generaciones de modelos de
datos. Brodie (1984) distingue cuatro
generaciones:
- Modelos de datos primitivos (orientados al fichero).
- Modelos de datos clásicos.
- Modelos de datos semánticos.
- Modelos de datos de propósito específico (orientados a la aplicación).
Los modelos de datos primitivos estaban absolutamente
orientados al fichero: las entidades se representan en registros (divididos en campos, que
representan su propiedades), que se agrupan en ficheros. Las relaciones entre entidades
son únicamente aquellas que pueden ser representadas usando directorios, por ejemplo
índices y listas invertidas. Un ejemplo de DBMS comercial de fichero, concretamente del
tipo "lista invertida", es el CA-DATACOMB de Computer Associates International.
Los modelos de datos clásicos son tres: el jerárquico, el
de red y el relacional.