Bases de datos
relacionales
Aunque, como ya hemos visto, existen diversos tipos de bases de
datos, las más utilizadas con diferencia en la actualidad son las relacionales,
que han demostrado su idoneidad en la mayor parte de situaciones. Estas son
también las que encontraremos en el ámbito SIG, y resulta por ello necesario
añadir algunas nociones adicionales sobre ellas para la correcta comprensión no
solo de este capítulo, sino también de otros posteriores que desarrollan temas
relacionados.
El modelo relacional fue desarrollado en 1969 por Ted Codd y publicado
un año después en un artículo ya clásico [Codd1969ACM],
y consiste básicamente en un conjunto de relaciones tabulares. Estas relaciones
son tan importantes como los propios datos (las tablas, en este caso), y
constituyen una idea central en el modelo relacional, de ahí su denominación.
La característica principales que ha convertido a este modelo de base de datos
en el más popular en la actualidad es su gran simplicidad, la cual
indirectamente le dota de una gran potencia. Paralelamente, el modelo
relacional se sustenta en unos fundamentos matemáticos sólidos y sus ideas
pueden expresarse mediante conceptos de la teoría de conjuntos, lo que
posibilita un análisis formal del mismo.
Además de las denominaciones habituales de tabla, fila y columna,
existe una terminología específica empleada al referirse a las bases de datos
relacionales. Así, en el modelo relacional los datos se organizan en tablas
bidimensionales, cada una de ellas con información relativa a un
determinada entidad. La tabla en sí se conoce como relación,
ya que recoge la relación existente entre sus elementos, y constituye así el
eje central del modelo relacional. Dentro de la tabla, los datos están
organizados a su vez en filas y columnas. Las columnas representan los
distintos atributos asociados a la entidad, mientras que las
filas conforman los distintos registros. Una fila se forma con un
conjunto de atributos,
constituyendo una tupla.
El esquema de la relación está formado por los
nombres de los atributos y un dominio asociado a estos, que
delimita el rango de valores posibles para cada atributo. El dominio especifica
el tipo de dato a contener en cada columna. Por ejemplo, si se recoge un nombre
el atributo será de tipo alfanumérico, mientras que si el atributo es un conteo
deberá ser de tipo entero. Además de los tipos habituales (fechas, cadenas de
texto, valores reales$. Puede emplearse también la denominación menos formal
de número decimal o bien valor de coma flotante,
esta última más común en el ámbito informático y referida a la forma de
almacenamiento de este tipo de valores.}, valores enteros, etc.) pueden
emplearse en ciertas bases de datos valores más complejos. Esto es de especial
interés en el caso de los SIG, ya que permite utilizar geometrías como un tipo
de datos más, con la utilidad que esto tiene a la hora de almacenar datos
espaciales. El esquema de la relación se recoge en la primera fila de la tabla,
conocida como cabecera. El número de filas de la tabla sin contar
la cabecera (es decir, el número de tuplas) se conoce como cardinalidad.
Las relaciones son, por tanto, un conjunto de tuplas asociadas a
un esquema. En una relación, tanto el orden de las filas como el de las columnas
son irrelevantes (exceptuando la cabecera, que no es un tupla como tal, sino
que define el esquema como hemos visto), pero es importante que cada atributo
sea del tipo correspondiente a la columna a la que pertenece. Es decir, que sea
coherente con el esquema.
No hay comentarios:
Publicar un comentario