Historia bases de datos

Boletín de Política IInformáticaNúm. 6, 2003 Boletín de Política nformática Núm. 6, 2003

El modelo relacional de bases de datos

Javier Quiroz

El contenido entero de una base de datos relacional se representa por una y sola una forma, a saber: como valores de atributos en tuplas dentro de relaciones. E. F. Codd A su memoria: honor a quien honor merece…
53

El 18 de abril del 2003falleció el Dr. Edgar Frank Codd, a la edad de 79 años víctima de un ataque al corazón. Aún si usted nunca escuchó o supo del Dr. Codd, lo más probable que a diario utilice cotidianamente tecnología derivada de las teorías de este brillante matemático y científico de la computación. Nacido en Inglaterra, la mayor parte de su vida la pasó en los Estados Unidos trabajando y desarrollando sus ideas queculminaron en una serie de informes técnicos acerca de una nueva manera de organizar y acceder los datos. A partir de estos trabajos publicó en 1970 el artículo A Relational Model of Data for Large Shared Data Banks, algo así como Un modelo de datos relacional para grandes bancos de datos compartidos. Codd propuso que los sistemas de bases de datos deberían presentarse a los usuarios con una visiónde los datos organizados en estructuras llamadas relaciones, definidas como conjuntos de tuplas (filas) y no como series o secuencias de objetos, con lo que el orden no es importante. Por tanto, detrás de una relación puede haber cualquier estructura de datos compleja que permita una respuesta rápida a una variedad de consultas. Codd hizo entonces El autor es Coordinador de Sistemas de Informacióny Bases de Datos, Dirección de Informática de la Dirección General de Estadística, INEGI.

Boletín de Política Informática Núm. 6, 2003

énfasis en que el usuario de un sistema relacional sólo debía preocuparse por el qué consultar y no el cómo de las estructuras de almacenamiento (lo que ahora se conoce como modelo físico). Aún hoy se consideran validas sus afirmaciones, especialmente: “Losusuarios futuros de grandes bancos de datos deben ser protegidos de tener que saber cómo están organizados los datos en la máquina (la representación interna. […] Las actividades de los usuarios en sus terminales y la mayoría de programas de aplicación no debería verse afectados cuando se cambia la representación interna de los datos o incluso cuando se cambian algunos aspectos de larepresentación externa. Se necesitará cambiar la representación de los datos a menudo como resultado de los cambios en el tráfico de las consultas, actualizaciones e informes y como consecuencia del crecimiento natural en los tipos de información almacenada.” Puede parecer extraño, pero las ideas de Codd no fueron “recibidas con los brazos abiertos” en IBM, donde realizaba sus labores de investigación, segúnafirma Harlwood Kolsky, un físico y antiguo compañero de Codd; “fue un enfoque revolucionario”, recuerda Kolsky. El nuevo enfoque de Codd, basado en la teoría matemática de conjuntos, no tuvo eco inmediato en IBM, que prefirió a IMS, un producto al que se le había invertido una fuerte cantidad de esfuerzo y dinero. Un grupo de la Universidad de Berkeley en California, lidereado por MichaelStonebreaker, creyó en la idea del modelo relacional y obtuvo financiamiento para desarrollar un sistema, el Ingres, cuya primera versión se presentó en 1974 y fue el primer manejador relacional de bases de datos funcional. Esto tuvo como consecuencia que IBM reaccionara poniendo en marcha otro sistema relacional, el System R con características de multiusuario y un lenguaje de consulta estructurado, elSEQUEL que luego pasaría a llamarse SQL (Structured Query Language). Para entonces Larry Ellison, un empresario del Valle del Silicón, había tomado ventajas de los escritos de Codd para crear un nuevo producto y una nueva empresa que hasta la fecha se conoce como Oracle. En 1985 Codd publicó sus famosas 12 reglas sobre el modelo relacional de bases de datos, un resumen de sus características…