Tema 15 · Modelado de datos, metodologías y reglas. Entidades, atributos y relaciones. Diseño de bases de datos. Diseño lógico y físico. El modelo lógico relacional. Normalización. | Técnicos Auxiliares de Informática del Estado

Lectura pública del tema

1. Modelado de datos, metodologías y reglas

🎯 Idea clave

El modelado de datos es un proceso estructurado para representar la información de un sistema de forma clara y eficiente.
Las metodologías de modelado proporcionan un marco ordenado para transformar requisitos en esquemas de bases de datos.
Las reglas de modelización garantizan la coherencia, integridad y calidad de los datos en entornos administrativos.
El diseño conceptual es la primera fase, donde se identifican entidades, atributos y relaciones sin considerar la implementación técnica.
La Administración General del Estado aplica estas técnicas para gestionar datos de oposiciones, recursos humanos y documentación administrativa.
El cumplimiento de estándares como el Esquema Nacional de Interoperabilidad (ENI) es esencial en el modelado de datos públicos.

📚 Desarrollo

Definición y propósito. El modelado de datos es una técnica que permite representar la información de un sistema mediante esquemas lógicos y estructurados. Su objetivo principal es facilitar la comprensión de los datos, sus relaciones y las reglas que los gobiernan, asegurando que el diseño final sea coherente, eficiente y adaptado a las necesidades del usuario. En la Administración General del Estado, este proceso es fundamental para garantizar la interoperabilidad y el cumplimiento normativo en sistemas críticos.

Fases del modelado. El proceso de modelado se divide en tres fases principales: conceptual, lógico y físico. El diseño conceptual se centra en identificar entidades, atributos y relaciones desde una perspectiva abstracta, sin considerar detalles técnicos. El diseño lógico transforma este modelo en estructuras de datos normalizadas, como tablas relacionales, mientras que el diseño físico optimiza la implementación en un sistema gestor de bases de datos concreto, incluyendo índices, tipos de datos y mecanismos de seguridad.

Metodologías aplicadas. En la AGE se emplean metodologías estandarizadas para el modelado de datos, como el Modelo Entidad-Relación (E-R). Este enfoque permite definir de manera gráfica y textual las entidades relevantes (por ejemplo, "Aspirante" o "Convocatoria"), sus atributos (como "DNI" o "fecha de publicación") y las relaciones entre ellas (por ejemplo, "un aspirante se presenta a una convocatoria"). La validación del modelo con usuarios y stakeholders es un paso clave para asegurar su alineación con los requisitos funcionales.

Reglas de modelización. Las reglas de modelización son directrices que garantizan la calidad y consistencia del diseño. Incluyen principios como la normalización (eliminación de redundancias mediante formas normales como 1FN, 2FN o 3FN), la definición de claves primarias y foráneas, y la restricción de accesos mediante vistas. Estas reglas son especialmente relevantes en entornos administrativos, donde la integridad de los datos es crítica para procesos como la gestión de oposiciones o el registro de personal.

Aplicación en la AGE. En la Administración General del Estado, el modelado de datos se aplica en sistemas como el Registro Central de Personal (RCP) o el Sistema de Información de Recursos Humanos (SIRH). Por ejemplo, en el ámbito de las oposiciones, se modelan entidades como "Prueba", "Calificación" o "Plaza", con relaciones que reflejan la estructura de los procesos selectivos. El Instituto Nacional de Administración Pública (INAP) sigue estas metodologías para gestionar datos de formación, documentación administrativa y procesos selectivos.

Cumplimiento normativo. Los modelos de datos en la AGE deben ajustarse a normativas como el Esquema Nacional de Interoperabilidad (ENI) y el Esquema Nacional de Seguridad (ENS). Esto implica el uso de estándares comunes para entidades como "Persona" o "Organización", así como formatos de intercambio como XML o JSON. La interoperabilidad entre sistemas, como el Portal de Transparencia o el SIRH, depende de un modelado coherente y alineado con estas directrices.

Herramientas y estándares. Para el modelado de datos, la AGE emplea herramientas como PowerDesigner, ERwin o Oracle SQL Developer Data Modeler. Estas aplicaciones permiten diseñar esquemas conceptuales y lógicos, generar documentación automática y validar el cumplimiento de reglas de normalización. Además, facilitan la colaboración entre equipos técnicos y usuarios finales, asegurando que el modelo refleje fielmente los requisitos del sistema.

🧩 Elementos esenciales

Modelado de datos: Proceso de representación estructurada de la información para garantizar coherencia y eficiencia en su gestión.
Diseño conceptual: Fase inicial donde se identifican entidades, atributos y relaciones sin considerar aspectos técnicos.
Diseño lógico: Transformación del modelo conceptual en estructuras normalizadas, como tablas relacionales con claves primarias y foráneas.
Diseño físico: Implementación concreta en un sistema gestor de bases de datos, incluyendo índices, tipos de datos y mecanismos de seguridad.
Modelo Entidad-Relación (E-R): Metodología gráfica para representar entidades, atributos y relaciones en un sistema de información.
Normalización: Proceso de eliminación de redundancias mediante formas normales (1FN, 2FN, 3FN, BCNF) para optimizar la estructura de los datos.
Claves primarias: Atributos que identifican de manera única cada registro en una tabla, como el "DNI" en una tabla de aspirantes.
Claves foráneas: Atributos que establecen relaciones entre tablas, como el "id_convocatoria" en una tabla de pruebas.
Vistas: Consultas predefinidas que restringen el acceso a datos sensibles, mejorando la seguridad y la usabilidad.
Interoperabilidad: Capacidad de los sistemas para intercambiar datos de manera eficiente, siguiendo estándares como el ENI.
Esquema Nacional de Interoperabilidad (ENI): Marco normativo que establece directrices para el intercambio de datos en la Administración Pública.
Herramientas de modelado: Aplicaciones como PowerDesigner o ERwin, utilizadas para diseñar y documentar esquemas de bases de datos.

🧠 Recuerda

El modelado de datos es un proceso en tres fases: conceptual, lógico y físico.
Las metodologías como el Modelo Entidad-Relación son fundamentales para estructurar la información.
La normalización elimina redundancias y mejora la eficiencia de las bases de datos.
Las claves primarias y foráneas son esenciales para establecer relaciones entre tablas.
En la AGE, el modelado de datos debe cumplir con normativas como el ENI y el ENS.
Herramientas como PowerDesigner facilitan el diseño y la documentación de esquemas de datos.
La validación con usuarios garantiza que el modelo refleje los requisitos funcionales del sistema.
La interoperabilidad entre sistemas depende de un modelado coherente y estandarizado.
El diseño físico incluye aspectos como índices, tipos de datos y mecanismos de seguridad.
Las vistas permiten restringir el acceso a datos sensibles en entornos administrativos.

2. Entidades, atributos y relaciones

🎯 Idea clave

Las entidades representan objetos del mundo real con existencia independiente en el modelo de datos.
Los atributos describen las propiedades o características que definen a cada entidad.
Las relaciones establecen vínculos semánticos entre dos o más entidades, reflejando interacciones reales.
La cardinalidad determina el número de instancias de una entidad que pueden asociarse con instancias de otra.
Cada entidad debe identificarse de forma única mediante un atributo clave o combinación de atributos.
El modelo entidad-relación es la base conceptual para el diseño de bases de datos en la Administración General del Estado.

📚 Desarrollo

Definición de entidad. Una entidad es cualquier objeto, persona, concepto o evento del mundo real que tiene relevancia para el sistema de información y puede distinguirse de otros objetos. En el ámbito de la Administración General del Estado, ejemplos de entidades incluyen empleados públicos, expedientes administrativos o unidades organizativas. Cada entidad se representa gráficamente mediante un rectángulo en los diagramas entidad-relación y debe poseer un identificador único que permita diferenciar cada instancia.

Atributos y sus tipos. Los atributos son las propiedades que describen las características de una entidad. Pueden clasificarse en varios tipos: simples (indivisibles, como el DNI), compuestos (formados por otros atributos, como la dirección postal), derivados (calculados a partir de otros atributos, como la edad a partir de la fecha de nacimiento) o multivaluados (que pueden tomar varios valores, como los idiomas que habla un empleado). Los atributos también se distinguen entre obligatorios (deben tener valor) y opcionales (pueden estar vacíos).

Claves primarias y únicas. Cada entidad debe contar con un atributo o conjunto de atributos que identifique de forma única cada instancia, denominado clave primaria. Esta clave no puede contener valores nulos ni duplicados. Además, pueden existir claves alternativas o únicas, que también identifican unívocamente una instancia pero no se utilizan como clave primaria. En la AGE, por ejemplo, el NIF de un empleado actúa como clave primaria en la entidad "Empleado Público".

Relaciones y su semántica. Las relaciones representan asociaciones entre entidades y se representan gráficamente mediante rombos en los diagramas entidad-relación. Cada relación tiene un nombre que describe su propósito (por ejemplo, "pertenece a" entre "Empleado" y "Unidad Organizativa"). Las relaciones pueden ser binarias (entre dos entidades), ternarias (entre tres) o de mayor grado, aunque las binarias son las más comunes. Además, las relaciones pueden tener atributos propios que describan características de la asociación.

Cardinalidad de las relaciones. La cardinalidad define el número de instancias de una entidad que pueden asociarse con instancias de otra entidad. Se expresa mediante notaciones como 1:1 (uno a uno), 1:N (uno a muchos) o M:N (muchos a muchos). Por ejemplo, en la relación "dirige" entre "Empleado" y "Unidad Organizativa", un empleado puede dirigir una sola unidad (cardinalidad 1:1), mientras que una unidad puede estar dirigida por un único empleado. La cardinalidad es fundamental para determinar las restricciones de integridad en el diseño lógico posterior.

Participación en relaciones. La participación de una entidad en una relación puede ser total (toda instancia de la entidad debe participar en la relación) o parcial (no todas las instancias participan). Por ejemplo, en la relación "trabaja en" entre "Empleado" y "Unidad Organizativa", la participación de "Empleado" es total, ya que todo empleado debe estar asignado a una unidad, mientras que la participación de "Unidad Organizativa" es parcial, pues puede existir una unidad sin empleados asignados.

Modelo entidad-relación en la AGE. En la Administración General del Estado, el modelo entidad-relación se aplica para diseñar bases de datos que gestionen información crítica, como registros de personal, expedientes administrativos o recursos materiales. Este modelo permite estructurar los datos de forma clara y coherente, facilitando su posterior transformación en tablas relacionales. Además, garantiza que los sistemas cumplan con los principios de interoperabilidad y seguridad establecidos en el Esquema Nacional de Interoperabilidad (ENI) y el Esquema Nacional de Seguridad (ENS).

🧩 Elementos esenciales

Entidad: Objeto del mundo real con existencia independiente, representado en el modelo de datos (ejemplo: "Expediente Administrativo").
Atributo simple: Propiedad indivisible de una entidad (ejemplo: "Número de expediente").
Atributo compuesto: Atributo formado por otros atributos (ejemplo: "Dirección" = calle + número + código postal).
Atributo derivado: Valor calculado a partir de otros atributos (ejemplo: "Antigüedad" a partir de la fecha de ingreso).
Clave primaria: Atributo o conjunto de atributos que identifica unívocamente cada instancia de una entidad.
Relación binaria: Asociación entre dos entidades (ejemplo: "Empleado trabaja en Unidad Organizativa").
Cardinalidad 1:N: Una instancia de una entidad se relaciona con muchas instancias de otra (ejemplo: "Un departamento tiene muchos empleados").
Cardinalidad M:N: Muchas instancias de una entidad se relacionan con muchas instancias de otra (ejemplo: "Empleados participan en proyectos").
Participación total: Toda instancia de una entidad debe participar en la relación (ejemplo: "Todo empleado debe pertenecer a una unidad").
Participación parcial: No todas las instancias de una entidad participan en la relación (ejemplo: "No todas las unidades tienen empleados asignados").
Atributo multivaluado: Atributo que puede tomar varios valores para una misma instancia (ejemplo: "Teléfonos de contacto" de un empleado).
Clave alternativa: Atributo que también identifica unívocamente una instancia pero no se usa como clave primaria.

🧠 Recuerda

Las entidades son los "objetos" del modelo, mientras que los atributos son sus "características".
La clave primaria es esencial para garantizar la unicidad de cada instancia en una entidad.
La cardinalidad define las reglas de asociación entre entidades y es clave para el diseño lógico.
Las relaciones pueden tener atributos propios que describan la asociación.
La participación total implica que todas las instancias de una entidad deben estar relacionadas.
Los atributos derivados no se almacenan físicamente, sino que se calculan cuando se necesitan.
El modelo entidad-relación es la base conceptual para el diseño de bases de datos relacionales.
En la AGE, este modelo se aplica para estructurar datos de personal, expedientes y recursos.
La correcta identificación de entidades, atributos y relaciones evita redundancias y mejora la integridad de los datos.
La notación gráfica (rectángulos para entidades, rombos para relaciones) facilita la comprensión del modelo.

3. Diseño de bases de datos

🎯 Idea clave

El diseño de bases de datos es un proceso estructurado que transforma requisitos funcionales en un modelo eficiente y seguro.
Comprende tres fases principales: diseño conceptual, lógico y físico, cada una con objetivos y técnicas específicas.
La validación con usuarios y stakeholders garantiza que el modelo refleje fielmente las necesidades del negocio.
La normalización elimina redundancias y mejora la integridad de los datos mediante reglas como 1FN, 2FN y 3FN.
En la Administración General del Estado, el diseño debe alinearse con estándares como el Esquema Nacional de Interoperabilidad (ENI) y el Esquema Nacional de Seguridad (ENS).
Las herramientas de modelado como PowerDesigner o ERwin facilitan la implementación de los diseños en entornos reales.

📚 Desarrollo

Proceso estructurado. El diseño de bases de datos es una metodología sistemática que parte de los requisitos del usuario para construir un sistema de almacenamiento eficiente. Este proceso se divide en tres etapas interconectadas: el diseño conceptual, el diseño lógico y el diseño físico. Cada fase aborda aspectos distintos, desde la abstracción inicial hasta la implementación técnica, asegurando que el resultado final sea funcional, seguro y escalable.

Diseño conceptual. En esta primera fase, se elabora un modelo entidad-relación (E-R) que representa las entidades, atributos y relaciones identificadas durante el análisis de requisitos. El objetivo es capturar la semántica del dominio sin considerar limitaciones técnicas. Se validan los diagramas con usuarios y stakeholders para confirmar que el modelo refleja correctamente las necesidades del negocio. Esta etapa es crítica, ya que errores aquí se propagan a las fases posteriores.

Diseño lógico. Aquí, el modelo conceptual se transforma en un esquema lógico basado en el modelo relacional. Se definen tablas, claves primarias y foráneas, y se aplican técnicas de normalización para eliminar redundancias y anomalías. La normalización sigue reglas como la Primera Forma Normal (1FN), Segunda Forma Normal (2FN) y Tercera Forma Normal (3FN), que garantizan la coherencia y eficiencia de los datos. Además, se crean vistas para restringir el acceso a información sensible, mejorando la seguridad.

Diseño físico. En esta fase, el esquema lógico se adapta a un sistema de gestión de bases de datos (SGBD) concreto. Se seleccionan tipos de datos, índices, estrategias de particionamiento y mecanismos de seguridad, como el cifrado o el control de acceso basado en roles (RBAC). También se implementan políticas de backup y planes de recuperación ante desastres. El diseño físico optimiza el rendimiento y la disponibilidad, considerando las limitaciones del hardware y el software.

Aplicación en la AGE. En la Administración General del Estado, el diseño de bases de datos debe cumplir con normativas como el Esquema Nacional de Interoperabilidad (ENI) y el Esquema Nacional de Seguridad (ENS). Estos marcos garantizan la interoperabilidad entre sistemas, la protección de datos personales y la seguridad de la información. Ejemplos de bases de datos en la AGE incluyen el Registro Central de Personal (RCP) o el Sistema de Información de Recursos Humanos (SIRH), que siguen los principios descritos.

Herramientas de soporte. Para implementar estos diseños, se utilizan herramientas especializadas como PowerDesigner, ERwin u Oracle SQL Developer Data Modeler. Estas plataformas permiten modelar, validar y documentar los esquemas de bases de datos, facilitando la colaboración entre equipos técnicos y no técnicos. Su uso es habitual en proyectos de la AGE para asegurar la calidad y el cumplimiento normativo.

Funciones del Cuerpo Técnico. Los Técnicos Auxiliares de Informática de la AGE participan activamente en el diseño de bases de datos. Sus responsabilidades incluyen colaborar en las tres fases del diseño, implementar medidas de seguridad, documentar los esquemas y optimizar el rendimiento. También deben garantizar el cumplimiento de los estándares ENI y ENS, así como resolver incidencias relacionadas con el acceso a los datos.

🧩 Elementos esenciales

Diseño conceptual: Fase inicial que define entidades, atributos y relaciones mediante modelos E-R, validados con usuarios.
Diseño lógico: Transformación del modelo conceptual en tablas relacionales, aplicando normalización (1FN, 2FN, 3FN) y definiendo vistas.
Diseño físico: Adaptación del esquema lógico a un SGBD concreto, incluyendo tipos de datos, índices, particionamiento y seguridad.
Normalización: Proceso para eliminar redundancias y anomalías, siguiendo reglas como 1FN (valores atómicos), 2FN (dependencia funcional completa) y 3FN (sin dependencias transitivas).
ENI y ENS: Estándares de la AGE que garantizan interoperabilidad y seguridad en el diseño de bases de datos.
Herramientas de modelado: Software como PowerDesigner o ERwin, utilizado para diseñar, validar y documentar esquemas.
Vistas: Mecanismo para restringir el acceso a datos sensibles, mejorando la seguridad y la privacidad.
Backup y recuperación: Políticas para garantizar la disponibilidad y la integridad de los datos ante fallos.
Claves primarias y foráneas: Elementos que establecen relaciones entre tablas y aseguran la integridad referencial.
Particionamiento: Técnica para dividir tablas grandes en segmentos más manejables, mejorando el rendimiento.
Cifrado y RBAC: Mecanismos de seguridad para proteger datos y controlar el acceso según roles.
Documentación: Registro detallado de los esquemas, esencial para el mantenimiento y la auditoría.

🧠 Recuerda

El diseño de bases de datos es un proceso en tres fases: conceptual, lógico y físico.
La normalización elimina redundancias y mejora la integridad de los datos.
En la AGE, el diseño debe cumplir con los estándares ENI y ENS.
Las herramientas de modelado facilitan la implementación y documentación de los esquemas.
Las vistas y el control de acceso son clave para la seguridad de los datos.
Los Técnicos Auxiliares de Informática participan en todas las fases del diseño.
La validación con usuarios es esencial para garantizar que el modelo refleje las necesidades reales.
El diseño físico optimiza el rendimiento y la disponibilidad del sistema.
La documentación es fundamental para el mantenimiento y la auditoría.
Los backups y los planes de recuperación son críticos para la continuidad del servicio.

4. Diseño lógico y físico

🎯 Idea clave

El diseño lógico transforma el modelo conceptual en estructuras relacionales, definiendo tablas, claves y relaciones.
La normalización elimina redundancias y garantiza la integridad de los datos mediante formas normales.
El diseño físico optimiza el rendimiento mediante índices, tipos de datos y particionamiento.
La seguridad en el diseño físico incluye cifrado, control de accesos y auditoría de operaciones.
Las bases de datos de la AGE deben cumplir con el Esquema Nacional de Interoperabilidad y el Esquema Nacional de Seguridad.
El Cuerpo de Técnicos Auxiliares de Informática colabora en la implementación y mantenimiento de estos diseños.

📚 Desarrollo

Transformación del modelo conceptual. El diseño lógico parte del modelo entidad-relación para convertirlo en un esquema relacional. Cada entidad se transforma en una tabla, y los atributos pasan a ser columnas. Las relaciones se implementan mediante claves foráneas, que establecen vínculos entre tablas. Este proceso garantiza que la estructura de datos sea coherente con los requisitos funcionales identificados en la fase conceptual.

Normalización de datos. La normalización es un paso crítico en el diseño lógico que busca eliminar redundancias y anomalías en los datos. Se aplican formas normales (1FN, 2FN, 3FN y BCNF) para asegurar que cada atributo dependa únicamente de la clave primaria. La primera forma normal exige atomicidad en los valores, mientras que la segunda y tercera eliminan dependencias parciales y transitivas, respectivamente.

Definición de claves y restricciones. En el diseño lógico, se definen claves primarias para identificar de forma única cada registro en una tabla. Las claves foráneas mantienen la integridad referencial entre tablas, evitando registros huérfanos. Además, se establecen restricciones como valores únicos, no nulos o rangos válidos para garantizar la calidad de los datos almacenados.

Diseño físico y optimización. El diseño físico se centra en la implementación concreta de la base de datos en un sistema gestor. Incluye la selección de tipos de datos adecuados, la creación de índices para acelerar consultas y el particionamiento de tablas para mejorar el rendimiento. También se definen estrategias de almacenamiento, como el uso de tablespaces o la compresión de datos, según las necesidades de la aplicación.

Seguridad y cumplimiento normativo. En el diseño físico, se implementan mecanismos de seguridad como el cifrado de datos sensibles, el control de accesos basado en roles (RBAC) y la auditoría de operaciones. Las bases de datos de la Administración General del Estado deben cumplir con el Esquema Nacional de Seguridad (ENS) y el Esquema Nacional de Interoperabilidad (ENI), lo que exige medidas específicas para proteger la confidencialidad, integridad y disponibilidad de la información.

Backups y recuperación. El diseño físico incluye la configuración de copias de seguridad periódicas y planes de recuperación ante desastres. Estos mecanismos aseguran la disponibilidad de los datos en caso de fallos hardware, errores humanos o ciberataques. La frecuencia y el tipo de backup (completo, incremental o diferencial) se determinan en función de la criticidad de la información.

Aplicación en la AGE. En la Administración General del Estado, el diseño lógico y físico se aplica en sistemas como el Registro Central de Personal o el Sistema de Información de Recursos Humanos. Estos sistemas deben garantizar la interoperabilidad con otros organismos, siguiendo estándares como XML o JSON para el intercambio de datos. El INAP, como responsable de la gestión documental y formativa, aplica estos principios en sus bases de datos.

🧩 Elementos esenciales

Diseño lógico: Transformación del modelo entidad-relación en tablas, claves primarias y foráneas.
Normalización: Proceso para eliminar redundancias mediante formas normales (1FN, 2FN, 3FN, BCNF).
Claves primarias: Atributos que identifican de forma única cada registro en una tabla.
Claves foráneas: Atributos que establecen relaciones entre tablas y garantizan la integridad referencial.
Índices: Estructuras que aceleran las consultas sobre columnas frecuentemente accedidas.
Tipos de datos: Selección adecuada para optimizar el almacenamiento y el rendimiento (ejemplo: VARCHAR, INTEGER, DATE).
Particionamiento: División de tablas grandes en segmentos más manejables para mejorar el rendimiento.
Cifrado: Protección de datos sensibles mediante algoritmos criptográficos.
RBAC: Control de accesos basado en roles para restringir permisos según funciones.
Auditoría: Registro de operaciones para detectar accesos no autorizados o modificaciones.
Backups: Copias de seguridad periódicas para garantizar la recuperación de datos.
Interoperabilidad: Cumplimiento de estándares como ENI y ENI para el intercambio de datos entre sistemas.

🧠 Recuerda

El diseño lógico convierte el modelo conceptual en estructuras relacionales.
La normalización evita redundancias y anomalías en los datos.
Las claves foráneas mantienen la integridad referencial entre tablas.
Los índices mejoran el rendimiento de las consultas frecuentes.
El diseño físico incluye la implementación concreta en un sistema gestor.
La seguridad en bases de datos exige cifrado, control de accesos y auditoría.
Las bases de datos de la AGE deben cumplir con el ENS y el ENI.
Los backups y planes de recuperación son esenciales para la disponibilidad de los datos.
El Cuerpo de Técnicos Auxiliares de Informática colabora en el diseño y mantenimiento de estas estructuras.
La interoperabilidad se garantiza mediante estándares como XML o JSON.

5. El modelo lógico relacional

🎯 Idea clave

El modelo lógico relacional es la base teórica para estructurar datos en tablas interconectadas mediante relaciones.
Se fundamenta en la teoría de conjuntos y el álgebra relacional propuesta por Edgar F. Codd.
Permite transformar el modelo conceptual (entidades y relaciones) en estructuras tabulares normalizadas.
Garantiza la integridad de los datos mediante restricciones como claves primarias y foráneas.
Facilita la eliminación de redundancias a través de procesos de normalización.
Es el estándar predominante en el diseño de bases de datos en la Administración General del Estado.

📚 Desarrollo

Base teórica. El modelo lógico relacional se sustenta en la teoría matemática de conjuntos y el álgebra relacional. Define los datos como relaciones (tablas) compuestas por tuplas (filas) y atributos (columnas), donde cada tupla representa una instancia única de una entidad. Esta estructura permite operaciones como selección, proyección, unión o producto cartesiano, fundamentales para la manipulación de datos.

Transformación desde el modelo conceptual. El paso del modelo entidad-relación al modelo relacional implica convertir entidades en tablas, atributos en columnas y relaciones en claves foráneas. Por ejemplo, una entidad Aspirante con atributos como DNI o nombre se transforma en una tabla ASPIRANTES con columnas equivalentes. Las relaciones muchos-a-muchos generan tablas intermedias para mantener la integridad referencial.

Claves y restricciones. Las claves primarias identifican de forma única cada tupla en una tabla, mientras que las claves foráneas establecen vínculos entre tablas. Estas restricciones son esenciales para garantizar la coherencia de los datos. En la AGE, por ejemplo, una tabla CONVOCATORIAS podría usar id_convocatoria como clave primaria, vinculada a la tabla PRUEBAS mediante una clave foránea.

Normalización. El modelo relacional incorpora técnicas de normalización para minimizar redundancias y anomalías en los datos. Las formas normales (1FN, 2FN, 3FN, BCNF) establecen reglas progresivas que descomponen tablas en estructuras más simples y eficientes. En el contexto de la AGE, esto es crítico para bases de datos como el Registro Central de Personal, donde la duplicación de datos podría generar inconsistencias.

Aplicación en la Administración. La AGE emplea el modelo relacional en sistemas como el Sistema de Información de Recursos Humanos (SIRH) o el Portal de Transparencia. Estos sistemas requieren estructuras normalizadas para gestionar grandes volúmenes de datos con precisión, cumpliendo además con normativas como el Esquema Nacional de Interoperabilidad (ENI) y el Esquema Nacional de Seguridad (ENS).

Herramientas y estándares. Para implementar el modelo relacional, se utilizan herramientas de modelado como PowerDesigner o ERwin, que permiten diseñar esquemas lógicos y físicos. En la AGE, estos diseños deben alinearse con estándares técnicos y normativos, asegurando la compatibilidad con otros sistemas y la protección de datos sensibles.

Ventajas operativas. La simplicidad y flexibilidad del modelo relacional lo hacen ideal para entornos administrativos. Permite consultas complejas mediante SQL, facilita la escalabilidad y garantiza la consistencia de los datos. En la gestión documental del INAP, por ejemplo, este modelo permite almacenar y recuperar eficientemente normativas, guías o materiales formativos.

🧩 Elementos esenciales

Relación: Estructura tabular compuesta por tuplas (filas) y atributos (columnas) que representa una entidad o asociación.
Tupla: Cada fila de una tabla, que contiene valores para cada atributo y representa una instancia única de una entidad.
Atributo: Columna de una tabla que define una propiedad de la entidad representada.
Clave primaria: Atributo o conjunto de atributos que identifica de forma única cada tupla en una tabla.
Clave foránea: Atributo o conjunto de atributos que referencia la clave primaria de otra tabla, estableciendo una relación entre ambas.
Integridad referencial: Restricción que garantiza que los valores de una clave foránea existan en la tabla referenciada.
Álgebra relacional: Conjunto de operaciones (unión, diferencia, producto cartesiano, etc.) que permiten manipular relaciones.
Normalización: Proceso de descomposición de tablas para eliminar redundancias y anomalías, siguiendo formas normales (1FN, 2FN, 3FN, BCNF).
Esquema lógico: Representación abstracta de las tablas, atributos, claves y relaciones de una base de datos relacional.
Vista: Consulta almacenada que restringe el acceso a datos sensibles o simplifica consultas complejas.
Índice: Estructura que acelera la recuperación de datos mediante la organización eficiente de los valores de un atributo.
Catálogo de Datos Comunes: Estándar de la AGE para definir modelos de datos interoperables entre sistemas administrativos.

🧠 Recuerda

El modelo relacional se basa en tablas, filas y columnas, con relaciones establecidas mediante claves.
Las claves primarias y foráneas son fundamentales para mantener la integridad de los datos.
La normalización evita redundancias y mejora la eficiencia de las bases de datos.
En la AGE, este modelo se aplica en sistemas críticos como el Registro Central de Personal.
Las herramientas de modelado como PowerDesigner facilitan la transformación del modelo conceptual al relacional.
El álgebra relacional permite realizar operaciones complejas sobre los datos.
La integridad referencial garantiza que las relaciones entre tablas sean coherentes.
Las vistas y los índices optimizan el acceso y la seguridad de los datos.
El modelo relacional es compatible con los estándares ENI y ENS de la Administración.
La desnormalización puede ser necesaria en casos específicos para mejorar el rendimiento.

6. Normalización

🎯 Idea clave

La normalización es un proceso sistemático para organizar los datos en una base de datos relacional y eliminar redundancias.
Su objetivo principal es garantizar la integridad de los datos y optimizar el almacenamiento.
Se basa en la aplicación de formas normales, que establecen reglas progresivas para estructurar las tablas.
Cada forma normal resuelve problemas específicos de dependencias entre atributos.
La normalización facilita el mantenimiento y la actualización de la base de datos al reducir anomalías.
En la Administración General del Estado, la normalización es clave para cumplir con estándares de interoperabilidad y seguridad.

📚 Desarrollo

Definición y propósito. La normalización es un conjunto de reglas y técnicas aplicadas durante el diseño lógico de una base de datos relacional. Su finalidad es estructurar las tablas de manera que se minimicen las redundancias y se eviten anomalías en las operaciones de inserción, actualización y eliminación. Este proceso mejora la eficiencia y la coherencia de los datos, aspectos críticos en entornos como la Administración General del Estado, donde la integridad de la información es prioritaria.

Formas normales. Las formas normales son niveles progresivos de normalización, cada uno con requisitos más estrictos que el anterior. Las más utilizadas son la Primera Forma Normal (1FN), la Segunda Forma Normal (2FN), la Tercera Forma Normal (3FN) y la Forma Normal de Boyce-Codd (BCNF). Cada una aborda problemas específicos, como la atomicidad de los atributos, las dependencias parciales o las dependencias transitivas, asegurando que los datos estén organizados de manera lógica y eficiente.

Primera Forma Normal (1FN). La 1FN establece que todos los atributos de una tabla deben contener valores atómicos, es decir, indivisibles. Además, cada registro debe ser único y no debe haber grupos repetitivos de datos. Por ejemplo, en una tabla de aspirantes a oposiciones, el atributo "teléfonos" no podría contener múltiples números separados por comas, sino que cada número debería almacenarse en una fila independiente o en una tabla relacionada.

Segunda Forma Normal (2FN). Para cumplir con la 2FN, una tabla debe estar en 1FN y, además, todos sus atributos no clave deben depender completamente de la clave primaria. Esto significa que no puede haber dependencias parciales, donde un atributo dependa solo de una parte de una clave compuesta. En el contexto de la AGE, esto es relevante en tablas como "Calificaciones", donde la nota debe depender tanto del aspirante como de la prueba, y no solo de uno de ellos.

Tercera Forma Normal (3FN). La 3FN exige que una tabla esté en 2FN y que no existan dependencias transitivas entre sus atributos. Es decir, ningún atributo no clave debe depender de otro atributo no clave. Por ejemplo, en una tabla de convocatorias, si el "nombre del tribunal" depende del "código del tribunal", y este a su vez depende de la clave primaria, se estaría incumpliendo la 3FN. La solución sería separar estos atributos en tablas distintas.

Forma Normal de Boyce-Codd (BCNF). La BCNF es una versión más estricta de la 3FN y se aplica cuando una tabla tiene múltiples claves candidatas superpuestas. En estos casos, la BCNF garantiza que todas las dependencias funcionales sean dependencias de clave, eliminando redundancias más complejas. Aunque menos común en entornos administrativos, su aplicación puede ser necesaria en sistemas con estructuras de datos muy interrelacionadas.

Aplicación en la AGE. En la Administración General del Estado, la normalización es fundamental para garantizar la calidad de los datos en sistemas como el Registro Central de Personal o el Sistema de Información de Recursos Humanos. Además, facilita el cumplimiento de normativas como el Esquema Nacional de Interoperabilidad (ENI) y el Esquema Nacional de Seguridad (ENS), que exigen estructuras de datos coherentes y seguras. La normalización también simplifica la integración con otros sistemas, como el Portal de Transparencia, al estandarizar el formato de los datos.

Herramientas y metodologías. Durante el diseño lógico de una base de datos, se utilizan herramientas como PowerDesigner o ERwin para aplicar las reglas de normalización. Estas herramientas permiten visualizar las dependencias entre atributos y automatizar parte del proceso, asegurando que el modelo resultante cumpla con las formas normales requeridas. En la AGE, este proceso se complementa con la validación por parte de usuarios y stakeholders para garantizar que el diseño se ajusta a las necesidades reales.

🧩 Elementos esenciales

Primera Forma Normal (1FN): Requiere que todos los atributos sean atómicos y que no existan grupos repetitivos.
Segunda Forma Normal (2FN): Elimina dependencias parciales, asegurando que todos los atributos no clave dependan de la clave primaria completa.
Tercera Forma Normal (3FN): Elimina dependencias transitivas entre atributos no clave.
Forma Normal de Boyce-Codd (BCNF): Versión más estricta de la 3FN, aplicable en tablas con múltiples claves candidatas.
Dependencia funcional: Relación en la que un atributo determina el valor de otro.
Dependencia parcial: Ocurre cuando un atributo depende solo de una parte de una clave compuesta.
Dependencia transitiva: Situación en la que un atributo no clave depende de otro atributo no clave.
Anomalías de datos: Problemas como redundancias, inconsistencias o pérdidas de información que la normalización busca evitar.
Clave primaria: Atributo o conjunto de atributos que identifica de manera única cada registro en una tabla.
Clave candidata: Atributo o conjunto de atributos que podría ser clave primaria.
Herramientas de modelado: Software como PowerDesigner o ERwin, utilizado para aplicar y visualizar la normalización.
Interoperabilidad: Capacidad de los sistemas para compartir datos, facilitada por estructuras normalizadas.

🧠 Recuerda

La normalización es un proceso progresivo que se aplica mediante formas normales.
Cada forma normal resuelve un tipo específico de problema en la estructura de los datos.
La 1FN garantiza que los atributos sean atómicos y no haya grupos repetitivos.
La 2FN elimina dependencias parciales en tablas con claves compuestas.
La 3FN evita dependencias transitivas entre atributos no clave.
La BCNF es una versión más estricta de la 3FN, aplicable en casos complejos.
La normalización reduce redundancias y mejora la integridad de los datos.
En la AGE, la normalización es clave para cumplir con el ENI y el ENS.
Herramientas como PowerDesigner facilitan la aplicación de las formas normales.
Un diseño normalizado simplifica el mantenimiento y la actualización de la base de datos.

Tema anterior Tema 14. Sistemas de gestión de bases de datos relacionales, orientados a objetos y NoSQL: características y componentes. Tema siguiente Tema 16. Lenguajes de programación. Representación de tipos de datos. Operadores. Instrucciones condicionales. Bucles y recursividad. Procedimientos, funciones y parámetros. Vectores y registros. Estructura de un programa.

Tema 15. Modelado de datos, metodologías y reglas. Entidades, atributos y relaciones. Diseño de bases de datos. Diseño lógico y físico. El modelo lógico relacional. Normalización.

Lectura pública del tema

1. Modelado de datos, metodologías y reglas

1. Modelado de datos, metodologías y reglas

🎯 Idea clave

📚 Desarrollo

🧩 Elementos esenciales

🧠 Recuerda

2. Entidades, atributos y relaciones

2. Entidades, atributos y relaciones

🎯 Idea clave

📚 Desarrollo

🧩 Elementos esenciales

🧠 Recuerda

3. Diseño de bases de datos

3. Diseño de bases de datos

🎯 Idea clave

📚 Desarrollo

🧩 Elementos esenciales

🧠 Recuerda

4. Diseño lógico y físico

4. Diseño lógico y físico

🎯 Idea clave

📚 Desarrollo

🧩 Elementos esenciales

🧠 Recuerda

5. El modelo lógico relacional

5. El modelo lógico relacional

🎯 Idea clave

📚 Desarrollo

🧩 Elementos esenciales

🧠 Recuerda

6. Normalización

6. Normalización

🎯 Idea clave

📚 Desarrollo

🧩 Elementos esenciales

🧠 Recuerda

Prueba la demo si quieres ver el resto

Una demo pensada para decidir con criterio

Formato real de estudio

Temario y simulacros

Acceso por correo

Solicita ya tu acceso Demo

Preguntas clave sobre Técnicos Auxiliares de Informática del Estado y OPOAGE