# Teoria del Diseño Relacional

## Parte 1: Formas Normales 

Criterios de un buen diseño relacional
- Preservacion de la informacion
- Redundancia minima

Cuando se parte de un correcto diseño conceptual y se hace un correcto pasaje al modelo logico, se obtiene un esquema sin redundancia y se preserva toda la informacion del mundo real que se queria modelar.

Pero, como verificamos un esquema relacional? Como corregimos un esquema que fue mal diseñado?

La <b>teoria del diseño relacional</b> formaliza estos requisitos a traves de las <b>formas normales</b>.

### Dependencia funcional

Dada una relacion $R(A)$, una <b>dependencia funcional</b> X -> Y, con X, Y incluidos en A es una restriccion sobre las posibles tuplas de R que implica que dos tuplas con igual valor del conjunto de atributos X deben tambien tener igual valor del conjunto de atributos Y.

\begin{equation}
\large \forall_{s, t \in  R} : s[X] = t[X] \rightarrow s[Y] = t[Y]
\end{equation}

La dependencia funcional $X \rightarrow Y$ implica que hay una relacion funcional entre los valores de X y los de Y dentro de la base de datos.

Cuando $Y \subset X$ decimos que $X \rightarrow Y$ es trivial.

Las dependencias funcionales se definen a partir de la semantica de los datos. No es posible inferirlas viendo los datos.

### Formas Normales

Las <b>formas normales</b> son una serie de estructuras con las que un esquema de base de datos puede cumplir o no.

Las formas normales clasicas son:
- Primera forma normal <b>(1FN)</b> (E. Codd, 1970)
- Segunda forma normal <b>(2FN)</b> (E. Codd, 1971)
- Tercera forma normal <b>(3FN)</b> (E. Codd, 1971)
- Forma normal Boyce-Codd <b>(FNBC)</b> (R. Boyce, E. Codd, 1974)
- Cuarta forma normal <b>(4FN)</b> (R. Fagin, 1977)
- Quita forma normal <b>(5FN)</b> (R. Fagin, 1979)

Cada forma normal es mas fuerte que las anteriores, en el orden en que las hemos introducido. Entonces:

<b>S</b> esta en <b>5FN</b> $\rightarrow$ <b>S</b> esta en <b>4FN</b> $\rightarrow$ <b>S</b> esta en <b>3FN</b> $\rightarrow$ <b>S</b> esta en <b>2FN</b> $\rightarrow$ <b>S</b> esta en <b>1FN</b>

En 1972 E. Codd propuso el concepto de <b>normalizacion</b> como el proceso a traves del cual se convierte un esquema de base de datos en uno equivalente (i.e que preserva toda la informacion) y que cumple con una determinada forma normal.

El objetivo es:
- Preservar la informacion
- Eliminar la redundancia
- Evitar las anomalias de ABM

<hr>

### Primera forma normal (1FN) 

Decimos que un esquema de base de datos relacional esta en <b>primera forma normal (1FN)</b> cuando los dominios de todos sus atributos solo permiten valores atomicos (es decir, indivisibles) y monovaluados. Actualmente, se considera que en el modelo relacional todos los atributos deben ser monovaluados y atomicos. Con este criterio, todo esquema relacional esta ya en 1FN. Pero, como resolvemos si este no fuera el caso?

<b>Situacion</b>:

nombre_profesor|mail
-|-
Juan Gomes|{jgomez@udbc.com.ar, jgomez94@mibase.com}
Roberta Casas|{rcasas@udbc.com.ar, rcasas@gmail.com}
Irene Adler|{iadler@udbc.com.ar}

<b>Solucion 1</b>: Colocar un mail por tupla y repetir el nombre del profesor

nombre_profesor|mail
-|-
Juan Gomes|jgomez@udbc.com.ar
Juan Gomes|jgomez94@mibase.com
Roberta Casas|rcasas@udbc.com.ar
Roberta Casas|rcasas@gmail.com
Irene Adler|iadler@udbc.com.ar

<b>Solucion 2</b>: Suponer un maximo posible M de mails y tener M atributos distintos reservados a tal fin. Para profesores que tienen menos de M mails, quedaran valores nulos.

nombre_profesor|mail1|mail2
-|-|-
Juan Gomes|jgomez@udbc.com.ar|jgomez94@mibase.com
Roberta Casas|rcasas@udbc.com.ar|rcasas@gmail.com}
Irene Adler|iadler@udbc.com.ar|NULL

<hr>

### Segunda forma normal (2FN) 

nombre_depto|nombre_profesor|asignatura
-|-|-
Fisica|Juan Gomez|Fisica 1
Fisica|Roberto Casas|Fisica 2
Fisica|Juan Gomez|Fisica 3
Matematica|Roberta Casas|Topologia
Matematica|Irene Adler|Algebra

Identifiquemos las dependencias funcionales semanticas:

<b>asignatura -> nombre_dpto</b>

Existen otras dependencias funcionales que pueden deducirse de la anterior:

<b>{nombre_profesor, asignatura} -> nombre_depto</b>

Y otras que son <b>triviales</b>:

<b>{nombre_profesor, asignatura} -> asignatura</b>

Identifiquemos ahora las claves candidatas de la relacion:

CK = {nombre_profesor, asignatura}

Luego esta es la unica clave candidata, y por lo tanto sera la clave primaria.

Observemos que nombre_depto no depende de la clave primaria completa, sino solo de una parte. Decimos que la dependencia PK -> nombre_depto es una dependencia funcional parcial.