# Álgebra relacional

A álgebra relacional é uma coleção de operadores que tomam relações como seus operandos e retornam uma relação como seu resultado.

In [1]:
# Utilizaremos a lib csvms em nossos exemplos
from csvms.table import Table

### Conjunto de dados

Relação **A**

|DeptId|DeptName|Manager|
|------|--------|-------|
|1|Finance|George|
|2|Sales|Charles|


Relação **B**

|DeptId|DeptName|Manager|
|------|--------|-------|
|1|Finance|George|
|2|Production|George|

In [2]:
# Criação das tabelas A e B

## Operadores

|Álgebra|csvms |Operação |Sintaxe|Primário|
|-------|------|---------|-------|--------|
|**∪**| + |União (*Union*)|A + B|Sim|
|**∩** | % |Interseção (*Intersection*)|A % B|Sim|
|**-** | – |Diferença (*Difference*)|A – B|Sim|
|**×** | * |Produto Cartesiano (*Product*)|A * B|Sim|
|**÷** | / |Divisão (*DivideBy*)|A ÷ (Relação C)|Sim|
|**π** | π |Projeção (*Project*)|A.π(`<lista de atributos>`)|Sim|
|**σ** | σ |Seleção (*Select*)|A.σ([`<condição lógica>`])|Sim|
|**ρ** | ρ |Renomear (*Rename*)|A.ρ(`nome`)|Não|
|**Π** | Π |Projeção estendida (*Extend*)|A.Π(`<funções>`)|Não|
|**⋈**| ᐅᐊ |Junção (*Join*)|A.ᐅᐊ( B, `<condição lógica>` )|Sim|
|**⟕**| ᗌᐊ |Junção externa esquerda (*Left Outer Join*)|A.ᗌᐊ( B, `<condição lógica>` )|Não|
|**⟖**| ᐅᗏ |Junção externa direita (*Right Outer Join*)|A.ᐅᗏ( B, `<condição lógica>` )|Não|
|**⟗**| ᗌᗏ |Junção externa total (*Full Outer Join*)|A.ᗌᗏ( B, `<condição lógica>` )|Não|
|**⋉**| ᐅᐸ |Semijunção esquerda (*Left Semi Join*)|A.ᐅᐸ( B, `<condição lógica>` )|Não|
|**⋊**| ᐳᐊ |Semijunção direita (*Right Semi Join*)|A.ᐳᐊ( B, `<condição lógica>` )|Não|
|**▷**| ᐅ |Antijunção esquerda (*Left Anti Join*)|A.ᐅ( B, `<condição lógica>` )|Não|
|**◁**| ◁ |Antijunção direita (*Right Anti Join*)|A.◁( B, `<condição lógica>` )|Não|


### União

*Retorna uma relação contendo todas as tuplas que aparecem em uma ou ambas as relações especificadas.*

Em matemática, a união de dois conjuntos é o conjunto de todos os elementos que pertencem a um ou a ambos os conjuntos originais. Na álgebra relacional **não é a união matemática habitual**.

Dadas duas relações A e B do mesmo tipo, a união dessas duas relações, `A + B`, é uma relação do mesmo tipo, cujo corpo consiste em todas as tuplas t tais que t aparece em A ou em B, ou ainda em ambas.

> A operação de união (*UNION*) é representada pelo operador `+`

In [3]:
# União de A e B

### Interseção

*Retorna uma relação contendo todas as tuplas que aparecem em ambas as relações especificadas.*

Como o operador de união, e essencialmente pela mesma razão, o operador relacional de interseção exige que seus operandos sejam do mesmo tipo. Então, dadas duas relações A e B do mesmo tipo, a interseção dessas duas relações, `A % B`, é uma relação do mesmo tipo, cujo corpo consiste em todas as tuplas t tais que t aparece em A e em B.

> A operação de interceção (*INSERCT*) é representada pelo operador `%`

In [4]:
# Interseção de A e B

### Diferença
*Retorna uma relação contendo todas as tuplas que aparecem na primeira e não na segunda de duas relações especificadas.*

Como os operadores de união e interseção, o operador relacional de diferença também exige que seus operandos sejam do mesmo tipo. Então, dadas duas relações A e B do mesmo tipo, a diferença entre essas duas relações, `A - B` (nessa ordem), é uma relação do mesmo tipo, cujo corpo consiste em todas as tuplas t tais que t aparece em A e não em B.

> A operação de diferença (*MINUS*) é representada pelo operador `-`

In [5]:
# Diferença de A e B
# Diferença de B e A

### Produto

*Retorna uma relação contendo todas as tuplas possíveis que são uma combinação de duas tuplas, uma de cada uma das duas relações especificadas.*

O produto cartesiano (relacional) de duas relações A e B, `A * B`, consiste no conjunto de todas as tuplas t, tais que t é a união (da teoria de conjuntos) de uma tupla que pertence a A e uma tupla que pertence a B. 
O cabeçalho do resultado consiste em todos os atributos de ambos os cabeçalhos de entrada.

> A operação de produto (*TIMES*) é representada pelo operador `*`

In [6]:
# Produto de A e B

### Seleção

*Retorna uma relação contendo todas as (sub)tuplas que permanecem em uma relação especificada após a remoção dos atributos especificados.*

Seja a relação A com os atributos X e Y (e possivelmente outros), e seja q um operador – normalmente, “=”, “≠”, “>”, “<” etc. – tal que a expressão booleana X Y seja bem definida e, dados valores particulares para X e Y, seja avaliada como um valor verdade (TRUE ou FALSE). Então, a restrição-θ, ou apenas restrição (para abreviar) da relação A sobre os atributos X e Y (`a WHERE X Y`) é uma relação com o mesmo cabeçalho de a e cujo corpo consiste em todas as tuplas de a, tais que a expressão X Y é avaliada como TRUE para essa tupla em questão.

> A operação de seleção (*WHERE*) é executada através da função `σ`

Os operadores lógicos aceitos estão relacionados na tabela abaixo:

| chave | operação |
|-------|----------|
|lt|*menor que* (`<`)|
|gt|*maior que* (`>`)|
|eq|*igualdade* (`=`)|
|lte|*menor ou igual* (`<=`)|
|gte|*maior ou igual* (`>=`)|
|neq|*diferença* (`≠`)|
|in|*Está contido* (`⊂`)|
|nin|*Não está contido* (`⊄`)|
|or|*ou* (`\|\|`)|
|and|*e* (`&&`)|
|missing|*O valor é **nulo***|
|exists|*O valor não é **nulo***|


In [7]:
# WHERE Manager = 'George' AND DeptId > 1

### Projeção

Seja a relação a com os atributos X, Y, ..., Z (e possivelmente outros). O operador de projeção produz efetivamente um subconjunto “vertical” de determinada relação, ou seja, o subconjunto obtido pela remoção de todos os atributos não mencionados na lista_com_vírgulas de nomes de atributos especificada

> A operação de projeção (*PROJECTION*) é executada através da função `π`

In [8]:
# Projetar os atributos 'DeptId' e 'DeptName' da relação A

#### Operadores adicionais
O conjunto de operações abaixo faz parte da **versão extendida** da álgebra relacional, não sendo assim, um dos operadores primários

##### Renomear

O operador `RENAME` toma determinada relação e retorna outra relação idêntica à primeira, exceto pelo fato de um de seus atributos receber um nome diferente. (A relação dada é especificada por meio de uma expressão relacional, talvez envolvendo outras operações relacionais.)

> A operação de renomear (*RENAME*) é executada através da função `ρ`

In [9]:
# Renomear a relação A para C

##### Projeção Extendida

A opreação `EXTEND` toma uma relação e retorna outra relação idêntica à relação dada, mas *incluindo um atributo adicional*, cujos valores são obtidos pela avaliação de alguma **expressão computacional especificada**. Por exemplo, poderíamos escrever: `EXTEND` P ADD ( PESO * 454 ) 

> A operação de projeção extendida (*EXTEND*) é executada através da função `Π`

In [10]:
# Extender a relação A com a multiplicação do 'DeptId' por 2

### Junção

Existem diversas variedades da operação de junção. Porém, de longe a mais importante é a chamada **junção natural**.
Sejam as relações A e B com os atributos: X, Y e Z; Então, a junção natural de A e B (`A ⋈ B`) é uma relação com o cabeçalho {X,Y,Z} e corpo que consiste no conjunto de todas as tuplas {X x,Y y,Z z} tal que uma tupla aparece em a com o valor X de x e o valor Y de y, e uma tupla aparece em b com o valor Y de y e o valor Z de z.

Sejam as relações A e B que satisfazem aos requisitos do produto cartesiano; suponha que a tenha um atributo X e que B tenha um atributo Y, e suponha ainda que X, Y e atendam aos requisitos da restrição-q. Então, a junção-q da relação A sobre o atributo X com a relação b sobre o atributo Y é definida como sendo o resultado da avaliação da expressão: 

`( A TIMES B ) WHERE X Y`

Em outras palavras, ela é uma relação com o mesmo cabeçalho que o produto cartesiano de a e b, e cujo corpo é o conjunto de todas as tuplas, t tais que t pertence ao produto cartesiano e a condição “X Y” tem valor TRUE para essa tupla t.

> A operação de junção (*JOIN*) é executada através da função `ᐅᐊ`

In [11]:
# Junção das relações A e B pelo atributo 'DeptId'

> [Continua...](dql-joins.ipynb)