# Álgebra relacional

A álgebra relacional é uma coleção de operadores que tomam relações como seus operandos e retornam uma relação como seu resultado.

### Conjunto de dados

Relação **A**

|DeptId|DeptName|Manager|
|------|--------|-------|
|1|Finance|George|
|2|Sales|Charles|


Relação **B**

|DeptId|DeptName|Manager|
|------|--------|-------|
|1|Finance|George|
|2|Production|George|

In [12]:
from csvms.table import Table
# As tabelas abaixo são utilizadas para exemplificar as operações
A = Table(
    name="A",
    columns={"DeptId":int, "DeptName":str, "Manager":str},
    data=[
        (1, "Finance","George"),
        (2, "Sales","Charles"),
    ])

B = Table(
    name="B",
    columns={"DeptId":int, "DeptName":str, "Manager":str},
    data=[
        (1, "Finance","George"),
        (3, "Production","George"),
    ])

## Operadores

|Simbolo|Oprador |Operação |Sintaxe|
|---|--------|---------|-------|
|**σ**| [σ](#restrição) |Seleção (*Select*)|A.σ([`<funções lógicas>`])|
|**π**| [π](#projeção) |Projeção (*Project*)|A.π(`<lista de atributos>`)|
|**∪**| [+](#união) |União (*Union*)|A + B|
|**∩**| [%](#interseção) |Interseção (*Intersection*)|A % B|
|**-**| [–](#diferença) |Diferença (*Difference*)|A – B|
|**X**| [*](#produto) |Produto Cartesiano (*Product*)|A * B|
|**⋈**| [ᐅᐊ](#produto) |Junção (*Join*)|A.ᐅᐊ( B, `<funções lógicas>` )|
|**÷**| [/]() |Divisão (*DivideBy*)|A ÷ (Relação C)|
|**ρ**| [ρ](#renomear) |Renomear (*Rename*)|A.ρ(`nome`)|
|**Π**| [Π](#projeção-extendida) |Projeção extendida (*Extend*)|A.Π(`<funções aritiméticas>`)|
|**⟕**| [ᗌᐊ](#junção-externas) |Junção externa esquerda (*Left Outer Join*)|A.ᐅᐸ( B, `<funções lógicas>` )|
|**⟖**| [ᐅᗏ](#junção-externas) |Junção externa direita (*Right Outer Join*)|A.ᐳᐊ( B, `<funções lógicas>` )|
|**⟗**| [ᗌᗏ](#junção-externas) |Junção externa total (*Full Outer Join*)|A.ᗌᗏ( B, `<funções lógicas>` )|


### União

Em matemática, a união de dois conjuntos é o conjunto de todos os elementos que pertencem a um ou a ambos os conjuntos originais. Na álgebra relacional **não é a união matemática habitual**.

Dadas duas relações A e B do mesmo tipo, a união dessas duas relações, `A + B`, é uma relação do mesmo tipo, cujo corpo consiste em todas as tuplas t tais que t aparece em A ou em B, ou ainda em ambas.

> A operação de união (*UNION*) é representada pelo operador `+`

In [13]:
# União de A e B
print(A + B)

   TABLE: default.(A∪B)
   +-------+----------+--------+
   |DeptId |DeptName  |Manager |
   +-------+----------+--------+
  0|      1|   Finance|  George|
  1|      2|     Sales| Charles|
  2|      3|Production|  George|
   +-------+----------+--------+



### Interseção
Como o operador de união, e essencialmente pela mesma razão, o operador relacional de interseção exige que seus operandos sejam do mesmo tipo. Então, dadas duas relações A e B do mesmo tipo, a interseção dessas duas relações, `A % B`, é uma relação do mesmo tipo, cujo corpo consiste em todas as tuplas t tais que t aparece em A e em B.

> A operação de interceção (*INSERCT*) é representada pelo operador `%`

In [14]:
# Interseção de A e B
print(A % B)

   TABLE: default.(A∩B)
   +-------+---------+--------+
   |DeptId |DeptName |Manager |
   +-------+---------+--------+
  0|      1|  Finance|  George|
   +-------+---------+--------+



### Diferença

Como os operadores de união e interseção, o operador relacional de diferença também exige que seus operandos sejam do mesmo tipo. Então, dadas duas relações A e B do mesmo tipo, a diferença entre essas duas relações, `A - B` (nessa ordem), é uma relação do mesmo tipo, cujo corpo consiste em todas as tuplas t tais que t aparece em A e não em B.

> A operação de diferença (*MINUS*) é representada pelo operador `-`

In [15]:
# Diferença de A e B
print(A - B)
# Diferença de B e A
print(B - A)

   TABLE: default.(A−B)
   +-------+---------+--------+
   |DeptId |DeptName |Manager |
   +-------+---------+--------+
  0|      2|    Sales| Charles|
   +-------+---------+--------+

   TABLE: default.(B−A)
   +-------+----------+--------+
   |DeptId |DeptName  |Manager |
   +-------+----------+--------+
  0|      3|Production|  George|
   +-------+----------+--------+



### Produto

O produto cartesiano (relacional) de duas relações A e B, `A * B`, consiste no conjunto de todas as tuplas t, tais que t é a união (da teoria de conjuntos) de uma tupla que pertence a A e uma tupla que pertence a B. 
O cabeçalho do resultado consiste em todos os atributos de ambos os cabeçalhos de entrada.

> A operação de produto (*TIMES*) é representada pelo operador `*`

In [16]:
# Produto de A e B
print(A * B)

   TABLE: default.(A×B)
   +---------+-----------+----------+---------+-----------+----------+
   |DeptId   |DeptName   |Manager   |DeptId   |DeptName   |Manager   |
   +---------+-----------+----------+---------+-----------+----------+
  0|        1|    Finance|    George|        1|    Finance|    George|
  1|        1|    Finance|    George|        3| Production|    George|
  2|        2|      Sales|   Charles|        1|    Finance|    George|
  3|        2|      Sales|   Charles|        3| Production|    George|
   +---------+-----------+----------+---------+-----------+----------+



### Restrição

Seja a relação A com os atributos X e Y (e possivelmente outros), e seja q um operador – normalmente, “=”, “≠”, “>”, “<” etc. – tal que a expressão booleana X Y seja bem definida e, dados valores particulares para X e Y, seja avaliada como um valor verdade (TRUE ou FALSE). Então, a restrição-θ, ou apenas restrição (para abreviar) da relação A sobre os atributos X e Y (`a WHERE X Y`) é uma relação com o mesmo cabeçalho de a e cujo corpo consiste em todas as tuplas de a, tais que a expressão X Y é avaliada como TRUE para essa tupla em questão.

> A operação de restrição (*WHERE*) é executada através da função `σ`

Os operadores lógicos aceitos estão relacionados na tabela abaixo:

| chave | operação |
|-------|----------|
|lt|*menor que* (`<`)|
|gt|*maior que* (`>`)|
|eq|*igualdade* (`=`)|
|lte|*menor ou igual* (`<=`)|
|gte|*maior ou igual* (`>=`)|
|neq|*diferença* (`≠`)|
|in|*Está contido* (`⊂`)|
|nin|*Não está contido* (`⊄`)|
|or|*ou* (`\|\|`)|
|and|*e* (`&&`)|
|missing|*O valor é **nulo***|
|exists|*O valor não é **nulo***|


In [17]:
# WHERE Manager = 'George' AND DeptId > 1
print(A.σ({'and':[{"eq":['Manager','George']},{"lt":['DeptId',2]}]}))

   TABLE: default.(Aσ)
   +-------+---------+--------+
   |DeptId |DeptName |Manager |
   +-------+---------+--------+
  0|      1|  Finance|  George|
   +-------+---------+--------+



### Projeção

Seja a relação a com os atributos X, Y, ..., Z (e possivelmente outros). O operador de projeção produz efetivamente um subconjunto “vertical” de determinada relação, ou seja, o subconjunto obtido pela remoção de todos os atributos não mencionados na lista_com_vírgulas de nomes de atributos especificada

> A operação de projeção (*PROJECTION*) é executada através da função `π`

In [18]:
print(A.π(['DeptId','DeptName']))

   TABLE: default.(Aπ)
   +-------+---------+
   |DeptId |DeptName |
   +-------+---------+
  0|      1|  Finance|
  1|      2|    Sales|
   +-------+---------+



### Junção

Existem diversas variedades da operação de junção. Porém, de longe a mais importante é a chamada **junção natural**.
Sejam as relações A e B com os atributos: X, Y e Z; Então, a junção natural de A e B (`A ⋈ B`) é uma relação com o cabeçalho {X,Y,Z} e corpo que consiste no conjunto de todas as tuplas {X x,Y y,Z z} tal que uma tupla aparece em a com o valor X de x e o valor Y de y, e uma tupla aparece em b com o valor Y de y e o valor Z de z.

Sejam as relações A e B que satisfazem aos requisitos do produto cartesiano; suponha que a tenha um atributo X e que B tenha um atributo Y, e suponha ainda que X, Y e atendam aos requisitos da restrição-q. Então, a junção-q da relação A sobre o atributo X com a relação b sobre o atributo Y é definida como sendo o resultado da avaliação da expressão: 

`( A TIMES B ) WHERE X Y`

Em outras palavras, ela é uma relação com o mesmo cabeçalho que o produto cartesiano de a e b, e cujo corpo é o conjunto de todas as tuplas, t tais que t pertence ao produto cartesiano e a condição “X Y” tem valor TRUE para essa tupla t.

> A operação de junção (*JOIN*) é executada através da função `ᐅᐊ`

In [19]:
print(A.ᐅᐊ(B, where={'eq':['A.DeptId','B.DeptId']}))

   TABLE: default.(A⋈B)
   +---------+-----------+----------+---------+-----------+----------+
   |DeptId   |DeptName   |Manager   |DeptId   |DeptName   |Manager   |
   +---------+-----------+----------+---------+-----------+----------+
  0|        1|    Finance|    George|        1|    Finance|    George|
   +---------+-----------+----------+---------+-----------+----------+



#### Operadores adicionais
O conjunto de operações abaixo faz parte da **versão extendida** da álgebra relacional, não sendo assim, um dos operadores primários

##### Renomear

O operador `RENAME` toma determinada relação e retorna outra relação idêntica à primeira, exceto pelo fato de um de seus atributos receber um nome diferente. (A relação dada é especificada por meio de uma expressão relacional, talvez envolvendo outras operações relacionais.)

> A operação de renomear (*RENAME*) é executada através da função `ρ`

In [20]:
print(A.ρ("C"))

   TABLE: default.C
   +-------+---------+--------+
   |DeptId |DeptName |Manager |
   +-------+---------+--------+
  0|      1|  Finance|  George|
  1|      2|    Sales| Charles|
   +-------+---------+--------+



##### Projeção Extendida

A opreação `EXTEND` toma uma relação e retorna outra relação idêntica à relação dada, mas *incluindo um atributo adicional*, cujos valores são obtidos pela avaliação de alguma **expressão computacional especificada**. Por exemplo, poderíamos escrever: `EXTEND` P ADD ( PESO * 454 ) 

> A operação de projeção extendida (*EXTEND*) é executada através da função `Π`

In [21]:
print(A.Π({'add':[{'mul':['DeptId',{'literal':2}]},'DeptId']}, alias="calc"))

   TABLE: default.(AΠ)
   +-------+---------+--------+-----+
   |DeptId |DeptName |Manager |calc |
   +-------+---------+--------+-----+
  0|      1|  Finance|  George|    3|
  1|      2|    Sales| Charles|    6|
   +-------+---------+--------+-----+



##### Junção Externas

Considerando que o resultado de um junção (ou Junção interna) consiste em combinar tuplas correspondentes nos dois operandos, uma junção externa contém essas tuplas e mais algumas formadas pelo "*preenchimento*" dos valores que não casam em um operador com cada atributo do outro operador.

> A operação de junção (*LEFT OUTER JOIN*) é executada através da função `ᗌᐊ`
> 
> A operação de junção (*RIGHT OUTER JOIN*) é executada através da função `ᐅᗏ`

In [22]:
print(A.ᗌᐊ(B, where={'eq':['A.DeptId','B.DeptId']}))
print(A.ᐅᗏ(B, where={'eq':['A.DeptId','B.DeptId']}))

   TABLE: default.(A⟕B)
   +---------+-----------+----------+---------+-----------+----------+
   |DeptId   |DeptName   |Manager   |DeptId   |DeptName   |Manager   |
   +---------+-----------+----------+---------+-----------+----------+
  0|        1|    Finance|    George|        1|    Finance|    George|
  1|        2|      Sales|   Charles|     None|       None|      None|
   +---------+-----------+----------+---------+-----------+----------+

   TABLE: default.(A⟖B)
   +---------+-----------+----------+---------+-----------+----------+
   |DeptId   |DeptName   |Manager   |DeptId   |DeptName   |Manager   |
   +---------+-----------+----------+---------+-----------+----------+
  0|        1|    Finance|    George|        1|    Finance|    George|
  1|     None|       None|      None|        3| Production|    George|
   +---------+-----------+----------+---------+-----------+----------+



Referencias: 
+ Date, C. J.. Introdução a Sistemas de Bancos de Dados. GEN LTC. 
+ Silberschatz, Abraham; Korth, Henry F.; Sudarshan, S. (2020-09-02). Sistema de Banco de Dados
+ Elmasri, Ramez (2015-08-05). Sistemas de Bancos de Dados. 
+ Elmasri, Ramez; Navathe, Shamkant B. (2019-01-31). Sistemas de banco de dados.