<font size="6" face="verdana" color="green">
    <b>Introdução à Linguagem SQL</b><br>
    <b>DML:</b><i> <b>D</b>ata <b>M</b>anipulation <b>L</b>anguage</i><br>
    <u>Parte 1</font>
    </font>

<br><br>

**Objetivo:** Explorar comandos básicos da sub-linguagem de manipulaçào de dados em SQL,\
    usando como exemplo de teste uma <i>toy database</i> que contém dados sobre as mátriculas de 15 alunos:\
    &emsp; &emsp; __a base de Dados `Alunos15`__

__Atividades:__ 
 * Explorar as cláusulas `SELECT` e `FROM` do comando `SELECT`
 * Clàusula `Distinct`
 * Aliases
 * Expressão `*`
 * Expressões `CASE`

<br><br>

----

<br>

## 1. Conectar com a Base de Dados

Para começar, sempre é necessário, em cada `Notebook`:
  * Carregar os pacotes que serão usados;
  * Estabelecer a coneção com a base.

In [2]:
# Importar os módulos necessários para o Notebook:
import ipywidgets as widgets     #---
from sqlalchemy import create_engine

# Conectar com um servidor SQL na base Alunos 15 --> Postgres.Alunos15
%load_ext sql

# Connection format: %sql dialect+driver://username:password@host:port/database
engine = create_engine('postgresql://postgres:pgadmin@localhost/alunos15')
%sql postgresql://postgres:postgres@localhost/alunos15

The sql extension is already loaded. To reload it, use:
  %reload_ext sql


<br><br>

----

<br>

## 2. <b><font size="6" face="courier" color="blue">O Comando SELECT</font></b>

<b><font size="4" face="courier" color="blue">O Comando SELECT</font></b> é o mais usado em SQL,
e é aquele que têm a sintaxe mais rica.\
Ele sintetiza as construções sintáticas de todos os demais comandos da DML,\
  &emsp; e portanto, uma vez entendido, serve de subsídio para entender todos os demais.

<br>
  
O comando `SELECT` recupera dados armazenados no servidor e os retorna ao cliente como uma tabela.\
  &emsp; &emsp; &emsp; $\therefore$ ele atende aos &starf; preceitos do __Modelo Relacional.__ &starf;\
Seu uso principal é retornar dados armazenados nas tabelas da base de dados,\
sendo este o único propósito previsto no padrão ISO.

No entanto, a maioria dos SGBDs, incluindo Postgres, também permite utilizá-lo para obter outros dados do servidor, como por exemplo:
  * verificar dados do ambiente de execução (qual a base em que estamos conectados),
  * executar expressões aritméticas e
  * executar funções pré-definidas.

<br><br>

----

<br>

## 2 Sintaxe geral: 

A sintaxe geral do comando `SELECT` é:
<div class=”square” style="background-color:#EAF0F0;"><b><font size="3" face="courier" color="blue">
SELECT [<u>ALL</u> | DISTINCT] $<$lista de atributos$>$<br>
   &emsp; FROM $<$lista de Tabelas$>$<br>
   &emsp; [WHERE $<$condições$>$]<br>
   &emsp; [GROUP BY $<$lista de atributos><br>
      &emsp; &emsp; [HAVING $<$condição$>$]]<br>
   &emsp; [ORDER BY $<$Lista de atributos$>$ [<u>ASC</u>|DESC], ...]
   ;</font></b>
</div>

Apenas as cláusulas `SELECT` e `FROM` são obrigatórias pelo padrão.\
E se forem solicitados dados que não são de uma tabela, nem `FROM` é obrigatório.

Vamos estudar suas cláusulas componentes.

<br><br>

----

<br>

## 3. `SELECT <atributos> FROM <Tabelas>`

Um comando `SELECT` precisa indicar pelo menos os __atributos__ que serão recuperados,\
de pelo menos uma __tabela__:
<div class=”square” style="background-color:#EAF0F0;"><b><font size="3" face="courier" color="blue">
SELECT  $<$lista de atributos$>$<br>
   &emsp; FROM $<$Tabela$>$;</font></b>
</div>

 * Cada atributo da lista é separado por vírgula;
 * Nomes de atributos e de tabelas não são sensíveis à caixa da letra.

Exemplo usando primeiro a mágica `%%sql` (que assume que todo o restante do texto da célula é o comando `SQL`):

In [3]:
%%sql
SELECT Nome, NUSP
    FROM Aluno;

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.


nome,nusp
Carlos,1234
Celso,2345
Cicero,3456
Carlitos,4567
Catarina,5678
Cibele,6789
Corina,7890
Celina,8901
Celia,9012
Cesar,9123


Ou o mesmo exemplo usando a mágica `%sql` (o restante da linha é o comando `SQL`, possivelmente com o final `\` para continuar a linha):

In [4]:
%sql Result <<     \
SELECT Nome, NUSP  \
    FROM Aluno;

print(Result)

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.
Returning data to local variable Result
+----------+------+
|   nome   | nusp |
+----------+------+
|  Carlos  | 1234 |
|  Celso   | 2345 |
|  Cicero  | 3456 |
| Carlitos | 4567 |
| Catarina | 5678 |
|  Cibele  | 6789 |
|  Corina  | 7890 |
|  Celina  | 8901 |
|  Celia   | 9012 |
|  Cesar   | 9123 |
|  Denise  | 4584 |
|  Durval  | 1479 |
|  Daniel  | 1489 |
|   Dora   | 1469 |
|   Dina   | 1459 |
+----------+------+


<br><br>

----

<br>

Postgres permite omitir a cláusula `FROM` quando se quer
solicitar um dado que não está em uma tabela, tal como uma função ou uma constante.

In [5]:
%%sql
SELECT Current_database();

 * postgresql://postgres:***@localhost/alunos15
1 rows affected.


current_database
alunos15


In [6]:
%%sql
SELECT Now(), PI(), 2+2;

 * postgresql://postgres:***@localhost/alunos15
1 rows affected.


now,pi,?column?
2024-05-06 22:39:21.762792-03:00,3.141592653589793,4


Essa sintaxe viola a especificação ISO, \
mas é consistente com o jargão informal de SQL.

<br><br>

----

<br>



### 3.1 Tuplas repetidas

  * Se a lista de atributos não contiver uma chave, a resposta pode ter tuplas repetidas.

In [7]:
%%sql
SELECT Cidade FROM Aluno;

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.


cidade
Sao Carlos
Sao Carlos
Araraquara
Ibitinga
Sao Carlos
Araraquara
Rio Claro
Sao Carlos
Rio Claro
Araraquara


  * A eliminação de repetições pode ser solicitada com a diretriz `DISTINCT`:

<div class=”square” style="background-color:#EAF0F0;"><b><font size="3" face="courier" color="blue">
SELECT [<u>ALL</u> | DISTINCT] $<$lista de atributos$>$<br>
   &emsp; FROM $<$lista de Tabelas$>$;</font></b>
</div>

In [8]:
%%sql
SELECT DISTINCT Cidade
    FROM ALuno;

 * postgresql://postgres:***@localhost/alunos15
7 rows affected.


cidade
""
Ibate
Campinas
Ibitinga
Araraquara
Sao Carlos
Rio Claro


Veja que sem usar a cláusula `DISTINCT`, o resultado apenas 'projeta' os atributos,\
  &emsp; sem executar a `eliminação de duplicatas`, \
    &emsp; e <font color="red">gerando uma tabela que viola a restrição de não-repetição de tuplas:</font>

In [9]:
%%sql
SELECT Cidade
    FROM ALuno;

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.


cidade
Sao Carlos
Sao Carlos
Araraquara
Ibitinga
Sao Carlos
Araraquara
Rio Claro
Sao Carlos
Rio Claro
Araraquara


<br><br>

----

<br>

### 3.2 Aliases

Nomes de atributos e de tabelas podem ter um alias.

In [10]:
%%sql
SELECT Nome, NUSP AS NumeroUSP
    FROM Aluno AS A;

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.


nome,numerousp
Carlos,1234
Celso,2345
Cicero,3456
Carlitos,4567
Catarina,5678
Cibele,6789
Corina,7890
Celina,8901
Celia,9012
Cesar,9123


  * o conectivo `AS` é opcional.

O `alias`  pode ser colocado entre `" "` para que se respeite a caixa do texto\
 ou para usar símbolos e separadores:

 &emsp; &emsp; &starf; Valores são colocados entre `' '` aspas simples,\
 &emsp; &emsp; &starf; Aliases são colocados entre `" "` aspas duplas.

In [11]:
%%sql
SELECT Nome AS "Nome Completo", 
       NUSP AS "# USP"
    FROM Aluno A;

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.


Nome Completo,# USP
Carlos,1234
Celso,2345
Cicero,3456
Carlitos,4567
Catarina,5678
Cibele,6789
Corina,7890
Celina,8901
Celia,9012
Cesar,9123


<br><br>

----

<br>

### 3.3 Explicitando a tabela do atributo

Os atributos podem ser qualificados pela tabela à qual pertencem.\
<small>(Util especialmente quando se usa várias tabelas que podem ter nomes de atributos repetidos)</small>

In [12]:
%%sql SELECT Aluno.Nome, NUSP
    FROM Aluno;

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.


nome,nusp
Carlos,1234
Celso,2345
Cicero,3456
Carlitos,4567
Catarina,5678
Cibele,6789
Corina,7890
Celina,8901
Celia,9012
Cesar,9123


  * Quando uma tabela tem um `alias`, a qualificação tem que ser feita com ele:

In [13]:
%%sql
SELECT A.Nome, Idade
    FROM Aluno A;

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.


nome,idade
Carlos,21.0
Celso,22.0
Cicero,22.0
Carlitos,21.0
Catarina,23.0
Cibele,21.0
Corina,25.0
Celina,27.0
Celia,20.0
Cesar,21.0


<font color="red">
    <font size="6">&emsp; &#9758;</font>
    Caso contrário, o comando resulta em erro!</font>

In [14]:
%%sql
SELECT Aluno.Nome, Idade
    FROM Aluno A;

 * postgresql://postgres:***@localhost/alunos15
(psycopg2.errors.UndefinedTable) invalid reference to FROM-clause entry for table "aluno"
LINE 1: SELECT Aluno.Nome, Idade
               ^
HINT:  Perhaps you meant to reference the table alias "a".

[SQL: SELECT Aluno.Nome, Idade
    FROM Aluno A;]
(Background on this error at: https://sqlalche.me/e/20/f405)


<br><br>

----

<br>

### 3.4 Indicando todos os atributos de uma tabela

Para obter todos os atributos de uma tabela, usa-se `*`, para não precisar colocaar a lista inteira de atributos.

In [15]:
%%sql
SELECT *
    FROM Aluno;

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.


nome,nusp,idade,cidade,curso
Carlos,1234,21.0,Sao Carlos,Computação
Celso,2345,22.0,Sao Carlos,Computação
Cicero,3456,22.0,Araraquara,Matemática
Carlitos,4567,21.0,Ibitinga,Computação
Catarina,5678,23.0,Sao Carlos,Elétrica
Cibele,6789,21.0,Araraquara,Computação
Corina,7890,25.0,Rio Claro,Matemática
Celina,8901,27.0,Sao Carlos,Computação
Celia,9012,20.0,Rio Claro,Computação
Cesar,9123,21.0,Araraquara,Elétrica


Indicar `SELECT *` retorna todos os atributos de todas as tabelas solicitadas.\
Se forem necessários todos os atributos de apenas <u>uma determinada tabela,</u> pode-se indicar a tabela explicitamente:

In [16]:
%%sql
SELECT Aluno.*
    FROM Aluno;

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.


nome,nusp,idade,cidade,curso
Carlos,1234,21.0,Sao Carlos,Computação
Celso,2345,22.0,Sao Carlos,Computação
Cicero,3456,22.0,Araraquara,Matemática
Carlitos,4567,21.0,Ibitinga,Computação
Catarina,5678,23.0,Sao Carlos,Elétrica
Cibele,6789,21.0,Araraquara,Computação
Corina,7890,25.0,Rio Claro,Matemática
Celina,8901,27.0,Sao Carlos,Computação
Celia,9012,20.0,Rio Claro,Computação
Cesar,9123,21.0,Araraquara,Elétrica


É claro que podem ser usados `Aliases`:

In [17]:
%%sql
SELECT A.*
    FROM Aluno A;

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.


nome,nusp,idade,cidade,curso
Carlos,1234,21.0,Sao Carlos,Computação
Celso,2345,22.0,Sao Carlos,Computação
Cicero,3456,22.0,Araraquara,Matemática
Carlitos,4567,21.0,Ibitinga,Computação
Catarina,5678,23.0,Sao Carlos,Elétrica
Cibele,6789,21.0,Araraquara,Computação
Corina,7890,25.0,Rio Claro,Matemática
Celina,8901,27.0,Sao Carlos,Computação
Celia,9012,20.0,Rio Claro,Computação
Cesar,9123,21.0,Araraquara,Elétrica


Nada impede que sejam repetidos atributos no resultado:

In [18]:
%%sql
SELECT Nome||' de '||Cidade, Aluno.*, Idade*12 "Meses", Upper(Nome)
    FROM Aluno;

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.


?column?,nome,nusp,idade,cidade,curso,Meses,upper
Carlos de Sao Carlos,Carlos,1234,21.0,Sao Carlos,Computação,252.0,CARLOS
Celso de Sao Carlos,Celso,2345,22.0,Sao Carlos,Computação,264.0,CELSO
Cicero de Araraquara,Cicero,3456,22.0,Araraquara,Matemática,264.0,CICERO
Carlitos de Ibitinga,Carlitos,4567,21.0,Ibitinga,Computação,252.0,CARLITOS
Catarina de Sao Carlos,Catarina,5678,23.0,Sao Carlos,Elétrica,276.0,CATARINA
Cibele de Araraquara,Cibele,6789,21.0,Araraquara,Computação,252.0,CIBELE
Corina de Rio Claro,Corina,7890,25.0,Rio Claro,Matemática,300.0,CORINA
Celina de Sao Carlos,Celina,8901,27.0,Sao Carlos,Computação,324.0,CELINA
Celia de Rio Claro,Celia,9012,20.0,Rio Claro,Computação,240.0,CELIA
Cesar de Araraquara,Cesar,9123,21.0,Araraquara,Elétrica,252.0,CESAR


ATENÇÃO:\
Usar `*` facilita escrever comandos quando se está testando comandos em utilitário interativo, tal como um `Notebook`,\
<font color="red"><font size="6">&emsp; &#9758;</font> Mas usar `*` não é uma boa prática para programação de aplicativos.</font>\
Se a tabela for atualizada incluindo ou renomeando atributos, um comando programado pode passar a dar erro.

<br><br>

----

<br>

### 3.5 Parâmetro da cláusula `SELECT`

A lista de atributos pode conter:
  * Nome de atributos: &emsp; &emsp; &emsp; &emsp; `SELECT Idade FROM Aluno;`
  * Operações entre atributos: &emsp; `SELECT Nome||' de '||Cidade, Aluno.*, Idade*12 "Meses", Upper(Nome) FROM Aluno;`
  * Funções  &emsp; &emsp; &emsp; &emsp; &emsp; &emsp; &emsp;  `SELECT upper(Nome) FROM Aluno;`
  * Expressões &emsp; &emsp; &emsp; &emsp; &emsp; &emsp; `CASE`
  * Subselects (a ser estudado em outro <i>Notebook</i>)

<br><br>

----

<br>

#### 3.5.1 Expressão `CASE`

É possível usar condições para modificar valores: <font size="3">Expressões <font size="3" face="courier" color="blue"><b>CASE</b></font>.</font>

Existem duas construçoes Sintáticas: 

<div class=”square” style="background-color:#EAF0F0;"><b><font size="3" face="courier" color="blue">
CASE $<$Expressão$>$<br>
    &emsp; WHEN $<$Valor Original$>$ THEN <Valor final><br>
    &emsp; [WHEN ...]<br>
    &emsp; [ELSE $<$Valor Default$>$]<br>
END
    </font></b>
</div>

ou 

<div class=”square” style="background-color:#EAF0F0;"><b><font size="3" face="courier" color="blue">
CASE <br>
    &emsp; WHEN $<$Condição$>$ THEN <Valor final><br>
    &emsp; [WHEN ...]<br>
    &emsp; [ELSE $<$Valor Default$>$]<br>
END
    </font></b>
</div>

Se `ELSE` não for especificado , valores que não atendam a nenhuma condição `WHEN` assumem `null`.\
<small>(Jupyter notebook imprime `null` como `none`)</small>

In [19]:
%%sql     -- Exemplo para expressão
SELECT Nome, Cidade, CASE Cidade
                          WHEN 'Sao Carlos' THEN 'aqui mesmo'
                          ELSE 'de fora'
                          END AS "Região"
FROM Aluno A;

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.


nome,cidade,Região
Carlos,Sao Carlos,aqui mesmo
Celso,Sao Carlos,aqui mesmo
Cicero,Araraquara,de fora
Carlitos,Ibitinga,de fora
Catarina,Sao Carlos,aqui mesmo
Cibele,Araraquara,de fora
Corina,Rio Claro,de fora
Celina,Sao Carlos,aqui mesmo
Celia,Rio Claro,de fora
Cesar,Araraquara,de fora


In [20]:
%%sql     -- Exemplo para condição
SELECT Nome, CASE WHEN Idade <= 20 THEN 'Adolescente'
                  WHEN Idade BETWEEN 21 AND 24 THEN 'Jovem'
                  WHEN Idade BETWEEN 25 AND 32 THEN 'Zoomer'
                  ELSE Idade::Text
                END AS "Faixa Etária",
        Idade
FROM Aluno A;

 * postgresql://postgres:***@localhost/alunos15
15 rows affected.


nome,Faixa Etária,idade
Carlos,Jovem,21.0
Celso,Jovem,22.0
Cicero,Jovem,22.0
Carlitos,Jovem,21.0
Catarina,Jovem,23.0
Cibele,Jovem,21.0
Corina,Zoomer,25.0
Celina,Zoomer,27.0
Celia,Adolescente,20.0
Cesar,Jovem,21.0


<br><br>

----

<br>

Lembre-se:
  * Para obter o valor de um atributo, é preciso indicar ao menos uma tabela,\
        <font size="6">&emsp; &#9758;</font> pois é de onde se traz a resposta;
  * A lista de atributos corresponde a um
        operador de projeção da álgebra relacional:\
		<font size="4">`SELECT` $a$ `FROM` $R_1$ </font> &emsp;
          é equivalente a &emsp; 
          <font size="6">$\uppi _{\left\{\mbox{\textit{a}}\right\}}R_1$}</font>.


<br><br>

----

<br><br>
