<font size="6" face="verdana" color="green">
<img src="Figuras/MBAIABD-Logo.png" width=100/>
    <b>Exploração inicial das tabelas da Base de dados <u>Alunos15</u></b>
</font>

<br><br>
**Objetivo:** Olhar rapidamente o conteúdo das tabelas que existem na base de Dados `Alunos15`\
__Adicional:__ Explorar algumas informações interessantes do Meta-esquema do SGBD &nbsp; <img src="Figuras/Postgres.png" width=130/>.

<br>

## Conectar com a Base de Dados

Para começar, é necessário estabelecer a coneção com a base:

In [1]:
############## Importar os módulos necessários para o Notebook:
import ipywidgets as widgets     #---
from sqlalchemy import create_engine

############## Conectar com um servidor SQL ###################### --> Postgres
%load_ext sql

# Connection format: %sql dialect+driver://username:password@host:port/database
engine = create_engine('postgresql://postgres:pgadmin@localhost/Alunos15')
%sql postgresql://postgres:pgadmin@localhost/Alunos15

The sql extension is already loaded. To reload it, use:
  %reload_ext sql


ModuleNotFoundError: No module named 'psycopg2'

<br><br>
## Explorar rapidamente o que tem na base de dados

As tabelas usadas nos exemplos são: `Alunos`, `Discip`, `Turma`, `Matricula` e `Professor`.<br>

Vamos usar as tabelas do <b>Meta-Esquema</b> do SGBD para verificar a quantidade de atributos e de tuplas dessas tabelas:

In [None]:
%%sql
SELECT TC.RelName, TC.RelNatts, SchemaName,                    -- --> Nome da relação, número de atributos e esquema onde está definida
       TC.RelTuples::INT, TC.RelPages                          -- --> Quantidade de tuplas e quantidade de páginas em disco
    FROM pg_catalog.pg_tables TN JOIN Pg_Class TC ON TN.TableName=TC.RelName
    WHERE RelName !~'(pg_)|(sql_)'
    --IN ('alunos', 'discip', 'turma', 'matricula', 'professor')
    ORDER BY 1;

<br>

Essa base é bem pequena...  Cada tabela ocupa apenas uma página de disco (de 8KBytes)\
Todas as tabelas estão no esquema <i>default</i>: `Public`

Vamos ver as tuplas das tabelas `Alunos` e `Disciplinas`:

In [None]:
%sql  tabAluno << SELECT * FROM Aluno;
print('\nAluno:\n', tabAluno, sep='')
%sql  tabDiscip << SELECT * FROM Discip;
print('\nDiscip:\n', tabDiscip, sep='')

<br>

Os alunos não se matriculam diretamente nas disciplinas, mas sim nas turmas criadas para cada disciplina.\
Pode haver mais de uma turma para cada disciplina.

In [None]:
%sql  tabTurma << SELECT * FROM Turma;
print('\nTurma:\n', tabTurma, sep='')
%sql  tabMatricula << SELECT * FROM Matricula;
print('\nMatricula:\n', tabMatricula, sep='')

<br>

Portanto, para listar as notas que um dado aluno tirou em todas as disciplinas, é necessário 'juntar' essas __4__ tabelas:

In [None]:
%%sql
SELECT A.Nome, D.Nome, M.Nota, A.NUSP
    FROM Aluno A JOIN Matricula M ON A.NUSP=M.NUSP
                 JOIN Turma T ON M.CodigoTurma=T.Codigo
                 JOIN Discip D ON T.Sigla=D.Sigla
    WHERE M.Nota>=5
    ORDER BY A.Nome, D.Nome
    LIMIT 10;

<br><br>
## Explorar algumas tabelas do <b>Meta-esquema do <img src="Figuras/Postgres.png" width=120/></b>

<br>

#### A tabela `PG_Class`:
A principal tabela para acessar as informações do <b>Meta-Esquema</b> de uma base de dados é a `PG_Class`.\
Ela tem as principais informações sobre as `tabelas`, `visões`, `índices` e demais objetos que podem ser generalizados como uma tabela.
Alguns dados interessantes são:
 * `OId:` o identificador interno da tabela
 * `RelName:` o nome da tabela
 * `RelNameSpace:` o nome do esquema ('NameSpace') onde o nome do objeto está definido (referencia `PG_NameSpace.OId`)
 * `RelKind:` o tipo do objeto: 'r'=tabela, 'i'=índice, 'v'=visão, 'm'=visão materializada, etc.
 * `RelAM:` organização do objeto  (referencia `PG_AM.OId`).\
   Se for tabela, se a armazenagem é por tupla ou colunar; se for índice, a estrutura de dados (b-tree, hash, r-tree, etc.)
 * `RelPages:` quantidade de páginas de 8KBytes ocupadas em disco
 * `RelTuples:` quantidade de tuplas armazenadas
 * `RelNAtts:` quantidade de atributos em cada tupla, sem contar os atributos de sistema.
   A tabela `PG_Attribute` contem as informações sobre cada um dos atributos

Por exemplo:

In [None]:
%%sql
SELECT OId, RelName, RelKind, RelNameSpace, RelAM, RelPages, RelTuples, RelNAtts
    FROM PG_Class
    WHERE RelName='aluno' OR RelName='professor';

Quando um atributo se referencia a um objeto em outra tabela, podemos buscar as informações desse objeto na tabela correspondente.

<br>

#### A tabela `PG_NameSpace`
Por exemplo, o `NameSpace` de uma tabela é o esquema onde ele está definido.\
Podemos obter as informações sobre o esquema onde a tabela `Aluno` está definida olhando a relação referenciada: `pg_namespace':

In [None]:
%%sql
SELECT C.RelName, S.*
    FROM PG_Class C JOIN PG_NameSpace S ON C.RelNameSpace = S.OId
    WHERE C.RelName='aluno' OR C.RelName='professor';


Se quizermos ver todos os esquemas da base de dados com todos os seus atributos podemos solicitar:

In [None]:
%%sql
SELECT S.*
    FROM PG_NameSpace S;

Veja que além do esquema público, existem os esquemas internos do próprio <img src="Figuras/Postgres.png" width=120/>

Se quizermos ver todos os esquemas definidos pelo usuário (incluindo o esquema `Public`) podemos filtrar:
 - os esquemas de trabalho do <img src="Figuras/Postgres.png" width=120/> (`LIKE 'pg\_%'`) e
 - o esquema padrão <img src="Figuras/ISO-Logo.png" width=35/> (`LIKE 'Information\_schema'`).

<br>

Filtrando usando uma Expressão Regular independente da caixa da letra (`~*`), o comando fica:

In [None]:
%%sql
SELECT S.*
    FROM PG_NameSpace S 
    WHERE NspName !~*'(pg_)|(Information_schema)';

<br>

#### A tabela `PG_Attribute`

As informações sobre cada aributo de uma tabela estão na relação `PG_Attribute`.\
Dentre as mais interessantes estão:
 * 'AttRelId:' indentifica a tabela (em `PG_Class.Oid`) que contém esse atributo
 * 'Attname:' o nome do atributo
 * 'AttNum:' Posição ordinal desse atributo na tabela
 * 'AttLen:' Número de bytes que esse atributo ocupa na tupla. -1 se for variável
 * 'AttTypId:' o identificador do tipo de dados do atributo (referencia PG_Type.OId)
 
Por exemplo:

In [None]:
%%sql
SELECT C.RelName, A.AttRelId, A.AttName, A.AttNum, A.AttLen, A. AttTypId, T.TypName
    FROM Pg_Class C JOIN Pg_Attribute A ON C.OID = A.AttRelId
                    JOIN Pg_Type T      ON A.AttTypId=T.OID
    WHERE (C.RelName = 'aluno' OR C.RelName = 'matricula')
      AND A.AttNum>0   -- AttNum<0 ==> Atributo de sistema
    ORDER BY 1,4;

<br><br>

A documentação das tabelas do <b>Meta-esquema</b> pode ser encontrada no manual do <img src="Figuras/Postgres.png" width=120/> em:\
https://www.postgresql.org/docs/current/catalogs.html

<br><br>
<font size="4" face="verdana" color="green">
     <b>Exploração inicial das tabelas da Base de dados __Alunos15</b>
    </font><br>

<font size="10" face="verdana" color="red">
        <b>FIM</b>&nbsp; <img src="Figuras/MBAIABD-Logo.png" width=100/>
    </font>