### Trabalho 6: HStore

Integrantes do Grupo:

Brenno Hissao Serikawa - 11296697

Fabio Henrique Alves Cavaleti - 11200550 (Representante)

Lucas Roberto de Oliveira Lopes - 10850460

Tarcídio Antônio Júnior - 10748347


### Conecta com o Servidor

In [1]:
############## Importar os módulos necessários para o Notebook:
import matplotlib.pyplot as plt
import pandas.io.sql as psql
from ipywidgets import interact  ##-- Interactors
import ipywidgets as widgets     #---
from sqlalchemy import create_engine, text

############## Conectar com um servidor SQL ###################### --> Postgres
%load_ext sql

# Connection format: %sql dialect+driver://username:password@host:port/database
crengine = create_engine('postgresql://postgres:11132018@localhost/Alunos80k')
engine = crengine.connect()
%sql postgresql://postgres:11132018@localhost/Alunos80k        

<br>
Como vamos usar dados de tipo `HStore`, é necessário que a extensão `HStore` esteja ativada.\
Vamos fazer isso:

In [2]:
%%sql
CREATE EXTENSION IF NOT EXISTS hstore;

 * postgresql://postgres:***@localhost/Alunos80k
Done.


[]

## Criar a tabela `Configura`

A tabela irá ter:
  * como chave o `NUSP` do aluno, 
  * o `Nome` do aluno como atributo 'tradicional' e
  * um atributo de tipo `HStore` com parâmetros de configuração de um aplicativo hipotético que o aluno poderia estar usando...\
    Note que um atributo `HStore` armazena pares de $<$ `Chave, Valor` $>$, onde cada `Chave` pode ser criada livremente.


In [3]:
%%sql
DROP TABLE IF EXISTS Configura;
CREATE TABLE Configura (
    NUSP NUMERIC(8),
    Nome TEXT,
    Config HSTORE
    -- Line INT, -- atributos que podem ser carregados, sem prejuiso de outros imprevistos...
    -- Col INT,
    -- BkGrdnColor INT,
    -- FrGrdnColor INT,
    -- Font TEXT,
    -- Proxy Boolean
);

 * postgresql://postgres:***@localhost/Alunos80k
Done.
Done.


[]

## Carregar a tabela com os atributos _tradicionais_

A tabela deve conter atributos cujo `NUSP` existam na tabela de `Alunos`, mas nem todo aluno precisa ter um registro de configuração.

Vamos fazer isso carregando aleatoriamente 50% dos alunos da tabela `Alunos` na tabela  `Configura`:



In [4]:
%%sql
INSERT INTO  Configura(NUSP, Nome)
    SELECT NUSP, Nome
        FROM Alunos
        ORDER BY Random();

 * postgresql://postgres:***@localhost/Alunos80k
80000 rows affected.


[]

## Atualizar a tabela com pares chave-valor (aleatoriamente)

O atributo `Config`, de tipo `HStore`, é carregado com valores aleatórios para as `chaves':
  * `Line` e `Col`: por exemplo, linha e coluna de um arquivo que o aluno estiver editando &mdash; assumimos que 80% dos alunos têm essas chaves;
  * `BkGrdnColor`, `FrGrdnColor`: cor do texto e do fundo  &mdash; assumimos que 60% dos alunos têm essas chaves;
  * `Font`: fonte sendo usada  &mdash; assumimos que 60% dos alunos têm essas chaves;
  * `Proxi`: se está conectado via um _proxy_ &mdash; assumimos que 50% dos alunos têm essa chave como 'false' e 50% dos restantes a tem como 'true'.

In [5]:
%%sql
-- Carrega valores para as chaves Line e Col (emparelhadas)
UPDATE Configura 
    SET Config = HStore(ARRAY['line', 'col'], 
                       ARRAY[TEXT((300*Random()+20*Random())::INT), TEXT((40*Random()+20*Random()+10*Random())::INT)])
    WHERE Random()<.8;

-- Carrega valores para as chaves BkGrdnColor e FrGrdnColor(emparelhadas)
UPDATE Configura 
    SET Config = HStore(ARRAY['BkGrdnColor', 'FrGrdnColor'], 
                                 ARRAY[TEXT((0xFFFFFF*Random())::INT), TEXT((0xFFFFFF*Random())::INT)])
    WHERE Config IS NULL AND Random()<.6;
UPDATE Configura 
    SET Config = Config || HStore(ARRAY['BkGrdnColor', 'FrGrdnColor'], 
                                 ARRAY[TEXT((0xFFFFFF*Random())::INT), TEXT((0xFFFFFF*Random())::INT)])
    WHERE Config IS NOT NULL AND Random()<.6;

-- Carrega valores para a chave Font
CREATE TEMPORARY TABLE Fonts (I INT, F TEXT);
INSERT INTO Fonts VALUES(1, 'Times'), (2, 'Helvetica'), (3, 'Arial'), (4, 'Courier'), (5, 'Garamond');

UPDATE Configura
    SET Config['Font']=(SELECT F FROM Fonts WHERE I=(NUSP%5+1))::TEXT
    WHERE Random()<.6;

DROP TABLE Fonts;

-- Carrega valores para a chave Proxy (que pode ser true ou false)
UPDATE Configura SET Config=Config || HStore('Proxy', 'true')
    WHERE Random()<.5;
UPDATE Configura SET Config=Config || HStore('Proxy', 'false')
    WHERE Random()<.5;

 * postgresql://postgres:***@localhost/Alunos80k
64005 rows affected.
9412 rows affected.
44083 rows affected.
Done.
5 rows affected.
47947 rows affected.
Done.
40037 rows affected.
40048 rows affected.


[]

Podemos ver rapidamente algumas das tuplas geradas:

In [6]:
%%sql
SELECT * FROM Configura
    ORDER BY RANDOM()
    LIMIT 20;

 * postgresql://postgres:***@localhost/Alunos80k
20 rows affected.


nusp,nome,config
91400947,Yoav Lucas,"{'col': '49', 'Font': 'Arial', 'line': '201', 'Proxy': 'false'}"
81872886,Turgo Gazzoni,"{'col': '13', 'line': '132', 'Proxy': 'false', 'BkGrdnColor': '3370163', 'FrGrdnColor': '15998888'}"
62105897,Felício Teles,"{'col': '11', 'line': '32', 'Proxy': 'false'}"
22404465,Enrique Lofrano,"{'col': '46', 'line': '197', 'Proxy': 'false', 'BkGrdnColor': '7012214', 'FrGrdnColor': '2892847'}"
41498682,Valente Rodella,"{'col': '20', 'Font': 'Arial', 'line': '84', 'Proxy': 'true', 'BkGrdnColor': '8821301', 'FrGrdnColor': '5046281'}"
17525201,Guimar Galeone,"{'col': '17', 'Font': 'Helvetica', 'line': '260', 'BkGrdnColor': '13551894', 'FrGrdnColor': '8885403'}"
11139607,Brizida Gómez,"{'col': '41', 'Font': 'Arial', 'line': '72', 'Proxy': 'false', 'BkGrdnColor': '6931533', 'FrGrdnColor': '4833407'}"
72332462,Jasmim Garcez,"{'col': '30', 'line': '296', 'Proxy': 'false', 'BkGrdnColor': '3827664', 'FrGrdnColor': '12600029'}"
68996909,Gianni Anhaia,"{'col': '21', 'line': '23', 'Proxy': 'true'}"
11809567,Saladino Sequera,"{'col': '36', 'Font': 'Arial', 'line': '231', 'BkGrdnColor': '8593779', 'FrGrdnColor': '11435986'}"


Vamos verificar algumas contagens sobre os valores inseridos:

In [7]:
%%sql
SELECT Count(*) "Tuplas total",
       Count(*) FILTER (WHERE Config IS NULL) "config nula",
       Count(*) FILTER (WHERE Config ? 'line') "config line",
       Count(*) FILTER (WHERE Config ? 'col') "config col",
       Count(*) FILTER (WHERE Config ? 'FrGrdnColor') "config FrGrdnColor",
       Count(*) FILTER (WHERE Config ? 'BkGrdnColor') "config BkGrdnColor",
       Count(*) FILTER (WHERE Config ? 'Font') "config Font",
       Count(*) FILTER (WHERE Config ? 'Proxy') "config Proxy",
       Count(*) FILTER (WHERE Config -> 'Proxy' = 'true') "Proxy True",
       Count(*) FILTER (WHERE Config -> 'Proxy' = 'false') "Proxy False"
    FROM Configura;

 * postgresql://postgres:***@localhost/Alunos80k
1 rows affected.


Tuplas total,config nula,config line,config col,config FrGrdnColor,config BkGrdnColor,config Font,config Proxy,Proxy True,Proxy False
80000,2584,64005,64005,47817,47817,47947,58061,19319,38742


Quantas tuplas têm:
  * `Line` e `col`
  * `Line` ou `col`
  * `Line` e `FrGrdnColor`
  * `Line` ou `FrGrdnColor`

In [8]:
%%sql
SELECT Count(*) FILTER (WHERE Config ?& ARRAY['line', 'col']) "Line e col",
       Count(*) FILTER (WHERE Config ?| ARRAY['line', 'col']) "Line ou col",
       Count(*) FILTER (WHERE Config ?& ARRAY['line', 'FrGrdnColor']) "Line e FrGrdnColor",
       Count(*) FILTER (WHERE Config ?| ARRAY['line', 'FrGrdnColor']) "Line ou FrGrdnColor"
    FROM Configura;

 * postgresql://postgres:***@localhost/Alunos80k
1 rows affected.


Line e col,Line ou col,Line e FrGrdnColor,Line ou FrGrdnColor
64005,64005,38405,73417


Selecionar os alunos que trabalham com o font 'Arial'

In [9]:
%%sql
SELECT NUSP, Nome, Config->'Font' Font, To_Hex((Config->'FrGrdnColor')::INT) FrGrdnColor
    FROM Configura
    WHERE Config->'Font' = 'Arial'
    LIMIT 5

 * postgresql://postgres:***@localhost/Alunos80k
5 rows affected.


nusp,nome,font,frgrdncolor
71255902,Sinésio Ventura,Arial,
65090617,Ludovico Custódio,Arial,67ec81
51391212,Sandrina Valadares,Arial,b86328
88943607,Manuela Bonesso,Arial,
79693977,Blaise Bruno,Arial,75c68


### Inicio do Exercicio

In [10]:
%%sql
SELECT * FROM Configura
LIMIT 5

 * postgresql://postgres:***@localhost/Alunos80k
5 rows affected.


nusp,nome,config
77024075,Mira Zagalo,
73663844,Onildo Kennedy,
82560829,Erméria Fabozzi,"{'BkGrdnColor': '3927284', 'FrGrdnColor': '9398261'}"
13954715,Graciliano Newman,
47376929,Cecelia Pegoraro,"{'BkGrdnColor': '1094378', 'FrGrdnColor': '5039214'}"


Adicionando colunas

In [11]:
%%sql
ALTER TABLE Configura
ADD COLUMN destaques HSTORE,
ADD COLUMN frequencia NUMERIC,
ADD COLUMN sigla TEXT,
ADD COLUMN nf NUMERIC;

 * postgresql://postgres:***@localhost/Alunos80k
Done.


[]

Criando colunas novas para a tabela configura

In [12]:
%%sql
UPDATE Configura
SET nf = Matriculaas.nf,
    frequencia = Matriculaas.frequencia,
    sigla = Matriculaas.sigla
FROM Matriculaas
WHERE Configura.nusp = Matriculaas.nusp;

 * postgresql://postgres:***@localhost/Alunos80k
58417 rows affected.


[]

Criando a chave distinção

In [13]:
%%sql
UPDATE Configura 
    SET destaques = HStore(ARRAY['distincao'], 
                       ARRAY[nf::TEXT])
    WHERE nf >= 9;

 * postgresql://postgres:***@localhost/Alunos80k
2 rows affected.


[]

Visualizando a chave distinção

In [14]:
%%sql
SELECT Nome,nf, destaques-> 'distincao' nota
    FROM Configura
WHERE destaques-> 'distincao' IS NOT NULL

 * postgresql://postgres:***@localhost/Alunos80k
2 rows affected.


nome,nf,nota
Herédia Zanin,9.0,9.0
Margie Vieira,9.0,9.0


Criando a chave Trancamento

In [15]:
%%sql
UPDATE Configura 
    SET destaques = HStore(ARRAY['Trancamento'], 
                       ARRAY[sigla::TEXT])
    WHERE frequencia = 0 and nf <= 0.5 ;

 * postgresql://postgres:***@localhost/Alunos80k
117 rows affected.


[]

Visualizando Trancamento

In [16]:
%%sql
SELECT Nome,frequencia,nf, destaques-> 'Trancamento' Disciplina
    FROM Configura
WHERE destaques-> 'Trancamento' IS NOT NULL

 * postgresql://postgres:***@localhost/Alunos80k
117 rows affected.


nome,frequencia,nf,disciplina
Renee Marconi,0,0.5,FBA-113
Paz Ribas,0,0.2,PCS-135
Sadie Cook,0,0.3,PCS-140
Cloé Câmara,0,0.4,PCS-134
Dâmaso Williams,0,0.5,ZAZ-146
Elise Zambujal,0,0.0,PMT-119
Nélio Peterson,0,0.0,PEF-119
Múcio Esteves,0,0.0,PEF-145
Prisca Yates,0,0.5,GSA-127
Francis Calheiros,0,0.2,GSA-130


Criando chave BOM

In [17]:
%%sql
UPDATE configura
SET destaques = CASE
    WHEN (
        SELECT COUNT(DISTINCT sigla)
        FROM configura AS c2
        WHERE c2.nusp = configura.nusp AND c2.nf >= 8
    ) >= 2 THEN destaques || hstore('BOM', (
        SELECT COUNT(DISTINCT sigla)
        FROM configura AS c2
        WHERE c2.nusp = configura.nusp AND c2.nf >= 8
    )::text)
    ELSE destaques
    END
WHERE nf >= 8;


 * postgresql://postgres:***@localhost/Alunos80k
856 rows affected.


[]

Neste ajuste:

Utiliza-se COUNT(DISTINCT disciplina) para contar apenas disciplinas distintas em que o aluno obteve nota maior ou igual a 8.
O resultado dessa contagem é convertido para texto (::text) para ser inserido no HSTORE.
Um CASE é usado para verificar se a contagem é maior ou igual a 2. Se for verdadeiro, a chave "BOM" com a quantidade de disciplinas é adicionada ao HSTORE. Caso contrário, nada será alterado no campo destaques.
A condição WHERE nf >= 8 permanece para selecionar apenas os alunos com nota maior ou igual a 8.
Isso garantirá que somente alunos com duas ou mais disciplinas onde a nota é maior que 8 terão a chave "BOM" com a quantidade de disciplinas adicionada ao campo destaques. 




In [18]:
%%sql
SELECT * FROM Configura
WHERE destaques IS NOT NULL

 * postgresql://postgres:***@localhost/Alunos80k
119 rows affected.


nusp,nome,config,destaques,frequencia,sigla,nf
59197803,Margie Vieira,"{'col': '37', 'line': '266', 'Proxy': 'false'}",{'distincao': '9.0'},0,SME-122,9.0
62109969,Renee Marconi,{'Font': 'Garamond'},{'Trancamento': 'FBA-113'},0,FBA-113,0.5
23904819,Herédia Zanin,"{'Font': 'Garamond', 'Proxy': 'false'}",{'distincao': '9.0'},0,FLH-140,9.0
52710216,Paz Ribas,"{'Font': 'Helvetica', 'Proxy': 'false', 'BkGrdnColor': '1485244', 'FrGrdnColor': '4465852'}",{'Trancamento': 'PCS-135'},0,PCS-135,0.2
92105334,Sadie Cook,"{'Proxy': 'false', 'BkGrdnColor': '2275937', 'FrGrdnColor': '16423194'}",{'Trancamento': 'PCS-140'},0,PCS-140,0.3
30143699,Cloé Câmara,,{'Trancamento': 'PCS-134'},0,PCS-134,0.4
19910503,Dâmaso Williams,"{'Font': 'Courier', 'Proxy': 'false'}",{'Trancamento': 'ZAZ-146'},0,ZAZ-146,0.5
89130645,Elise Zambujal,"{'Font': 'Times', 'Proxy': 'false'}",{'Trancamento': 'PMT-119'},0,PMT-119,0.0
98036984,Nélio Peterson,"{'BkGrdnColor': '6664012', 'FrGrdnColor': '3176863'}",{'Trancamento': 'PEF-119'},0,PEF-119,0.0
61450411,Múcio Esteves,"{'BkGrdnColor': '12069691', 'FrGrdnColor': '4224260'}",{'Trancamento': 'PEF-145'},0,PEF-145,0.0
