### Exercícios
Alunos
* Vitor Versoza da Mata Quintella
* Samya de Lara Pinheiro

Crie um novo banco de dados chamado exercicios (se ele já não existir)

### Loja de Computadores

Execute o código abaixo para criação de tabelas que serão usadas

``` sql
CREATE TABLE Manufacturers (
	Code INTEGER PRIMARY KEY NOT NULL,
	Name CHAR(50) NOT NULL
);

CREATE TABLE Products (
	Code INTEGER PRIMARY KEY NOT NULL,
	Name CHAR(50) NOT NULL ,
	Price REAL NOT NULL ,
	Manufacturer INTEGER NOT NULL
		CONSTRAINT fk_Manufacturers_Code REFERENCES Manufacturers(Code)
);

INSERT INTO Manufacturers
    (Code,Name)
VALUES
    (1,'Sony'),
    (2,'Creative Labs'),
    (3,'Hewlett-Packard'),
    (4,'Iomega'),
    (5,'Fujitsu'),
    (6,'Winchester');

INSERT INTO
    Products(Code,Name,Price,Manufacturer)
VALUES
    (1,'Hard drive',240,5),
    (2,'Memory',120,6),
    (3,'ZIP drive',150,4),
    (4,'Floppy disk',5,6),
    (5,'Monitor',240,1),
    (6,'DVD drive',180,2),
    (7,'CD drive',90,2),
    (8,'Printer',270,3),
    (9,'Toner cartridge',66,3),
    (10,'DVD burner',180,2);
```

#### Coloque o comando SQL abaixo de cada pergunta aqui no notebook (depois de testar no pgAdmin)

1. Selecione os nomes de todos os produtos da loja.

```sql
select name from products;
```

2. Selecione os nomes e os preços de todos os produtos da loja.

```sql
select name,price from products;
```

3. Selecione o nome dos produtos com preço menor ou igual a 200.

```sql
select name from products where price <= 200;
```

4. Selecione todos os produtos com preço entre $60 e $120.

```sql
select name from products where price between 60 and 120;
```

5. Selecione o nome e o preço em centavos (ou seja, o preço deve ser multiplicado por 100).

```sql
select name,price*100 from products;
```

6. Calcule o preço médio de todos os produtos.

```sql
select avg(price) as media_preco from products;
```

7. Calcule o preço médio de todos os produtos com código de fabricante igual a 2.

```sql
select avg(price) as media_preco from products where manufacturer = 2;
```

8. Calcule o número de produtos com preço maior ou igual a 180.

```sql
select count(*) as num_produtos from products where price >= 180;
```

9. Selecione o nome e o preço de todos os produtos com preço maior ou igual a US180 e classifique primeiro por preço (em ordem decrescente) e depois por nome (em ordem crescente).

```sql
select name,price from products where price >= 180 order by price desc,name;
```

10. Selecione todos os dados dos produtos, incluindo todos os dados do fabricante de cada produto.

```sql
select
    products.*
    ,manufacturers.name as manufacturer_name
from products
inner join manufacturers
on products.manufacturer = manufacturers.code
order by manufacturer, products.name;
```

11.Selecione o nome do produto, preço e nome do fabricante de todos os produtos.

```sql
select
    products.name as product_name
    ,products.price as price
    ,manufacturers.name as manufacturer_name
from products
inner join manufacturers
on products.manufacturer = manufacturers.code
order by manufacturer, products.name;
```

12. Selecione o preço médio dos produtos de cada fabricante, mostrando apenas o código do fabricante.

```sql
select manufacturer, avg(price) from products group by manufacturer;
```

13. Selecione o preço médio dos produtos de cada fabricante, mostrando o nome do fabricante.

```sql
-- opcao 1: Mais limpo
select m.name, avg(p.price) from products p inner join manufacturers m on p.manufacturer = m.code group by m.name;

-- opcao 2: Menos custoso? (testar com explain)
select name,media_preco
from
(select manufacturer, avg(price) as media_preco
from products group by manufacturer )
    as t
inner join manufacturers
    on t.manufacturer = manufacturers.code;
```

14. Selecione os nomes dos fabricantes cujos produtos têm preço médio maior ou igual a 50.


```sql
with cte_media as (
    select m.name, avg(p.price) as media_preco
    from products p
    inner join manufacturers m on p.manufacturer = m.code
    group by m.name
    )
select name from cte_media where media_preco >= 150;
```

15. Selecione o nome e o preço do produto mais barato.

```sql
select name,price from products order by price asc limit 1;

-- opcao 2
with cte_min as (select min(price) as min_price from products)
select name, price from products
inner join cte_min on price = cte_min.min_price;
```

16. Selecione o nome de cada fabricante junto com o nome e o preço de seu produto mais caro.

```sql
-- seleciona considerando a possibilidade de mais de um produto com o maior preço
with cte_max as (select manufacturer,max(price) as max_price from products group by manufacturer)
select manufacturers.name, products.name, price from products
right join  cte_max on price = cte_max.max_price and products.manufacturer = cte_max.manufacturer
inner join manufacturers on manufacturers.code = products.manufacturer
order by manufacturers.name, products.name;
```

17. Selecione o nome de cada fabricante que tenha um preço médio acima de 145 e contenha pelo menos 2 produtos diferentes.

```sql
with cte_media as (
    select m.name, avg(p.price) as media_preco,  count(distinct p.name) as qtd_produtos
    from products p
    inner join manufacturers m on p.manufacturer = m.code
    group by m.name
    )
select name from cte_media where media_preco > 145 and qtd_produtos> 1;
```

18. Adicione um novo produto: Alto-falantes, US 70, fabricante 2.

```sql
insert into products
        (code, name, price, manufacturer)
    values
        ((select MAX(code)+1 from products), 'Alto-falantes', 70, 2);
```

19. Atualize o nome do produto 8 para "Impressora a Laser".

```sql
UPDATE products SET name = 'Impressora a Laser' WHERE code = 8;
```

20. Aplique um desconto de 10% em todos os produtos.

```sql
update products set price = price * (1-0.1);
```

21. Aplique um desconto de 10% em todos os produtos com preço maior ou igual a 120.

```sql
update products set price = price * (1-0.1) where price >= 120;
```

### Gerenciamento de Empregados

![Relacionamento](https://upload.wikimedia.org/wikipedia/commons/thumb/3/36/Employees.png/300px-Employees.png)

Crie as tabelas e relacionamentos conforme diagrama acima.

```sql
CREATE TABLE Departaments (
	Code INTEGER PRIMARY KEY NOT NULL,
	Name CHAR(45) NOT NULL,
	Budget MONEY NOT NULL
);

CREATE TABLE Employees (
    Code INTEGER PRIMARY KEY NOT NULL,
    Name VARCHAR(100) NOT NULL,
    Departament INTEGER NOT NULL,
    CONSTRAINT FK_Departament_Code FOREIGN KEY (Departament) REFERENCES departaments (Code)
);
````

Insira na tabela os valores abaixo

```sql
INSERT INTO departaments
    (code, name, budget)
VALUES
       (14, 'IT', 65000),
       (37, 'Accounting', 15000),
       (59, 'Human Resources', 240000),
       (77, 'Research', 55000);


-- Create new column lastname in the table employees
ALTER TABLE employees ADD COLUMN lastname varchar(100);

-- INSERT FOLLOWING DATA INTO THE TABLE employees

INSERT INTO employees
    (code, name, lastname, departament)
VALUES
       (123234877, 'Michael', 'Rogers', 14),
       (152934485, 'Anand', 'Manikutty', 14),
       (222364883, 'Carol', 'Smith', 37),
       (326587417, 'Joe', 'Stevens', 37),
       (332154719, 'Mary-Anne', 'Foster', 14),
       (332569843, 'George', 'O''Donnell', 77),
       (546523478, 'John', 'Doe', 59),
       (631231482, 'David', 'Smith', 77),
       (654873219, 'Zacary', 'Efron', 59),
       (745685214, 'Eric', 'Goldsmith', 59),
       (845657245, 'Elizabeth', 'Doe', 14),
       (845657246, 'Kumar', 'Swamy', 14);
```

1. Selecione o nome e o sobrenome dos funcionários que trabalham para os departamentos com o segundo menor orçamento.

```sql
select name, lastname from employees
where departament in (
    select code
    from departaments
    order by budget limit 1 offset 1
    );
```

2. Adicione um novo departamento chamado "Garantia de Qualidade", com um orçamento de 40.000 e código departamental 11. Adicione um funcionário chamado "Mary Moore" nesse departamento, com SSN 847-21-9811.


```sql
INSERT INTO departaments (code, name, budget)
VALUES (11, 'Garantia de Qualidade', 40000);

INSERT INTO employees (ssn, name, lastname, departament)
VALUES (847219811, 'Mary Moore', 'Garcia', 11);
```

3. Reduzir o orçamento de todos os departamentos em 10%.
```sql
UPDATE departaments SET budget = budget * (1 - 0.1);
```

4. Reatribuir todos os funcionários do departamento de Pesquisa (código 77) para o departamento de TI (código 14).
```sql
UPDATE employees SET departament = 14 WHERE departament = 77;
```

5. Apague da tabela todos os funcionários do departamento de TI (código 14).
```sql
DELETE FROM employees WHERE departament = 14;
```
6. Exclua da tabela todos os funcionários que trabalham em departamentos com orçamento maior ou igual a 60.000.
```sql
DELETE FROM employees
WHERE departament IN (SELECT code FROM departaments WHERE budget >= 60000::money);
```

7. Exclua da tabela todos os funcionários.
```sql
DELETE FROM employees;
```

### Titanic

1 - Utilize o site do Kaggle. Iremos baixar o arquivo CSV do Titanic:https://www.kaggle.com/competitions/titanic/data?select=test.csv

3 - O objetivo desta tarefa é:
    a. Criar quatro tabelas: Survival, pclass, embarked e passageiros. Isso por que para as colunas que possuem uma descrição (Key) é necessário criar uma tabela para cada uma delas.

In [4]:
import psycopg2


In [123]:

table_survival = "CREATE TABLE IF NOT EXISTS Survival(Code int primary key, description char(3));"
table_pclass = "CREATE TABLE IF NOT EXISTS pclass(Code int primary key, description char(10));"
table_embarked = "CREATE TABLE IF NOT EXISTS embarked(Code varchar(10) primary key, description varchar(20));"
table_passenger = """CREATE TABLE IF NOT EXISTS passenger
(
    PassengerId int primary key,
    Survived    int,
    Pclass      int,
    Name        varchar(100),
    Sex         char(6),
    Age         float,
    SibSp       int,
    Parch       int,
    Fare      float,
    Cabin       varchar(100),
    Embarked    varchar(10),


    foreign key (Survived) references survival (code),
    foreign key (Pclass) references pclass (code),
    foreign key (Embarked) references embarked (code)
);"""


conn = psycopg2.connect(host='localhost',
                        database='exercicios',
                        user='postgres',
                        password= 'admin')

cur = conn.cursor()

try:
    cur.execute(table_survival)
    conn.commit()
    cur.execute(table_pclass)
    conn.commit()
    cur.execute(table_embarked)
    conn.commit()
    cur.execute(table_passenger)
    conn.commit()
    cur.close()

except (Exception, psycopg2.DatabaseError) as error:
    print(error)
finally:
    if conn is not None:
        conn.close()
        print('Tabelas criadas! Conexão encerrada.')

Tabelas criadas! Conexão encerrada.


In [45]:
# Function to commit sql to DB
def commit_query(query):
    conn = psycopg2.connect(host='localhost',
                            database='exercicios',
                            user='postgres',
                            password= 'admin')

    cur = conn.cursor()

    try:
        cur.execute(query)
        conn.commit()
        mobile_records = cur.fetchall()
        cur.close()

    except (Exception, psycopg2.DatabaseError) as error:
        print(error)
    finally:
        if conn is not None:
            conn.close()
        return mobile_records

def dataframe_to_query(df, table):
    cols = ",".join([str(i) for i in df.columns.tolist()])
    sql = f"INSERT INTO {table} ( {cols} )\n VALUES\n"
    last_row = df.shape[0] - 1
    for i,row in df.iterrows():
        sql = sql + str(tuple(row))
        if i is not last_row:
            sql = sql +',\n'
        else:
            sql = sql +';'
    return sql


In [41]:
# Input Survival
table ='survival'
columns = ['code', 'description']
data = [[0,'No'],[1, 'Yes']]
df = pd.DataFrame(data, columns=columns)
query = dataframe_to_query(df, table)
commit_query(query)

# Input Survival
table ='pclass'
columns = ['code', 'description']
data = [[1,'1st class'],[2, '2nd class'],[3, '3rd class']]
df = pd.DataFrame(data, columns=columns)
query = dataframe_to_query(df, table)
commit_query(query)

# Input embarked
table ='embarked'
columns = ['code', 'description']
data = [['C','Cherbourg'],['Q', 'Queenstown'],['S', 'Southampton']]
df = pd.DataFrame(data, columns=columns)
query = dataframe_to_query(df, table)
commit_query(query)

In [4]:
import pandas as pd
import numpy as np
# Read titanic.csv file keep only the columns Survived, Pclass, embarked
df = pd.read_csv('titanic.csv')
df = df.drop(columns='Ticket')
df = df.replace({np.nan: None})

conn = psycopg2.connect(host='localhost',
                        database='exercicios',
                        user='postgres',
                        password= 'admin')
# cursor
cur = conn.cursor()

# list for inserting
cols = ",".join([str(i) for i in df.columns.tolist()])

# insert DataFrame records one by one.
for i,row in df.iterrows():
    sql = "INSERT INTO passenger (" +cols + ") VALUES (" + "%s,"*(len(row)-1) + "%s)"
    cur.execute(sql, tuple(row))
    conn.commit()

cur.close()
conn.close()
print('Tabela Passengers povoada! Conexão encerrada.')

Tabela Passengers povoada! Conexão encerrada.


4- Responder as seguintes perguntas via SQL:
1 - Quantas pessoas sobreviveram do sexo feminino? **resposta = 233**
```sql
SELECT count(passengerid) FROM passenger WHERE survived = 1 AND sex = 'female';

```

2 - Quantas pessoas do sexo masculino não sobreviveram?  **resposta = 468**

```sql
SELECT count(passengerid) FROM passenger WHERE survived = 0 AND sex = 'male';

```

3 - Agrupar em um unico resultado (mas pode ser usado varias queries) quantas pessoas sobreviveram de 0 a 10 anos, sobreviveram de 11 a 20 anos, sobreviveram de 21 a 40 anos e sobreviveram acima de 40 anos. O resultado devera ter duas colunas, o nome do grupo (por ex: Pessoas de 0 a 10 anos) e a contagem

**Resposta:**
contagem, faixa_etaria
62  Pessoas de 0 a 10 anos
163 Pessoas de mais de 40 anos
102 Pessoas de 11 a 20 anos
387 Pessoas de 21 a 40 anos


```sql
SELECT count(age) as Contagem,
    CASE WHEN age >= 0 AND age < 10 THEN 'Pessoas de 0 a 10 anos'
      WHEN age >= 10 AND age < 20 THEN 'Pessoas de 11 a 20 anos'
      WHEN age >= 20 AND age < 40 THEN 'Pessoas de 21 a 40 anos'
      WHEN age >= 40 THEN 'Pessoas de mais de 40 anos'
    END Faixa_Etária
FROM passenger
WHERE age is not NULL
GROUP BY Faixa_etária;
```


In [33]:
def custom_select(table, columns_return, filter_list=[]):
    sql = f"Select {', '.join(columns_return)} from {table}"

    if filter_list != []:
        sql += ' WHERE '
        for i,filter in enumerate(filter_list):
            if i != 0:
                sql += ' AND '
            sql += filter
        sql += ';'

    return sql

In [53]:
table = 'passenger'
columns_return = ['name', 'sex', 'age']
filter = ['survived = 1', "sex = 'female'"]
query = custom_select(table, columns_return, filter)
print('query usado:', query)
print('Resultados:')
commit_query(query)


query usado: Select name, sex, age from passenger WHERE survived = 1 AND sex = 'female';
Resultados:


[('Cumings, Mrs. John Bradley (Florence Briggs Thayer)', 'female', 38.0),
 ('Heikkinen, Miss. Laina', 'female', 26.0),
 ('Futrelle, Mrs. Jacques Heath (Lily May Peel)', 'female', 35.0),
 ('Johnson, Mrs. Oscar W (Elisabeth Vilhelmina Berg)', 'female', 27.0),
 ('Nasser, Mrs. Nicholas (Adele Achem)', 'female', 14.0),
 ('Sandstrom, Miss. Marguerite Rut', 'female', 4.0),
 ('Bonnell, Miss. Elizabeth', 'female', 58.0),
 ('Hewlett, Mrs. (Mary D Kingcome) ', 'female', 55.0),
 ('Masselmani, Mrs. Fatima', 'female', None),
 ('McGowan, Miss. Anna "Annie"', 'female', 15.0),
 ('Asplund, Mrs. Carl Oscar (Selma Augusta Emilia Johansson)', 'female', 38.0),
 ('O\'Dwyer, Miss. Ellen "Nellie"', 'female', None),
 ('Spencer, Mrs. William Augustus (Marie Eugenie)', 'female', None),
 ('Glynn, Miss. Mary Agatha', 'female', None),
 ('Nicola-Yarred, Miss. Jamila', 'female', 14.0),
 ('Laroche, Miss. Simonne Marie Anne Andree', 'female', 3.0),
 ('Devaney, Miss. Margaret Delia', 'female', 19.0),
 ("O'Driscoll, Miss.