# PRÁTICA

### Preparando o ambiente

In [None]:
# Montando o Google Drive
from google.colab import drive
drive.mount('/content/drive')


Mounted at /content/drive


In [None]:
%cd /content/drive/MyDrive/ciclo11_Python_Para_Dados/mod3/

/content/drive/MyDrive/ciclo11_Python_Para_Dados/mod3


In [None]:
import os
print(os.getcwd())


/content/drive/MyDrive/ciclo11_Python_Para_Dados/mod3


In [None]:
!ls

aula1.ipynb  aula3.ipynb  empresa.db-journal  vendas_carros.db
aula2.ipynb  empresa.db   Untitled0.ipynb


### Tabela de Comando SQL

| **Comando SQL**        | **Descrição**                                                                 | **Exemplo de Uso**                                                                                     |
|------------------------|-------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------------|
| `CREATE TABLE`          | Cria uma nova tabela no banco de dados.                                       | ```CREATE TABLE Alunos (id INTEGER PRIMARY KEY, nome TEXT);```                                           |
| `INSERT INTO`           | Insere novos registros em uma tabela.                                         | ```INSERT INTO Alunos (id, nome) VALUES (1, 'João');```                                                  |
| `SELECT`                | Seleciona dados de uma ou mais tabelas.                                       | ```SELECT * FROM Alunos;```                                                                             |
| `JOIN`                  | Junta dados de duas ou mais tabelas com base em uma condição.                 | ```SELECT Alunos.nome, Cursos.nome FROM Alunos JOIN Cursos ON Alunos.id_curso = Cursos.id;```             |
| `WHERE`                 | Filtra os resultados de uma consulta com base em uma condição.                | ```SELECT * FROM Alunos WHERE idade > 18;```                                                             |
| `GROUP BY`              | Agrupa resultados de uma consulta em categorias.                             | ```SELECT curso, COUNT(*) FROM Alunos GROUP BY curso;```                                                 |
| `HAVING`                | Filtra grupos após o uso de `GROUP BY`.                                       | ```SELECT curso, COUNT(*) FROM Alunos GROUP BY curso HAVING COUNT(*) > 5;```                             |
| `ORDER BY`              | Ordena os resultados de uma consulta.                                         | ```SELECT * FROM Alunos ORDER BY nome ASC;```                                                            |
| `UPDATE`                | Atualiza registros existentes em uma tabela.                                  | ```UPDATE Alunos SET idade = 20 WHERE id = 1;```                                                         |
| `DELETE`                | Remove registros de uma tabela.                                               | ```DELETE FROM Alunos WHERE id = 1;```                                                                   |
| `ALTER TABLE`           | Modifica a estrutura de uma tabela.                                           | ```ALTER TABLE Alunos ADD COLUMN email TEXT;```                                                          |
| `DROP TABLE`            | Remove uma tabela do banco de dados.                                          | ```DROP TABLE Alunos;```                                                                                 |
| `INNER JOIN`            | Retorna apenas os registros que possuem correspondências em ambas as tabelas. | ```SELECT Alunos.nome, Cursos.nome FROM Alunos INNER JOIN Cursos ON Alunos.id_curso = Cursos.id;```       |
| `LEFT JOIN`             | Retorna todos os registros da tabela à esquerda e os correspondentes à direita.| ```SELECT Alunos.nome, Cursos.nome FROM Alunos LEFT JOIN Cursos ON Alunos.id_curso = Cursos.id;```        |
| `RIGHT JOIN`            | Retorna todos os registros da tabela à direita e os correspondentes à esquerda.| ```SELECT Alunos.nome, Cursos.nome FROM Alunos RIGHT JOIN Cursos ON Alunos.id_curso = Cursos.id;```       |
| `FULL OUTER JOIN`       | Retorna todos os registros quando há correspondência em uma das tabelas.      | ```SELECT Alunos.nome, Cursos.nome FROM Alunos FULL OUTER JOIN Cursos ON Alunos.id_curso = Cursos.id;```  |
| `DISTINCT`              | Retorna valores distintos (não duplicados) de uma coluna.                     | ```SELECT DISTINCT curso FROM Alunos;```                                                                 |
| `COUNT`                 | Conta o número de registros que correspondem a uma consulta.                  | ```SELECT COUNT(*) FROM Alunos;```                                                                       |
| `AVG`                   | Calcula a média de uma coluna numérica.                                       | ```SELECT AVG(idade) FROM Alunos;```                                                                     |
| `SUM`                   | Calcula a soma de uma coluna numérica.                                        | ```SELECT SUM(salario) FROM Funcionarios;```                                                             |
| `MAX`                   | Retorna o valor máximo de uma coluna.                                         | ```SELECT MAX(salario) FROM Funcionarios;```                                                             |
| `MIN`                   | Retorna o valor mínimo de uma coluna.                                         | ```SELECT MIN(salario) FROM Funcionarios;```                                                             |
| `CREATE INDEX`          | Cria um índice para acelerar consultas.                                       | ```CREATE INDEX idx_nome ON Alunos (nome);```                                                            |
| `DROP INDEX`            | Remove um índice.                                                             | ```DROP INDEX idx_nome;```                                                                               |


### Cenário: Análise da Jornada e Experiência do Cliente

#### Descrição do Cenário:


Uma empresa de e-commerce está interessada em entender melhor a jornada dos seus clientes no site, bem como a experiência de compra e atendimento. A empresa tem informações sobre:

Clientes: Identificação dos clientes, dados demográficos e informações de contato.

Pedidos: Registro de pedidos realizados por cada cliente, incluindo o valor total do pedido, data, e status do pagamento.

Avaliações: Feedback dos clientes sobre os produtos comprados, assim como avaliações sobre a experiência de navegação e atendimento.

A empresa quer analisar como diferentes perfis de clientes avaliam a experiência de compra, comparando esses resultados com o número de pedidos e o valor gasto em um determinado período.

#### Objetivo:

  -  Criar três bases de dados em arquivos CSV contendo informações sobre Clientes, Pedidos, e Avaliações.

- Construir um banco de dados relacional em SQLite para armazenar e cruzar essas informações, definindo as chaves primárias e estrangeiras.

 - Realizar consultas para responder às seguintes perguntas:

1. Qual é o gasto total por cliente?

2. Qual é a média de avaliação por cliente e por produto?

3. Existe alguma correlação entre a frequência de pedidos e as notas de avaliação?


### Mão na Massa

#### Criação das Bases de Dados (CSV)

In [None]:
!pip install faker

In [None]:
import csv
import random
from faker import Faker

In [None]:

# Inicializar o Faker para gerar dados fictícios
fake = Faker()

In [None]:
# Quantidade de linhas para gerar
num_linhas = 5000


In [None]:
# Criar dados para a base de Clientes
def gerar_clientes(num_linhas):
    clientes = []
    for i in range(1, num_linhas + 1):
        nome = fake.name()
        email = fake.email()
        idade = random.randint(18, 70)
        genero = random.choice(['Masculino', 'Feminino'])
        clientes.append((i, nome, email, idade, genero))
    return clientes


In [None]:
# Criar dados para a base de Pedidos
def gerar_pedidos(num_linhas):
    pedidos = []
    for i in range(1, num_linhas + 1):
        id_cliente = random.randint(1, num_linhas)  # Relaciona o pedido ao cliente
        data_pedido = fake.date_between(start_date='-1y', end_date='today')
        valor_total = round(random.uniform(50.0, 5000.0), 2)
        status_pagamento = random.choice(['Pago', 'Pendente'])
        pedidos.append((i, id_cliente, data_pedido, valor_total, status_pagamento))
    return pedidos

In [None]:
# Criar dados para a base de Avaliações
def gerar_avaliacoes(num_linhas):
    avaliacoes = []
    for i in range(1, num_linhas + 1):
        id_cliente = random.randint(1, num_linhas)  # Relaciona a avaliação ao cliente
        produto = random.choice(['Produto A', 'Produto B', 'Produto C', 'Produto D'])
        nota = round(random.uniform(1.0, 5.0), 1)
        comentario = fake.sentence(nb_words=10)
        avaliacoes.append((i, id_cliente, produto, nota, comentario))
    return avaliacoes

In [None]:
# Função para salvar dados em CSV
def salvar_csv(nome_arquivo, dados, colunas):
    with open(nome_arquivo, 'w', newline='') as file:
        writer = csv.writer(file)
        writer.writerow(colunas)
        writer.writerows(dados)

In [None]:
# Gerar e salvar os dados de Clientes, Pedidos e Avaliações
clientes = gerar_clientes(num_linhas)
salvar_csv('clientes.csv', clientes, ['id_cliente', 'nome', 'email', 'idade', 'genero'])

pedidos = gerar_pedidos(num_linhas)
salvar_csv('pedidos.csv', pedidos, ['id_pedido', 'id_cliente', 'data_pedido', 'valor_total', 'status_pagamento'])

avaliacoes = gerar_avaliacoes(num_linhas)
salvar_csv('avaliacoes.csv', avaliacoes, ['id_avaliacao', 'id_cliente', 'produto', 'nota', 'comentario'])

print("Arquivos CSV gerados com sucesso!")

Arquivos CSV gerados com sucesso!


### Criar o Banco de Dados SQLite

In [None]:
import sqlite3


In [None]:
# Conectar ao banco de dados SQLite
conexao = sqlite3.connect('ecommerce.db')
cursor = conexao.cursor()

In [None]:
# Criar tabelas Clientes, Pedidos e Avaliações
cursor.execute('''
CREATE TABLE IF NOT EXISTS Clientes (
    id_cliente INTEGER PRIMARY KEY,
    nome TEXT NOT NULL,
    email TEXT NOT NULL UNIQUE,
    idade INTEGER NOT NULL,
    genero TEXT NOT NULL
)
''')

<sqlite3.Cursor at 0x7abedb7727c0>

In [None]:
cursor.execute('''
CREATE TABLE IF NOT EXISTS Pedidos (
    id_pedido INTEGER PRIMARY KEY,
    id_cliente INTEGER,
    data_pedido TEXT NOT NULL,
    valor_total REAL NOT NULL,
    status_pagamento TEXT NOT NULL,
    FOREIGN KEY (id_cliente) REFERENCES Clientes(id_cliente)
)
''')

<sqlite3.Cursor at 0x7abedb7727c0>

In [None]:
cursor.execute('''
CREATE TABLE IF NOT EXISTS Avaliacoes (
    id_avaliacao INTEGER PRIMARY KEY,
    id_cliente INTEGER,
    produto TEXT NOT NULL,
    nota REAL NOT NULL,
    comentario TEXT,
    FOREIGN KEY (id_cliente) REFERENCES Clientes(id_cliente)
)
''')

<sqlite3.Cursor at 0x7abedb7727c0>

In [None]:
# Função para ler dados CSV e inseri-los nas tabelas SQLite
def inserir_dados_csv(arquivo, tabela, colunas, num_colunas):
    with open(arquivo, newline='') as file:
        reader = csv.reader(file)
        next(reader)  # Pular o cabeçalho
        dados = [tuple(row) for row in reader]
        placeholder = ', '.join(['?'] * num_colunas)  # Gerar placeholders de acordo com o número de colunas
        query = f"INSERT OR IGNORE INTO {tabela} ({colunas}) VALUES ({placeholder})"
        cursor.executemany(query, dados)

In [None]:

# Inserir dados nas tabelas com INSERT OR IGNORE para evitar duplicatas
inserir_dados_csv('clientes.csv', 'Clientes', 'id_cliente, nome, email, idade, genero', 5)
inserir_dados_csv('pedidos.csv', 'Pedidos', 'id_pedido, id_cliente, data_pedido, valor_total, status_pagamento', 5)
inserir_dados_csv('avaliacoes.csv', 'Avaliacoes', 'id_avaliacao, id_cliente, produto, nota, comentario', 5)

In [None]:
# Salvar alterações e fechar conexão
conexao.commit()
#conexao.close()
print("Dados inseridos com sucesso no banco de dados!")

Dados inseridos com sucesso no banco de dados!


### Consultas SQL e Análise

 Gasto Total por Cliente:

In [None]:
# Consulta SQL
cursor.execute('''
SELECT Clientes.nome, SUM(Pedidos.valor_total) AS total_gasto
FROM Clientes
JOIN Pedidos ON Clientes.id_cliente = Pedidos.id_cliente
WHERE Pedidos.status_pagamento = 'Pago'
GROUP BY Clientes.nome
''')


<sqlite3.Cursor at 0x7abedb7727c0>

In [None]:
# Exibir resultados
resultados = cursor.fetchall()
for resultado in resultados:
    print(f"Cliente: {resultado[0]}, Gasto Total: {resultado[1]}")


Cliente: Aaron Matthews, Gasto Total: 7281.18
Cliente: Aaron Powell, Gasto Total: 2346.1
Cliente: Aaron Russell, Gasto Total: 3636.2400000000002
Cliente: Abigail Clark, Gasto Total: 1023.21
Cliente: Abigail Stevenson, Gasto Total: 7805.2300000000005
Cliente: Adam Schwartz, Gasto Total: 797.38
Cliente: Adam Simmons, Gasto Total: 12140.24
Cliente: Adam Stevenson, Gasto Total: 622.72
Cliente: Alan Hayes, Gasto Total: 2719.0899999999997
Cliente: Albert Raymond, Gasto Total: 4292.67
Cliente: Alec Rivera, Gasto Total: 3323.7
Cliente: Alejandro Walls, Gasto Total: 7259.3
Cliente: Alex Bush, Gasto Total: 1039.64
Cliente: Alex Smith, Gasto Total: 471.07
Cliente: Alexander Andrews, Gasto Total: 4832.88
Cliente: Alexander Campos, Gasto Total: 6233.120000000001
Cliente: Alexander Garrett, Gasto Total: 4324.74
Cliente: Alexander Reyes, Gasto Total: 2642.78
Cliente: Alexander Romero, Gasto Total: 7891.84
Cliente: Alexander Ross, Gasto Total: 5110.84
Cliente: Alexander Williams, Gasto Total: 4096.4
C

In [None]:
# Criar a tabela para armazenar o gasto total por cliente
cursor.execute('''
CREATE TABLE IF NOT EXISTS Gasto_Total_Cliente (
    id_cliente INTEGER,
    nome TEXT,
    total_gasto REAL,
    PRIMARY KEY(id_cliente)
)
''')

<sqlite3.Cursor at 0x7abedb7727c0>

In [None]:
# Buscar os resultados e inserir na tabela Gasto_Total_Cliente
resultados = cursor.fetchall()
cursor.executemany('''
INSERT OR REPLACE INTO Gasto_Total_Cliente ( nome, total_gasto)
VALUES (?, ?)
''', resultados)

<sqlite3.Cursor at 0x7abedb7727c0>

Média de Avaliação por Cliente e Produto:

In [None]:
# Consulta SQL
cursor.execute('''
SELECT Clientes.nome, Avaliacoes.produto, AVG(Avaliacoes.nota) AS media_nota
FROM Clientes
JOIN Avaliacoes ON Clientes.id_cliente = Avaliacoes.id_cliente
GROUP BY Clientes.nome, Avaliacoes.produto
''')

<sqlite3.Cursor at 0x7abedb7727c0>

In [None]:
# Exibir resultados
resultados = cursor.fetchall()
for resultado in resultados:
    print(f"Cliente: {resultado[0]}, Produto: {resultado[1]}, Média de Avaliação: {resultado[2]}")


Cliente: Aaron Houston, Produto: Produto B, Média de Avaliação: 2.3
Cliente: Aaron Houston, Produto: Produto D, Média de Avaliação: 2.5
Cliente: Aaron Hunt, Produto: Produto D, Média de Avaliação: 4.1
Cliente: Aaron Martinez, Produto: Produto B, Média de Avaliação: 2.9
Cliente: Aaron Matthews, Produto: Produto A, Média de Avaliação: 1.4
Cliente: Aaron Matthews, Produto: Produto C, Média de Avaliação: 3.2
Cliente: Aaron Matthews, Produto: Produto D, Média de Avaliação: 3.5
Cliente: Aaron Powell, Produto: Produto B, Média de Avaliação: 2.2
Cliente: Aaron Quinn, Produto: Produto B, Média de Avaliação: 2.5
Cliente: Aaron Quinn, Produto: Produto C, Média de Avaliação: 4.0
Cliente: Aaron Quinn, Produto: Produto D, Média de Avaliação: 3.9
Cliente: Aaron Russell, Produto: Produto A, Média de Avaliação: 2.75
Cliente: Aaron Waller, Produto: Produto B, Média de Avaliação: 3.2
Cliente: Aaron Ward, Produto: Produto B, Média de Avaliação: 2.4
Cliente: Aaron Ward, Produto: Produto C, Média de Avaliaç

In [None]:
# Criar a tabela para armazenar a média de avaliação por cliente e produto
cursor.execute('''
CREATE TABLE IF NOT EXISTS Media_Avaliacao_Cliente_Produto (
    id_cliente INTEGER,
    nome TEXT,
    produto TEXT,
    media_nota REAL,
    PRIMARY KEY(id_cliente, produto)
)
''')

<sqlite3.Cursor at 0x7abedb7727c0>

In [None]:
# Buscar os resultados e inserir na tabela Media_Avaliacao_Cliente_Produto
resultados = cursor.fetchall()
cursor.executemany('''
INSERT OR REPLACE INTO Media_Avaliacao_Cliente_Produto (nome, produto, media_nota)
VALUES (?, ?, ?)
''', resultados)


<sqlite3.Cursor at 0x7abedb7727c0>

Correlação entre Frequência de Pedidos e Notas de Avaliação:

In [None]:
# Consulta SQL para contar pedidos e calcular a média de notas
cursor.execute('''
SELECT Clientes.id_cliente, Clientes.nome, COUNT(Pedidos.id_pedido) AS total_pedidos, AVG(Avaliacoes.nota) AS media_avaliacao
FROM Clientes
JOIN Pedidos ON Clientes.id_cliente = Pedidos.id_cliente
JOIN Avaliacoes ON Clientes.id_cliente = Avaliacoes.id_cliente
WHERE Pedidos.status_pagamento = 'Pago'
GROUP BY Clientes.nome
''')

<sqlite3.Cursor at 0x7abedb7727c0>

In [None]:
# Exibir resultados
resultados = cursor.fetchall()
for resultado in resultados:
    print(f"Cliente: {resultado[0]}, Total de Pedidos: {resultado[1]}, Média de Avaliação: {resultado[2]}")


Cliente: Aaron Matthews, Total de Pedidos: 6, Média de Avaliação: 2.6999999999999997
Cliente: Aaron Powell, Total de Pedidos: 1, Média de Avaliação: 2.2
Cliente: Aaron Russell, Total de Pedidos: 4, Média de Avaliação: 2.75
Cliente: Abigail Stevenson, Total de Pedidos: 2, Média de Avaliação: 3.1
Cliente: Adam Schwartz, Total de Pedidos: 3, Média de Avaliação: 3.0
Cliente: Adam Simmons, Total de Pedidos: 12, Média de Avaliação: 3.225
Cliente: Adam Stevenson, Total de Pedidos: 1, Média de Avaliação: 5.0
Cliente: Alan Hayes, Total de Pedidos: 2, Média de Avaliação: 2.6
Cliente: Alejandro Walls, Total de Pedidos: 6, Média de Avaliação: 3.0500000000000003
Cliente: Alex Bush, Total de Pedidos: 3, Média de Avaliação: 3.266666666666667
Cliente: Alex Smith, Total de Pedidos: 1, Média de Avaliação: 4.6
Cliente: Alexander Andrews, Total de Pedidos: 2, Média de Avaliação: 1.4
Cliente: Alexander Campos, Total de Pedidos: 9, Média de Avaliação: 1.8000000000000003
Cliente: Alexander Reyes, Total de Pe

In [None]:
# Criar a tabela para armazenar a correlação entre frequência de pedidos e notas de avaliação
cursor.execute('''
CREATE TABLE IF NOT EXISTS Correlacao_Pedidos_Avaliacoes (
    id_cliente INTEGER,
    nome TEXT,
    total_pedidos INTEGER,
    media_avaliacao REAL,
    PRIMARY KEY(id_cliente)
)
''')

<sqlite3.Cursor at 0x7abedb7727c0>

In [None]:
# Buscar os resultados e inserir na tabela Correlacao_Pedidos_Avaliacoes
resultados = cursor.fetchall()
cursor.executemany('''
INSERT OR REPLACE INTO Correlacao_Pedidos_Avaliacoes (id_cliente, nome, total_pedidos, media_avaliacao)
VALUES (?, ?, ?, ?)
''', resultados)



<sqlite3.Cursor at 0x7abedb7727c0>

In [None]:
# Salvar as alterações e fechar a conexão
conexao.commit()
conexao.close()