# Usando SQLite no Google Colab com dados de CSV

Vamos **carregar um arquivo CSV com pandas**, transformá-lo em uma **tabela SQLite**, e então usar SQL para consultar os dados.

📌 Isso é muito útil para aplicar SQL em planilhas ou arquivos CSV que você já possui.

## Passo 1 – Carregar o CSV com pandas

In [2]:
import pandas as pd

# Substitua pelo nome do arquivo enviado
df = pd.read_csv("clientes_dataset.csv")
df.head()

Unnamed: 0,cliente_id,nome,email,idade,cidade,estado,data_ultima_compra,total_gasto,frequencia_compras,forma_pagamento,satisfacao,cliente_ativo
0,1,Norma Fisher,christopherbond@yahoo.com,62,Elliottmouth,NJ,2025-01-26,4635.94,21,Crédito,1,False
1,2,Jorge Sullivan,jeaton@yahoo.com,65,East Adam,PA,2024-05-24,1615.33,5,Boleto,4,False
2,3,Elizabeth Woods,mfuller@jones-taylor.com,18,Whitetown,GA,2024-09-29,2075.77,13,Boleto,3,True
3,4,Susan Wagner,lauren75@gmail.com,21,Jamesside,RI,2025-01-03,3202.0,22,Débito,5,False
4,5,Peter Montgomery,tdaugherty@pratt-crawford.com,21,Heidiborough,TN,2024-11-28,4464.2,18,Crédito,5,True


## Passo 2 – Enviar o DataFrame para um banco SQLite

In [4]:
import sqlite3

# Criar banco em memória
conn = sqlite3.connect(':memory:')

# Enviar o DataFrame como tabela chamada 'clientes'
df.to_sql("clientes", conn, index=False, if_exists="replace")

1000

## Passo 3 – Consultar a tabela com SQL usando pandas

In [5]:
df_sql = pd.read_sql_query("SELECT * FROM clientes", conn)
df_sql.head()

Unnamed: 0,cliente_id,nome,email,idade,cidade,estado,data_ultima_compra,total_gasto,frequencia_compras,forma_pagamento,satisfacao,cliente_ativo
0,1,Norma Fisher,christopherbond@yahoo.com,62,Elliottmouth,NJ,2025-01-26,4635.94,21,Crédito,1,0
1,2,Jorge Sullivan,jeaton@yahoo.com,65,East Adam,PA,2024-05-24,1615.33,5,Boleto,4,0
2,3,Elizabeth Woods,mfuller@jones-taylor.com,18,Whitetown,GA,2024-09-29,2075.77,13,Boleto,3,1
3,4,Susan Wagner,lauren75@gmail.com,21,Jamesside,RI,2025-01-03,3202.0,22,Débito,5,0
4,5,Peter Montgomery,tdaugherty@pratt-crawford.com,21,Heidiborough,TN,2024-11-28,4464.2,18,Crédito,5,1


## Exemplos de consultas

In [11]:
# Filtro com WHERE
df_sql_2 = pd.read_sql_query("SELECT * FROM clientes WHERE idade > 30", conn)
df_sql_2.head()

Unnamed: 0,cliente_id,nome,email,idade,cidade,estado,data_ultima_compra,total_gasto,frequencia_compras,forma_pagamento,satisfacao,cliente_ativo
0,1,Norma Fisher,christopherbond@yahoo.com,62,Elliottmouth,NJ,2025-01-26,4635.94,21,Crédito,1,0
1,2,Jorge Sullivan,jeaton@yahoo.com,65,East Adam,PA,2024-05-24,1615.33,5,Boleto,4,0
2,6,Theodore Mcgrath,grant52@yahoo.com,57,East Josephberg,CA,2024-05-08,2219.77,23,Crédito,3,1
3,8,Stephanie Sutton,melissa03@hotmail.com,37,Wyattborough,AK,2024-07-28,3001.2,16,Pix,3,1
4,9,Brian Hamilton,geoffreygrant@yahoo.com,39,New Kendraview,PA,2024-10-14,2215.75,7,Crédito,3,1


In [8]:
df_sql_2.describe()

Unnamed: 0,cliente_id,idade,total_gasto,frequencia_compras,satisfacao,cliente_ativo
count,734.0,734.0,734.0,734.0,734.0,734.0
mean,498.554496,50.299728,2528.485708,12.348774,3.332425,0.685286
std,287.701047,11.201007,1437.572663,6.677804,1.259555,0.464719
min,1.0,31.0,100.3,1.0,1.0,0.0
25%,250.25,41.0,1286.8175,7.0,2.0,0.0
50%,491.5,50.5,2562.78,12.0,4.0,1.0
75%,747.75,60.0,3764.6,18.0,4.0,1.0
max,1000.0,69.0,4999.28,24.0,5.0,1.0


In [9]:
df_sql = pd.read_sql_query("SELECT nome, idade FROM clientes", conn)
df_sql.head()

Unnamed: 0,nome,idade
0,Norma Fisher,62
1,Jorge Sullivan,65
2,Elizabeth Woods,18
3,Susan Wagner,21
4,Peter Montgomery,21


## Conclusão
- Essa é uma forma prática de aplicar SQL em qualquer CSV
- Você combina a familiaridade do pandas com o poder das consultas SQL
- Ideal para análises, filtros, dashboards e ETL leve