<a href="https://colab.research.google.com/github/SteAmarante/python-data-science/blob/main/aula_07/Data_Science_com_Bancos_de_Dados.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Python para Data Science com Bancos de Dados

Um Banco de Dados é um conjunto organizado de
informações armazenadas de forma estruturada para
que possam ser acessadas, gerenciadas e atualizadas de
maneira eficiente.

In [19]:
import sqlite3
import pandas as pd

In [20]:
# Conexão (cria o arquivo se não existir)
conn = sqlite3.connect("/content/vinhos.db")

##SQLite Exemplo

**O que é:**

*   Banco de dados relacional, leve, salvo em um
único arquivo .db.

**Como funciona:**

*   Você cria e manipula tabelas diretamente no
arquivo.
*   Não precisa instalar servidor.
*   Ideal para testes, pequenas aplicações e ensino.



**Objetivo no curso:**

* Aprender a manipular dados relacionais de forma
simples e rápida.

* Integrar com Pandas e SQLAlchemy para
práticas de Data Science.

In [21]:
# Leitura de tabela existente
df = pd.read_sql("SELECT * FROM vinhos", conn)

In [22]:
# Exibir primeiras linhas
df.tail()

Unnamed: 0,year,month,location,location_type,category,grape_type,volume_hl,value_usd
26635,2024,12,China,Country,Import,Wine,3574,12650.27
26636,2024,12,China,Country,Import,Sparkling,825,3844.02
26637,2024,12,China,Country,Export,Table,2115,6153.84
26638,2024,12,China,Country,Export,Wine,2107,9355.02
26639,2024,12,China,Country,Export,Sparkling,6813,23101.92


In [23]:
# Consulta filtrada
df_brasil = pd.read_sql("SELECT * FROM vinhos WHERE location_type='Brazil_State'", conn)
df_brasil.tail()

Unnamed: 0,year,month,location,location_type,category,grape_type,volume_hl,value_usd
19435,2024,12,TO,Brazil_State,Production,Wine,1365,4895.26
19436,2024,12,TO,Brazil_State,Production,Sparkling,4912,14925.51
19437,2024,12,TO,Brazil_State,Sales,Table,3391,9911.72
19438,2024,12,TO,Brazil_State,Sales,Wine,306,1154.84
19439,2024,12,TO,Brazil_State,Sales,Sparkling,1717,3201.36


In [24]:
# exemplo de leitura de uma tabela 'vinho'
# (se não existir, adapte o nome)
try:
  df = pd.read_sql("SELECT * FROM vinho LIMIT 5", conn)
  display(df)
except Exception as e:
  print("Ajuste o nome da tabela. Erro:", e)

Ajuste o nome da tabela. Erro: Execution failed on sql 'SELECT * FROM vinho LIMIT 5': no such table: vinho


In [25]:
conn.close() # Fecha a conexão

##SQLAlchemy Exemplo

**O que é:**
* Uma biblioteca Python para trabalhar com bancos
relacionais, você escreve SQL de forma Pythonic.

**Como funciona:**
* Abstrai diferenças entre SGBDs (SQLite, Postgres,
MySQL…)
* Permite trabalhar com bancos sem escrever SQL
* Facilita manutenção e reuso

**Objetivo no curso:**
* Demonstrar como integrar Pandas e Python com
bancos de forma mais simples e legível.
* Reduzir necessidade de conhecimento avançado em
SQL para análises básicas

In [26]:
#Instalar o SQLAlchemy no google colab !

!pip install SQLAlchemy



In [27]:
#Improtar a engine para utilizar o pacote
from sqlalchemy import create_engine

In [28]:
# Criar engine para conectar ao SQLite
engine = create_engine("sqlite:///vinhos.db")

In [29]:
# Ler tabela
df = pd.read_sql("vinhos", engine)
df.tail()

Unnamed: 0,year,month,location,location_type,category,grape_type,volume_hl,value_usd
26635,2024,12,China,Country,Import,Wine,3574,12650.27
26636,2024,12,China,Country,Import,Sparkling,825,3844.02
26637,2024,12,China,Country,Export,Table,2115,6153.84
26638,2024,12,China,Country,Export,Wine,2107,9355.02
26639,2024,12,China,Country,Export,Sparkling,6813,23101.92


In [30]:
# Escrever nova tabela
df_filtrado = df[df['location_type'] == 'Brazil_State' ]
df_filtrado.to_sql("vinho_brasil", engine, if_exists="replace", index=False)

19440

In [31]:
# Confirmar gravação
pd.read_sql("vinho_brasil", engine).head()

Unnamed: 0,year,month,location,location_type,category,grape_type,volume_hl,value_usd
0,2015,1,AC,Brazil_State,Production,Table,910,1782.31
1,2015,1,AC,Brazil_State,Production,Wine,3822,11435.9
2,2015,1,AC,Brazil_State,Production,Sparkling,516,902.97
3,2015,1,AC,Brazil_State,Sales,Table,3494,10491.74
4,2015,1,AC,Brazil_State,Sales,Wine,180,279.26


In [32]:
# Ler tabela 'vinho' como DataFrame (se existir)
try:
  df = pd.read_sql("SELECT * FROM vinhos LIMIT 10", engine)
  display(df.head())
except Exception as e:
  print("Ajuste o nome da tabela. Erro:", e)

Unnamed: 0,year,month,location,location_type,category,grape_type,volume_hl,value_usd
0,2015,1,AC,Brazil_State,Production,Table,910,1782.31
1,2015,1,AC,Brazil_State,Production,Wine,3822,11435.9
2,2015,1,AC,Brazil_State,Production,Sparkling,516,902.97
3,2015,1,AC,Brazil_State,Sales,Table,3494,10491.74
4,2015,1,AC,Brazil_State,Sales,Wine,180,279.26


In [33]:
# Ex .: gravar um DataFrame de resultados
resumo = pd.DataFrame({
"categoria": ["Tinto","Branco"],
"preco_medio": [55.2, 49.8]
})

resumo.to_sql("resumo_precos", engine, if_exists="replace", index=False)

pd.read_sql("SELECT * FROM resumo_precos", engine)

Unnamed: 0,categoria,preco_medio
0,Tinto,55.2
1,Branco,49.8
