# üõí Super Market - An√°lise de Dados com Python, Google Colab e SQLite

Este projeto apresenta uma an√°lise de dados de supermercado utilizando **Python em Google Colab**, com **persist√™ncia dos dados via SQLite** salvo diretamente no **Google Drive**.

Todos os notebooks e arquivos s√£o versionados via **GitHub**, permitindo organiza√ß√£o, colabora√ß√£o e hist√≥rico de altera√ß√µes.

---

## ‚öôÔ∏è Tecnologias
- Python (pandas, sqlite3, matplotlib, seaborn)
- Google Colab
- Google Drive (armazenamento do banco de dados)
- SQLite (banco local)
- GitHub (versionamento de c√≥digo)

---

## üîó Estrutura do Projeto

1. **Google Drive**: Armazena o banco `super_market.db` de forma persistente.
2. **SQLite**: Gerencia os dados diretamente pelo Colab.
3. **GitHub**: Guarda o c√≥digo-fonte e notebooks.

---

‚öôÔ∏è **Como executar o notebook no Colab:**

1Ô∏è‚É£ **Executar tudo de uma vez:**  
Ideal ao abrir o notebook pela primeira vez.  
V√° em **Ambiente de execu√ß√£o > Executar tudo** ou use o atalho `Ctrl+F9`.

2Ô∏è‚É£ **Executar a partir de uma c√©lula:**  
√ötil se voc√™ j√° rodou parte do c√≥digo e quer continuar.  
Clique na c√©lula desejada e v√° em **Ambiente de execu√ß√£o > Executar a partir daqui**.

3Ô∏è‚É£ **Executar manualmente (uma por uma):**  
Use `Shift+Enter` em cada c√©lula para rodar individualmente.  
√ìtimo para revisar ou testar partes do c√≥digo.
____________________________________________________________________

# üõ¢ Criando o banco de dados 'super_market.db' üõíüí∏üí∞
# üë®‚Äçüíª Iniciando: toda vez que abrir o notebook
üåê 1. Montar o Google Drive: drive.mount('/content/drive')

üìÅ 2. Definir o caminho do banco de dados no Drive

üîå 3. Conectar ao banco SQLite: con = sqlite3.connect(caminho_banco)

üìö 4. Importar as bibliotecas (pandas, sqlite3, os, etc.)

‚ö†Ô∏è Verifique se o con.close() est√° comentado no final para evitar desconex√£o durante a execu√ß√£o completa

---

**üåêEtapa 1 - Montar o Google Drive (sempre ao abrir o notebook)** : Conecta seu Google Drive ao Colab para acessar e salvar arquivos diretamente, como o banco de dados SQLite.

In [1]:
from google.colab import drive  # Importa a fun√ß√£o para conectar o Google Drive no Colab
drive.mount('/content/drive')   # Monta o Drive no diret√≥rio /content/drive para acesso aos arquivos

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


üóÇÔ∏è **Etapa 2 ‚Äì Definir o caminho do banco de dados no Drive (sempre ap√≥s montar o Drive):**  
Especificamos o caminho onde o arquivo `super_market.db` ser√° salvo e garantimos que a pasta exista no Google Drive.


In [2]:
import os  # Biblioteca para manipular caminhos e pastas no sistema operacional
caminho_banco = '/content/drive/MyDrive/Colab Notebooks/super_market/super_market.db'  # Caminho completo do banco no Drive
os.makedirs(os.path.dirname(caminho_banco), exist_ok=True)  # Cria a pasta se ainda n√£o existir

üõ¢ **Etapa 3 ‚Äì Conectar ao banco SQLite (sempre ap√≥s definir o caminho):**  Estabelece a conex√£o com o banco de dados `super_market.db` no Drive.Se o arquivo n√£o existir, ser√° criado automaticamente.

In [3]:
import sqlite3  # Biblioteca para trabalhar com bancos SQLite em Python
con = sqlite3.connect(caminho_banco) # Conecta ao banco usando o caminho definido
cursor = con.cursor() # Cria um cursor para executar comandos SQL

üìö **Etapa 4 - Importando bibliotecas essenciais:**  
Estas bibliotecas s√£o utilizadas ao longo do notebook para an√°lise, visualiza√ß√£o e manipula√ß√£o de dados.

In [4]:
# Lista de bibiliotecas python
import pandas as pd               # Manipula√ß√£o de dados com DataFrames
import sqlite3                    # Conex√£o e comandos SQL com banco SQLite
import csv                        # Leitura e escrita de arquivos CSV
import os                         # Opera√ß√µes com arquivos e diret√≥rios
import matplotlib.pyplot as plt   # Visualiza√ß√£o de dados
import seaborn as sns             # Visualiza√ß√£o de dados

---
# üõ¢ Realizando altera√ß√µes no Banco de dados ‚öôÔ∏è
- Criar, consultar, inserir, atualizar e excluir dados
- Usar pandas, seaborn, matplotlib para an√°lises e visualiza√ß√µes
- Sempre que fizer mudan√ßas no banco, execute: con.commit()

**üö´ O que voc√™ n√£o precisa executar sempre:**

- Criar tabelas j√° existentes
- Inserir dados duplicados
- Clonar GitHub se j√° foi feito nesta sess√£o
---

ùÑú  **Criando a tabela `Products`:**  
Tabela usada para armazenar os produtos dispon√≠veis no sistema.  
Inclui dados como nome do item, categoria, estoque, tipo e pre√ßos de compra/venda.  
A coluna `OrderID` funciona como identificador √∫nico para cada produto.

In [5]:
cursor.execute("""
    CREATE TABLE IF NOT EXISTS Products (
        OrderID INTEGER PRIMARY KEY AUTOINCREMENT,
        Item TEXT NOT NULL,
        Category TEXT,
        Stock INTEGER DEFAULT 0,
        Type TEXT,
        Purchase_Price REAL NOT NULL,
        Sale_Price REAL CHECK(Sale_Price >= 0)
    )
""")
con.commit()  # üíæ Salva a cria√ß√£o da tabela no banco

üîç Consultar tabelas existentes no banco:
Usado para verificar quais tabelas j√° foram criadas no banco de dados SQLite.

In [6]:
result = cursor.execute("SELECT name FROM sqlite_master WHERE type='table'")
result.fetchall()

[('Products',), ('sqlite_sequence',)]

üìë **Importar e Ler o CSV com pandas**  
Nesta etapa, usamos o pandas para ler o arquivo CSV com os dados dos produtos que ser√£o inseridos no banco de dados.

In [7]:
# Lendo o CSV
df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/super_market/products_supermarket.csv')
# Visualiza as primeiras linhas
df.head(5)

Unnamed: 0,Order,Item,Category,Stock,Type,Purchase Price (USD),Sale Price (USD)
0,1,Rice,Basic Foods,120,5kg pack,3.32,4.38
1,2,Beans,Basic Foods,95,1kg pack,1.49,2.11
2,3,Pasta,Basic Foods,150,500g pack,0.56,0.97
3,4,Soybean Oil,Basic Foods,80,900ml bottle,1.2,1.74
4,5,Sugar,Basic Foods,110,1kg pack,0.76,1.14


üõ†Ô∏è **Renomear colunas para combinar com a tabela SQL**  
Renomeamos as colunas do DataFrame para garantir que os nomes sejam exatamente os mesmos da tabela criada no banco SQLite.

In [8]:
df.rename(columns={
    'Order': 'OrderID',
    'Purchase Price (USD)': 'Purchase_Price',
    'Sale Price (USD)': 'Sale_Price'
}, inplace=True)
con.commit()

üîé **Verificar se as colunas est√£o corretas**  
Antes de importar os dados, exibimos os nomes das colunas e as primeiras linhas do DataFrame para conferir se est√° tudo certo.

In [9]:
print("Colunas do DataFrame:", df.columns.tolist())
df.head()

Colunas do DataFrame: ['OrderID', 'Item', 'Category', 'Stock', 'Type', 'Purchase_Price', 'Sale_Price']


Unnamed: 0,OrderID,Item,Category,Stock,Type,Purchase_Price,Sale_Price
0,1,Rice,Basic Foods,120,5kg pack,3.32,4.38
1,2,Beans,Basic Foods,95,1kg pack,1.49,2.11
2,3,Pasta,Basic Foods,150,500g pack,0.56,0.97
3,4,Soybean Oil,Basic Foods,80,900ml bottle,1.2,1.74
4,5,Sugar,Basic Foods,110,1kg pack,0.76,1.14


üß© **Inserir dados no banco de dados**  
Percorremos cada linha do DataFrame e inserimos os dados na tabela `Products`, usando `INSERT OR IGNORE INTO

In [10]:
for _, row in df.iterrows():
    cursor.execute("""
        INSERT OR IGNORE INTO Products (OrderID, Item, Category, Stock, Type, Purchase_Price, Sale_Price)
        VALUES (?, ?, ?, ?, ?, ?, ?)
    """, tuple(row))
con.commit()

üßê **Verificar dados salvos da tabela no banco**  
consulta na tabela para exibir os dados j√° inseridos e garantir que o processo de importa√ß√£o foi bem-sucedido.

In [26]:
df_produtos = pd.read_sql_query("SELECT * FROM Products", con)
df_produtos.head()  # Mostra as 5 primeiras linhas

Unnamed: 0,OrderID,Item,Category,Stock,Type,Purchase_Price,Sale_Price
0,1,Rice,Basic Foods,120,5kg pack,3.32,4.38
1,2,Beans,Basic Foods,95,1kg pack,1.49,2.11
2,3,Pasta,Basic Foods,150,500g pack,0.56,0.97
3,4,Soybean Oil,Basic Foods,80,900ml bottle,1.2,1.74
4,5,Sugar,Basic Foods,110,1kg pack,0.76,1.14


üíØ Total de Produtos inseridos: A quantidade de produtos, importados do '.csv' inseridos na tabela 'Products' do banco de dados 'super-market.db'

In [25]:
df_verificacao = pd.read_sql_query("SELECT * FROM Products", con)
print(f'Total de registros inseridos: {len(df_verificacao)}')
total_products_supermarket = len(df_verificacao)

Total de registros inseridos: 100


---
# üõ¢ Realizando consultas no banco de dados üîç
**üìëTabela: Products**
- Nesta etapa, realizamos consultas SQL diretamente no banco de dados SQLite criado.
- As consultas ajudam a explorar, analisar e extrair informa√ß√µes √∫teis dos dados armazenados,
- facilitando a tomada de decis√µes e a visualiza√ß√£o de padr√µes.
- Abaixo, seguem consultas √∫teis para analisar os dados da tabela:
---

üîù Ver os 10 primeiros produtos

In [27]:
df_primeiros = pd.read_sql_query("SELECT * FROM Products ORDER BY OrderID ASC LIMIT 10", con)
df_primeiros

Unnamed: 0,OrderID,Item,Category,Stock,Type,Purchase_Price,Sale_Price
0,1,Rice,Basic Foods,120,5kg pack,3.32,4.38
1,2,Beans,Basic Foods,95,1kg pack,1.49,2.11
2,3,Pasta,Basic Foods,150,500g pack,0.56,0.97
3,4,Soybean Oil,Basic Foods,80,900ml bottle,1.2,1.74
4,5,Sugar,Basic Foods,110,1kg pack,0.76,1.14
5,6,Salt,Basic Foods,200,1kg pack,0.26,0.53
6,7,Wheat Flour,Basic Foods,75,1kg pack,0.74,1.2
7,8,Cornmeal,Basic Foods,60,500g pack,0.62,1.04
8,9,Milk,Dairy,180,1L carton,0.72,1.14
9,10,Butter,Dairy,65,200g block,1.56,2.37


‚¨áÔ∏è Ver os 10 √∫ltimos produtos

In [28]:
df_ultimos = pd.read_sql_query("SELECT * FROM Products ORDER BY OrderID DESC LIMIT 10", con)
df_ultimos

Unnamed: 0,OrderID,Item,Category,Stock,Type,Purchase_Price,Sale_Price
0,100,Cat Litter,Pet,20,4kg bag,3.32,5.26
1,99,Dog Food,Pet,30,1kg pack,2.27,3.5
2,98,Lighter/Match,Household Items,50,Unit,0.26,0.69
3,97,Batteries,Household Items,40,2-unit pack,1.04,2.09
4,96,Candles,Utensils/Disposables,25,3-unit pack,0.69,1.56
5,95,Disposable Cups,Utensils/Disposables,60,20-unit pack,1.04,2.09
6,94,Disposable Plates,Utensils/Disposables,50,10-unit pack,0.86,1.74
7,93,Plastic Wrap,Utensils/Disposables,35,15m roll,1.21,2.27
8,92,Aluminum Foil,Utensils/Disposables,30,15m roll,1.04,1.92
9,91,Trash Bags,Utensils/Disposables,45,30-unit roll,1.56,2.79


üé≤ Ver 10 produtos aleat√≥rios

In [29]:
df_aleatorios = pd.read_sql_query("SELECT * FROM Products ORDER BY RANDOM() LIMIT 10", con)
df_aleatorios

Unnamed: 0,OrderID,Item,Category,Stock,Type,Purchase_Price,Sale_Price
0,4,Soybean Oil,Basic Foods,80,900ml bottle,1.2,1.74
1,7,Wheat Flour,Basic Foods,75,1kg pack,0.74,1.2
2,50,Laundry Detergent,Cleaning,50,1kg pack,2.27,3.5
3,35,Beetroot,Produce,30,Kg,0.56,1.09
4,43,Orange Juice,Beverages,40,1L carton,1.04,1.92
5,67,Dental Floss,Personal Care,25,Unit,0.69,1.39
6,84,Ketchup,Ready Foods,40,380g bottle,0.86,1.74
7,41,Papaya,Produce,25,Unit,1.04,2.27
8,25,Pork Chop,Meats,15,1kg tray,4.02,5.78
9,96,Candles,Utensils/Disposables,25,3-unit pack,0.69,1.56


üìâ Ver os produtos com estoque abaixo de 20 unidades

In [31]:
df = pd.read_sql_query("SELECT * FROM Products WHERE Stock < 20", con)
df

Unnamed: 0,OrderID,Item,Category,Stock,Type,Purchase_Price,Sale_Price
0,19,Cake,Bakery,15,Slice,0.32,0.79
1,25,Pork Chop,Meats,15,1kg tray,4.02,5.78
2,27,Calabrese Sausage,Deli,18,500g pack,2.2,3.5
3,28,Frozen Fish,Meats,12,1kg pack,4.38,6.49
4,56,Broom,Cleaning,15,Unit,3.32,5.26
5,57,Squeegee,Cleaning,12,Unit,2.79,4.38
6,89,Pancake Mix,Ready Foods,15,200g pack,0.69,1.39


üìä Obter a m√©dia de pre√ßo de venda por categoria

In [33]:
df = pd.read_sql_query("""
    SELECT Category, AVG(Sale_Price) AS Avarage_Price
    FROM Products
    GROUP BY Category
""", con)
df

Unnamed: 0,Category,Avarage_Price
0,Bakery,1.1625
1,Basic Foods,1.63875
2,Beverages,1.932857
3,Cleaning,2.597778
4,Dairy,1.40375
5,Deli,1.9
6,Household Items,1.39
7,Meats,5.255
8,Meats/Deli,2.62
9,Personal Care,2.25


üí∞ Ver produtos ordenados do mais caro para o mais barato (pre√ßo de venda)

In [34]:
df = pd.read_sql_query("""
    SELECT * FROM Products
    ORDER BY Sale_Price DESC
""", con)
df.head(10)

Unnamed: 0,OrderID,Item,Category,Stock,Type,Purchase_Price,Sale_Price
0,28,Frozen Fish,Meats,12,1kg pack,4.38,6.49
1,25,Pork Chop,Meats,15,1kg tray,4.02,5.78
2,56,Broom,Cleaning,15,Unit,3.32,5.26
3,77,Ice Cream,Snacks/Desserts,25,1.5L tub,3.32,5.26
4,100,Cat Litter,Pet,20,4kg bag,3.32,5.26
5,24,Ground Beef,Meats,20,500g tray,3.25,4.73
6,1,Rice,Basic Foods,120,5kg pack,3.32,4.38
7,57,Squeegee,Cleaning,12,Unit,2.79,4.38
8,23,Chicken Breast,Meats,35,1kg tray,2.79,4.02
9,27,Calabrese Sausage,Deli,18,500g pack,2.2,3.5


üß© Contar quantos produtos h√° por Categoria (Category)

In [37]:
df = pd.read_sql_query("""
    SELECT Category, COUNT(*) AS Quantity
    FROM Products
    GROUP BY Category
""", con)
df

Unnamed: 0,Category,Quantity
0,Bakery,4
1,Basic Foods,8
2,Beverages,7
3,Cleaning,9
4,Dairy,8
5,Deli,3
6,Household Items,2
7,Meats,4
8,Meats/Deli,1
9,Personal Care,10


---
# üì• Antes de fechar o notebook:
- üíæ Execute con.commit() para salvar tudo
- ‚õî Execute con.close() para desconectar com seguran√ßa
- üóÉÔ∏è Confirme que o arquivo foi salvo no Google Drive
---

üíæ **Salvar altera√ß√µes no banco de dados**  
Executamos `con.commit()` para confirmar as altera√ß√µes e garantir que os dados fiquem salvos de forma permanente.

In [24]:
con.commit()
print("‚úÖ Dados importados com sucesso para o banco SQLite!")

‚úÖ Dados importados com sucesso para o banco SQLite!


### üîí Executar esta c√©lula SOMENTE ao finalizar todo o trabalho com o banco. retirar cometarios (#)
üîå **Fechar a conex√£o com o banco**  
Fechamos a conex√£o com o SQLite ap√≥s terminar as opera√ß√µes, liberando recursos do sistema.

In [None]:
# üîí Fechar conex√£o com o banco de dados (s√≥ executar ao finalizar tudo)
# Use esta c√©lula apenas quando terminar TODAS as edi√ß√µes e inser√ß√µes no banco
# con.close()
# print("‚úÖ Banco de dados desconectado com sucesso.")

---
# ‚öôÔ∏è Coisas opcionais:
- Fazer backup no GitHub
- Baixar o .db localmente
- Comentar o con.close() se quiser continuar testando
- Deixar este checklist vis√≠vel e organizado no topo do notebook
---

üë®‚Äçüíª **Salvar no GitHub**  
Ap√≥s as altera√ß√µes, podemos fazer backup do notebook e/ou do banco de dados, enviando-os para um reposit√≥rio no GitHub como forma de controle de vers√£o.

In [None]:
# @title
'''# ‚òÅÔ∏è Etapa: Backup autom√°tico no GitHub (com token oculto)

from getpass import getpass  # Para ocultar a digita√ß√£o do token
import shutil

# üîê Digitar token manualmente (n√£o aparece na tela)
token = getpass("Digite seu GitHub Personal Access Token (oculto): ")

# Seus dados do reposit√≥rio
usuario = "italomellors"
repositorio = "Data_Analysis_Projects"

# üß≤ Clonar o reposit√≥rio (s√≥ uma vez por sess√£o)
!git clone https://{token}:x-oauth-basic@github.com/{usuario}/{repositorio}.git

# üìÇ Mudar para a pasta do reposit√≥rio clonado
%cd {repositorio}

# üìÅ Copiar o banco do Drive para o reposit√≥rio local
shutil.copy('/content/drive/MyDrive/Colab Notebooks/super_market/super_market.db', './super_market.db')

# ‚úÖ Git: Preparar, registrar e enviar os arquivos
!git status
!git add super_market.db
!git commit -m "Backup autom√°tico do banco de dados SQLite"
!git push'''