<a href="https://colab.research.google.com/github/Santosdevbjj/analiseRiscosAtrasoObras/blob/main/Notebooks/01_extracao_SQL.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [3]:

"""
Este notebook realiza:

- Conex√£o com banco PostgreSQL (simulado para rodar no Colab)
- Consulta SQL para extrair dados de obras, fornecedores, clima, m√£o de obra
- Salvamento dos datasets em formato CSV dentro da pasta data/raw

ATEN√á√ÉO: No Colab, substitua as credenciais do banco conforme necess√°rio.
"""

# ============================
# 1Ô∏è‚É£ Instala√ß√£o de depend√™ncias
# ============================
!pip install psycopg2-binary sqlalchemy pandas

# ============================
# 2Ô∏è‚É£ Importa√ß√£o das bibliotecas
# ============================
import pandas as pd
from sqlalchemy import create_engine
import os

# ============================
# 3Ô∏è‚É£ Conex√£o com PostgreSQL
# ============================
# Exemplo de string de conex√£o:
# engine = create_engine("postgresql://usuario:senha@host:5432/ccbjj_db")

host = "localhost"   # No Colab, substitua por host remoto
port = "5432"
usuario = "ccbjj_user"
senha = "ccbjj_pass"
banco = "ccbjj_db"

conn_string = f"postgresql://{usuario}:{senha}@{host}:{port}/{banco}"
engine = create_engine(conn_string)

# ============================
# 4Ô∏è‚É£ Consultas SQL
# ============================
sql_obras = "SELECT * FROM obras;"
sql_fornecedores = "SELECT * FROM fornecedores;"
sql_clima = "SELECT * FROM clima;"
sql_mao_obra = "SELECT * FROM mao_obra;"

try:
    obras_df = pd.read_sql(sql_obras, engine)
    fornecedores_df = pd.read_sql(sql_fornecedores, engine)
    clima_df = pd.read_sql(sql_clima, engine)
    mao_df = pd.read_sql(sql_mao_obra, engine)
    print("‚úÖ Dados extra√≠dos com sucesso do PostgreSQL!")
except Exception as e:
    print("‚ö†Ô∏è Erro de conex√£o ‚Äî usando dados simulados...")

    # Criando tabelas dummy
    obras_df = pd.DataFrame({
        "id_obra": range(1, 6),
        "cidade": ["BH", "SP", "RJ", "Curitiba", "Recife"],
        "prazo_previsto_dias": [300, 420, 350, 280, 410],
        "prazo_real_dias": [310, 440, 360, 290, 500],
        "chuva_mm": [120, 180, 95, 210, 300],
        "atrasou": [1, 1, 0, 0, 1]
    })

    fornecedores_df = pd.DataFrame({
        "id_forn": [1, 2, 3],
        "nota_qualidade": [4.5, 3.2, 2.9],
        "tipo": ["cimento", "areia", "a√ßo"]
    })

    clima_df = pd.DataFrame({
        "id_obra": [1, 2, 3, 4, 5],
        "chuva_mm": [120, 180, 95, 210, 300]
    })

    mao_df = pd.DataFrame({
        "id_obra": [1, 2, 3, 4, 5],
        "qtd_engenheiros": [3, 4, 2, 5, 3],
        "qtd_pedreiros": [10, 15, 8, 20, 18]
    })

# ============================
# 5Ô∏è‚É£ Salvando datasets em CSV
# ============================
os.makedirs("data/raw", exist_ok=True)

obras_df.to_csv("data/raw/obras.csv", index=False)
fornecedores_df.to_csv("data/raw/fornecedores.csv", index=False)
clima_df.to_csv("data/raw/clima.csv", index=False)
mao_df.to_csv("data/raw/mao_obra.csv", index=False)

print("üìÇ Arquivos salvos em data/raw")

# ============================
# 6Ô∏è‚É£ Pr√©via dos dados
# ============================
print("Pr√©via das obras:")
display(obras_df.head())

print("Pr√©via dos fornecedores:")
display(fornecedores_df.head())

print("Pr√©via do clima:")
display(clima_df.head())

print("Pr√©via da m√£o de obra:")
display(mao_df.head())

‚ö†Ô∏è Erro de conex√£o ‚Äî usando dados simulados...
üìÇ Arquivos salvos em data/raw
Pr√©via das obras:


Unnamed: 0,id_obra,cidade,prazo_previsto_dias,prazo_real_dias,chuva_mm,atrasou
0,1,BH,300,310,120,1
1,2,SP,420,440,180,1
2,3,RJ,350,360,95,0
3,4,Curitiba,280,290,210,0
4,5,Recife,410,500,300,1


Pr√©via dos fornecedores:


Unnamed: 0,id_forn,nota_qualidade,tipo
0,1,4.5,cimento
1,2,3.2,areia
2,3,2.9,a√ßo


Pr√©via do clima:


Unnamed: 0,id_obra,chuva_mm
0,1,120
1,2,180
2,3,95
3,4,210
4,5,300


Pr√©via da m√£o de obra:


Unnamed: 0,id_obra,qtd_engenheiros,qtd_pedreiros
0,1,3,10
1,2,4,15
2,3,2,8
3,4,5,20
4,5,3,18


In [4]:

# ============================
# 5Ô∏è‚É£ Salvando datasets em CSV
# ============================
import os
os.makedirs("data/raw", exist_ok=True)

obras_df.to_csv("data/raw/obras.csv", index=False)
fornecedores_df.to_csv("data/raw/fornecedores.csv", index=False)
clima_df.to_csv("data/raw/clima.csv", index=False)
mao_df.to_csv("data/raw/mao_obra.csv", index=False)

print("üìÇ Arquivos salvos em data/raw")

# ============================
# 6Ô∏è‚É£ Pr√©via dos dados
# ============================
print("Pr√©via das obras:")
display(obras_df.head())

print("Pr√©via dos fornecedores:")
display(fornecedores_df.head())

print("Pr√©via do clima:")
display(clima_df.head())

print("Pr√©via da m√£o de obra:")
display(mao_df.head())

# ============================
# 7Ô∏è‚É£ Download autom√°tico dos CSVs
# ============================
from google.colab import files

for file in ["data/raw/obras.csv",
             "data/raw/fornecedores.csv",
             "data/raw/clima.csv",
             "data/raw/mao_obra.csv"]:
    files.download(file)

üìÇ Arquivos salvos em data/raw
Pr√©via das obras:


Unnamed: 0,id_obra,cidade,prazo_previsto_dias,prazo_real_dias,chuva_mm,atrasou
0,1,BH,300,310,120,1
1,2,SP,420,440,180,1
2,3,RJ,350,360,95,0
3,4,Curitiba,280,290,210,0
4,5,Recife,410,500,300,1


Pr√©via dos fornecedores:


Unnamed: 0,id_forn,nota_qualidade,tipo
0,1,4.5,cimento
1,2,3.2,areia
2,3,2.9,a√ßo


Pr√©via do clima:


Unnamed: 0,id_obra,chuva_mm
0,1,120
1,2,180
2,3,95
3,4,210
4,5,300


Pr√©via da m√£o de obra:


Unnamed: 0,id_obra,qtd_engenheiros,qtd_pedreiros
0,1,3,10
1,2,4,15
2,3,2,8
3,4,5,20
4,5,3,18


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>