In [11]:
import pandas as pd
from sqlalchemy import create_engine
import logging

# Configuração do banco de dados
DB_CONFIG = {
    "database": "brain_agro",
    "user": "agro_user",
    "password": "agro_password",
    "host": "localhost",
    "port": "5432"
}

# Configuração de logging
logging.basicConfig(
    level=logging.INFO,
    format="%(asctime)s - %(levelname)s - %(message)s"
)

# Criação da string de conexão SQLAlchemy
connection_string = f"postgresql://{DB_CONFIG['user']}:{DB_CONFIG['password']}@{DB_CONFIG['host']}:{DB_CONFIG['port']}/{DB_CONFIG['database']}"
engine = create_engine(connection_string)

# Mapeamento completo das colunas
column_mapping = {
    "Nome_cultura": "nome_cultura",
    "SafraIni": "safra_ini",
    "SafraFin": "safra_fin",
    "Cod_Cultura": "cod_cultura",
    "Cod_Ciclo": "cod_ciclo",
    "Cod_Solo": "cod_solo",
    "geocodigo": "geocodigo",
    "UF": "uf",
    "municipio": "municipio",
    "Cod_Clima": "cod_clima",
    "Nome_Clima": "nome_clima",
    "Cod_Outros_Manejos": "cod_outros_manejos",
    "Nome_Outros_Manejos": "nome_outros_manejos",
    "Produtividade": "produtividade",
    "Cod_Munic": "cod_munic",
    "Cod_Meso": "cod_meso",
    "Cod_Micro": "cod_micro",
    "Portaria": "portaria",
    **{f"dec{i}": f"dec{i}" for i in range(1, 37)}  # Adicionar todos os decêntios
}

def clean_and_load_filtered_csv(csv_path, table_name, column_mapping):
    try:
        logging.info(f"Lendo o arquivo CSV filtrado: {csv_path}")
        df = pd.read_csv(csv_path, sep=';', low_memory=False)

        # Renomear colunas para corresponder à tabela do banco de dados
        df.rename(columns=column_mapping, inplace=True)

        # Tratamento de dados
        for col in df.columns:
            if col.startswith('dec'):  # Converter decêntios para numérico
                df[col] = pd.to_numeric(df[col].replace(',', '.', regex=True), errors='coerce')
            elif col == 'safra_ini':  # Ajustar safra_ini para inteiro
                df[col] = pd.to_numeric(df[col], errors='coerce', downcast='integer')
            elif col in ['safra_fin', 'uf', 'municipio', 'nome_cultura', 'nome_clima', 'nome_outros_manejos', 'produtividade', 'portaria']:
                # Converter apenas valores não string para string
                df[col] = df[col].fillna("").map(lambda x: str(x).strip()[:255])

        # Inserir no banco de dados
        logging.info(f"Carregando os dados na tabela {table_name}...")
        df.to_sql(table_name, con=engine, if_exists='replace', index=False)
        logging.info(f"Dados carregados com sucesso na tabela {table_name}!")

    except Exception as e:
        logging.error(f"Erro ao processar e carregar o CSV {csv_path} na tabela {table_name}: {e}")

# Caminho do CSV reduzido e nome da tabela
csv_path = "df_filtrado.csv"
table_name = "tabua_de_risco"

# Processar e carregar o arquivo filtrado
clean_and_load_filtered_csv(csv_path, table_name, column_mapping)

2024-12-05 19:02:34,445 - INFO - Lendo o arquivo CSV filtrado: df_filtrado.csv
2024-12-05 19:02:37,333 - INFO - Carregando os dados na tabela tabua_de_risco...
2024-12-05 19:04:11,896 - INFO - Dados carregados com sucesso na tabela tabua_de_risco!


In [None]:
# String de conexão SQLAlchemy
connection_string = f"postgresql://{DB_CONFIG['user']}:{DB_CONFIG['password']}@{DB_CONFIG['host']}:{DB_CONFIG['port']}/{DB_CONFIG['database']}"
engine = create_engine(connection_string)

# Query para visualizar os primeiros 10 registros
query = "SELECT * FROM tabua_de_risco LIMIT 10;"

# Executar a query e carregar os dados em um DataFrame
df = pd.read_sql_query(query, con=engine)

# Mostrar os dados
print(df)

In [None]:
df.head()