In [6]:
"""
Notebook: An√°lise de Dados Imobili√°rios

Este notebook l√™ um conjunto de dados local, verifica/cria o banco MySQL,
cria tabelas para cada CSV e insere os dados no banco de forma automatizada.
"""

import os
import pandas as pd
import mysql.connector
from mysql.connector import Error

# Configura√ß√µes do banco de dados
DB_CONFIG = {
    "host": "localhost",
    "user": "root",
    "password": "12344",
    "database": "mercado_imobiliario"
}

# Caminho da pasta de dados
extract_path = "data"

# Fun√ß√£o para conectar ao banco de dados
def conectar_banco():
    try:
        conexao = mysql.connector.connect(**DB_CONFIG)
        return conexao
    except Error as e:
        print(f"Erro ao conectar ao banco: {e}")
        return None

# Fun√ß√£o para criar tabela no banco de dados para cada arquivo CSV
def criar_tabela(nome_tabela, df, conexao):
    try:
        cursor = conexao.cursor()

        # Ajustar os nomes das colunas para evitar caracteres inv√°lidos
        df.columns = [col.replace(" ", "_").replace("-", "_") for col in df.columns]
        
        # Criar estrutura de colunas baseado nos tipos de dados
        colunas = []
        for col in df.columns:
            col_formatado = f"`{col}` TEXT"  # Definimos TEXT para evitar conflitos com tipos diferentes
            colunas.append(col_formatado)
        
        colunas_str = ", ".join(colunas)

        # Criar tabela se n√£o existir
        query = f"""
        CREATE TABLE IF NOT EXISTS `{nome_tabela}` (
            {colunas_str}
        );
        """
        cursor.execute(query)
        conexao.commit()
        print(f"‚úÖ Tabela `{nome_tabela}` criada/verificada com sucesso.")
    except Error as e:
        print(f"‚ùå Erro ao criar tabela {nome_tabela}: {e}")
    finally:
        cursor.close()

# Fun√ß√£o para inserir dados na tabela
def inserir_dados(nome_tabela, df, conexao):
    try:
        cursor = conexao.cursor()
        
        # Ajustar colunas
        colunas = ", ".join([f"`{col}`" for col in df.columns])
        valores = ", ".join(["%s"] * len(df.columns))

        query = f"INSERT INTO `{nome_tabela}` ({colunas}) VALUES ({valores})"
        
        cursor.executemany(query, df.fillna("NULL").values.tolist())
        conexao.commit()
        print(f"‚úÖ Dados inseridos na tabela `{nome_tabela}` com sucesso.")
    except Error as e:
        print(f"‚ùå Erro ao inserir dados na tabela `{nome_tabela}`: {e}")
    finally:
        cursor.close()

# Fun√ß√£o para carregar os dados e inseri-los no banco
def carregar_dados():
    print(f"üìÇ Verificando diret√≥rio: {extract_path}")
    if not os.path.exists(extract_path):
        print("‚ùå Erro: Diret√≥rio de dados n√£o encontrado. Verifique se os arquivos est√£o no local correto.")
        return
    
    arquivos = [f for f in os.listdir(extract_path) if f.endswith(".csv")]
    if arquivos:
        conexao = conectar_banco()
        if conexao:
            for arquivo in arquivos:
                caminho_arquivo = os.path.join(extract_path, arquivo)
                print(f"\nüì• Carregando arquivo: {caminho_arquivo}")
                
                df = pd.read_csv(caminho_arquivo)
                
                # Ajustar nome da tabela (removendo extens√£o .csv)
                nome_tabela = os.path.splitext(arquivo)[0]
                
                criar_tabela(nome_tabela, df, conexao)
                inserir_dados(nome_tabela, df, conexao)
            
            conexao.close()
    else:
        print("‚ùå Nenhum arquivo CSV encontrado na pasta.")

# Fun√ß√£o para verificar a exist√™ncia do banco de dados e cri√°-lo caso n√£o exista
def verificar_criar_banco():
    try:
        print("üóÑÔ∏è Verificando banco de dados...")
        conexao = mysql.connector.connect(
            host=DB_CONFIG["host"],
            user=DB_CONFIG["user"],
            password=DB_CONFIG["password"]
        )
        cursor = conexao.cursor()
        cursor.execute("CREATE DATABASE IF NOT EXISTS mercado_imobiliario;")
        print("‚úÖ Banco de dados verificado/criado com sucesso.")
    except Error as e:
        print(f"‚ùå Erro ao conectar ao banco: {e}")
    finally:
        if conexao and conexao.is_connected():
            cursor.close()
            conexao.close()

# üöÄ Executando o fluxo de leitura de dados
print("üîÑ Iniciando pipeline de leitura de dados...")
verificar_criar_banco()
carregar_dados()
print("‚úÖ Pipeline conclu√≠do. Pronto para processamento posterior.")


üîÑ Iniciando pipeline de leitura de dados...
üóÑÔ∏è Verificando banco de dados...
‚úÖ Banco de dados verificado/criado com sucesso.
üìÇ Verificando diret√≥rio: data

üì• Carregando arquivo: data\sample_submission.csv
‚úÖ Tabela `sample_submission` criada/verificada com sucesso.
‚úÖ Dados inseridos na tabela `sample_submission` com sucesso.

üì• Carregando arquivo: data\test.csv
‚úÖ Tabela `test` criada/verificada com sucesso.
‚úÖ Dados inseridos na tabela `test` com sucesso.

üì• Carregando arquivo: data\train.csv
‚úÖ Tabela `train` criada/verificada com sucesso.
‚úÖ Dados inseridos na tabela `train` com sucesso.
‚úÖ Pipeline conclu√≠do. Pronto para processamento posterior.
