In [1]:
from environment import Environment
from programmer import Programmer
from reviewer import Reviewer
from prompt_master import PromptMaster

import logging

In [2]:
# Configurar logging para exibir no console
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# Tentar carregar o Programador salvo
programmer = Programmer.load('programmer.pkl')
if programmer is None:
    # Se não encontrado, criar um novo
    promptMaster = PromptMaster()
    programmer = Programmer(promptMaster, epsilon=0.1)
else:
    # Carregar PromptMaster, caso necessário
    # Se o promptMaster não for salvo, criar um novo promptMaster
    promptMaster = PromptMaster()

# Tentar carregar o Revisor salvo
reviewer = Reviewer.load('reviewer.pkl')
if reviewer is None:
    # Se não encontrado, criar um novo
    reviewer = Reviewer(promptMaster, epsilon=0.1)

env = Environment(programmer, reviewer, promptMaster)



In [3]:
problems = [
    {
        "question": "Limpeza de dados: Dado um conjunto de dados de vendas, limpe e prepare os dados para análise.",
        "data": "sales_data.csv",
        "metrics": {
            "accuracy": True,
            "unit_tests": True
        }
    },
    {
        "question": "Visualização: Crie visualizações eficazes para o conjunto de dados de vendas.",
        "data": "sales_data.csv",
        "metrics": {
            "accuracy": True,
            "unit_tests": False
        }
    },
    {
        "question": "Análise Estatística: Realize uma análise estatística dos dados de vendas para identificar tendências.",
        "data": "sales_data.csv",
        "metrics": {
            "accuracy": True,
            "unit_tests": False
        }
    }
    # Adicione mais problemas conforme necessário
]


In [None]:
# Treinamento

for epoch in range(10):  # Número de ciclos de treinamento
    logging.info(f"\n=== Epoch {epoch + 1} ===")
    for problem in problems:
        env.train(problem)
    
    programmer.save('programmer.pkl')
    reviewer.save('reviewer.pkl')

env.plot_results()

2024-12-10 22:55:41,497 - INFO - 
=== Epoch 1 ===
2024-12-10 22:55:41,499 - INFO - 
--- Treinando com o problema: Limpeza de dados: Dado um conjunto de dados de vendas, limpe e prepare os dados para análise. ---
2024-12-10 22:55:41,500 - INFO - Programador explorando com ação: Dica: Sempre valide os dados antes de processá-los.
2024-12-10 22:57:18,646 - INFO - HTTP Request: POST http://localhost:11434/api/chat "HTTP/1.1 200 OK"
2024-12-10 22:57:18,702 - INFO - Código Gerado:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import OneHotEncoder, StandardScaler

def load_and_clean_data():
    # Carregar conjunto de dados de vendas
    data = {
        'Id': [1, 2, 3, 4, 5],
        'Produto': ['A', 'B', 'C', 'D', 'E'],
        'Preço': [10.99, 20.49, None, 15.75, 8.95],
        'Quantidade': [100, 50, 200, 150, 300],
        'Region': ['North', 'South', 'East', 'West', 'North']
    }
   

In [5]:
# Teste após o treinamento
for problem in problems:
    env.test(problem)

2024-12-11 02:09:01,508 - INFO - 
--- Testando com o problema: Limpeza de dados: Dado um conjunto de dados de vendas, limpe e prepare os dados para análise. ---
2024-12-11 02:09:01,510 - INFO - Programador explorando com ação: ```python
# Import necessary libraries for analysis and visualization
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics
import matplotlib.pyplot as plt
import seaborn as sns

# Create a sample dataset for sales data
data = {
    'clarity': [1, 2, 3, 4, 5],
    'readability': [10, 9, 8, 7, 6],
    'efficiency': [15, 14, 13, 12, 11],
    'optimization': [20, 19, 18, 17, 16],
    'sales': [100, 120, 130, 140, 150]
}

# Create a DataFrame
df = pd.DataFrame(data)

# Convert the date column to datetime format
#df['date'] = pd.to_datetime(df['date'])

# Check for missing values
print("Number of missing values in each column:")
print(df.isnull().sum())
