<a href="https://colab.research.google.com/github/Dayanebiaerafa/trabalho-de-extensao-ia/blob/main/Trabalho_de_Extens%C3%A3o.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [4]:
import pandas as pd
import plotly.express as px
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline

# Conectando ao Google Drive
from google.colab import drive
drive.mount('/content/drive')

# Passo 1: Carregar os dados do arquivo CSV no Google Drive
dados = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Avecom/Dados_2024-10-03_atualizado.csv', sep=';')

# Verificar o cabeçalho para entender a estrutura
print(dados.head())

# Passo 2: Separar as variáveis independentes (X) e dependentes (y)
X = dados[['idade', 'cod_sexo', 'cod_estacao', 'cod_linhagem']]
y = dados['peso_misto_avg'].str.replace(',', '.').astype(float)  # Convertendo y para float

# Passo 3: Dividir os dados em conjunto de treino e teste (80% treino, 20% teste)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Passo 4: Aplicar OneHotEncoder com handle_unknown='ignore'
categorical_columns = ['cod_sexo', 'cod_estacao', 'cod_linhagem']

# Criar o transformador com OneHotEncoder (ignorando categorias desconhecidas)
column_transformer = ColumnTransformer(
    transformers=[
        ('encoder', OneHotEncoder(drop='first', handle_unknown='ignore'), categorical_columns)
    ],
    remainder='passthrough'
)

# Criar o modelo dentro de um pipeline
modelo = Pipeline(steps=[
    ('transformer', column_transformer),
    ('regressor', LinearRegression())
])

# Passo 5: Treinar o modelo com os dados de treino
modelo.fit(X_train, y_train)

# Passo 6: Fazer previsões com os dados de teste
y_pred = modelo.predict(X_test)

# Passo 7: Avaliar o modelo com o erro médio quadrático (MSE)
precisao = mean_squared_error(y_test, y_pred)
print(f"Erro médio quadrático (MSE) do modelo: {precisao:.2f}")

# Passo 8: Gráfico interativo de linhas com Peso e Idade, separado por Sexo, Linhagem e Estação
# Agrupar os dados por sexo, estação e linhagem
dados['peso_misto_avg'] = dados['peso_misto_avg'].str.replace(',', '.').astype(float)

# Criar o gráfico usando Plotly Express
fig = px.line(
    dados,
    x='idade',
    y='peso_misto_avg',
    color='cod_sexo',
    line_group='cod_linhagem',
    facet_col='cod_estacao',
    title='Evolução do Peso Médio por Sexo, Linhagem e Estação',
    labels={'peso_misto_avg': 'Peso (kg)', 'idade': 'Idade (dias)'}
)

# Ajustar o eixo Y para 0 a 5 kg
fig.update_yaxes(range=[0, 5])

# Ajustar o eixo X para 7, 14, 21, 28, 35, 42 dias
fig.update_xaxes(tickvals=[7, 14, 21, 28, 35, 42])

# Exibir o gráfico interativo
fig.show()

# Passo 9: Prever o peso final na idade de 42 dias para diferentes combinações de sexo, linhagem e estação
sexos = ['A', 'F', 'M']
linhagens = ['Co', 'Cs', 'Ro', 'Hy', 'Hu', 'Cx', 'Cm', 'Cl', 'Cf', 'Av']
estacoes = ['IN', 'VE']

# Criar uma tabela para armazenar os resultados
resultados = []

# Iterar sobre todas as combinações
for sexo in sexos:
    for linhagem in linhagens:
        for estacao in estacoes:
            # Criar um DataFrame com os valores de idade, sexo, estação e linhagem
            novo_X = pd.DataFrame({
                'idade': [42],
                'cod_sexo': [sexo],
                'cod_estacao': [estacao],
                'cod_linhagem': [linhagem]
            })

            # Fazer a previsão do peso usando o pipeline diretamente
            peso_previsto = modelo.predict(novo_X)[0]

            # Salvar os resultados
            resultados.append({
                'sexo': sexo,
                'linhagem': linhagem,
                'estacao': estacao,
                'peso_previsto': peso_previsto
            })

# Converter os resultados em um DataFrame para exibição
df_resultados = pd.DataFrame(resultados)

# Exibir os resultados
print(df_resultados)

# Passo 10: Exibir as previsões finais no console
for index, row in df_resultados.iterrows():
    print(f"Previsão para Sexo: {row['sexo']}, Linhagem: {row['linhagem']}, Estação: {row['estacao']}: {row['peso_previsto']:.2f} kg na idade de 42 dias")

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
     peso_misto_avg  idade cod_sexo cod_estacao cod_linhagem
0               2,7      0        A          IN           CF
1  1,07955555555556      0        A          IN           CO
2             0,288      0        A          IN           CS
3  1,19783333333333      0        A          VE           CF
4              0,19      0        A          VE           CL
Erro médio quadrático (MSE) do modelo: 0.24



Found unknown categories in columns [2] during transform. These unknown categories will be encoded as all zeros


Found unknown categories in columns [2] during transform. These unknown categories will be encoded as all zeros


Found unknown categories in columns [2] during transform. These unknown categories will be encoded as all zeros


Found unknown categories in columns [2] during transform. These unknown categories will be encoded as all zeros


Found unknown categories in columns [2] during transform. These unknown categories will be encoded as all zeros


Found unknown categories in columns [2] during transform. These unknown categories will be encoded as all zeros


Found unknown categories in columns [2] during transform. These unknown categories will be encoded as all zeros


Found unknown categories in columns [2] during transform. These unknown categories will be encoded as all zeros


Found unknown categories in columns [2] during transform. These unknown categories will

   sexo linhagem estacao  peso_previsto
0     A       Co      IN       2.316610
1     A       Co      VE       2.443841
2     A       Cs      IN       2.316610
3     A       Cs      VE       2.443841
4     A       Ro      IN       2.316610
5     A       Ro      VE       2.443841
6     A       Hy      IN       2.316610
7     A       Hy      VE       2.443841
8     A       Hu      IN       2.316610
9     A       Hu      VE       2.443841
10    A       Cx      IN       2.316610
11    A       Cx      VE       2.443841
12    A       Cm      IN       2.316610
13    A       Cm      VE       2.443841
14    A       Cl      IN       2.316610
15    A       Cl      VE       2.443841
16    A       Cf      IN       2.316610
17    A       Cf      VE       2.443841
18    A       Av      IN       2.316610
19    A       Av      VE       2.443841
20    F       Co      IN       2.062048
21    F       Co      VE       2.189279
22    F       Cs      IN       2.062048
23    F       Cs      VE       2.189279



Found unknown categories in columns [2] during transform. These unknown categories will be encoded as all zeros


Found unknown categories in columns [2] during transform. These unknown categories will be encoded as all zeros



In [7]:
# Adicionando a coluna 'idade' ao df_resultados
df_resultados['idade'] = 42  # Idade fixa de 42 dias

# Criar um dicionário de cores para diferenciar sexo e linhagem
cores_sexo = {
    'A': 'blue',  # Exemplo de tom claro para sexo A
    'F': 'green',  # Exemplo de tom claro para sexo F
    'M': 'coral'   # Exemplo de tom claro para sexo M
}

# Plotar o gráfico com as linhagens em facetas de coluna e o sexo representado pelas cores mais claras
fig_coluna = px.bar(
    df_resultados,
    x='idade',  # Usando a idade no eixo X
    y='peso_previsto',
    color='sexo',
    barmode='group',
    facet_col='linhagem',  # Separando por linhagem nas colunas
    facet_row='estacao',   # Separando por estação em linhas
    title='Previsão do Peso Médio por Sexo, Linhagem, Estação e Idade',
    labels={'peso_previsto': 'Peso Previsto (kg)', 'idade': 'Idade (dias)'}
)

# Atualizar o esquema de cores com as cores definidas para sexo
fig_coluna.for_each_trace(
    lambda t: t.update(marker_color=cores_sexo[t.name])  # Aplicar as cores de acordo com o sexo
)

# Ajustar o eixo Y para 0 a 5 kg
fig_coluna.update_yaxes(range=[0, 5])

# Ajustar o eixo X para as idades 7, 14, 21, 28, 35, 42 (se isso for relevante)
fig_coluna.update_xaxes(tickvals=[7, 14, 21, 28, 35, 42])

# Exibir o gráfico interativo de colunas
fig_coluna.show()
