# Jeu de données complet - XGRegressor

17/12/2025

## Import Modules

In [24]:
import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt
import sklearn
import xgboost

## Import Data

In [25]:
data = pd.read_csv("Donnees_IA_2025.csv", sep=";", encoding="latin1")

data.head(5)

Unnamed: 0,Ordre,Code,Classe,Nom,Nom détaillé,Pays,Année récolte,Date mesure,MS % brut,PB % brut,...,ED porc croissance (kcal) kcal/kg brut,EM porc croissance (kcal) kcal/kg brut,EN porc croissance (kcal) kcal/kg brut,EMAn coq (kcal) kcal/kg brut,EMAn poulet (kcal) kcal/kg brut,UFL 2018 par kg brut,UFV 2018 par kg brut,PDIA 2018 g_kg brut,PDI 2018 g_kg brut,BalProRu 2018 g_kg brut
0,1,657397,Céréales,Avoine,Avoine,Canada,01/01/1976,01/01/1976,87,95,...,2460,2380,1850,2610,2480,81,76,17,62,-10
1,2,657400,Céréales,Avoine,Avoine,Canada,01/01/1976,01/01/1976,87,119,...,2580,2480,1880,2590,2460,88,85,22,69,5
2,3,657402,Céréales,Avoine,Avoine,Canada,01/01/1976,01/01/1976,874,122,...,2760,2660,2030,2690,2560,95,92,22,70,6
3,4,657404,Céréales,Avoine,Avoine,Canada,01/01/1976,01/01/1976,888,108,...,2150,2060,1500,2080,1950,77,72,20,65,-1
4,5,657405,Céréales,Avoine,Avoine,Canada,01/01/1976,01/01/1976,883,116,...,2690,2590,2000,2750,2620,92,89,21,68,3


## Suppression des colonnes inutiles 

In [26]:
data2 = data.drop(columns=['Ordre', 'Code', 'Nom détaillé', 'Pays', 'Année récolte', 'Date mesure'])
data2.head(5)

Unnamed: 0,Classe,Nom,MS % brut,PB % brut,CB % brut,MGR % brut,MM % brut,NDF % brut,ADF % brut,Lignine % brut,...,ED porc croissance (kcal) kcal/kg brut,EM porc croissance (kcal) kcal/kg brut,EN porc croissance (kcal) kcal/kg brut,EMAn coq (kcal) kcal/kg brut,EMAn poulet (kcal) kcal/kg brut,UFL 2018 par kg brut,UFV 2018 par kg brut,PDIA 2018 g_kg brut,PDI 2018 g_kg brut,BalProRu 2018 g_kg brut
0,Céréales,Avoine,87,95,126,32,38,334,154,24,...,2460,2380,1850,2610,2480,81,76,17,62,-10
1,Céréales,Avoine,87,119,118,26,25,317,145,23,...,2580,2480,1880,2590,2460,88,85,22,69,5
2,Céréales,Avoine,874,122,107,42,18,297,135,22,...,2760,2660,2030,2690,2560,95,92,22,70,6
3,Céréales,Avoine,888,108,167,27,37,419,197,27,...,2150,2060,1500,2080,1950,77,72,20,65,-1
4,Céréales,Avoine,883,116,117,46,28,318,145,23,...,2690,2590,2000,2750,2620,92,89,21,68,3


### Liste des colonnes d'entrées : 

- Catégorielle : 'Classe', 'Nom', 

- Numériques : 'MS % brut', 'PB % brut', 'CB % brut', 'MGR % brut', 'MM % brut', 'NDF % brut', 'ADF % brut', 'Lignine % brut', 'Amidon % brut', 'Sucres % brut'

### Liste des colonnes de sorties : 

- Porc : ['EB (kcal) kcal/kg brut', 'ED porc croissance (kcal) kcal/kg brut', 'EM porc croissance (kcal) kcal/kg brut', 'EN porc croissance (kcal) kcal/kg brut', 

- Poulet : 'EMAn coq (kcal) kcal/kg brut', 'EMAn poulet (kcal) kcal/kg brut', 

- Autres : 'UFL 2018 par kg brut', 'PDI 2018 g/kg brut', 'BalProRu 2018 g/kg brut']

In [27]:
colonnes = data2.columns
colonnes_X = list(colonnes[:12])
colonnes_Y = list(colonnes[12:])

print(colonnes_X)
print(colonnes_Y)

colonnes_cat = colonnes_X[:2]
colonnes_num = colonnes_X[2:]
print(colonnes_cat)

['Classe', 'Nom', 'MS % brut', 'PB % brut', 'CB % brut', 'MGR % brut', 'MM % brut', 'NDF % brut', 'ADF % brut', 'Lignine % brut', 'Amidon % brut', 'Sucres % brut']
['EB (kcal) kcal/kg brut', 'ED porc croissance (kcal) kcal/kg brut', 'EM porc croissance (kcal) kcal/kg brut', 'EN porc croissance (kcal) kcal/kg brut', 'EMAn coq (kcal) kcal/kg brut', 'EMAn poulet (kcal) kcal/kg brut', 'UFL 2018 par kg brut', 'UFV 2018 par kg brut', 'PDIA 2018 g_kg brut', 'PDI 2018 g_kg brut', 'BalProRu 2018 g_kg brut']
['Classe', 'Nom']


## One Hot encoding des variables catégorielles

In [28]:
from sklearn.preprocessing import OneHotEncoder
categorical_cols = colonnes_cat
numerical_cols = colonnes_num
# OneHotEncoder
enc = OneHotEncoder(sparse_output=False)
X_cat = enc.fit_transform(data[categorical_cols])


column_names = []
for i, cat in enumerate(enc.categories_):
    column_names.extend([f"{categorical_cols[i]}_{c}" for c in cat])


X_cat_df = pd.DataFrame(X_cat, columns=column_names)


data_final = pd.concat([ X_cat_df, data2[numerical_cols], data2[colonnes_Y]], axis=1)
data_final.head(5)


Unnamed: 0,"Classe_Amidon, racines et tubercules",Classe_Autres coproduits des céréales,Classe_Autres produits végétaux,Classe_Coproduits d'animaux terrestres,Classe_Coproduits de fruits et légumes,Classe_Coproduits du blé,Classe_Coproduits du maïs,Classe_Céréales,Classe_Farines et solubles de poisson,Classe_Fourrages déshydratés,...,ED porc croissance (kcal) kcal/kg brut,EM porc croissance (kcal) kcal/kg brut,EN porc croissance (kcal) kcal/kg brut,EMAn coq (kcal) kcal/kg brut,EMAn poulet (kcal) kcal/kg brut,UFL 2018 par kg brut,UFV 2018 par kg brut,PDIA 2018 g_kg brut,PDI 2018 g_kg brut,BalProRu 2018 g_kg brut
0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,...,2460,2380,1850,2610,2480,81,76,17,62,-10
1,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,...,2580,2480,1880,2590,2460,88,85,22,69,5
2,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,...,2760,2660,2030,2690,2560,95,92,22,70,6
3,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,...,2150,2060,1500,2080,1950,77,72,20,65,-1
4,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0,...,2690,2590,2000,2750,2620,92,89,21,68,3


## Jeu de données final

In [29]:
# Colonnes à retirer pour X et à garder pour y
colonnes_cibles = [
    'EB (kcal) kcal/kg brut', 
    'ED porc croissance (kcal) kcal/kg brut', 
    'EM porc croissance (kcal) kcal/kg brut', 
    'EN porc croissance (kcal) kcal/kg brut', 
    'EMAn coq (kcal) kcal/kg brut', 
    'EMAn poulet (kcal) kcal/kg brut', 
    'UFL 2018 par kg brut', 
    'UFV 2018 par kg brut', 
    'PDIA 2018 g_kg brut', 
    'PDI 2018 g_kg brut', 
    'BalProRu 2018 g_kg brut'
]

# Génération des descripteurs
X = data_final.drop(columns=colonnes_cibles)
print(X)

# Génération de la variable cible
y = data_final[colonnes_cibles]
print(y)


      Classe_Amidon, racines et tubercules  \
0                                      0.0   
1                                      0.0   
2                                      0.0   
3                                      0.0   
4                                      0.0   
...                                    ...   
3993                                   0.0   
3994                                   0.0   
3995                                   0.0   
3996                                   0.0   
3997                                   0.0   

      Classe_Autres coproduits des céréales  Classe_Autres produits végétaux  \
0                                       0.0                              0.0   
1                                       0.0                              0.0   
2                                       0.0                              0.0   
3                                       0.0                              0.0   
4                                       0.0    

## Formatage des données

In [30]:
cols_num = ['MS % brut', 'PB % brut', 'CB % brut', 'MGR % brut', 'MM % brut', 
            'NDF % brut', 'ADF % brut', 'Lignine % brut', 'Amidon % brut', 'Sucres % brut']

for col in cols_num:
    X[col] = X[col].astype(str).str.replace(',', '.')
    X[col] = pd.to_numeric(X[col], errors='coerce') 


print(X.dtypes)

Classe_Amidon, racines et tubercules      float64
Classe_Autres coproduits des céréales     float64
Classe_Autres produits végétaux           float64
Classe_Coproduits d'animaux terrestres    float64
Classe_Coproduits de fruits et légumes    float64
                                           ...   
NDF % brut                                float64
ADF % brut                                float64
Lignine % brut                            float64
Amidon % brut                             float64
Sucres % brut                             float64
Length: 66, dtype: object


In [31]:
for col in y.columns:
    y[col] = y[col].astype(str).str.strip().str.replace(',', '.')
    y[col] = pd.to_numeric(y[col], errors='coerce') 

print(y.dtypes)

EB (kcal) kcal/kg brut                      int64
ED porc croissance (kcal) kcal/kg brut      int64
EM porc croissance (kcal) kcal/kg brut      int64
EN porc croissance (kcal) kcal/kg brut      int64
EMAn coq (kcal) kcal/kg brut                int64
EMAn poulet (kcal) kcal/kg brut             int64
UFL 2018 par kg brut                      float64
UFV 2018 par kg brut                      float64
PDIA 2018 g_kg brut                         int64
PDI 2018 g_kg brut                          int64
BalProRu 2018 g_kg brut                     int64
dtype: object


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  y[col] = y[col].astype(str).str.strip().str.replace(',', '.')
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  y[col] = pd.to_numeric(y[col], errors='coerce')
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  y[col] = y[col].astype(str).str.strip().str.replace(',', '.')
A value is trying to be set on a 

## Séparation des différents ensembles de train et test

### Définition des variables cibles à garder

#### Variables cibles : Classe, Nom, MS et PB

In [32]:
Xpspb = X.drop(columns=['CB % brut', 'MGR % brut', 'MM % brut', 
            'NDF % brut', 'ADF % brut', 'Lignine % brut', 'Amidon % brut', 'Sucres % brut'])
print(Xpspb.columns)

Index(['Classe_Amidon, racines et tubercules',
       'Classe_Autres coproduits des céréales',
       'Classe_Autres produits végétaux',
       'Classe_Coproduits d'animaux terrestres',
       'Classe_Coproduits de fruits et légumes', 'Classe_Coproduits du blé',
       'Classe_Coproduits du maïs', 'Classe_Céréales',
       'Classe_Farines et solubles de poisson', 'Classe_Fourrages déshydratés',
       'Classe_Graines protéagineuses et oléagineuses',
       'Classe_Tourteaux d'oléagineux', 'Nom_Avoine ', 'Nom_Blé tendre ',
       'Nom_Concentré protéique de luzerne ', 'Nom_Coproduits de biscuiterie ',
       'Nom_Coques de soja ', 'Nom_Corn gluten feed ', 'Nom_Corn gluten meal ',
       'Nom_Drêches de blé de distillerie, amidon < 7 % ',
       'Nom_Drêches de blé de distillerie, amidon > 7 % ',
       'Nom_Farine basse de blé tendre ', 'Nom_Farine de poisson (toutes) ',
       'Nom_Farine de viande (toutes) ', 'Nom_Féverole à fleurs blanches ',
       'Nom_Gluten feed de blé, type 20% 

#### Variables cibles : Classe et Nom

In [33]:
Xtable = X.drop(columns=['MS % brut', 'PB % brut','CB % brut', 'MGR % brut', 'MM % brut', 
            'NDF % brut', 'ADF % brut', 'Lignine % brut', 'Amidon % brut', 'Sucres % brut'])
print(Xtable.columns)

Index(['Classe_Amidon, racines et tubercules',
       'Classe_Autres coproduits des céréales',
       'Classe_Autres produits végétaux',
       'Classe_Coproduits d'animaux terrestres',
       'Classe_Coproduits de fruits et légumes', 'Classe_Coproduits du blé',
       'Classe_Coproduits du maïs', 'Classe_Céréales',
       'Classe_Farines et solubles de poisson', 'Classe_Fourrages déshydratés',
       'Classe_Graines protéagineuses et oléagineuses',
       'Classe_Tourteaux d'oléagineux', 'Nom_Avoine ', 'Nom_Blé tendre ',
       'Nom_Concentré protéique de luzerne ', 'Nom_Coproduits de biscuiterie ',
       'Nom_Coques de soja ', 'Nom_Corn gluten feed ', 'Nom_Corn gluten meal ',
       'Nom_Drêches de blé de distillerie, amidon < 7 % ',
       'Nom_Drêches de blé de distillerie, amidon > 7 % ',
       'Nom_Farine basse de blé tendre ', 'Nom_Farine de poisson (toutes) ',
       'Nom_Farine de viande (toutes) ', 'Nom_Féverole à fleurs blanches ',
       'Nom_Gluten feed de blé, type 20% 

#### Variables cibles : MS et PB

In [34]:
Xbaseline = X.drop(columns=[
    "Classe_Amidon, racines et tubercules",
    "Classe_Autres coproduits des céréales",
    "Classe_Autres produits végétaux",
    "Classe_Coproduits d'animaux terrestres",
    "Classe_Coproduits de fruits et légumes",
    "Classe_Coproduits du blé",
    "Classe_Coproduits du maïs",
    "Classe_Céréales",
    "Classe_Farines et solubles de poisson",
    "Classe_Fourrages déshydratés",
    "Classe_Graines protéagineuses et oléagineuses",
    "Classe_Tourteaux d'oléagineux",
    "Nom_Avoine ",
    "Nom_Blé tendre ",
    "Nom_Concentré protéique de luzerne ",
    "Nom_Coproduits de biscuiterie ",
    "Nom_Coques de soja ",
    "Nom_Corn gluten feed ",
    "Nom_Corn gluten meal ",
    "Nom_Drêches de blé de distillerie, amidon < 7 % ",
    "Nom_Drêches de blé de distillerie, amidon > 7 % ",
    "Nom_Farine basse de blé tendre ",
    "Nom_Farine de poisson (toutes) ",
    "Nom_Farine de viande (toutes) ",
    "Nom_Féverole à fleurs blanches ",
    "Nom_Gluten feed de blé, type 20% amidon ",
    "Nom_Graine de lin ",
    "Nom_Graine de soja extrudée ",
    "Nom_Graine de tournesol ",
    "Nom_Lupin générique ",
    "Nom_Luzerne déshydratée, générique ",
    "Nom_Manioc, amidon 70-74 % ",
    "Nom_Maïs ",
    "Nom_Orge ",
    "Nom_Pois ",
    "Nom_Pois chiche, type Kabuli ",
    "Nom_Pulpe d'agrumes déshydratée ",
    "Nom_Pulpe de betterave déshydratée ",
    "Nom_Radicelles d'orge de brasserie déshydratées ",
    "Nom_Remoulage de blé tendre (tous) ",
    "Nom_Seigle ",
    "Nom_Son de blé tendre ",
    "Nom_Sorgho ",
    "Nom_Tourteau d'arachide, huile < 5 %, cellulose brute > 9 % ",
    "Nom_Tourteau de colza, huile 5-20 % ",
    "Nom_Tourteau de colza, huile < 5 % ",
    "Nom_Tourteau de coprah, huile 5-20% ",
    "Nom_Tourteau de germes de maïs, huile 5-20 % ",
    "Nom_Tourteau de germes de maïs, huile < 5 % ",
    "Nom_Tourteau de lin, huile > 5 % ",
    "Nom_Tourteau de palmiste, huile 5-20% ",
    "Nom_Tourteau de soja, huile < 5 %, 48 % protéine + huile ",
    "Nom_Tourteau de soja, huile < 5 %, 50 % protéine + huile ",
    "Nom_Tourteau de tournesol, huile < 5 %, décortiqué ",
    "Nom_Tourteau de tournesol, huile < 5 %, non décortiqué ",
    "Nom_Triticale ",
    "CB % brut",
    "MGR % brut",
    "MM % brut",
    "NDF % brut",
    "ADF % brut",
    "Lignine % brut",
    "Amidon % brut",
    "Sucres % brut"
])

print(Xbaseline.columns)


Index(['MS % brut', 'PB % brut'], dtype='object')


In [35]:
Xm= X.values
ym= y.values
X2= Xpspb.values
X3= Xtable.values
X4= Xbaseline.values

### Séparation de l'ensemble de test et d'apprentissage

In [36]:
#Séparation de l'ensemble de test et d'apprentissage

from sklearn.model_selection import train_test_split
X_train, X_test, X2_train, X2_test,X3_train, X3_test,X4_train, X4_test, y_train, y_test = train_test_split(Xm, X2,X3,X4, ym, train_size= 0.70)
print(X_train.shape)
print(X_test.shape)
print(X2_train.shape)
print(X2_test.shape)
print(X3_train.shape)
print(X3_test.shape)
print(X4_train.shape)
print(X4_test.shape)


(2798, 66)
(1200, 66)
(2798, 58)
(1200, 58)
(2798, 56)
(1200, 56)
(2798, 2)
(1200, 2)


## Définition des métriques

In [37]:
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score
def evaluation_regression(model, X_train, X_test, y_train, y_test, model_name = ""):
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    mae = mean_absolute_error(y_test, y_pred)
    rmse = np.sqrt(mean_squared_error(y_test, y_pred))
    r2 = r2_score(y_test, y_pred)
    print("____________")
    print(f'Essai sur échantillon de test {model_name}')
    print("y_pred min/max :", round(y_pred.min(),3), round(y_pred.max(),3))
    print(f"MAE: {mae:.3f} | RMSE: {rmse:.3f} | R²: {r2:.3f}")
    return [model_name, mae, rmse, r2]

### Mise en place des modèles

### Variables d'entrée: Classe, Nom, MS % brut,PB % brut,CB % brut,MGR % brut, MM % brut, NDF % brut, ADF % brut, Lignine % brut, Amidon % brut, Sucres % brut

In [38]:
from xgboost import XGBRegressor
df_exp = pd.DataFrame(columns=["Model Name", "MAE", "RMSE", "R2"])
# XGBRegressor
model_xgb = XGBRegressor()
df_exp.loc[len(df_exp)] = evaluation_regression(model_xgb, X_train, X_test, y_train, y_test, "XGBRegressor")

____________
Essai sur échantillon de test XGBRegressor
y_pred min/max : -91.516 6496.29
MAE: 18.599 | RMSE: 45.626 | R²: 0.993


### Variables d'entrée:  Classe, Nom, MS % brut,PB % brut

In [39]:
model_xgb2 = XGBRegressor()
df_exp.loc[len(df_exp)] = evaluation_regression(model_xgb2, X2_train, X2_test, y_train, y_test, "XGBRegressor")

____________
Essai sur échantillon de test XGBRegressor
y_pred min/max : -91.806 6425.318
MAE: 42.954 | RMSE: 95.865 | R²: 0.967


### Variables d'entrée:  Classe, Nom

In [40]:
model_xgb3 = XGBRegressor()
df_exp.loc[len(df_exp)] = evaluation_regression(model_xgb3, X3_train, X3_test, y_train, y_test, "XGBRegressor")

____________
Essai sur échantillon de test XGBRegressor
y_pred min/max : -77.11 6270.442
MAE: 53.489 | RMSE: 121.813 | R²: 0.943


### Variables d'entrée:  MS, PB

In [41]:
model_xgb4 = XGBRegressor()
df_exp.loc[len(df_exp)] = evaluation_regression(model_xgb4, X4_train, X4_test, y_train, y_test, "XGBRegressor")

____________
Essai sur échantillon de test XGBRegressor
y_pred min/max : -90.728 6692.612
MAE: 189.542 | RMSE: 405.742 | R²: 0.476


### Essai avec random Forest sur le premier modèle

In [42]:
from sklearn.ensemble import RandomForestRegressor
model_rfr = RandomForestRegressor()
df_exp.loc[len(df_exp)] = evaluation_regression(model_rfr, X_train, X_test, y_train, y_test, "RandomForestRegressor")

____________
Essai sur échantillon de test RandomForestRegressor
y_pred min/max : -90.32 6458.9
MAE: 21.115 | RMSE: 51.021 | R²: 0.987


In [43]:
df_exp

Unnamed: 0,Model Name,MAE,RMSE,R2
0,XGBRegressor,18.599245,45.626117,0.992526
1,XGBRegressor,42.953616,95.865076,0.967004
2,XGBRegressor,53.488684,121.812672,0.943341
3,XGBRegressor,189.542013,405.742146,0.476083
4,RandomForestRegressor,21.11455,51.020827,0.987278


## Test sur une valeur précise

### Modèle xgb 1 (avec toutes les variables variables d'entrée)

In [44]:
instance_X = X_test[10]
instance_y = y_test[10]

y_chap_tot = model_xgb.predict([instance_X])
df_ychap = pd.DataFrame(columns=colonnes_Y)

df_ychap.loc[len(df_ychap)] = instance_y
df_ychap.loc[len(df_ychap)] = y_chap_tot[0]



df_ychap.T

Unnamed: 0,0,1
EB (kcal) kcal/kg brut,3810.0,3839.281982
ED porc croissance (kcal) kcal/kg brut,2290.0,2340.738037
EM porc croissance (kcal) kcal/kg brut,2130.0,2173.99585
EN porc croissance (kcal) kcal/kg brut,1400.0,1409.754395
EMAn coq (kcal) kcal/kg brut,1610.0,1739.141357
EMAn poulet (kcal) kcal/kg brut,1600.0,1613.687256
UFL 2018 par kg brut,0.77,0.782081
UFV 2018 par kg brut,0.72,0.692589
PDIA 2018 g_kg brut,40.0,39.512566
PDI 2018 g_kg brut,86.0,84.599976


### Modèle xgb 2 (avec comme variables d'entrée Nom, Classe, MS et PB)

In [45]:
instance_X2 = X2_test[10]
instance_y = y_test[10]

y_chap_tot = model_xgb2.predict([instance_X2])
df_ychap.loc[len(df_ychap)] = y_chap_tot[0]



df_ychap.T

Unnamed: 0,0,1,2
EB (kcal) kcal/kg brut,3810.0,3839.281982,3878.94165
ED porc croissance (kcal) kcal/kg brut,2290.0,2340.738037,2325.214111
EM porc croissance (kcal) kcal/kg brut,2130.0,2173.99585,2183.895508
EN porc croissance (kcal) kcal/kg brut,1400.0,1409.754395,1466.253784
EMAn coq (kcal) kcal/kg brut,1610.0,1739.141357,1743.446533
EMAn poulet (kcal) kcal/kg brut,1600.0,1613.687256,1787.40625
UFL 2018 par kg brut,0.77,0.782081,0.799124
UFV 2018 par kg brut,0.72,0.692589,0.740022
PDIA 2018 g_kg brut,40.0,39.512566,39.801064
PDI 2018 g_kg brut,86.0,84.599976,86.071274


### Modèle xgb 3 (avec comme variables d'entrée Classe et nom)

In [46]:
instance_X3 = X3_test[10]
instance_y = y_test[10]

y_chap_tot = model_xgb3.predict([instance_X3])
df_ychap.loc[len(df_ychap)] = y_chap_tot[0]


df_ychap.T

Unnamed: 0,0,1,2,3
EB (kcal) kcal/kg brut,3810.0,3839.281982,3878.94165,3969.284424
ED porc croissance (kcal) kcal/kg brut,2290.0,2340.738037,2325.214111,2440.381104
EM porc croissance (kcal) kcal/kg brut,2130.0,2173.99585,2183.895508,2270.767578
EN porc croissance (kcal) kcal/kg brut,1400.0,1409.754395,1466.253784,1500.748047
EMAn coq (kcal) kcal/kg brut,1610.0,1739.141357,1743.446533,1814.338135
EMAn poulet (kcal) kcal/kg brut,1600.0,1613.687256,1787.40625,1797.048096
UFL 2018 par kg brut,0.77,0.782081,0.799124,0.81666
UFV 2018 par kg brut,0.72,0.692589,0.740022,0.770592
PDIA 2018 g_kg brut,40.0,39.512566,39.801064,46.60046
PDI 2018 g_kg brut,86.0,84.599976,86.071274,94.172546


### Modèle random forest (avec toutes les variables d'entrée)

In [47]:
y_chap_tot = model_rfr.predict([instance_X])
df_ychap.loc[len(df_ychap)] = y_chap_tot[0]

df_ychap.T

Unnamed: 0,0,1,2,3,4
EB (kcal) kcal/kg brut,3810.0,3839.281982,3878.94165,3969.284424,3877.2
ED porc croissance (kcal) kcal/kg brut,2290.0,2340.738037,2325.214111,2440.381104,2327.9
EM porc croissance (kcal) kcal/kg brut,2130.0,2173.99585,2183.895508,2270.767578,2165.2
EN porc croissance (kcal) kcal/kg brut,1400.0,1409.754395,1466.253784,1500.748047,1418.2
EMAn coq (kcal) kcal/kg brut,1610.0,1739.141357,1743.446533,1814.338135,1714.4
EMAn poulet (kcal) kcal/kg brut,1600.0,1613.687256,1787.40625,1797.048096,1696.4
UFL 2018 par kg brut,0.77,0.782081,0.799124,0.81666,0.7869
UFV 2018 par kg brut,0.72,0.692589,0.740022,0.770592,0.7391
PDIA 2018 g_kg brut,40.0,39.512566,39.801064,46.60046,45.74
PDI 2018 g_kg brut,86.0,84.599976,86.071274,94.172546,91.72
