In [29]:
import numpy as np
import pandas as pd
import pickle

from sklearn.compose import ColumnTransformer
from sklearn.linear_model import Lasso, LinearRegression
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score
from sklearn.model_selection import train_test_split
from sklearn.pipeline import make_pipeline, Pipeline
from sklearn.preprocessing import OrdinalEncoder, OneHotEncoder, StandardScaler

from feature_engine.encoding import CountFrequencyEncoder
from feature_engine.selection import DropFeatures

from catboost import CatBoostRegressor

# Prédictions avec le modèle catb

In [30]:
with open("../models/model_cb.pkl", "rb") as f:
    model = pickle.load(f)
f.close()

## Prédictions sur d'anciennes sorties

### Intouchables
- Prédiction au 09/04 du nombre d'entrées pour la première semaine : 427745.01087895344
- Nombre d'entrées réelles : 2 126 545

In [31]:
inputs = pd.DataFrame({
    'budget': [9611412],
    'duree' : [112],
    'franchise': ['0'],
    'genres': ['Comédie'],
    'pegi_fr' : ['Tous public'],
    'pegi_usa' : ['R'],
    'entrees_usa' : [103507],
    'salles_fr' : [508],
    'studio': ['Gaumont'],
    'is_compositeur': ['0'],
    'annee': ['2011'],
    'origine': ['France']
})

result = model.predict(inputs)

print("Prédiction du nombre d'entrées pour la première semaine :", result[0])
print("Nombre d'entrées réelles :", "2 126 545")


Prédiction du nombre d'entrées pour la première semaine : 583093.2706166679
Nombre d'entrées réelles : 2 126 545




### Iron Man 3
- Prédiction au 09/04 du nombre d'entrées pour la première semaine : 1321309.1952236528
- Nombre d'entrées réelles : 2 064 740

In [32]:
inputs = pd.DataFrame({
    'budget': [200000000],
    'duree' : [130],
    'franchise': ['1'],
    'genres': ['Comicbook'],
    'pegi_fr' : ['Tous publics'],
    'pegi_usa' : ['PG-13'],
    'entrees_usa' : [174144585],
    'salles_fr' : [740],
    'studio': ['Walt Disney Pictures'],
    'is_compositeur': ['0'],
    'annee': ['2013'],
    'origine': ['etats-unis']
})

result = model.predict(inputs)

print("Prédiction du nombre d'entrées pour la première semaine :", result[0])
print("Nombre d'entrées réelles :", "2 064 740")
# 1503728.9119381884

Prédiction du nombre d'entrées pour la première semaine : 1503728.9119381884
Nombre d'entrées réelles : 2 064 740




### Dune : Deuxième Partie
- Prédiction au 09/04 du nombre d'entrées pour la première semaine : 1105943.8533700795
- Nombre d'entrées réelles : 1 383 999

In [33]:
inputs = pd.DataFrame({
    'budget': [190000000],
    'duree' : [166],
    'franchise': ['0'],
    'genres': ['Science Fiction'],
    'pegi_fr' : ['Tous publics'],
    'pegi_usa' : ['PG-13'],
    'entrees_usa' : [82505391],
    'salles_fr' : [994],
    'studio': ['Warner Bros.'],
    'is_compositeur': ['1'],
    'annee': ['2024'],
    'origine': ['etats-unis']
})

result = model.predict(inputs)

print("Prédiction du nombre d'entrées pour la première semaine :", result[0])
print("Nombre d'entrées réelles :", "1 383 999")
# 1160805.768966211

Prédiction du nombre d'entrées pour la première semaine : 1160805.768966211
Nombre d'entrées réelles : 1 383 999




## Prédictions sur les nouvelles sorties

### Nous, les Leroy
- Prédiction au 09/04 du nombre d'entrées pour la première semaine : 148 272
- premier week-end : 155 439


In [34]:
inputs = pd.DataFrame({
    'budget': [4600000],
    'duree' : [166],
    'franchise': ['0'],
    'genres': ['Comédie'],
    'pegi_fr' : ['Tous publics'],
    'pegi_usa' : ['-1'],
    'entrees_usa' : [-1],
    'salles_fr' : [414],
    'studio': ['Apollo Films'],
    'is_compositeur': ['0'],
    'annee': ['2024'],
    'origine': ['france']
})

result = model.predict(inputs)

print("Prédiction du nombre d'entrées pour la première semaine :", result[0])
# 251868.39100035562 

Prédiction du nombre d'entrées pour la première semaine : 251868.39100035562




### S.O.S. Fantômes : La Menace de glace
- Prédiction au 09/04 du nombre d'entrées pour la première semaine : 589 067
- premier week-end : 248 128

In [35]:
inputs = pd.DataFrame({
    'budget': [100000000],
    'duree' : [116],
    'franchise': ['1'],
    'genres': ['Fantasy'],
    'pegi_fr' : ['Tous publics'],
    'pegi_usa' : ['PG-13'],
    'entrees_usa' : [45004673],
    'salles_fr' : [670],
    'studio': ['Sony Pictures'],
    'is_compositeur': ['0'],
    'annee': ['2024'],
    'origine': ['etats-unis']
})

result = model.predict(inputs)

print("Prédiction du nombre d'entrées pour la première semaine :", result[0])
# 477714.72832720366

Prédiction du nombre d'entrées pour la première semaine : 477714.72832720366


