In [1]:
import pandas as pd
import pymysql
from sqlalchemy import create_engine
from dotenv import load_dotenv
import os
from pathlib import Path

# Charger le fichier .env
env_path = Path('/Users/ikram/Desktop') / '.env'
load_dotenv(dotenv_path=env_path)

# Connexion à la base de données
def get_engine():
    password = os.getenv('DB_PASSWORD')
    connection_string = f"mysql+pymysql://root:{password}@localhost/sakila"
    engine = create_engine(connection_string)
    return engine

# Fonction pour récupérer les données de location pour un mois et une année donnés
def rentals_month(engine, month, year):
    query = f"""
    SELECT rental_id, rental_date, inventory_id, customer_id, return_date, staff_id, last_update
    FROM rental
    WHERE MONTH(rental_date) = {month} AND YEAR(rental_date) = {year}
    """
    df = pd.read_sql(query, engine)
    return df

# Fonction pour compter le nombre de locations par client pour un mois et une année donnés
def rental_count_month(df, month, year):
    count_df = df.groupby('customer_id').size().reset_index(name=f'rentals_{month:02d}_{year}')
    return count_df

# Fonction pour comparer les locations entre deux mois
def compare_rentals(df1, df2):
    merged_df = pd.merge(df1, df2, on='customer_id', how='outer').fillna(0)
    merged_df['difference'] = merged_df.iloc[:, 1] - merged_df.iloc[:, 2]
    return merged_df

# Exécution de l'exercice
if __name__ == "__main__":
    engine = get_engine()

    # Récupérer les données de location pour mai et juin 2005
    may_rentals = rentals_month(engine, 5, 2005)
    june_rentals = rentals_month(engine, 6, 2005)

    # Compter les locations par client pour mai et juin 2005
    may_count = rental_count_month(may_rentals, 5, 2005)
    june_count = rental_count_month(june_rentals, 6, 2005)

    # Comparer les locations entre mai et juin 2005
    comparison = compare_rentals(may_count, june_count)

    print(comparison)


     customer_id  rentals_05_2005  rentals_06_2005  difference
0              1              2.0              7.0        -5.0
1              2              1.0              1.0         0.0
2              3              2.0              4.0        -2.0
3              5              3.0              5.0        -2.0
4              6              3.0              4.0        -1.0
..           ...              ...              ...         ...
593          583              0.0              6.0        -6.0
594          585              0.0              4.0        -4.0
595          591              0.0              3.0        -3.0
596          592              0.0              5.0        -5.0
597          598              0.0              1.0        -1.0

[598 rows x 4 columns]
