# 0 - QB - Utils

## Importation des modules

In [None]:
# Modules de base
import pandas as pd
import numpy as np
from datetime import datetime

# Utilitaires
from tsforecast.utils.time import get_period_start, get_period_end, timeseries_to_string, string_to_timeseries

## Identification des dates de d√©but et de fin de p√©riode

### Identification de la date de d√©but de p√©riode

In [None]:
# G√©n√©ration d'une date
date = pd.Timestamp('2024-03-15 14:30:00')
print(f"Date de r√©f√©rence: {date}")

# Parcours des fr√©quences
for frequency in ['daily', 'weekly', 'monthly', 'quarterly', 'annual'] :
    # G√©n√©ration de la date de d√©but de p√©riode
    start_date = get_period_start(date=date, frequency=frequency)
    print(f"D√©but {frequency:10s}: {start_date}")

### Identification de la date de fin de p√©riode

In [None]:
# G√©n√©ration d'une date
date = pd.Timestamp('2024-03-15 14:30:00')
print(f"Date de r√©f√©rence: {date}")

# Parcours des fr√©quences
for frequency in ['daily', 'weekly', 'monthly', 'quarterly', 'annual'] :
    # G√©n√©ration de la date de fin  de p√©riode
    end_date = get_period_end(date=date, frequency=frequency)
    print(f"Fin {frequency:10s}: {end_date}")

## Conversion entre s√©ries temporelles et cha√Ænes de caract√®res

### Conversion d'une s√©rie temporelle en cha√Ænes de caract√®res

In [None]:
# Cr√©ation d'une s√©rie temporelle de d√©monstration
dates = pd.date_range('2023-01-01', periods=8, freq='MS')  # Mensuel d√©but de mois
values = np.random.randn(8).cumsum() + 100
ts_demo = pd.Series(values, index=dates, name='economic_indicator')

print("üìä S√©rie temporelle originale:")
print(ts_demo)
print(f"\nType de l'index: {type(ts_demo.index[0])}")

print("\n" + "="*50)

# Conversion avec format par d√©faut (ann√©e-mois-jour)
ts_string_default = timeseries_to_string(ts_demo)
print("üî§ Conversion avec format par d√©faut (%Y-%m-%d):")
print(ts_string_default)
print(f"Type de l'index: {type(ts_string_default.index[0])}")

print("\n" + "="*30)

# Conversion avec format personnalis√©
ts_string_custom = timeseries_to_string(ts_demo, format="%B %Y")  # Mois complet Ann√©e
print("üî§ Conversion avec format personnalis√© (%B %Y):")
print(ts_string_custom)

print("\n" + "="*30)

# Conversion avec format fran√ßais
ts_string_fr = timeseries_to_string(ts_demo, format="%d/%m/%Y")  # Format fran√ßais
print("üî§ Conversion au format fran√ßais (%d/%m/%Y):")
print(ts_string_fr)

print("\n" + "="*30)

# Conversion avec format ISO complet
ts_string_iso = timeseries_to_string(ts_demo, format="%Y-%m-%dT%H:%M:%S")
print("üî§ Conversion au format ISO complet:")
print(ts_string_iso.head(3))  # Affichage partiel pour la lisibilit√©

### Conversion inverse : cha√Ænes de caract√®res vers s√©rie temporelle

In [None]:
# Conversion inverse sans sp√©cification de format (inf√©rence automatique)
print("üîÑ Conversion inverse avec inf√©rence automatique:")
ts_converted_auto = string_to_timeseries(ts_string_default)
print("S√©rie avec format par d√©faut reconvertie:")
print(ts_converted_auto)
print(f"Type de l'index: {type(ts_converted_auto.index[0])}")

# V√©rification que nous retrouvons les m√™mes donn√©es
print(f"\n‚úÖ Donn√©es identiques apr√®s conversion: {ts_demo.equals(ts_converted_auto)}")

print("\n" + "="*50)

# Conversion inverse avec format sp√©cifique
print("üîÑ Conversion inverse avec format sp√©cifique:")
ts_converted_specific = string_to_timeseries(ts_string_fr, format="%d/%m/%Y")
print("S√©rie avec format fran√ßais reconvertie:")
print(ts_converted_specific)

# V√©rification de l'√©quivalence (en ignorant les heures/minutes)
dates_equal = all(ts_demo.index.date == ts_converted_specific.index.date)
values_equal = np.allclose(ts_demo.values, ts_converted_specific.values)
print(f"\n‚úÖ Dates √©quivalentes: {dates_equal}")
print(f"‚úÖ Valeurs √©quivalentes: {values_equal}")

print("\n" + "="*50)

# D√©monstration avec des formats complexes
print("üéØ D√©monstration avec des formats plus complexes:")

# Cr√©ation d'une s√©rie avec dates irr√©guli√®res
irregular_dates = ['2023-01-15', '2023-02-28', '2023-04-10', '2023-07-04', '2023-12-25']
irregular_values = [150.2, 148.7, 152.1, 149.5, 155.8]
ts_irregular = pd.Series(irregular_values, index=irregular_dates, name='irregular_series')

print("S√©rie avec index string (irr√©gulier):")
print(ts_irregular)
print(f"Type de l'index: {type(ts_irregular.index[0])}")

# Conversion en datetime
ts_datetime = string_to_timeseries(ts_irregular)
print("\nApr√®s conversion en datetime:")
print(ts_datetime)
print(f"Type de l'index: {type(ts_datetime.index[0])}")

print("\n" + "="*30)

# Test avec format am√©ricain
american_dates = ['01/15/2023', '02/28/2023', '04/10/2023']
american_values = [100, 105, 98]
ts_american = pd.Series(american_values, index=american_dates)

print("S√©rie avec format am√©ricain (MM/dd/yyyy):")
print(ts_american)

# Conversion avec format sp√©cifique
ts_american_converted = string_to_timeseries(ts_american, format="%m/%d/%Y")
print("Apr√®s conversion avec format sp√©cifique:")
print(ts_american_converted)

# Comparaison avec inf√©rence automatique
ts_american_inferred = string_to_timeseries(ts_american)
print("Avec inf√©rence automatique:")
print(ts_american_inferred)

# V√©rification des diff√©rences potentielles
dates_same = ts_american_converted.index.equals(ts_american_inferred.index)
print(f"\n‚ö†Ô∏è  R√©sultats identiques: {dates_same}")
if not dates_same:
    print("Attention: L'inf√©rence automatique peut parfois interpr√©ter diff√©remment les dates ambig√ºes!")

### Cas d'usage pratiques et exemples avanc√©s

In [None]:
# Cas d'usage 1: Sauvegarde et chargement de donn√©es
print("üíæ Cas d'usage 1: Sauvegarde et chargement de donn√©es")
print("="*55)

# Simulation d'une s√©rie de donn√©es √©conomiques
dates_econ = pd.date_range('2020-01-01', '2024-12-01', freq='QS')  # Trimestriel
pib_growth = np.random.normal(0.5, 2.0, len(dates_econ)).cumsum()
ts_pib = pd.Series(pib_growth, index=dates_econ, name='pib_growth_rate')

print("S√©rie PIB originale (5 premi√®res valeurs):")
print(ts_pib.head())

# Conversion pour sauvegarde dans un format lisible
ts_pib_string = timeseries_to_string(ts_pib, format="%Y-Q%q")  # Format trimestriel
print("\nFormat string pour sauvegarde:")
print(ts_pib_string.head())

# Simulation: sauvegarde et rechargement (DataFrame pour d√©monstration)
df_save = pd.DataFrame({
    'date_str': ts_pib_string.index,
    'pib_growth': ts_pib_string.values
})
print("\nDataFrame pour sauvegarde CSV:")
print(df_save.head())

# Rechargement et reconversion
ts_loaded = pd.Series(df_save['pib_growth'].values, index=df_save['date_str'])
ts_reloaded = string_to_timeseries(ts_loaded)
print("\nS√©rie recharg√©e:")
print(ts_reloaded.head())

print("\n" + "="*40)

# Cas d'usage 2: Comparaison de diff√©rents formats de dates
print("üìÖ Cas d'usage 2: Harmonisation de formats de dates multiples")
print("="*65)

# Simulation de donn√©es provenant de sources diff√©rentes
# Source 1: Format ISO
dates_iso = ['2023-01-01', '2023-02-01', '2023-03-01']
values_iso = [100, 102, 104]
ts_iso = pd.Series(values_iso, index=dates_iso, name='source_iso')

# Source 2: Format fran√ßais
dates_fr = ['01/04/2023', '01/05/2023', '01/06/2023']
values_fr = [106, 108, 110]
ts_fr_source = pd.Series(values_fr, index=dates_fr, name='source_fr')

# Source 3: Format am√©ricain
dates_us = ['07/01/2023', '08/01/2023', '09/01/2023']
values_us = [112, 114, 116]
ts_us_source = pd.Series(values_us, index=dates_us, name='source_us')

print("Donn√©es provenant de 3 sources diff√©rentes:")
print("Source ISO:", ts_iso.index.tolist())
print("Source FR:", ts_fr_source.index.tolist())
print("Source US:", ts_us_source.index.tolist())

# Harmonisation vers datetime
ts_iso_dt = string_to_timeseries(ts_iso)
ts_fr_dt = string_to_timeseries(ts_fr_source, format="%d/%m/%Y")
ts_us_dt = string_to_timeseries(ts_us_source, format="%m/%d/%Y")

print("\nApr√®s harmonisation:")
print("Source ISO:", ts_iso_dt.index.tolist()[:2])
print("Source FR:", ts_fr_dt.index.tolist()[:2])
print("Source US:", ts_us_dt.index.tolist()[:2])

# Concat√©nation des s√©ries harmonis√©es
ts_combined = pd.concat([ts_iso_dt, ts_fr_dt, ts_us_dt]).sort_index()
print("\nS√©rie combin√©e et tri√©e:")
print(ts_combined)

print("\n" + "="*40)

# Cas d'usage 3: Analyse de p√©riodicit√© et conversion de fr√©quence
print("üîÑ Cas d'usage 3: Impact des formats sur l'analyse temporelle")
print("="*60)

# Cr√©ation d'une s√©rie avec diff√©rentes r√©solutions temporelles
hourly_dates = pd.date_range('2023-01-01 00:00', '2023-01-01 23:00', freq='H')
hourly_data = np.sin(np.arange(len(hourly_dates)) * 2 * np.pi / 24) + np.random.normal(0, 0.1, len(hourly_dates))
ts_hourly = pd.Series(hourly_data, index=hourly_dates)

print(f"S√©rie horaire (24 observations): {len(ts_hourly)} points")

# Conversion vers diff√©rents formats de granularit√©
formats_and_names = [
    ("%Y-%m-%d %H:00", "Format heure"),
    ("%Y-%m-%d", "Format jour"),
    ("%Y-%m", "Format mois"),
    ("%Y", "Format ann√©e")
]

for format_str, name in formats_and_names:
    ts_string_format = timeseries_to_string(ts_hourly, format=format_str)
    unique_dates = len(ts_string_format.index.unique())
    print(f"{name:12}: {unique_dates:2d} p√©riodes uniques, exemple: '{ts_string_format.index[0]}'")

print("\n" + "="*40)

# Cas d'usage 4: Validation et gestion d'erreurs
print("‚ö†Ô∏è  Cas d'usage 4: Gestion des cas limites")
print("="*45)

# Test avec des dates ambigu√´s
ambiguous_dates = ['01/02/2023', '03/04/2023', '05/06/2023']
ambiguous_values = [1, 2, 3]
ts_ambiguous = pd.Series(ambiguous_values, index=ambiguous_dates)

print("Dates ambigu√´s (jour/mois ou mois/jour?):")
print(ts_ambiguous)

# Conversion avec formats diff√©rents
try:
    ts_dm = string_to_timeseries(ts_ambiguous, format="%d/%m/%Y")
    print("\nInterpr√©tation jour/mois:")
    print(ts_dm)
except Exception as e:
    print(f"Erreur format jour/mois: {e}")

try:
    ts_md = string_to_timeseries(ts_ambiguous, format="%m/%d/%Y")
    print("\nInterpr√©tation mois/jour:")
    print(ts_md)
except Exception as e:
    print(f"Erreur format mois/jour: {e}")

print("\nüìã R√©sum√© des bonnes pratiques:")
print("1. Toujours sp√©cifier le format lors de la conversion inverse si ambigu√Øt√©")
print("2. V√©rifier la coh√©rence des dates apr√®s conversion")
print("3. Utiliser des formats standards (ISO 8601) quand possible")
print("4. Tester avec des √©chantillons de donn√©es avant traitement en masse")