In [1]:
# -*- coding: utf-8 -*-
# üìå 1Ô∏è‚É£ IMPORTS

from modules.Utils import read_decimal_file
from modules.Analysing import analyse_sequence , evaluate_generator
from modules.Generators import PythonGenerator, OurGenerator
from modules.Tests import Chi2Test, GapTest, MaximumTest, KSTest, PokerTest, CouponCollectorTest
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt


In [2]:
# ===============================================
# üìå 2Ô∏è‚É£ PARAM√àTRES
# ===============================================
DECIMAL_FILE = "data/e2M.txt"
GRANULARITIES = [1000, 10000, 50000 , 100000]  # tailles des portions pour analyse locale
ALPHA = 0.05
TESTS = [Chi2Test(), GapTest(), MaximumTest(), KSTest(), PokerTest(), CouponCollectorTest()]

N_GEN = 100000  # taille d'une s√©quence g√©n√©r√©e
K_ITER = 100    # nombre de r√©p√©titions pour √©valuer les g√©n√©rateurs



In [3]:
# =================================================
# üìå 3Ô∏è‚É£ LECTURE ET PR√âPARATION DES D√âCIMALES DE e
# =================================================
# => R√©cup√©ration des 2M d√©cimales en entiers (0-9)
decimals_e = read_decimal_file(DECIMAL_FILE)
print(f"Longueur totale des d√©cimales de e : {len(decimals_e)}")


Longueur totale des d√©cimales de e : 2000000


In [6]:
# ===============================================
# üìå 4Ô∏è‚É£ ANALYSE DE LA S√âQUENCE COMPL√àTE DES D√âCIMALES
# ===============================================
# => S√©quence globale
global_res = analyse_sequence(
    sequence=decimals_e,
    tests=TESTS,
    alpha=ALPHA,
    granularities=None
)

# => S√©quence par portions de granularit√©s
granular_res = analyse_sequence(
    sequence=decimals_e,
    tests=TESTS,
    alpha=ALPHA,
    granularities=GRANULARITIES
)

print("\n‚úÖ Analyse globale et par granularit√©s des d√©cimales de e termin√©e !")




‚úÖ Analyse globale et par granularit√©s des d√©cimales de e termin√©e !


In [7]:
# ===============================================
# üìå 6Ô∏è‚É£ √âVALUATION DES G√âN√âRATEURS
# ===============================================

# Cr√©ation des g√©n√©rateurs
gen_python = PythonGenerator()
gen_our = OurGenerator(decimals=decimals_e)

# √âvaluation Python Generator
df_python = evaluate_generator(gen_python,
                            granularities=GRANULARITIES,
                            seq_len=N_GEN,
                            n_repeat=K_ITER,
                            tests=TESTS,
                            alpha=ALPHA)
print("‚úÖ √âvaluation Python Generator termin√©e.")

# √âvaluation Our Generator
df_our = evaluate_generator(gen_our,
                            granularities=GRANULARITIES,
                            seq_len=N_GEN,
                            n_repeat=K_ITER,
                            tests=TESTS,
                            alpha=ALPHA)
print("‚úÖ √âvaluation Our Generator termin√©e.")


‚úÖ √âvaluation Python Generator termin√©e.
‚úÖ √âvaluation Our Generator termin√©e.


In [None]:

# Fusion des r√©sultats
df_comparison = pd.concat([df_python.hist_df, df_our.hist_df], ignore_index=True)

# Sauvegarde
df_comparison.to_csv("comparison_results.csv", index=False)

print("\n R√©sultats sauvegard√©s dans 'comparison_results.csv'")



üìÅ R√©sultats sauvegard√©s dans 'comparison_results.csv'


In [None]:
# ===============================================
# üìå 7Ô∏è‚É£ VISUALISATION : Taux de rejet par test et par g√©n√©rateur
# ===============================================
summary = df_comparison.groupby(["Generator", "Test"])["Reject_H0"].mean().reset_index()
summary["Rejection_Rate (%)"] = summary["Reject_H0"] * 100

plt.figure(figsize=(12, 6))
sns.barplot(data=summary, x="Test", y="Rejection_Rate (%)", hue="Generator")
plt.title("üìä Taux de rejet H0 par test statistique et par g√©n√©rateur")
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

print("\n‚úÖ Pipeline complet termin√© ! Tu peux inclure le CSV et le graphique dans ton rapport.")
