# EuroMillions Analysis: 8 M√©thodes Analytiques vs Hasard

**Auteur**: Julien Sisavath  
**P√©riode**: 2020-2023  
**Objectif**: Analyser 134 jeux EuroMillions avec 8 m√©thodes analytiques  
**Hypoth√®se**: Les m√©thodes maximisent les petits gains au d√©triment des gros gains

---

## üìã Table des mati√®res

1. [Setup & Imports](#setup)
2. [Chargement des donn√©es](#data)
3. [Exploration des donn√©es](#exploration)
4. [Les 8 M√©thodes Analytiques](#methods)
5. [Analyse de mes jeux](#analysis)
6. [Tests Statistiques](#tests)
7. [Backtesting: Julien vs Random](#backtesting)
8. [Visualisations](#viz)
9. [Conclusions](#conclusions)

## 1. Setup & Imports <a id='setup'></a>

In [None]:
# Imports
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from pathlib import Path
import sys

# Configuration
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette('viridis')
%matplotlib inline

# Imports utils
sys.path.append('src')
from utils import *

print('‚úÖ Imports r√©ussis')

## 2. Chargement des donn√©es <a id='data'></a>

In [None]:
# Charger donn√©es
historical = pd.read_csv('data/processed/clean_draws.csv')
my_games = pd.read_csv('data/processed/clean_my_games.csv')

# Backtesting
bt_julien = pd.read_csv('outputs/reports/backtesting_julien.csv')
bt_random = pd.read_csv('outputs/reports/backtesting_random.csv')
bt_comparison = pd.read_csv('outputs/reports/backtesting_comparison.csv')

print(f'üìä Tirages historiques: {len(historical):,}')
print(f'üéÆ Mes jeux: {len(my_games):,}')
print(f'üé≤ Backtesting Julien: {len(bt_julien):,}')
print(f'üé≤ Backtesting Random: {len(bt_random):,}')

## 3. Exploration des donn√©es <a id='exploration'></a>

In [None]:
# Aper√ßu tirages historiques
print('üìä Tirages Historiques (5 premiers)')
display(historical.head())

print('\nüìä Info')
historical.info()

In [None]:
# Aper√ßu mes jeux
print('üéÆ Mes Jeux (5 premiers)')
display(my_games.head())

print('\nüéÆ Info')
my_games.info()

In [None]:
# Statistiques descriptives
print('üìà Statistiques Tirages Historiques')
display(historical[['Sum_Balls', 'Even_Count', 'Max_Gap']].describe())

print('\nüìà Statistiques Mes Jeux')
display(my_games[['Sum_Balls', 'Even_Count', 'Max_Gap']].describe())

## 4. Les 8 M√©thodes Analytiques <a id='methods'></a>

### üìö Documentation des m√©thodes

1. **R√©currence + Amplitude**: Favorise num√©ros fr√©quents ET rares
2. **Validation par Somme**: Cible somme ~120 dans [90-150]
3. **Unicit√©**: P√©nalise doublons avec tirages pr√©c√©dents
4. **Analyse des √âcarts**: P√©nalise √©carts trop grands
5. **Moving Averages**: Lisse les tendances sur 10 tirages
6. **Compartimentalisation**: Force diversit√© entre 5 zones [1-10, 11-20...]
7. **Parit√© & Divisibilit√©**: Equilibre pairs/impairs et multiples
8. **Num√©ro Sacr√© (13)**: Force inclusion du 13

In [None]:
# Tester g√©n√©ration combinaison Julien style
print('üé≤ G√©n√©ration de 5 combinaisons "Style Julien":\n')

for i in range(5):
    combo = generate_combination_julien_style(historical)
    print(f'  Combo {i+1}: {combo} (Somme: {sum(combo)})')

In [None]:
# Comparer avec g√©n√©ration al√©atoire
print('üé≤ G√©n√©ration de 5 combinaisons AL√âATOIRES:\n')

for i in range(5):
    combo = generate_combination_random()
    print(f'  Combo {i+1}: {combo} (Somme: {sum(combo)})')

## 5. Analyse de mes jeux <a id='analysis'></a>

In [None]:
# Investissement et gains
n_games = len(my_games)
total_invested = n_games * 3.50

print(f'üí∞ ANALYSE FINANCI√àRE')
print(f'{'='*50}')
print(f'Jeux jou√©s: {n_games:,}')
print(f'Investissement total: {total_invested:,.2f} CHF')
print(f'P√©riode: {my_games["Date_Jeu"].min()} ‚Üí {my_games["Date_Jeu"].max()}')

In [None]:
# Fr√©quence du num√©ro 13
has_13_count = my_games['Has_13'].sum()
has_13_pct = (has_13_count / n_games) * 100

print(f'üî¢ NUM√âRO SACR√â (13)')
print(f'{'='*50}')
print(f'Jeux avec 13: {has_13_count} / {n_games} ({has_13_pct:.1f}%)')
print(f'Fr√©quence th√©orique: 10% (5/50)')
print(f'Sur-repr√©sentation: {has_13_pct / 10:.2f}x')

In [None]:
# Distribution sommes
plt.figure(figsize=(12, 6))
plt.hist(my_games['Sum_Balls'], bins=20, alpha=0.7, color='#FF6B6B', edgecolor='black')
plt.axvline(x=120, color='green', linestyle='--', linewidth=2, label='Cible (120)')
plt.axvline(x=90, color='red', linestyle=':', linewidth=1, alpha=0.5, label='Contraintes')
plt.axvline(x=150, color='red', linestyle=':', linewidth=1, alpha=0.5)
plt.xlabel('Somme des 5 boules', fontsize=12)
plt.ylabel('Fr√©quence', fontsize=12)
plt.title('Distribution des sommes - Mes jeux', fontsize=14, fontweight='bold')
plt.legend()
plt.grid(alpha=0.3)
plt.show()

## 6. Tests Statistiques <a id='tests'></a>

In [None]:
# Chi-2 uniformit√©
from scipy.stats import chisquare

ball_cols = ['B1', 'B2', 'B3', 'B4', 'B5']
all_numbers = historical[ball_cols].values.flatten()
freq = pd.Series(all_numbers).value_counts()

observed = [freq.get(i, 0) for i in range(1, 51)]
expected_freq = len(all_numbers) / 50
expected = [expected_freq] * 50

chi2, p_value = chisquare(observed, expected)

print(f'üß™ TEST CHI-2: UNIFORMIT√â DES NUM√âROS')
print(f'{'='*50}')
print(f'Chi-2: {chi2:.4f}')
print(f'P-value: {p_value:.4f}')
print(f'Conclusion: {"Distribution uniforme (H0 accept√©e)" if p_value > 0.05 else "Distribution NON uniforme (H0 rejet√©e)"}')

In [None]:
# Kolmogorov-Smirnov normalit√©
from scipy.stats import kstest

sum_mean = historical['Sum_Balls'].mean()
sum_std = historical['Sum_Balls'].std()

ks_stat, ks_p = kstest(
    historical['Sum_Balls'],
    lambda x: ((x - sum_mean) / sum_std)
)

print(f'üß™ TEST KOLMOGOROV-SMIRNOV: NORMALIT√â DES SOMMES')
print(f'{'='*50}')
print(f'KS statistic: {ks_stat:.4f}')
print(f'P-value: {ks_p:.4f}')
print(f'Conclusion: {"Distribution normale (H0 accept√©e)" if ks_p > 0.05 else "Distribution NON normale (H0 rejet√©e)"}')

## 7. Backtesting: Julien vs Random <a id='backtesting'></a>

In [None]:
# Charger statistiques backtesting
n_sims = len(bt_julien)
invested = n_sims * 3.50

# ROI
roi_julien = ((bt_julien['Gain_CHF'].sum() - invested) / invested) * 100
roi_random = ((bt_random['Gain_CHF'].sum() - invested) / invested) * 100

# Taux de r√©ussite
wins_julien = bt_julien['Rank'].notna().sum()
wins_random = bt_random['Rank'].notna().sum()
win_rate_julien = (wins_julien / n_sims) * 100
win_rate_random = (wins_random / n_sims) * 100

print(f'üé≤ BACKTESTING: {n_sims:,} SIMULATIONS')
print(f'{'='*60}')
print(f'\nüìä PROFIL JULIEN (8 m√©thodes)')
print(f'  ROI: {roi_julien:.2f}%')
print(f'  Taux de r√©ussite: {win_rate_julien:.2f}% ({wins_julien:,}/{n_sims:,})')
print(f'  Gains totaux: {bt_julien["Gain_CHF"].sum():,.2f} CHF')

print(f'\nüìä PROFIL RANDOM (al√©atoire)')
print(f'  ROI: {roi_random:.2f}%')
print(f'  Taux de r√©ussite: {win_rate_random:.2f}% ({wins_random:,}/{n_sims:,})')
print(f'  Gains totaux: {bt_random["Gain_CHF"].sum():,.2f} CHF')

print(f'\n‚öñÔ∏è  COMPARAISON')
print(f'  √âcart ROI: {roi_julien - roi_random:+.2f}%')
print(f'  √âcart taux r√©ussite: {win_rate_julien - win_rate_random:+.2f}%')
print(f'\nüí° CONCLUSION:')
if abs(roi_julien - roi_random) < 1:
    print('  ‚ö†Ô∏è  Diff√©rence NON significative - Les m√©thodes ne surperforment PAS le hasard')
elif roi_julien > roi_random:
    print(f'  ‚úÖ Julien sur-performe: {roi_julien - roi_random:+.2f}%')
else:
    print(f'  ‚ùå Julien sous-performe: {roi_julien - roi_random:+.2f}%')

In [None]:
# Visualisation comparaison
fig, axes = plt.subplots(1, 2, figsize=(16, 6))

# ROI
axes[0].bar(['Julien', 'Random'], [roi_julien, roi_random], 
            color=['#FF6B6B', '#4ECDC4'], alpha=0.8, edgecolor='black')
axes[0].axhline(y=-50, color='red', linestyle='--', linewidth=2, 
                label='ROI th√©orique (-50%)', alpha=0.7)
axes[0].set_ylabel('ROI (%)', fontsize=12)
axes[0].set_title(f'ROI Comparaison ({n_sims:,} jeux)', fontsize=13, fontweight='bold')
axes[0].legend()
axes[0].grid(alpha=0.3)

# Taux de r√©ussite
axes[1].bar(['Julien', 'Random'], [win_rate_julien, win_rate_random], 
            color=['#FF6B6B', '#4ECDC4'], alpha=0.8, edgecolor='black')
axes[1].set_ylabel('Taux de r√©ussite (%)', fontsize=12)
axes[1].set_title(f'Taux de r√©ussite ({n_sims:,} jeux)', fontsize=13, fontweight='bold')
axes[1].grid(alpha=0.3)

plt.tight_layout()
plt.show()

## 8. Visualisations <a id='viz'></a>

In [None]:
# Charger visualisations g√©n√©r√©es
from IPython.display import Image, display

figures = [
    'heatmap_frequency.png',
    'sum_distribution.png',
    'number_frequency_comparison.png',
    'autocorrelation_13.png',
    'backtesting_comparison.png'
]

for fig in figures:
    print(f'\nüìä {fig}')
    display(Image(filename=f'outputs/figures/{fig}'))

## 9. Conclusions <a id='conclusions'></a>

### üîë R√©sultats cl√©s

1. **Les 8 m√©thodes analytiques ne surperforment PAS le hasard**
   - ROI Julien: -89.63% vs Random: -89.86%
   - Diff√©rence non significative (<1%)

2. **Confirmation: La loterie est un jeu de hasard pur**
   - Tests Chi-2: Distribution uniforme (p=0.86)
   - Tests KS: Distribution normale des sommes (p=0.80)
   - Pas d'autocorr√©lation d√©tect√©e

3. **Le num√©ro 13 est sur-repr√©sent√© dans mes jeux**
   - 17.9% vs 10% th√©orique (1.8x)
   - Biais psychologique confirm√©

4. **ROI r√©el: -61.3% (134 jeux)**
   - Pire que -50% th√©orique
   - Variance √©lev√©e sur petit √©chantillon

### üí° Insights

- Les m√©thodes analytiques cr√©ent un **biais cognitif** mais aucun avantage statistique
- Le backtesting valide que **toutes les strat√©gies convergent vers -50% ROI**
- L'espoir initial (petits gains fr√©quents) ne se mat√©rialise pas

### üéØ Application RegTech

Ce projet d√©montre:
- Rigueur analytique (8 m√©thodes structur√©es)
- Pipeline data science reproductible
- Tests statistiques rigoureux
- Visualisations professionnelles
- **Honn√™tet√© intellectuelle**: Accepter que l'hypoth√®se soit fausse

Ces comp√©tences sont directement transf√©rables au RegTech:
- Analyse de patterns dans transactions financi√®res
- D√©tection d'anomalies
- Validation statistique de r√®gles de compliance
- Reporting automatis√©

---

**Conclusion finale**: Les math√©matiques ne peuvent pas battre les math√©matiques. La loterie reste un jeu de hasard pur.