In [7]:
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings('ignore')
from datetime import datetime
from collections import Counter, defaultdict
import random

class IALabo:
    """Syst√®me d'analyse intelligent pour jeux de hasard"""
    
    def __init__(self, fichier_donnees):
        """
        Initialise IA Labo
        :param fichier_donnees: Chemin vers le fichier historique
        """
        # D√©finir les attributs d'abord
        self.numero_max = 49  # Pour Loto fran√ßais
        self.historique_scores = defaultdict(list)
        self.performance_reseaux = {}
        
        # Puis charger les donn√©es
        self.df = self.charger_donnees(fichier_donnees)
        
    def charger_donnees(self, fichier):
        """Charge et pr√©pare les donn√©es historiques"""
        try:
            print(f"üìñ Chargement du fichier: {fichier}")
            
            # Essayer diff√©rentes m√©thodes de chargement
            try:
                df = pd.read_csv(fichier, sep=';')
            except:
                df = pd.read_csv(fichier, sep=',')
            
            print(f"Colonnes d√©tect√©es: {df.columns.tolist()}")
            print(f"Aper√ßu des donn√©es:\n{df.head()}")
            
            # Nettoyer les noms de colonnes
            df.columns = [col.strip().lower() for col in df.columns]
            
            # Identifier automatiquement les colonnes de num√©ros
            numeros_columns = []
            
            # Chercher des colonnes nomm√©es num0, num1, etc.
            for i in range(5):
                col_name = f'num{i}'
                if col_name in df.columns:
                    numeros_columns.append(col_name)
            
            print(f"Colonnes de num√©ros identifi√©es: {numeros_columns}")
            
            # Si on n'a pas trouv√© toutes les colonnes
            if len(numeros_columns) < 5:
                print("‚ö†Ô∏è  Moins de 5 colonnes de num√©ros trouv√©es")
                # Prendre les premi√®res colonnes num√©riques
                numeric_cols = df.select_dtypes(include=[np.number]).columns.tolist()
                # Exclure la colonne date si elle est num√©rique
                if 'date' in numeric_cols:
                    numeric_cols.remove('date')
                numeros_columns = numeric_cols[:5]
            
            print(f"Colonnes finales utilis√©es: {numeros_columns}")
            
            # Renommer les colonnes pour uniformit√©
            for i, col in enumerate(numeros_columns[:5]):
                if f'num{i}' not in df.columns:
                    df[f'num{i}'] = pd.to_numeric(df[col], errors='coerce')
            
            # Garder seulement les 5 colonnes de num√©ros standardis√©es
            numeros_columns_standard = [f'num{i}' for i in range(5)]
            df = df[numeros_columns_standard].copy()
            
            # Supprimer les lignes avec valeurs manquantes
            df = df.dropna()
            
            # Convertir en entiers
            for col in numeros_columns_standard:
                df[col] = df[col].astype(int)
            
            # V√©rifier que les num√©ros sont dans la bonne plage
            for col in numeros_columns_standard:
                df = df[(df[col] >= 1) & (df[col] <= self.numero_max)]
            
            # Trier les num√©ros dans l'ordre croissant
            df[numeros_columns_standard] = np.sort(df[numeros_columns_standard].values, axis=1)
            
            print(f"‚úÖ {len(df)} tirages valides charg√©s")
            print(f"Plage des num√©ros: {df.min().min()} √† {df.max().max()}")
            
            return df
            
        except Exception as e:
            print(f"‚ùå Erreur lors du chargement: {e}")
            import traceback
            traceback.print_exc()
            return None
    
    # ==================== MODULES D'ANALYSE SIMPLIFI√âS ====================
    
    class AnalyseFrequentielle:
        """Module 1: Analyse fr√©quentielle"""
        
        def __init__(self, historique):
            self.historique = historique
            
        def analyser(self):
            """Analyse des fr√©quences"""
            scores = np.zeros(49)
            
            # Compter les apparitions
            compteur = Counter()
            for tirage in self.historique:
                compteur.update(tirage)
            
            total_tirages = len(self.historique)
            if total_tirages > 0:
                for num, count in compteur.items():
                    if 1 <= num <= 49:
                        scores[num-1] = count / total_tirages
            
            return scores
    
    class AnalyseRetards:
        """Module 2: Analyse des retards"""
        
        def __init__(self, historique):
            self.historique = historique
            
        def analyser(self):
            """Analyse des num√©ros en retard"""
            scores = np.zeros(49)
            
            # Calculer le d√©lai depuis la derni√®re apparition
            derniere_apparition = {i: -1000 for i in range(1, 50)}  # Initialiser avec une valeur basse
            
            for idx, tirage in enumerate(self.historique):
                for num in tirage:
                    derniere_apparition[num] = idx
            
            max_retard = max(idx for idx in derniere_apparition.values())
            
            for num, dernier_idx in derniere_apparition.items():
                retard = len(self.historique) - dernier_idx
                scores[num-1] = retard / max_retard if max_retard > 0 else 0
            
            return scores
    
    class AnalysePairsImpairs:
        """Module 3: Analyse pairs/impairs"""
        
        def __init__(self, historique):
            self.historique = historique
            
        def analyser(self):
            """Analyse de la r√©partition pairs/impairs"""
            scores = np.zeros(49)
            
            if not self.historique:
                return scores
            
            # Analyser la tendance r√©cente
            derniers_tirages = self.historique[-20:] if len(self.historique) > 20 else self.historique
            
            # Compter les pairs et impairs
            total_numeros = sum(len(t) for t in derniers_tirages)
            pairs_recent = sum(1 for tirage in derniers_tirages for num in tirage if num % 2 == 0)
            ratio_pairs = pairs_recent / total_numeros if total_numeros > 0 else 0.5
            
            # Attribuer des scores selon le ratio
            for i in range(1, 50):
                if i % 2 == 0:  # Pair
                    scores[i-1] = ratio_pairs
                else:  # Impair
                    scores[i-1] = 1 - ratio_pairs
            
            return scores
    
    class AnalyseSommes:
        """Module 4: Analyse des sommes"""
        
        def __init__(self, historique):
            self.historique = historique
            
        def analyser(self):
            """Analyse des sommes moyennes"""
            scores = np.zeros(49)
            
            if not self.historique:
                return scores
            
            # Calculer la somme moyenne des derniers tirages
            sommes = [sum(t) for t in self.historique[-30:]]
            if not sommes:
                return scores
                
            somme_moyenne = np.mean(sommes)
            somme_std = np.std(sommes) if len(sommes) > 1 else 30
            
            # Score bas√© sur la contribution √† une somme proche de la moyenne
            contribution_ideale = somme_moyenne / 5
            
            for i in range(1, 50):
                distance = abs(i - contribution_ideale)
                scores[i-1] = np.exp(-(distance**2) / (2 * (somme_std/5)**2))
            
            return scores
    
    class AnalyseClusters:
        """Module 5: Analyse des clusters"""
        
        def __init__(self, historique):
            self.historique = historique
            
        def analyser(self):
            """Analyse des clusters de num√©ros"""
            scores = np.zeros(49)
            
            if len(self.historique) < 10:
                return scores
            
            # Analyser les paires fr√©quentes
            paires = Counter()
            for tirage in self.historique:
                for i in range(len(tirage)):
                    for j in range(i+1, len(tirage)):
                        paire = tuple(sorted([tirage[i], tirage[j]]))
                        paires[paire] += 1
            
            if paires:
                max_freq = max(paires.values()) if paires.values() else 1
                for (num1, num2), freq in paires.items():
                    score = freq / max_freq
                    scores[num1-1] += score * 0.1
                    scores[num2-1] += score * 0.1
            
            return scores
    
    class AnalyseDizaines:
        """Module 6: Analyse par dizaines"""
        
        def __init__(self, historique):
            self.historique = historique
            
        def analyser(self):
            """Analyse de la r√©partition par dizaines"""
            scores = np.zeros(49)
            
            if not self.historique:
                return scores
            
            # Analyser la fr√©quence par dizaine
            compteur_dizaines = {d: 0 for d in range(5)}  # 0:1-9, 1:10-19, etc.
            total_numeros = 0
            
            derniers_tirages = self.historique[-50:] if len(self.historique) > 50 else self.historique
            for tirage in derniers_tirages:
                for num in tirage:
                    dizaine = (num - 1) // 10
                    if dizaine < 5:  # S'assurer que c'est valide
                        compteur_dizaines[dizaine] += 1
                        total_numeros += 1
            
            if total_numeros > 0:
                for num in range(1, 50):
                    dizaine = (num - 1) // 10
                    if dizaine < 5:
                        freq_dizaine = compteur_dizaines[dizaine] / total_numeros
                        scores[num-1] = 1 - freq_dizaine  # Favorise les dizaines sous-repr√©sent√©es
            
            return scores
    
    # ==================== MOTEUR D'AGR√âGATION ====================
    
    def analyser_avec_tous_modules(self):
        """Ex√©cute tous les modules d'analyse"""
        if self.df is None or len(self.df) < 10:
            print("‚ùå Pas assez de donn√©es historiques")
            return None
        
        # Pr√©parer les donn√©es historiques
        numeros_columns = [f'num{i}' for i in range(5)]
        historique_tirages = self.df[numeros_columns].values.tolist()
        
        print(f"üìä Analyse de {len(historique_tirages)} tirages historiques...")
        
        # Initialiser les modules
        modules = {
            'frequentiel': self.AnalyseFrequentielle(historique_tirages),
            'retards': self.AnalyseRetards(historique_tirages),
            'pairs_impairs': self.AnalysePairsImpairs(historique_tirages),
            'sommes': self.AnalyseSommes(historique_tirages),
            'clusters': self.AnalyseClusters(historique_tirages),
            'dizaines': self.AnalyseDizaines(historique_tirages)
        }
        
        # Ex√©cuter toutes les analyses
        resultats = {}
        for nom, module in modules.items():
            scores = module.analyser()
            resultats[nom] = scores
            print(f"   ‚úÖ Module {nom}")
        
        return resultats
    
    def bagging(self, resultats_modules):
        """M√©thode Bagging: moyenne simple des scores"""
        if not resultats_modules:
            return None
        
        # Moyenne des scores de tous les modules
        scores_combined = np.zeros(self.numero_max)
        
        for module_name, scores in resultats_modules.items():
            scores_combined += scores
        
        scores_combined /= len(resultats_modules)
        
        # Normaliser entre 0 et 1
        if scores_combined.max() > 0:
            scores_combined = scores_combined / scores_combined.max()
        
        # Classement des num√©ros
        classement = np.argsort(scores_combined)[::-1] + 1
        
        return {
            'scores': scores_combined,
            'classement': classement[:20],  # Top 20
            'methode': 'bagging'
        }
    
    def boosting(self, resultats_modules):
        """M√©thode Boosting: pond√©ration intelligente"""
        if not resultats_modules:
            return None
        
        # Pond√©rations selon le type d'analyse
        poids = {
            'frequentiel': 1.0,    # Fr√©quences historiques
            'retards': 1.2,        # Retards (important)
            'pairs_impairs': 0.8,  # √âquilibre pairs/impairs
            'sommes': 1.1,         # Sommes moyennes
            'clusters': 0.9,       # Paires fr√©quentes
            'dizaines': 1.0        # R√©partition
        }
        
        # Application des poids
        scores_combined = np.zeros(self.numero_max)
        poids_total = sum(poids.values())
        
        for module_name, scores in resultats_modules.items():
            poids_module = poids.get(module_name, 1.0)
            scores_combined += scores * poids_module
        
        scores_combined /= poids_total
        
        # Normaliser
        if scores_combined.max() > 0:
            scores_combined = scores_combined / scores_combined.max()
        
        # Classement
        classement = np.argsort(scores_combined)[::-1] + 1
        
        return {
            'scores': scores_combined,
            'classement': classement[:20],
            'methode': 'boosting',
            'poids': poids
        }
    
    def generer_recommandations(self, methode='bagging'):
        """G√©n√®re des recommandations finales"""
        print(f"\n{'='*60}")
        print(f"üß† IA LABO - G√©n√©ration de recommandations")
        print(f"{'='*60}")
        
        # 1. Analyser avec tous les modules
        resultats_modules = self.analyser_avec_tous_modules()
        if resultats_modules is None:
            return
        
        # 2. Appliquer la m√©thode d'agr√©gation
        if methode == 'bagging':
            resultat = self.bagging(resultats_modules)
        elif methode == 'boosting':
            resultat = self.boosting(resultats_modules)
        else:
            resultat = self.bagging(resultats_modules)
        
        if resultat is None:
            return
        
        # 3. Afficher les r√©sultats
        self.afficher_resultats(resultat, resultats_modules)
        
        # 4. G√©n√©rer des combinaisons sugg√©r√©es
        if len(resultat['classement']) >= 12:
            combinaisons = self.generer_combinaisons(resultat['classement'][:12])
            self.afficher_combinaisons(combinaisons)
        
        return resultat
    
    def afficher_resultats(self, resultat_aggrege, resultats_modules):
        """Affiche les r√©sultats d'analyse"""
        print(f"\nüìä R√âSULTATS - M√©thode: {resultat_aggrege['methode'].upper()}")
        
        if 'poids' in resultat_aggrege:
            print("\n‚öñÔ∏è  Pond√©rations des modules:")
            for module, poids in sorted(resultat_aggrege['poids'].items(), key=lambda x: x[1], reverse=True):
                print(f"   {module:15} ‚Üí {poids:.3f}")
        
        print(f"\nüèÜ TOP 15 NUM√âROS RECOMMAND√âS:")
        print("   Rang | Num√©ro | Score  | D√©tails")
        print("   " + "-" * 40)
        
        for i, num in enumerate(resultat_aggrege['classement'][:15], 1):
            score = resultat_aggrege['scores'][num-1]
            
            # Caract√©ristiques du num√©ro
            est_pair = "Pair" if num % 2 == 0 else "Impair"
            dizaine = (num - 1) // 10
            details = f"{est_pair}, Dizaine {dizaine*10+1}-{dizaine*10+10}"
            
            print(f"   {i:4} | {num:6} | {score:.4f} | {details}")
    
    def generer_combinaisons(self, numeros_recommandes, n_combinaisons=5):
        """G√©n√®re des combinaisons √©quilibr√©es"""
        combinaisons = []
        
        for _ in range(n_combinaisons):
            # Essayer plusieurs fois pour avoir une combinaison valide
            for attempt in range(100):
                # S√©lection al√©atoire
                combinaison = random.sample(numeros_recommandes.tolist(), 5)
                combinaison.sort()
                
                # V√©rifier les crit√®res
                if self.combinaison_valide(combinaison):
                    combinaisons.append(combinaison)
                    break
        
        return combinaisons[:n_combinaisons]
    
    def combinaison_valide(self, combinaison):
        """V√©rifie si une combinaison respecte certains crit√®res"""
        # 1. Au moins 1 pair et 1 impair
        pairs = sum(1 for n in combinaison if n % 2 == 0)
        if pairs == 0 or pairs == 5:
            return False
        
        # 2. Au moins 2 dizaines diff√©rentes
        dizaines = set((n-1)//10 for n in combinaison)
        if len(dizaines) < 2:
            return False
        
        # 3. Somme dans une plage raisonnable (100-200 pour 5/49)
        somme = sum(combinaison)
        if somme < 100 or somme > 200:
            return False
        
        return True
    
    def afficher_combinaisons(self, combinaisons):
        """Affiche les combinaisons sugg√©r√©es"""
        print(f"\nüéØ {len(combinaisons)} COMBINAISONS SUGG√âR√âES:")
        print("   (Crit√®res: √©quilibre pairs/impairs, diversit√© dizaines, somme 100-200)")
        
        for i, comb in enumerate(combinaisons, 1):
            somme = sum(comb)
            pairs = sum(1 for n in comb if n % 2 == 0)
            dizaines = len(set((n-1)//10 for n in comb))
            
            print(f"\n   Option {i}: {comb}")
            print(f"      ‚Ä¢ Somme: {somme} (moyenne: {somme/5:.1f})")
            print(f"      ‚Ä¢ Pairs/Impairs: {pairs}/{5-pairs}")
            print(f"      ‚Ä¢ Dizaines: {dizaines}/5")
            print(f"      ‚Ä¢ √âcart: {max(comb)-min(comb)}")

# ==================== UTILISATION SIMPLIFI√âE ====================

if __name__ == "__main__":
    print("""
    ‚ñà‚ñà‚ïó ‚ñà‚ñà‚ñà‚ñà‚ñà‚ïó      ‚ñà‚ñà‚ïó      ‚ñà‚ñà‚ñà‚ñà‚ñà‚ïó ‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïó  ‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïó 
    ‚ñà‚ñà‚ïë‚ñà‚ñà‚ïî‚ïê‚ïê‚ñà‚ñà‚ïó     ‚ñà‚ñà‚ïë     ‚ñà‚ñà‚ïî‚ïê‚ïê‚ñà‚ñà‚ïó‚ñà‚ñà‚ïî‚ïê‚ïê‚ñà‚ñà‚ïó‚ñà‚ñà‚ïî‚ïê‚ïê‚ïê‚ñà‚ñà‚ïó
    ‚ñà‚ñà‚ïë‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïë     ‚ñà‚ñà‚ïë     ‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïë‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïî‚ïù‚ñà‚ñà‚ïë   ‚ñà‚ñà‚ïë
    ‚ñà‚ñà‚ïë‚ñà‚ñà‚ïî‚ïê‚ïê‚ñà‚ñà‚ïë‚ñà‚ñà   ‚ñà‚ñà‚ïë     ‚ñà‚ñà‚ïî‚ïê‚ïê‚ñà‚ñà‚ïë‚ñà‚ñà‚ïî‚ïê‚ïê‚ñà‚ñà‚ïó‚ñà‚ñà‚ïë   ‚ñà‚ñà‚ïë
    ‚ñà‚ñà‚ïë‚ñà‚ñà‚ïë  ‚ñà‚ñà‚ïë‚ïö‚ñà‚ñà‚ñà‚ñà‚ñà‚ïî‚ïù     ‚ñà‚ñà‚ïë  ‚ñà‚ñà‚ïë‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïî‚ïù‚ïö‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïî‚ïù
    ‚ïö‚ïê‚ïù‚ïö‚ïê‚ïù  ‚ïö‚ïê‚ïù ‚ïö‚ïê‚ïê‚ïê‚ïê‚ïù      ‚ïö‚ïê‚ïù  ‚ïö‚ïê‚ïù‚ïö‚ïê‚ïê‚ïê‚ïê‚ïê‚ïù  ‚ïö‚ïê‚ïê‚ïê‚ïê‚ïê‚ïù 
    
    Syst√®me d'analyse intelligent pour jeux de hasard
    Version 1.0 - Recherche appliqu√©e
    """)
    
    try:
        # Initialiser IA Labo
        print("\nüìä INITIALISATION DU SYST√àME...")
        ia_labo = IALabo('lotodata1.csv')
        
        if ia_labo.df is not None and len(ia_labo.df) >= 10:
            # G√©n√©rer des recommandations avec Bagging
            print("\n" + "="*60)
            print("1. ANALYSE AVEC BAGGING (MOYENNE SIMPLE)")
            print("="*60)
            resultats_bagging = ia_labo.generer_recommandations(methode='bagging')
            
            print("\n" + "="*60)
            print("2. ANALYSE AVEC BOOSTING (POND√âRATION INTELLIGENTE)")
            print("="*60)
            resultats_boosting = ia_labo.generer_recommandations(methode='boosting')
            
            print("\n" + "="*60)
            print("üìã NOTE D'UTILISATION:")
            print("""
            IA Labo est un outil de recherche qui :
            ‚Ä¢ Combine 6 m√©thodes d'analyse diff√©rentes
            ‚Ä¢ Utilise l'agr√©gation pour r√©duire les biais
            ‚Ä¢ Propose des combinaisons statistiquement diversifi√©es
            ‚Ä¢ NE GARANTIT PAS de gains
            
            L'approche vise √† cr√©er des jeux plus int√©ressants
            statistiquement, pas √† pr√©dire l'avenir.
            """)
        else:
            print(f"\n‚ùå Impossible de continuer: {len(ia_labo.df) if ia_labo.df is not None else 0} tirages valides seulement")
            print("   Le syst√®me n√©cessite au moins 10 tirages historiques")
            
    except Exception as e:
        print(f"\n‚ùå ERREUR CRITIQUE: {e}")
        import traceback
        traceback.print_exc()


    ‚ñà‚ñà‚ïó ‚ñà‚ñà‚ñà‚ñà‚ñà‚ïó      ‚ñà‚ñà‚ïó      ‚ñà‚ñà‚ñà‚ñà‚ñà‚ïó ‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïó  ‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïó 
    ‚ñà‚ñà‚ïë‚ñà‚ñà‚ïî‚ïê‚ïê‚ñà‚ñà‚ïó     ‚ñà‚ñà‚ïë     ‚ñà‚ñà‚ïî‚ïê‚ïê‚ñà‚ñà‚ïó‚ñà‚ñà‚ïî‚ïê‚ïê‚ñà‚ñà‚ïó‚ñà‚ñà‚ïî‚ïê‚ïê‚ïê‚ñà‚ñà‚ïó
    ‚ñà‚ñà‚ïë‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïë     ‚ñà‚ñà‚ïë     ‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïë‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïî‚ïù‚ñà‚ñà‚ïë   ‚ñà‚ñà‚ïë
    ‚ñà‚ñà‚ïë‚ñà‚ñà‚ïî‚ïê‚ïê‚ñà‚ñà‚ïë‚ñà‚ñà   ‚ñà‚ñà‚ïë     ‚ñà‚ñà‚ïî‚ïê‚ïê‚ñà‚ñà‚ïë‚ñà‚ñà‚ïî‚ïê‚ïê‚ñà‚ñà‚ïó‚ñà‚ñà‚ïë   ‚ñà‚ñà‚ïë
    ‚ñà‚ñà‚ïë‚ñà‚ñà‚ïë  ‚ñà‚ñà‚ïë‚ïö‚ñà‚ñà‚ñà‚ñà‚ñà‚ïî‚ïù     ‚ñà‚ñà‚ïë  ‚ñà‚ñà‚ïë‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïî‚ïù‚ïö‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ïî‚ïù
    ‚ïö‚ïê‚ïù‚ïö‚ïê‚ïù  ‚ïö‚ïê‚ïù ‚ïö‚ïê‚ïê‚ïê‚ïê‚ïù      ‚ïö‚ïê‚ïù  ‚ïö‚ïê‚ïù‚ïö‚ïê‚ïê‚ïê‚ïê‚ïê‚ïù  ‚ïö‚ïê‚ïê‚ïê‚ïê‚ïê‚ïù 
    
    Syst√®me d'analyse intelligent pour jeux de hasard
    Version 1.0 - Recherche appliqu√©e
    

üìä INITIALISATION DU SYST√àME...
üìñ Chargement du fichier: lotodata1.csv
Colonnes d√©tect√©es: ['date', 'num0', 'num1', 'num2'