# Analyse des Risques Walmart
## Combinaison d'Analyse Traditionnelle et d'IA Générative

Ce notebook présente l'analyse complète des risques basée sur les avis clients de Walmart, en combinant des techniques d'analyse traditionnelle et l'IA générative (Gemini).

In [None]:
# Import des bibliothèques nécessaires
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from wordcloud import WordCloud

# Import de nos modules d'analyse
from walmart_analysis import WalmartRiskAnalyzer
from genai_analysis import GeminiRiskAnalyzer

## 1. Chargement et Préparation des Données

In [None]:
# Chargement des données
df = pd.read_csv('../data/Walmart_reviews_data.csv')

# Affichage des premières lignes
print("Aperçu des données :")
display(df.head())

print("\nInformations sur le dataset :")
display(df.info())

## 2. Analyse Traditionnelle des Risques

In [None]:
# Initialisation de l'analyseur traditionnel
traditional_analyzer = WalmartRiskAnalyzer('../data/Walmart_reviews_data.csv')

# Prétraitement
traditional_analyzer.preprocess_date()

# Analyse des risques
traditional_analyzer.identify_risk_categories()
traditional_analyzer.analyze_sentiment()

# Visualisations
plt.figure(figsize=(15, 10))
traditional_analyzer.plot_risk_analysis()
plt.tight_layout()
plt.show()

## 3. Analyse avec IA Générative (Gemini)

In [None]:
# Initialisation de l'analyseur Gemini
genai_analyzer = GeminiRiskAnalyzer(df)

# Analyse d'un échantillon d'avis
print("Analyse d'un échantillon d'avis...")
batch_analysis = genai_analyzer.analyze_batch(sample_size=5)

if batch_analysis:
    print("\nRésultats de l'analyse par échantillon :")
    print(f"Nombre d'avis analysés : {batch_analysis['total_reviews_analyzed']}")
    
    print("\nCatégories de risque identifiées :")
    for category in batch_analysis['risk_categories']:
        print(f"- {category}")
    
    print("\nDistribution de la sévérité des risques :")
    severity_df = pd.DataFrame(batch_analysis['severity_distribution'].items(), 
                              columns=['Severity', 'Percentage'])
    
    plt.figure(figsize=(10, 6))
    sns.barplot(data=severity_df, x='Severity', y='Percentage')
    plt.title('Distribution de la Sévérité des Risques')
    plt.show()

## 4. Génération du Rapport d'Analyse

In [None]:
# Génération du rapport complet
print("Génération du rapport d'analyse...\n")
report = genai_analyzer.generate_risk_report()

if report:
    print("Rapport d'analyse des risques :")
    print(report)

## 5. Conclusions et Recommandations

### Points Clés :
1. Les avis clients révèlent plusieurs domaines de risque majeurs
2. L'IA générative a permis d'identifier des patterns subtils
3. La combinaison des deux approches offre une vue complète

### Recommandations Principales :
1. Améliorer le service client
2. Optimiser les processus de livraison
3. Renforcer la sécurité des comptes
4. Mettre en place un système de détection précoce

### Prochaines Étapes :
1. Implémenter les recommandations prioritaires
2. Suivre les métriques de risque
3. Mettre à jour l'analyse régulièrement