# 03 - Analyse IA avec Google Gemini

Nous entrons dans le c≈ìur du sujet : l'intelligence artificielle.
Nous allons utiliser **Google Gemini** pour analyser nos avis.

### Objectifs :
1. Comprendre comment appeler l'API Gemini.
2. G√©rer les limites de tokens (contexte).
3. Passer d'une analyse texte libre √† une donn√©e structur√©e (JSON) exploitable.

## 1. Configuration de l'API

Pour utiliser le mod√®le, il faut une cl√© API.
Vous pouvez la r√©cup√©rer gratuitement sur [Google AI Studio](https://aistudio.google.com/).

Une fois la cl√© obtenue, le mieux est de la stocker dans un fichier `.env` ou directement dans les secrets de votre environnement.

In [None]:
import google.generativeai as genai
import os
import pandas as pd
from dotenv import load_dotenv

# Chargement des variables d'environnement
load_dotenv()

GOOGLE_API_KEY = os.getenv('GOOGLE_API_KEY')

# Configuration globale de la librairie
genai.configure(api_key=GOOGLE_API_KEY)

## 2. Chargement des Donn√©es

Reprenons nos avis consolid√©s.

In [None]:
sample_reviews

In [None]:
df = pd.read_csv('df_final.csv')

# On garde un √©chantillon repr√©sentatif pour la d√©mo, ou tout le dataset si c'est petit
# Pour l'IA, on va concat√©ner le texte des avis pour lui donner du contexte

# Prenons les 10 derniers avis pour tester
sample_reviews = df.head(10)

# Cr√©ation d'un gros bloc de texte avec tous les avis
reviews_text = ""
for index, row in sample_reviews.iterrows():
    reviews_text += f"[Note: {row['rating']}/5] {row['text']}\n---\n"

print(f"Texte pr√©par√© ({len(reviews_text)} caract√®res) :")
print(reviews_text[:500] + "... [tronqu√©]")

## 3. Premier Appel Simple (Mod√®le Flash)

Nous allons utiliser le mod√®le `gemini-2.5-flash`. C'est le mod√®le le plus rapide et le moins cher, id√©al pour du gros volume.

Faisons un test na√Øf : "Analyse √ßa".

In [None]:
model_flash = genai.GenerativeModel('gemini-2.5-flash')

prompt_basic = f"Analyse ces avis :\n{reviews_text}"

response = model_flash.generate_content(prompt_basic)

print(response.text)

## 4. La Limite de Tokens

Chaque mod√®le a une "fen√™tre de contexte". C'est la quantit√© de texte qu'il peut lire en une fois.
- **Gemini 2.5 Flash** : 1 Million de tokens (~700 000 mots)
- **Gemini 2.5 Pro** : 1 Million de tokens

C'est √©norme ! Cela signifie qu'on peut litt√©ralement lui donner des livres entiers.
Mais attention, plus on envoie de texte, plus c'est lent et co√ªteux (si version payante).

### V√©rifions la taille de notre prompt

In [None]:
# L'API permet de compter les tokens avant d'envoyer
token_count = model_flash.count_tokens(prompt_basic)
print(f"Nombre de tokens : {token_count.total_tokens}")
print(f"Limite du mod√®le : 1 000 000")

if token_count.total_tokens > 1000000:
    print("‚ö†Ô∏è Attention, trop de texte !")
else:
    print("‚úÖ √áa passe large !")

## 5. Structurer la Sortie (JSON)

Le r√©sultat du point 3 √©tait du texte libre. C'est sympa √† lire, mais impossible √† mettre dans un graphique.
On va demander au mod√®le Flash de nous r√©pondre en **JSON**.

In [None]:
prompt_json = f"""
Analyse ces avis et sors-moi les 3 points forts et les 3 points faibles.
R√©ponds uniquement au format JSON comme ceci :
{{
  "points_forts": ["pf1", "pf2", "pf3"],
  "points_faibles": ["pf1", "pf2", "pf3"]
}}

AVIS :
{reviews_text}
"""

response_json = model_flash.generate_content(prompt_json)

response_json.text

## 6. La M√©thode Robuste : Pydantic & Gemini 2.5 Pro

Pour une application en production, on ne peut pas juste "esp√©rer" que le mod√®le respecte le JSON.
On utilise le mode **Structured Output** avec le mod√®le `gemini-2.5-pro` (plus intelligent).
On d√©finit la structure exacte voulue avec `Pydantic`.

In [None]:
from pydantic import BaseModel, Field
from typing import List

# 1. On d√©finit l'architecture de la r√©ponse
class Theme(BaseModel):
    nom: str = Field(description="Nom court de la th√©matique (ex: Bug, UX, Prix)")
    sentiment: str = Field(description="Positif ou N√©gatif")
    citation: str = Field(description="Une citation courte tir√©e des avis qui illustre le th√®me")

class AnalyseResponse(BaseModel):
    synthese: str = Field(description="R√©sum√© g√©n√©ral en 2 phrases")
    themes: List[Theme] = Field(description="Liste des th√®mes principaux identifi√©s")

# 2. On instancie le mod√®le PRO
model_pro = genai.GenerativeModel('gemini-2.5-pro')

# 3. Appel avec le sch√©ma forc√©
prompt_struct = f"Analyse ces avis en profondeur :\n{reviews_text}"

response_struct = model_pro.generate_content(
    prompt_struct,
    generation_config={
        "response_mime_type": "application/json",
        "response_schema": AnalyseResponse
    }
)

print(response_struct.text)

## 7. Exploitation

On peut maintenant charger ce JSON directement en Python.

In [None]:
import json

# Parsing du JSON
data = json.loads(response_struct.text)

# Affichage propre
print(f"üì¢ SYNTH√àSE : {data['synthese']}\n")

for theme in data['themes']:
    icon = "‚úÖ" if theme['sentiment'] == "Positif" else "‚ùå"
    print(f"{icon} {theme['nom']} : \"{theme['citation']}\"")