# Gestion des m√©tadonn√©es des esp√®ces

Nous scannons les dossiers disponibles afin d'en faire un dataframe et r√©utiliser ces informations.
Puis nous r√©cup√©rons les m√©tadonn√©es depuis l'API Mistral et Gemini, comparons leurs r√©sultats pour r√©duire les erreurs potentielles, et cr√©ons un CSV final optimis√©.
Un sleep de 3s a √©t√© ajout√© afin d'√©viter de trop spam les APIs.

In [1]:
import json
import os
import random
import time
from datetime import datetime

import pandas as pd
from dotenv import load_dotenv
from google import genai
from mistralai import Mistral

In [2]:
# Scanner les dossiers d'animaux
folder_all_animals = [d for d in os.listdir("ressource/image/train") if
                      os.path.isdir(os.path.join("ressource/image/train", d))]
df_all_animals = pd.DataFrame(folder_all_animals, columns=["Nom du dossier"])

# Charger les variables d'environnement
load_dotenv()

# Nombre total d'animaux √† scanner
total_animaux = len(df_all_animals)
reste_a_scanner = total_animaux

In [3]:
# R√©cup√©ration des cl√©s API
mistral_api_key = os.environ.get("mistral_api_key")
if not mistral_api_key:
    raise ValueError("La cl√© API Mistral n'est pas d√©finie dans les variables d'environnement.")

gemini_api_key = os.environ.get("gemini_api_key")
if not gemini_api_key:
    raise ValueError("La cl√© API gemini n'est pas d√©finie dans les variables d'environnement.")

# Configuration des mod√®les
mistral_model = "open-mistral-nemo"
gemini_model = "gemini-2.0-flash"

# Initialisation des clients
mistral_client = Mistral(api_key=mistral_api_key)
gemini_client = genai.Client(api_key=gemini_api_key)

In [4]:
# Chemins des fichiers CSV
fichier_csv_mistral = "ressource/metadata_mistral.csv"
fichier_csv_gemini = "ressource/metadata_gemini.csv"
fichier_csv_comparaison = "ressource/metadata_comparaison.csv"
fichier_csv_final = "ressource/metadata_final.csv"

# Supprimer les fichiers s'ils existent d√©j√†
for fichier in [fichier_csv_mistral, fichier_csv_gemini, fichier_csv_comparaison, fichier_csv_final]:
    if os.path.exists(fichier):
        os.remove(fichier)

# Initialisation des listes pour stocker les donn√©es
donnees_animaux_mistral = []
donnees_animaux_gemini = []
donnees_animaux_final = []
comparaisons = []

In [5]:
# Fonction am√©lior√©e pour faire un appel √† l'API avec gestion de toutes les erreurs
def make_api_call_with_retry(client, model, messages, max_retries=5, initial_delay=5):
    for attempt in range(max_retries):
        try:
            # Ajouter un d√©lai exponentiel avec un peu d'al√©atoire
            if attempt > 0:
                # D√©lai plus long pour les tentatives suppl√©mentaires
                delay = initial_delay * (2 ** attempt) + random.uniform(0, 2)
                print(f"‚è≥ Tentative {attempt + 1}/{max_retries} - Attente de {delay:.1f} secondes...")
                time.sleep(delay)

            # Timestamp pour le log
            timestamp = datetime.now().strftime("%H:%M:%S")
            print(f"[{timestamp}] Appel API - Tentative {attempt + 1}")

            # Faire l'appel √† l'API
            response = client.chat.complete(model=model, messages=messages)
            return response
        except Exception as e:
            # G√©rer tous les types d'erreurs, pas seulement 429
            error_type = "Rate limit" if "429" in str(e) else "API"
            print(f"‚ö†Ô∏è {error_type} erreur (tentative {attempt + 1}/{max_retries}): {e}")

            # Si c'est la derni√®re tentative, lever l'exception
            if attempt == max_retries - 1:
                raise e

            # Sinon continuer avec la prochaine tentative apr√®s le d√©lai

    # Ce code ne devrait jamais √™tre atteint car on l√®ve l'exception √† la derni√®re tentative
    raise Exception(f"√âchec apr√®s {max_retries} tentatives")

In [6]:
# Fonction pour faire un appel √† l'API Gemini avec retry
def make_gemini_call_with_retry(client, model, prompt, max_retries=5, initial_delay=5):
    for attempt in range(max_retries):
        try:
            # Ajouter un d√©lai exponentiel si ce n'est pas la premi√®re tentative
            if attempt > 0:
                delay = initial_delay * (2 ** attempt) + random.uniform(0, 2)
                print(f"‚è≥ Tentative Gemini {attempt + 1}/{max_retries} - Attente de {delay:.1f} secondes...")
                time.sleep(delay)

            # Timestamp pour le log
            timestamp = datetime.now().strftime("%H:%M:%S")
            print(f"[{timestamp}] Appel API Gemini - Tentative {attempt + 1}")

            # Faire l'appel √† l'API Gemini
            response = client.models.generate_content(
                model=model,
                contents=prompt
            )
            return response
        except Exception as e:
            error_type = "Indisponibilit√©" if "503" in str(e) else "API"
            print(f"‚ö†Ô∏è Gemini {error_type} erreur (tentative {attempt + 1}/{max_retries}): {e}")

            # Si c'est la derni√®re tentative, lever l'exception
            if attempt == max_retries - 1:
                raise e

    # Ce code ne devrait jamais √™tre atteint
    raise Exception(f"√âchec apr√®s {max_retries} tentatives avec Gemini")

In [7]:
folder_all_animals = [d for d in os.listdir("ressource/image/train") if
                      os.path.isdir(os.path.join("ressource/image/train", d))]
df_all_animals = pd.DataFrame(folder_all_animals, columns=["Nom du dossier"])

# Nombre total d'animaux √† scanner
total_animaux = len(df_all_animals)


In [8]:
def get_animal_info(animal):
    prompt = f"""
            En fran√ßais, donne-moi les informations suivantes sur {animal} :
            - le nom de l'esp√®ce (l'exacte nom que je t'ai donn√©)
            - le nom de l'esp√®ce (traduit en fran√ßais),
            - la famille,
            - le nom latin,
            - la population estim√©e (uniquement un nombre, sans texte, sans unit√©, sans ponctuation, sans espace entre les nombre, sans approximation, incertitude,  inconnue ou 0),
            - la localisation (uniquement le ou les pays, s√©par√©s par un espace).
            - la description, une courte phrase d√©crivant l'animal.

            Attention :
            - Ne mets pas d'explication ou de phrase, uniquement les valeurs demand√©es.
            - Pour la population, √©cris uniquement un nombre sans texte. Par exemple : 1000000 au lieu de '1 million d'esp√®ces environ' ou '1 000 000'.
            - Pour la localisation, √©cris uniquement le ou les pays s√©par√©s par un espace.
            - Pour la Description, je souhaite 30 mots grand maximum.
            - Pour le nom de l'esp√®ce en anglais, ce sera le nom que je t'aurai donn√©es lors du prompt, brut, tel quel, sans aucun changement. Notamment, sans majuscule.
            - Pour le nom en fran√ßais, je souhaite √©viter les mot composable ("Chat" au lieu de "Chat Domestique" par exemple)

            Pr√©sente les informations sous ce format exact :
            Esp√®ce anglais : <nom de l'esp√®ce en anglais>
            Esp√®ce fran√ßais : <nom de l'esp√®ce traduit en fran√ßais>
            Famille : <famille>
            Nom latin : <nom latin>
            Description: <description>
            Population estim√©e : <population estim√©e>
            Localisation : <localisation>
            """

    try:
        # R√©ponse avec Mistral
        chat_response_mistral = make_api_call_with_retry(
            client=mistral_client,
            model=mistral_model,
            messages=[{"role": "user", "content": prompt}]
        )
        reponse_mistral = chat_response_mistral.choices[0].message.content
        print("R√©ponse Mistral re√ßue")

        # D√©lai entre les deux mod√®les
        time.sleep(2)

        # R√©ponse avec Gemini
        response = make_gemini_call_with_retry(
            client=gemini_client,
            model=gemini_model,
            prompt=prompt
        )
        reponse_gemini = response.text
        print("R√©ponse Gemini re√ßue")

        # Parser les r√©ponses
        informations_mistral = {}
        for ligne in reponse_mistral.split("\n"):
            if ":" in ligne:
                cle, valeur = ligne.split(":", 1)
                informations_mistral[cle.strip()] = valeur.strip()

        informations_gemini = {}
        for ligne in reponse_gemini.split("\n"):
            if ":" in ligne:
                cle, valeur = ligne.split(":", 1)
                informations_gemini[cle.strip()] = valeur.strip()

        return informations_mistral, informations_gemini

    except Exception as e:
        print(f"Erreur lors de la r√©cup√©ration des infos pour {animal} : {e}")
        return None, None

In [9]:
def compare_results(animal, informations_mistral, informations_gemini):
    try:
        prompt_comparaison = f"""
                Analyse ces deux ensembles de m√©tadonn√©es pour l'animal "{animal}":

                M√©tadonn√©es de Mistral:
                {json.dumps(informations_mistral, indent=2, ensure_ascii=False)}

                M√©tadonn√©es de Gemini:
                {json.dumps(informations_gemini, indent=2, ensure_ascii=False)}

                Objectif: Identifier les diff√©rences importantes pour cr√©er un CSV final fiable en combinant les meilleures r√©ponses.

                Pour chaque champ o√π tu observes une diff√©rence significative (s√©mantique ou orthographique):
                1. Identifie pr√©cis√©ment le champ concern√©
                2. Compare objectivement les deux valeurs
                3. D√©termine laquelle est la plus pr√©cise/correcte avec justification courte
                4. Indique "ERREUR" si les deux valeurs semblent incorrectes ou contradictoires

                Format de r√©ponse:
                - Structure ta r√©ponse sous forme de liste par champ
                - Pour chaque champ avec diff√©rence, indique clairement le champ, la valeur √† retenir et pourquoi
                - Si aucune diff√©rence significative n'est trouv√©e, indique "Aucune diff√©rence significative"
                - Si une valeur est manifestement incorrecte, signale-la avec "ERREUR: [explication]"

                Fournis √©galement un ensemble de m√©tadonn√©es final qui combine le meilleur des deux sources.
                Pr√©sente ces m√©tadonn√©es finales sous le m√™me format que les entr√©es originales:
                Esp√®ce anglais : <valeur>
                Esp√®ce fran√ßais : <valeur>
                Famille : <valeur>
                Nom latin : <valeur>
                Description: <valeur>
                Population estim√©e : <valeur>
                Localisation : <valeur>
                """
        # D√©lai avant l'appel de comparaison pour √©viter le rate limiting
        print("‚è≥ Attente avant comparaison pour √©viter le rate limiting...")
        time.sleep(3)

        comparaison_response = make_api_call_with_retry(
            client=mistral_client,
            model=mistral_model,
            messages=[{"role": "user", "content": prompt_comparaison}]
        )
        reponse_comparaison = comparaison_response.choices[0].message.content

        # Extraire les m√©tadonn√©es finales de la r√©ponse
        informations_final = {}
        section_finale_trouvee = False
        lignes_finales = []

        for ligne in reponse_comparaison.split("\n"):
            if "Esp√®ce anglais :" in ligne and not section_finale_trouvee:
                section_finale_trouvee = True

            if section_finale_trouvee and ":" in ligne:
                lignes_finales.append(ligne)

        # Si des m√©tadonn√©es finales ont √©t√© trouv√©es, les utiliser
        if lignes_finales:
            for ligne in lignes_finales:
                if ":" in ligne:
                    cle, valeur = ligne.split(":", 1)
                    if cle.strip() != "ERREUR":  # Ignorer les champs ERREUR
                        informations_final[cle.strip()] = valeur.strip()
        else:
            # Si pas de section finale, utiliser les m√©tadonn√©es de Mistral par d√©faut
            informations_final = {k: v for k, v in informations_mistral.copy().items() if k != "ERREUR"}

        # V√©rifier que toutes les colonnes requises sont pr√©sentes
        colonnes_requises = ["Esp√®ce anglais", "Esp√®ce fran√ßais", "Famille", "Nom latin",
                             "Description", "Population estim√©e", "Localisation"]

        for colonne in colonnes_requises:
            if colonne not in informations_final or not informations_final[colonne] or informations_final[
                colonne].upper() == "ERREUR":
                # Au lieu d'indiquer ERREUR, utiliser une valeur par d√©faut significative
                if colonne == "Esp√®ce anglais":
                    informations_final[colonne] = animal
                elif colonne == "Population estim√©e":
                    informations_final[colonne] = "0"  # Valeur num√©rique par d√©faut
                else:
                    informations_final[colonne] = f"Information non disponible pour {animal}"

        return reponse_comparaison, informations_final

    except Exception as e:
        print(f"Erreur lors de la comparaison pour {animal}: {e}")
        # Cr√©er un dictionnaire sans la cl√© ERREUR
        informations_final = {k: v for k, v in informations_mistral.copy().items() if k != "ERREUR"}

        # Garantir que toutes les colonnes requises sont pr√©sentes
        colonnes_requises = ["Esp√®ce anglais", "Esp√®ce fran√ßais", "Famille", "Nom latin",
                             "Description", "Population estim√©e", "Localisation"]

        for colonne in colonnes_requises:
            if colonne not in informations_final or not informations_final[colonne]:
                if colonne == "Esp√®ce anglais":
                    informations_final[colonne] = animal
                elif colonne == "Population estim√©e":
                    informations_final[colonne] = "0"
                else:
                    informations_final[colonne] = f"Information non disponible pour {animal}"

        return f"Erreur: {str(e)}", informations_final

In [10]:
# Traitement des animaux
for index, animal in enumerate(df_all_animals["Nom du dossier"]):
    reste_a_scanner = total_animaux - (index + 1)
    print(f"Animal en cours: {animal} - Il reste {reste_a_scanner} animaux √† scanner")

    try:
        # Sauvegarde interm√©diaire tous les 5 animaux ou √† la fin
        if index % 5 == 0 or index == total_animaux - 1:
            # Sauvegarde interm√©diaire
            print(f"üíæ Sauvegarde interm√©diaire des donn√©es (animal {index + 1}/{total_animaux})...")
            pd.DataFrame(donnees_animaux_final).to_csv(f"ressource/metadata_final_intermediate.csv", index=False)

        # Reste du code de traitement
        informations_mistral, informations_gemini = get_animal_info(animal)

        if informations_mistral and informations_gemini:
            # Ajouter √† nos listes
            donnees_animaux_mistral.append(informations_mistral)
            donnees_animaux_gemini.append(informations_gemini)

            # Cr√©er une entr√©e pour la comparaison
            comparaison = {"Esp√®ce": animal, "Diff√©rences": []}

            # Comparer les r√©sultats
            reponse_comparaison, informations_final = compare_results(animal, informations_mistral, informations_gemini)
            comparaison["Diff√©rences"] = reponse_comparaison
            comparaisons.append(comparaison)
            donnees_animaux_final.append(informations_final)
        else:
            # En cas d'erreur g√©n√©rale, ajouter une entr√©e d'erreur aux donn√©es finales
            informations_final = {
                "Esp√®ce anglais": animal,
                "Esp√®ce fran√ßais": f"Information non disponible pour {animal}",
                "Famille": f"Information non disponible pour {animal}",
                "Nom latin": f"Information non disponible pour {animal}",
                "Description": f"Information non disponible pour {animal}",
                "Population estim√©e": "0",
                "Localisation": f"Information non disponible pour {animal}"
            }
            donnees_animaux_final.append(informations_final)

    except Exception as e:
        print(f"üî¥ Erreur majeure lors du traitement de {animal}: {e}")
        print(f"Sauvegarde d'urgence et passage √† l'animal suivant...")

        # Ajouter une entr√©e d'erreur
        informations_final = {
            "Esp√®ce anglais": animal,
            "Esp√®ce fran√ßais": f"Erreur de traitement - {str(e)[:50]}",
            "Famille": f"Information non disponible pour {animal}",
            "Nom latin": f"Information non disponible pour {animal}",
            "Description": f"Erreur lors du traitement de cet animal",
            "Population estim√©e": "0",
            "Localisation": f"Information non disponible pour {animal}"
        }
        donnees_animaux_final.append(informations_final)

        # Sauvegarde d'urgence
        pd.DataFrame(donnees_animaux_final).to_csv(f"ressource/metadata_final_emergency.csv", index=False)

        # Pause plus longue apr√®s une erreur
        print("‚è≥ Attente de 5 secondes apr√®s erreur...")
        time.sleep(5)
        continue

    # Pause pour √©viter d'√™tre banni
    print("‚è≥ Attente de 3 secondes avant la prochaine requ√™te...")
    time.sleep(3)  # Nettoyage final des donn√©es avant cr√©ation du DataFrame
# Nettoyage final des donn√©es avant cr√©ation du DataFrame
colonnes_a_conserver = ["Esp√®ce anglais", "Esp√®ce fran√ßais", "Famille", "Nom latin",
                        "Description", "Population estim√©e", "Localisation"]


# Fonction pour fusionner les informations des colonnes normales et √©toil√©es
def fusionner_donnees(row, animal):
    resultat = {}
    colonnes_a_conserver = ["Esp√®ce anglais", "Esp√®ce fran√ßais", "Famille", "Nom latin",
                            "Description", "Population estim√©e", "Localisation"]

    for col in colonnes_a_conserver:
        # Initialiser la colonne avec une valeur par d√©faut
        resultat[col] = f"Information non disponible pour {animal}"

        # R√©cup√©rer les valeurs normales et avec ast√©risques
        valeur = row.get(col, "")
        valeur_etoile = row.get(f"* {col}", "")

        # Prioriser la valeur non vide et diff√©rente de "Information non disponible"
        if valeur and "Information non disponible" not in str(valeur):
            resultat[col] = valeur
        elif valeur_etoile and "Information non disponible" not in str(valeur_etoile):
            resultat[col] = valeur_etoile
        elif valeur:
            resultat[col] = valeur
        elif valeur_etoile:
            resultat[col] = valeur_etoile

        # Gestion sp√©cifique de la population estim√©e
        if col == "Population estim√©e":
            # Si apr√®s toutes les v√©rifications, la valeur est toujours la valeur par d√©faut, mettre "0"
            if resultat[col] == f"Information non disponible pour {animal}":
                resultat[col] = "0"
            else:
                # Supprimer les espaces et caract√®res non num√©riques
                resultat[col] = ''.join(filter(str.isdigit, str(resultat[col])))
                if not resultat[col]:
                    resultat[col] = "0"

    return resultat


# Traiter chaque animal pour r√©cup√©rer les meilleures donn√©es
donnees_animaux_final_fusionnees = []
for donnee in donnees_animaux_final:
    animal = donnee.get("Esp√®ce anglais", "animal inconnu")
    donnee_fusionnee = fusionner_donnees(donnee, animal)
    donnees_animaux_final_fusionnees.append(donnee_fusionnee)

# Cr√©ation du DataFrame final avec uniquement les colonnes souhait√©es
df_animaux_final = pd.DataFrame(donnees_animaux_final_fusionnees)
df_animaux_final = df_animaux_final[colonnes_a_conserver]  # Garantir l'ordre des colonnes

# Pour s'assurer qu'il n'y a pas de colonnes avec ast√©risques dans le DataFrame final
colonnes_filtrees = [col for col in df_animaux_final.columns if not col.startswith('*')]
df_animaux_final = df_animaux_final[colonnes_filtrees]

# Supprimer le fichier s'il existe d√©j√† pour √©viter l'ajout de colonnes
if os.path.exists(fichier_csv_final):
    os.remove(fichier_csv_final)

# Sauvegarde du CSV final (avec mode='w' pour s'assurer de r√©√©crire le fichier)
df_animaux_final.to_csv(fichier_csv_final, index=False, mode='w')
print(f"‚úÖ Fichier final cr√©√© avec succ√®s : {fichier_csv_final}")

Animal en cours: raccoon - Il reste 17 animaux √† scanner
üíæ Sauvegarde interm√©diaire des donn√©es (animal 1/18)...
[19:15:15] Appel API - Tentative 1
R√©ponse Mistral re√ßue
[19:15:18] Appel API Gemini - Tentative 1
R√©ponse Gemini re√ßue
‚è≥ Attente avant comparaison pour √©viter le rate limiting...
[19:15:22] Appel API - Tentative 1
‚è≥ Attente de 3 secondes avant la prochaine requ√™te...
Animal en cours: western_grey_squirrel - Il reste 16 animaux √† scanner
[19:15:28] Appel API - Tentative 1
R√©ponse Mistral re√ßue
[19:15:31] Appel API Gemini - Tentative 1
R√©ponse Gemini re√ßue
‚è≥ Attente avant comparaison pour √©viter le rate limiting...
[19:15:36] Appel API - Tentative 1
‚è≥ Attente de 3 secondes avant la prochaine requ√™te...
Animal en cours: coyote - Il reste 15 animaux √† scanner
[19:15:42] Appel API - Tentative 1
R√©ponse Mistral re√ßue
[19:15:45] Appel API Gemini - Tentative 1
R√©ponse Gemini re√ßue
‚è≥ Attente avant comparaison pour √©viter le rate limiting...
[19:15:

In [13]:
# Supprimer les fichiers interm√©diaires
fichiers_intermediaires = ["ressource/metadata_final_intermediate.csv", "ressource/metadata_final_emergency.csv"]
for fichier in fichiers_intermediaires:
    if os.path.exists(fichier):
        try:
            os.remove(fichier)
            print(f"‚úÖ Fichier interm√©diaire supprim√© : {fichier}")
        except Exception as e:
            print(f"‚ö†Ô∏è Impossible de supprimer {fichier}: {e}")

In [14]:
# Cr√©ation des DataFrames
df_animaux_mistral = pd.DataFrame(donnees_animaux_mistral)
df_animaux_gemini = pd.DataFrame(donnees_animaux_gemini)
df_comparaisons = pd.DataFrame(comparaisons)
df_animaux_final = pd.DataFrame(donnees_animaux_final)

# Affichage des r√©sultats
print("R√©sultats Mistral:")
display(df_animaux_mistral)

print("R√©sultats Gemini:")
display(df_animaux_gemini)

print("Comparaison des r√©sultats:")
display(df_comparaisons)

print("R√©sultats finaux optimis√©s:")
display(df_animaux_final)

# Sauvegarde dans des CSV
df_animaux_mistral.to_csv(fichier_csv_mistral, index=False)
df_animaux_gemini.to_csv(fichier_csv_gemini, index=False)
df_comparaisons.to_csv(fichier_csv_comparaison, index=False)
df_animaux_final.to_csv(fichier_csv_final, index=False)

print(f"Les r√©sultats ont √©t√© enregistr√©s dans les fichiers suivants:")
print(f" - {fichier_csv_mistral}")
print(f" - {fichier_csv_gemini}")
print(f" - {fichier_csv_comparaison}")
print(f" - {fichier_csv_final}")

R√©sultats Mistral:


Unnamed: 0,Esp√®ce anglais,Esp√®ce fran√ßais,Famille,Nom latin,Description,Population estim√©e,Localisation
0,raccoon,raton laveur,Procyonidae,Procyon lotor,Mammif√®re nocturne au masque noir et √† la queu...,30000000,√âtats-Unis Canada Mexique
1,western_grey_squirrel,√©cureuil gris de l'Ouest,Sciuridae,Sciurus carolinensis,Petit rongeur arboricole aux poils gris avec d...,30000000,√âtats-Unis Canada
2,coyote,Coyote,Canidae,Canis latrans,"Le coyote est un canid√© de taille moyenne, ave...",3000000,√âtats-Unis Canada Mexique
3,turkey,dinde,Phasianidae,Meleagris gallopavo,"Oiseau de grande taille au plumage color√©, ori...",220000000,√âtats-Unis Mexique
4,muledeer,Cerf mulet,Cervidae,Odocoileus hemionus,Le cerf mulet est un grand cervid√© d'Am√©rique ...,1000000,√âtats-Unis Canada
5,rat,rat,Muridae,Rattus norvegicus,Petit mammif√®re gris-brun avec une longue queu...,600000000,France Chine √âtats-Unis Inde
6,otter,loutre,Mustelidae,Lutra lutra,Mammif√®re semi-aquatique avec une fourrure den...,1000000,France Espagne
7,black_bear,Ours noir,Ursidae,Ursus americanus,"L'ours noir est un ours de taille moyenne, rec...",900000,√âtats-Unis Canada
8,mouse,souris,Muridae,Mus musculus,Petite souris grise avec de grands yeux et des...,600000000,Monde entier
9,beaver,Castor,Castoridae,Castor canadensis,Le castor est un rongeur semi-aquatique connu ...,60000000,Canada √âtats-Unis Russie


R√©sultats Gemini:


Unnamed: 0,Esp√®ce anglais,Esp√®ce fran√ßais,Famille,Nom latin,Description,Population estim√©e,Localisation
0,raccoon,raton laveur,Procyonidae,Procyon lotor,"Mammif√®re omnivore nocturne, reconnaissable √† ...",20000000,Canada √âtats-Unis Mexique
1,western_grey_squirrel,Ecureuil,Sciuridae,Sciurus griseus,L'√©cureuil gris de l'Ouest est un rongeur arbo...,0,Etats-Unis
2,coyote,Coyote,Canid√©s,Canis latrans,"Le coyote est un canid√© d'Am√©rique du Nord, pl...",6000000,Canada Mexique EtatsUnis
3,turkey,Dindon,Phasianid√©s,Meleagris gallopavo,Grand oiseau terrestre avec un plumage iridesc...,7000000,√âtatsUnis Mexique Canada
4,muledeer,cerf,Cervidae,Odocoileus hemionus,Cerf nord-am√©ricain avec de grandes oreilles r...,15000000,Canada Mexique √âtatsUnis
5,rat,Rat,Muridae,Rattus,"Rongeur de taille moyenne √† grande, avec une l...",0,Monde
6,otter,Loutre,Must√©lid√©s,Lutra lutra,Mammif√®re semi-aquatique avec un corps allong√©...,30000,France Espagne Portugal Irlande Royaume-Uni Al...
7,black_bear,Ours,Ursidae,Ursus americanus,"Mammif√®re omnivore d'Am√©rique du Nord, g√©n√©ral...",900000,Canada √âtatsUnis Mexique
8,mouse,Souris,Muridae,Mus musculus,"La souris est un petit rongeur agile, avec un ...",1000000000,Monde entier
9,beaver,castor,Castoridae,Castor,Rongeur semi-aquatique avec une queue large et...,10000000,Canada √âtatsUnis Russie Finlande Norv√®ge Su√®de...


Comparaison des r√©sultats:


Unnamed: 0,Esp√®ce,Diff√©rences
0,raccoon,Voici les diff√©rences significatives entre les...
1,western_grey_squirrel,Voici les diff√©rences importantes entre les de...
2,coyote,Voici les diff√©rences importantes entre les de...
3,turkey,Voici les diff√©rences importantes entre les de...
4,muledeer,Voici les diff√©rences importantes entre les de...
5,rat,Voici les diff√©rences importantes entre les de...
6,otter,Voici la liste des diff√©rences significatives ...
7,black_bear,Apr√®s avoir analys√© les deux ensembles de m√©ta...
8,mouse,Apr√®s avoir analys√© les deux ensembles de m√©ta...
9,beaver,Voici l'analyse des diff√©rences entre les deux...


R√©sultats finaux optimis√©s:


Unnamed: 0,Esp√®ce anglais,Esp√®ce fran√ßais,Famille,Nom latin,Description,Population estim√©e,Localisation,* Esp√®ce anglais,* Esp√®ce fran√ßais,* Famille,* Nom latin,* Description,* Population estim√©e,* Localisation
0,raccoon,raton laveur,Procyonidae,Procyon lotor,Mammif√®re nocturne au masque noir et √† la queu...,30000000,Canada √âtats-Unis Mexique,,,,,,,
1,western_grey_squirrel,√©cureuil gris de l'Ouest,Sciuridae,Sciurus carolinensis,Petit rongeur arboricole aux poils gris avec d...,30000000,√âtats-Unis Canada,,,,,,,
2,coyote,Coyote,Canidae,Canis latrans,"Le coyote est un canid√© de taille moyenne, ave...",3000000,√âtats-Unis Canada Mexique,,,,,,,
3,turkey,dinde,Phasianidae,Meleagris gallopavo,"Oiseau de grande taille au plumage color√©, ori...",220000000,√âtats-Unis Mexique,,,,,,,
4,muledeer,Cerf mulet,Cervidae,Odocoileus hemionus,Le cerf mulet est un grand cervid√© d'Am√©rique ...,1000000,√âtats-Unis Canada,,,,,,,
5,rat,Information non disponible pour rat,Information non disponible pour rat,Information non disponible pour rat,Information non disponible pour rat,0,Information non disponible pour rat,rat,rat,Muridae,Rattus norvegicus,Petit mammif√®re gris-brun avec une longue queu...,600000000,Monde
6,otter,loutre,Mustelidae,Lutra lutra,Mammif√®re semi-aquatique avec une fourrure den...,1000000,France Espagne,,,,,,,
7,black_bear,Ours noir,Ursidae,Ursus americanus,"L'ours noir est un ours de taille moyenne, rec...",900000,√âtats-Unis Canada,,,,,,,
8,mouse,Souris,Muridae,Mus musculus,"La souris est un petit rongeur agile, avec un ...",1000000000,Monde entier,,,,,,,
9,beaver,Castor,Castoridae,Castor canadensis,Le castor est un rongeur semi-aquatique connu ...,60 000 000,Canada √âtats-Unis Russie Finlande Norv√®ge Su√®d...,,,,,,,


Les r√©sultats ont √©t√© enregistr√©s dans les fichiers suivants:
 - ressource/metadata_mistral.csv
 - ressource/metadata_gemini.csv
 - ressource/metadata_comparaison.csv
 - ressource/metadata_final.csv
