# Exemples de Sources de Données EasyTransfert

Ce notebook présente des exemples de toutes les sources de données utilisées dans les architectures expérimentales.

## 1. FAQ EasyTransfert

Paires question-réponse officielles

In [None]:
import json

faq_data = [
    {
        "id": "faq_001",
        "question": "Qu'est-ce qu'EasyTransfert ?",
        "answer": "EasyTransfert est une application mobile qui permet de transférer de l'argent entre différents opérateurs de mobile money en Côte d'Ivoire (MTN, Orange, Moov, Wave, Trésor Money). Elle facilite les transactions inter-opérateurs de manière rapide et sécurisée.",
        "category": "général",
        "keywords": ["présentation", "définition", "EasyTransfert"]
    },
    {
        "id": "faq_002",
        "question": "Quels sont les opérateurs supportés ?",
        "answer": "EasyTransfert supporte 5 opérateurs de mobile money en Côte d'Ivoire: MTN Mobile Money, Orange Money, Moov Money, Wave et Trésor Money (Trémo). Vous pouvez faire des transferts entre n'importe lesquels de ces opérateurs.",
        "category": "opérateurs",
        "keywords": ["opérateurs", "MTN", "Orange", "Moov", "Wave", "Trésor Money"]
    },
    {
        "id": "faq_003",
        "question": "Comment faire un transfert ?",
        "answer": "Pour faire un transfert: 1) Ouvrez l'application EasyTransfert, 2) Sélectionnez l'opérateur d'envoi (votre opérateur), 3) Sélectionnez l'opérateur de réception (opérateur du destinataire), 4) Entrez le numéro du destinataire, 5) Entrez le montant, 6) Confirmez la transaction. Vous recevrez une confirmation par SMS.",
        "category": "utilisation",
        "keywords": ["transfert", "procédure", "comment faire"]
    },
    {
        "id": "faq_004",
        "question": "Quels sont les frais de transaction ?",
        "answer": "Les frais varient entre 1% et 2% du montant transféré, avec un minimum de 25 FCFA et un maximum de 500 FCFA. Les frais exacts dépendent du montant et des opérateurs concernés. Certaines promotions peuvent offrir des tarifs réduits.",
        "category": "tarifs",
        "keywords": ["frais", "coût", "tarifs", "prix"]
    },
    {
        "id": "faq_005",
        "question": "Combien de temps prend un transfert ?",
        "answer": "Les transferts EasyTransfert sont généralement instantanés. Dans la majorité des cas, le destinataire reçoit l'argent en moins de 2 minutes. En cas de retard exceptionnel, contactez le service client au 2522018730.",
        "category": "délais",
        "keywords": ["délai", "temps", "durée", "instantané"]
    },
    {
        "id": "faq_006",
        "question": "Que faire si mon transfert n'arrive pas ?",
        "answer": "Si votre transfert n'arrive pas: 1) Vérifiez le numéro du destinataire, 2) Attendez 5 minutes (certains transferts peuvent avoir un léger délai), 3) Vérifiez votre identifiant de transaction (EFB.*) dans l'historique, 4) Contactez le service client au 2522018730 avec votre identifiant EasyTransfert et l'identifiant de l'opérateur.",
        "category": "problèmes",
        "keywords": ["problème", "transfert échoué", "argent non reçu"]
    },
    {
        "id": "faq_007",
        "question": "Comment réinitialiser mon mot de passe ?",
        "answer": "Pour réinitialiser votre mot de passe: 1) Sur l'écran de connexion, cliquez sur 'Mot de passe oublié', 2) Entrez votre numéro de téléphone, 3) Vous recevrez un code par SMS, 4) Entrez le code, 5) Créez un nouveau mot de passe (minimum 8 caractères). Si vous ne recevez pas le SMS, contactez le 2522018730.",
        "category": "compte",
        "keywords": ["mot de passe", "réinitialisation", "connexion"]
    },
    {
        "id": "faq_008",
        "question": "Y a-t-il des limites de transfert ?",
        "answer": "Oui, les limites dépendent de l'opérateur: MTN (100-2000000 FCFA), Orange (100-1500000 FCFA), Moov (100-1000000 FCFA), Wave (100-5000000 FCFA), Trésor Money (100-1000000 FCFA). Des limites journalières peuvent également s'appliquer selon votre compte.",
        "category": "limites",
        "keywords": ["limite", "maximum", "minimum", "montant"]
    }
]

# Sauvegarder en JSON
with open('faq_easytransfert.json', 'w', encoding='utf-8') as f:
    json.dump(faq_data, f, ensure_ascii=False, indent=2)

print(f"Créé {len(faq_data)} entrées FAQ")
print("\nExemple:")
print(json.dumps(faq_data[0], ensure_ascii=False, indent=2))

## 2. Documentation des Opérateurs

Informations techniques structurées sur chaque opérateur

In [None]:
operators_data = {
    "MTN": {
        "nom_complet": "MTN Mobile Money",
        "description": "Service de mobile money de MTN Côte d'Ivoire, leader du marché avec la plus grande couverture nationale.",
        "format_identifiant": {
            "type": "numérique",
            "pattern": "Chiffres uniquement",
            "longueur": "10 chiffres généralement",
            "exemple": "1234567890"
        },
        "limites_transaction": {
            "minimum": 100,
            "maximum": 2000000,
            "devise": "FCFA"
        },
        "frais": {
            "pourcentage": "1-2%",
            "minimum": 25,
            "maximum": 500,
            "devise": "FCFA"
        },
        "prefixes_telephone": ["05", "06", "07"],
        "compatible_avec": ["Orange", "Moov", "Wave", "Trésor Money"],
        "informations_supplementaires": {
            "disponibilite": "24h/24, 7j/7",
            "points_service": "Plus de 50 000 points de service",
            "particularites": "Permet aussi les paiements marchands et retraits"
        }
    },
    "Orange": {
        "nom_complet": "Orange Money",
        "description": "Service de mobile money d'Orange CI, avec une forte présence urbaine.",
        "format_identifiant": {
            "type": "alphanumérique",
            "pattern": "MP suivi de 10 chiffres (pour envoi)",
            "longueur": "12 caractères",
            "exemple": "MP1234567890"
        },
        "limites_transaction": {
            "minimum": 100,
            "maximum": 1500000,
            "devise": "FCFA"
        },
        "frais": {
            "pourcentage": "1-2%",
            "minimum": 25,
            "maximum": 500,
            "devise": "FCFA"
        },
        "prefixes_telephone": ["07", "08", "09"],
        "compatible_avec": ["MTN", "Moov", "Wave", "Trésor Money"],
        "informations_supplementaires": {
            "disponibilite": "24h/24, 7j/7",
            "points_service": "Plus de 30 000 points de service",
            "particularites": "Intégration avec services Orange (forfaits, etc.)"
        }
    },
    "Moov": {
        "nom_complet": "Moov Money",
        "description": "Service de mobile money de Moov Africa, en croissance rapide.",
        "format_identifiant": {
            "type": "alphanumérique",
            "pattern": "MRCH* ou CF* suivi de caractères alphanumériques (pour envoi)",
            "longueur": "Variable",
            "exemple": "MRCH123456 ou CF789012"
        },
        "limites_transaction": {
            "minimum": 100,
            "maximum": 1000000,
            "devise": "FCFA"
        },
        "frais": {
            "pourcentage": "1-2%",
            "minimum": 25,
            "maximum": 500,
            "devise": "FCFA"
        },
        "prefixes_telephone": ["01", "02"],
        "compatible_avec": ["MTN", "Orange", "Wave", "Trésor Money"],
        "informations_supplementaires": {
            "disponibilite": "24h/24, 7j/7",
            "points_service": "Plus de 25 000 points de service",
            "particularites": "Offres promotionnelles fréquentes"
        }
    },
    "Wave": {
        "nom_complet": "Wave",
        "description": "Plateforme de paiement mobile nouvelle génération, sans frais sur certaines transactions.",
        "format_identifiant": {
            "type": "variable",
            "pattern": "Format variable, souvent T suivi de chiffres",
            "longueur": "Variable",
            "exemple": "T123456789"
        },
        "limites_transaction": {
            "minimum": 100,
            "maximum": 5000000,
            "devise": "FCFA"
        },
        "frais": {
            "pourcentage": "1%",
            "minimum": 25,
            "maximum": 500,
            "devise": "FCFA",
            "note": "Certaines transactions Wave-Wave sont gratuites"
        },
        "prefixes_telephone": ["05", "07"],
        "compatible_avec": ["MTN", "Orange", "Moov", "Trésor Money"],
        "informations_supplementaires": {
            "disponibilite": "24h/24, 7j/7",
            "points_service": "Réseau en expansion",
            "particularites": "Interface moderne, transactions rapides, limite élevée"
        }
    },
    "Trésor Money": {
        "nom_complet": "Trésor Money (Trémo)",
        "description": "Service de mobile money de Trésor Money CI.",
        "format_identifiant": {
            "type": "variable",
            "pattern": "Format variable selon la transaction",
            "longueur": "Variable",
            "exemple": "Variable"
        },
        "limites_transaction": {
            "minimum": 100,
            "maximum": 1000000,
            "devise": "FCFA"
        },
        "frais": {
            "pourcentage": "1-2%",
            "minimum": 25,
            "maximum": 500,
            "devise": "FCFA"
        },
        "prefixes_telephone": ["05"],
        "compatible_avec": ["MTN", "Orange", "Moov", "Wave"],
        "informations_supplementaires": {
            "disponibilite": "24h/24, 7j/7",
            "points_service": "Réseau en développement",
            "particularites": "Service récent avec offres attractives"
        }
    }
}

# Sauvegarder
with open('operators_info.json', 'w', encoding='utf-8') as f:
    json.dump(operators_data, f, ensure_ascii=False, indent=2)

print(f"Créé informations pour {len(operators_data)} opérateurs")
print("\nExemple MTN:")
print(json.dumps(operators_data["MTN"], ensure_ascii=False, indent=2))

## 3. Procédures de Résolution

Guide étape par étape pour résoudre les problèmes courants

In [None]:
procedures_data = [
    {
        "id": "proc_001",
        "titre": "Transaction non aboutie / Argent non reçu",
        "categorie": "problème_transaction",
        "etapes": [
            {
                "numero": 1,
                "action": "Vérifier les informations",
                "details": "Demander à l'utilisateur de vérifier le numéro du destinataire et le montant de la transaction."
            },
            {
                "numero": 2,
                "action": "Récupérer l'identifiant EasyTransfert",
                "details": "L'identifiant commence par EFB. et se trouve dans l'historique de l'application, ligne 'Réf Numéro'."
            },
            {
                "numero": 3,
                "action": "Récupérer l'identifiant opérateur",
                "details": "Demander l'identifiant de transaction de l'opérateur d'envoi (format varie selon opérateur)."
            },
            {
                "numero": 4,
                "action": "Vérifier le statut",
                "details": "Avec ces identifiants, vérifier le statut de la transaction dans le système."
            },
            {
                "numero": 5,
                "action": "Initier remboursement si nécessaire",
                "details": "Si la transaction est bloquée ou échouée, initier la procédure de remboursement."
            },
            {
                "numero": 6,
                "action": "Escalader si problème persiste",
                "details": "Si le problème n'est pas résolu, rediriger vers le service technique au 2522018730."
            }
        ],
        "informations_requises": [
            "Identifiant EasyTransfert (EFB.*)",
            "Identifiant opérateur d'envoi",
            "Numéro destinataire",
            "Montant",
            "Date et heure approximative"
        ],
        "delai_resolution": "5-10 minutes (remboursement: 24-48h)",
        "contact_escalade": "2522018730 (WhatsApp 24h/24)"
    },
    {
        "id": "proc_002",
        "titre": "Mot de passe oublié",
        "categorie": "compte",
        "etapes": [
            {
                "numero": 1,
                "action": "Accéder à la réinitialisation",
                "details": "Sur l'écran de connexion de l'app, cliquer sur 'Mot de passe oublié'."
            },
            {
                "numero": 2,
                "action": "Saisir le numéro",
                "details": "Entrer le numéro de téléphone enregistré sur le compte."
            },
            {
                "numero": 3,
                "action": "Recevoir le code",
                "details": "Un code de vérification sera envoyé par SMS (délai: 1-2 minutes)."
            },
            {
                "numero": 4,
                "action": "Entrer le code",
                "details": "Saisir le code reçu dans l'application."
            },
            {
                "numero": 5,
                "action": "Créer nouveau mot de passe",
                "details": "Créer un nouveau mot de passe sécurisé (minimum 8 caractères, avec lettres et chiffres recommandés)."
            },
            {
                "numero": 6,
                "action": "Confirmer",
                "details": "Confirmer le nouveau mot de passe et se connecter."
            }
        ],
        "informations_requises": [
            "Numéro de téléphone enregistré",
            "Accès au téléphone (pour recevoir SMS)"
        ],
        "delai_resolution": "2-5 minutes",
        "problemes_courants": [
            "SMS non reçu: Vérifier le réseau, attendre 5 minutes, ou contacter le 2522018730",
            "Numéro non reconnu: S'assurer d'utiliser le numéro d'inscription, sinon contacter le support"
        ]
    },
    {
        "id": "proc_003",
        "titre": "Erreur de numéro destinataire",
        "categorie": "problème_transaction",
        "etapes": [
            {
                "numero": 1,
                "action": "Vérifier si transaction exécutée",
                "details": "Vérifier dans l'historique si la transaction a été validée."
            },
            {
                "numero": 2,
                "action": "Si non exécutée",
                "details": "Aucun problème, l'utilisateur peut refaire la transaction avec le bon numéro."
            },
            {
                "numero": 3,
                "action": "Si exécutée",
                "details": "Récupérer l'identifiant EasyTransfert (EFB.*) et l'identifiant opérateur."
            },
            {
                "numero": 4,
                "action": "Contacter le destinataire erroné",
                "details": "L'utilisateur peut essayer de contacter le numéro erroné pour demander un retour (bonne foi)."
            },
            {
                "numero": 5,
                "action": "Ouvrir ticket de réclamation",
                "details": "Si le destinataire erroné ne répond pas, ouvrir un ticket avec identifiants pour investigation."
            },
            {
                "numero": 6,
                "action": "Procédure longue",
                "details": "Ce type de problème nécessite investigation auprès des opérateurs (délai: 3-7 jours ouvrables)."
            }
        ],
        "informations_requises": [
            "Identifiant EasyTransfert",
            "Numéro correct",
            "Numéro erroné",
            "Montant",
            "Captures d'écran si disponibles"
        ],
        "delai_resolution": "3-7 jours ouvrables",
        "note_importante": "Les erreurs de numéro sont difficiles à résoudre. Toujours vérifier le numéro avant de confirmer!"
    }
]

# Sauvegarder
with open('procedures_resolution.json', 'w', encoding='utf-8') as f:
    json.dump(procedures_data, f, ensure_ascii=False, indent=2)

print(f"Créé {len(procedures_data)} procédures de résolution")
print("\nExemple:")
print(json.dumps(procedures_data[0], ensure_ascii=False, indent=2))

## 4. Exemples de Logs de Transactions

Structure des logs pour training et debugging

In [None]:
from datetime import datetime, timedelta
import random

# Générer des exemples de logs de transactions
transaction_logs = []

operators = ["MTN", "Orange", "Moov", "Wave", "Trésor Money"]
statuses = ["success", "pending", "failed", "cancelled"]

for i in range(10):
    timestamp = datetime.now() - timedelta(days=random.randint(0, 30))
    
    log = {
        "transaction_id": f"EFB.{random.randint(100000, 999999)}",
        "timestamp": timestamp.isoformat(),
        "sender": {
            "phone": f"07{random.randint(10000000, 99999999)}",
            "operator": random.choice(operators)
        },
        "receiver": {
            "phone": f"0{random.randint(1, 9)}{random.randint(10000000, 99999999)}",
            "operator": random.choice(operators)
        },
        "amount": random.choice([1000, 5000, 10000, 25000, 50000, 100000]),
        "fees": random.choice([25, 50, 100, 200, 500]),
        "status": random.choice(statuses),
        "operator_reference": {
            "sender_ref": f"REF{random.randint(1000000, 9999999)}",
            "receiver_ref": f"REF{random.randint(1000000, 9999999)}" if random.random() > 0.3 else None
        },
        "metadata": {
            "device": random.choice(["Android", "iOS"]),
            "app_version": random.choice(["2.1.0", "2.2.0", "2.3.0"]),
            "ip_address": f"41.{random.randint(1, 255)}.{random.randint(1, 255)}.{random.randint(1, 255)}"
        }
    }
    
    transaction_logs.append(log)

# Sauvegarder
with open('transaction_logs_sample.json', 'w', encoding='utf-8') as f:
    json.dump(transaction_logs, f, ensure_ascii=False, indent=2)

print(f"Généré {len(transaction_logs)} logs de transactions")
print("\nExemple:")
print(json.dumps(transaction_logs[0], ensure_ascii=False, indent=2))

# Statistiques
print("\n=== Statistiques ===")
status_counts = {}
for log in transaction_logs:
    status = log['status']
    status_counts[status] = status_counts.get(status, 0) + 1

for status, count in status_counts.items():
    print(f"{status}: {count}")

## 5. Expressions et Abréviations Ivoiriennes

Dictionnaire pour comprendre le registre linguistique local

In [None]:
expressions_ivoiriennes = [
    {
        "expression": "Bjr",
        "signification": "Bonjour",
        "type": "abréviation",
        "contexte": "salutation"
    },
    {
        "expression": "Bsr",
        "signification": "Bonsoir",
        "type": "abréviation",
        "contexte": "salutation"
    },
    {
        "expression": "Slt",
        "signification": "Salut",
        "type": "abréviation",
        "contexte": "salutation"
    },
    {
        "expression": "Svp",
        "signification": "S'il vous plaît",
        "type": "abréviation",
        "contexte": "politesse"
    },
    {
        "expression": "Pq",
        "signification": "Pourquoi",
        "type": "abréviation",
        "contexte": "question"
    },
    {
        "expression": "Cmmt",
        "signification": "Comment",
        "type": "abréviation",
        "contexte": "question"
    },
    {
        "expression": "Nn",
        "signification": "Non",
        "type": "abréviation",
        "contexte": "réponse"
    },
    {
        "expression": "Ds",
        "signification": "Dans",
        "type": "abréviation",
        "contexte": "général"
    },
    {
        "expression": "C'est comment?",
        "signification": "Comment ça va? / Quelle est la situation?",
        "type": "expression",
        "contexte": "salutation/question"
    },
    {
        "expression": "On est ensemble",
        "signification": "D'accord / Ok / Je comprends / Solidarité",
        "type": "expression",
        "contexte": "accord"
    },
    {
        "expression": "C'est grave là",
        "signification": "C'est très problématique / C'est sérieux",
        "type": "expression",
        "contexte": "urgence"
    },
    {
        "expression": "Dêh",
        "signification": "Alors / Donc / Eh bien",
        "type": "particule",
        "contexte": "liaison"
    },
    {
        "expression": "Ça va aller",
        "signification": "Ne t'inquiète pas / Ça ira / Tout va s'arranger",
        "type": "expression",
        "contexte": "réconfort"
    },
    {
        "expression": "Gérer ça",
        "signification": "Résoudre le problème / S'en occuper",
        "type": "expression",
        "contexte": "action"
    },
    {
        "expression": "Transfert",
        "signification": "Envoi d'argent / Transaction mobile money",
        "type": "terme métier",
        "contexte": "transaction"
    },
    {
        "expression": "Dépôt",
        "signification": "Envoyer de l'argent / Faire un transfert",
        "type": "terme métier",
        "contexte": "transaction"
    },
    {
        "expression": "Le réseau",
        "signification": "L'opérateur mobile (MTN, Orange, etc.)",
        "type": "terme métier",
        "contexte": "opérateur"
    },
    {
        "expression": "Merci beaucoup hein",
        "signification": "Merci beaucoup (emphase)",
        "type": "expression",
        "contexte": "remerciement"
    },
    {
        "expression": "Eh là",
        "signification": "Exclamation / Surprise / Insistance",
        "type": "interjection",
        "contexte": "émotion"
    },
    {
        "expression": "Faut faire comment?",
        "signification": "Que dois-je faire? / Comment procéder?",
        "type": "expression",
        "contexte": "question"
    }
]

# Sauvegarder
with open('expressions_ivoiriennes.json', 'w', encoding='utf-8') as f:
    json.dump(expressions_ivoiriennes, f, ensure_ascii=False, indent=2)

print(f"Créé dictionnaire de {len(expressions_ivoiriennes)} expressions")
print("\nExemples:")
for expr in expressions_ivoiriennes[:5]:
    print(f"- {expr['expression']}: {expr['signification']}")

## 6. Résumé des Sources de Données

Tous les fichiers créés peuvent être utilisés pour:

### Architecture 1 (Fine-tuning):
- `conversation_1000_finetune.jsonl` (déjà présent) - Conversations pour entraînement
- `expressions_ivoiriennes.json` - Pour enrichissement linguistique

### Architecture 2 (RAG):
- `faq_easytransfert.json` - FAQ pour base ChromaDB
- `operators_info.json` - Documentation opérateurs
- `procedures_resolution.json` - Procédures de résolution
- Conversations historiques (échantillons réussis)

### Architecture 3 (RAG-Agentique):
- Tout ce qui précède pour le RAG Retriever
- `operators_info.json` - Pour l'outil Operator Info
- `transaction_logs_sample.json` - Pour simulation de vérification de statut
- Patterns d'expressions pour Entity Extractor

Ces données permettent de créer une base de connaissances complète et réaliste pour tester les trois architectures.