# Portefauille Client Mutuelle

## Dataset

In [5]:
import pandas as pd
import random
from faker import Faker

# Initialisation de Faker
fake = Faker('fr_FR')

# Noms d'entreprises fictives
noms_societes = ["TechCorp", "EcoBuild", "GreenEnergy", "HealthPlus", "EduSmart", "TransGlobal", "MediLife", "AgriPro", "FinServe", "LogiTrack"]
# Noms des filiales fictives
noms_filiales = ["Filiale A", "Filiale B", "Filiale C", "Filiale D", "Filiale E", "Filiale F", "Filiale G", "Filiale H", "Filiale I"]

# Assureurs fictifs
assureurs = ["AXA", "Allianz", "Generali", "CNP Assurances", "MAIF", "Groupama"]

# Types d'assurances
types_assurances = [
    "Assurance santé collective", "Assurance prévoyance", "Assurance décès", 
    "Assurance invalidité", "Assurance accident de travail", "Assurance hospitalisation"
]

# Localisations (régions en France)
localisations = ["Île-de-France", "Auvergne-Rhône-Alpes", "Nouvelle-Aquitaine", "Occitanie", "Provence-Alpes-Côte d'Azur", "Grand Est"]

# Secteurs d'activité
secteurs_activite = ["Technologie", "Construction", "Énergie", "Santé", "Éducation", "Transport", "Finance", "Agriculture", "Logistique"]

# Exemple de génération de données
data = []
for i in range(10):
    siren = f"{random.randint(100000000, 999999999)}"
    code_ape = fake.siret()[0:5]
    anciennete_entreprise = random.randint(1, 100)
    secteur_activite = random.choice(secteurs_activite)
    for j in range(random.randint(3, 9)):  # Entre 3 et 9 filiales
        siret = f"{siren}{random.randint(10000, 99999)}"
        nom_filiale = noms_filiales[j % len(noms_filiales)]
        nombre_salaries = random.randint(20, 500)
        assureur = random.choice(assureurs)
        type_assurance = random.choice(types_assurances)
        niveau_contrat = random.randint(1, 5)
        localisation = random.choice(localisations)
        montant_total_assurance = round(random.uniform(50000, 2000000), 2)
        montant_moyen_par_salarie = round(montant_total_assurance / nombre_salaries, 2)
        date_souscription = fake.date_between(start_date='-5y', end_date='today')
        duree_contrat = random.randint(1, 10)
        numero_contrat = fake.uuid4()
        contact_prenom_nom = fake.name()
        contact_email = fake.email()
        contact_telephone = fake.phone_number()
        taux_sinistralite = round(random.uniform(0, 10), 2)
        taux_satisfaction = random.randint(1, 10)
        pourcentage_hommes = random.randint(30, 70)
        pourcentage_femmes = 100 - pourcentage_hommes
        taux_renouvellement = round(random.uniform(0, 100), 2)
        primes_annuelles_par_salarie = round(random.uniform(500, 5000), 2)
        statut_contrat = random.choice(["Actif", "Résilié", "En attente de renouvellement"])
        commentaires = fake.sentence()
        indice_performance_financiere = random.randint(1, 100)
        nombre_sinistres_declares = random.randint(0, 10)
        reductions_appliquees = random.choice([True, False])
        
        data.append([
            noms_societes[i % len(noms_societes)],  # Nom de la société
            nom_filiale,  # Nom de la filiale
            siren,  # Numéro de SIREN
            siret,  # Numéro de SIRET
            nombre_salaries,  # Nombre de salariés
            assureur,  # Nom de l'assureur
            type_assurance,  # Type d'assurance souscrit
            niveau_contrat,  # Niveau de contrat
            localisation,  # Localisation de la filiale
            montant_total_assurance,  # Montant total des assurances par filiale
            montant_moyen_par_salarie,  # Moyenne des montants des contrats d'assurances par salarié
            date_souscription,  # Date de souscription
            duree_contrat,  # Durée du contrat
            numero_contrat,  # Numéro de contrat
            contact_prenom_nom,  # Prénom et Nom du contact principal
            contact_email,  # Email du contact principal
            contact_telephone,  # Téléphone du contact principal
            taux_sinistralite,  # Taux de sinistralité
            taux_satisfaction,  # Taux de satisfaction des assurés
            code_ape,  # Code APE
            pourcentage_hommes,  # Pourcentage hommes
            pourcentage_femmes,  # Pourcentage femmes
            anciennete_entreprise,  # Ancienneté de l'entreprise
            secteur_activite,  # Secteur d'activité
            taux_renouvellement,  # Taux de renouvellement des contrats
            primes_annuelles_par_salarie,  # Primes annuelles par salarié
            statut_contrat,  # Statut du contrat
            commentaires,  # Commentaires ou notes spécifiques
            indice_performance_financiere,  # Indice de performance financière
            nombre_sinistres_declares,  # Nombre de sinistres déclarés
            reductions_appliquees  # Réductions appliquées
        ])

# Création du DataFrame
df = pd.DataFrame(data, columns=[
    "Nom de la société", "Nom de la filiale", "Numéro de SIREN", "Numéro de SIRET", "Nombre de salariés",
    "Nom de l'assureur", "Type d'assurance souscrit", "Niveau de contrat", "Localisation",
    "Montant total des assurances par filiale", "Moyenne des montants des contrats d'assurances par salarié",
    "Date de souscription", "Durée du contrat", "Numéro de contrat", "Prénom et Nom du contact principal",
    "Email du contact principal", "Téléphone du contact principal", "Taux de sinistralité",
    "Taux de satisfaction des assurés", "Code APE", "Pourcentage hommes", "Pourcentage femmes",
    "Ancienneté de l'entreprise", "Secteur d'activité", "Taux de renouvellement des contrats", 
    "Primes annuelles par salarié", "Statut du contrat", "Commentaires ou notes spécifiques", 
    "Indice de performance financière", "Nombre de sinistres déclarés", "Réductions appliquées"
])

# Chemin de sortie
chemin_sortie = r'C:\Users\patri\OneDrive\Documents\Famille\Patrice\Patrice_travail\Booster_Croissance\Exercices_Booster_Croissance\portefeuille_clients.csv'

# Enregistrement du DataFrame au format CSV
df.to_csv(chemin_sortie, index=False)

print("Le fichier CSV a été créé avec succès.")


Le fichier CSV a été créé avec succès.
