| Nom de la colonne                           | Type   | Description                                                          |
| ------------------------------------------- | ------ | -------------------------------------------------------------------- |
| **annee_de_publication**                    | int    | Année de publication de l’information sur l’emprunt.                 |
| **nature**                                  | string | Nature de la dette (ex : emprunt, mobilisation, ligne de crédit).    |
| **organisme_preteur_ou_chef_de_file**       | string | Nom du prêteur ou de l’établissement chef de file.                   |
| **date_d_emission_ou_date_de_mobilisation** | date   | Date à laquelle l’emprunt a été émis ou mobilisé.                    |
| **date_de_derniere_echeance**               | date   | Date de la dernière échéance prévue pour le remboursement.           |
| **capital_initial**                         | float  | Montant initial du capital emprunté (€).                             |
| **capital_restant_du_au_31_12_2016**        | float  | Montant du capital restant dû au 31/12/2016 (€).                     |
| **type_de_taux_d_interet**                  | string | Type de taux appliqué : fixe, variable, mixte.                       |
| **index**                                   | string | Indice de référence pour les taux variables (Euribor, Livret A…).    |
| **taux_initial_niveau_de_taux**             | float  | Niveau du taux initial (en %) défini lors de l'émission.             |
| **taux_initial_taux_actuariel**             | float  | Taux actuariel initial (en %), intégrant les conditions financières. |
| **profil_d_amortissement**                  | string | Mode d’amortissement : linéaire, in fine, amortissable…              |
| **possibilite_de_remboursement**            | string | Possibilité de remboursement anticipé (oui/non + modalités).         |
| **categorie_d_emprunt**                     | string | Catégorie de l’emprunt : court terme, long terme, structurel, etc.   |


In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [2]:
dataset = pd.read_csv("dette_propre_complet.csv", sep=",")

In [3]:
dataset.shape

(697, 14)

In [4]:
dataset.columns

Index(['annee_de_publication', 'nature', 'organisme_preteur_ou_chef_de_file',
       'date_d_emission_ou_date_de_mobilisation', 'date_de_derniere_echeance',
       'capital_initial', 'capital_restant_du_au_31_12_2016',
       'type_de_taux_d_interet', 'index', 'taux_initial_niveau_de_taux',
       'taux_initial_taux_actuariel', 'profil_d_amortissement',
       'possibilite_de_remboursement', 'categorie_d_emprunt'],
      dtype='object')

In [5]:
dataset.head()

Unnamed: 0,annee_de_publication,nature,organisme_preteur_ou_chef_de_file,date_d_emission_ou_date_de_mobilisation,date_de_derniere_echeance,capital_initial,capital_restant_du_au_31_12_2016,type_de_taux_d_interet,index,taux_initial_niveau_de_taux,taux_initial_taux_actuariel,profil_d_amortissement,possibilite_de_remboursement,categorie_d_emprunt
0,2010,1641 - Emprunts établissements crédit,DEXIA CREDIT LOCAL,2003-12-22,2013-12-22,35000000.0,35000000.0,Indexé,TAG06M,0.1581,1.9644,Emprunt in fine,oui,A-1
1,2012,1641 - Emprunts établissements crédit,SOCIETE GENERALE,2005-12-28,2019-12-28,25000000.0,25000000.0,Indexé,TAG01M,0.0,1.0218,Emprunt in fine,oui,A-1
2,2012,1641 - Emprunts établissements crédit,BNP Paribas,2009-12-30,2021-12-29,25000000.0,25000000.0,Indexé,EURIBOR03M,0.421,0.7061,Emprunt in fine,oui,A-1
3,2008,16441 - Emprunts option tirage tréso,Caisse Nat. C.E.,2004-12-17,2010-12-17,75000000.0,75000000.0,Fixe,TAUX FIXE,0.0,0.0,Emprunt in fine,oui,A-1
4,2009,16311 - Emissions obligataires,HSBC,2005-11-09,2018-11-09,50651230.1,50651230.1,Indexé,EURIBOR03M,0.021,1.3865,Emprunt in fine,oui,A-1


In [6]:
dataset.tail()

Unnamed: 0,annee_de_publication,nature,organisme_preteur_ou_chef_de_file,date_d_emission_ou_date_de_mobilisation,date_de_derniere_echeance,capital_initial,capital_restant_du_au_31_12_2016,type_de_taux_d_interet,index,taux_initial_niveau_de_taux,taux_initial_taux_actuariel,profil_d_amortissement,possibilite_de_remboursement,categorie_d_emprunt
692,2012,16311 - Emissions obligataires,HSBC,2012-10-26,2026-01-20,30000000.0,30000000.0,Fixe,TAUX FIXE,2.909,2.9097,Emprunt in fine,oui,A-1
693,2013,16311 - Emissions obligataires,Crédit Suisse-BNPP,2008-11-05,2018-11-05,95328884.65,95328884.65,Indexé,EURIBOR03M,0.119,0.6826,Emprunt in fine,oui,A-1
694,2008,16311 - Emissions obligataires,HSBC,2005-11-16,2015-11-16,14888865.0,14888865.0,Indexé,EURIBOR03M,-0.012,1.7396,Emprunt in fine,oui,A-1
695,2018,1641 - Emprunts établissements crédit,Helaba,,2043-09-24,50000000.0,50000000.0,,TAUX FIXE,1.499,1.499,Emprunt in fine,oui,A-1
696,2010,16311 - Emissions obligataires,Crédit Suisse,2007-12-14,2017-01-14,24405125.08,24405125.08,Indexé,EURIBOR04M,0.021,1.1414,Emprunt in fine,oui,A-1


In [7]:
dataset.describe()

Unnamed: 0,annee_de_publication,capital_initial,capital_restant_du_au_31_12_2016,taux_initial_niveau_de_taux,taux_initial_taux_actuariel
count,697.0,697.0,697.0,697.0,697.0
mean,2013.559541,66162720.0,62756500.0,1.774974,2.033912
std,3.393236,55358990.0,56346110.0,1.657272,1.501794
min,2007.0,4278.21,0.0,-0.379,-0.295
25%,2011.0,25000000.0,25000000.0,0.021,0.951
50%,2014.0,50000000.0,50000000.0,1.579,1.7364
75%,2016.0,100000000.0,100000000.0,3.24,3.2401
max,2018.0,320000000.0,320000000.0,5.95,9.5103


In [8]:
dataset.describe(include=['object'])

Unnamed: 0,nature,organisme_preteur_ou_chef_de_file,date_d_emission_ou_date_de_mobilisation,date_de_derniere_echeance,type_de_taux_d_interet,index,profil_d_amortissement,possibilite_de_remboursement,categorie_d_emprunt
count,697,697,610,697,610,697,697,697,697
unique,5,74,91,106,3,8,3,2,1
top,16311 - Emissions obligataires,HSBC,2003-12-22,2019-03-31,Fixe,TAUX FIXE,Emprunt in fine,oui,A-1
freq,377,81,25,23,436,510,611,396,697


In [9]:
dataset.isna().sum()

annee_de_publication                        0
nature                                      0
organisme_preteur_ou_chef_de_file           0
date_d_emission_ou_date_de_mobilisation    87
date_de_derniere_echeance                   0
capital_initial                             0
capital_restant_du_au_31_12_2016            0
type_de_taux_d_interet                     87
index                                       0
taux_initial_niveau_de_taux                 0
taux_initial_taux_actuariel                 0
profil_d_amortissement                      0
possibilite_de_remboursement                0
categorie_d_emprunt                         0
dtype: int64

In [10]:
dataset = dataset.dropna(subset=['date_d_emission_ou_date_de_mobilisation'])

In [11]:
dataset.isna().sum()

annee_de_publication                       0
nature                                     0
organisme_preteur_ou_chef_de_file          0
date_d_emission_ou_date_de_mobilisation    0
date_de_derniere_echeance                  0
capital_initial                            0
capital_restant_du_au_31_12_2016           0
type_de_taux_d_interet                     0
index                                      0
taux_initial_niveau_de_taux                0
taux_initial_taux_actuariel                0
profil_d_amortissement                     0
possibilite_de_remboursement               0
categorie_d_emprunt                        0
dtype: int64

In [12]:
dataset.info()

<class 'pandas.core.frame.DataFrame'>
Index: 610 entries, 0 to 696
Data columns (total 14 columns):
 #   Column                                   Non-Null Count  Dtype  
---  ------                                   --------------  -----  
 0   annee_de_publication                     610 non-null    int64  
 1   nature                                   610 non-null    object 
 2   organisme_preteur_ou_chef_de_file        610 non-null    object 
 3   date_d_emission_ou_date_de_mobilisation  610 non-null    object 
 4   date_de_derniere_echeance                610 non-null    object 
 5   capital_initial                          610 non-null    float64
 6   capital_restant_du_au_31_12_2016         610 non-null    float64
 7   type_de_taux_d_interet                   610 non-null    object 
 8   index                                    610 non-null    object 
 9   taux_initial_niveau_de_taux              610 non-null    float64
 10  taux_initial_taux_actuariel              610 non-null  

In [13]:
dataset = dataset.rename(columns={
    'date_d_emission_ou_date_de_mobilisation': 'date_d_emission',
    'capital_restant_du_au_31_12_2016': 'capital_restant'
})

In [14]:
dataset.info()

<class 'pandas.core.frame.DataFrame'>
Index: 610 entries, 0 to 696
Data columns (total 14 columns):
 #   Column                             Non-Null Count  Dtype  
---  ------                             --------------  -----  
 0   annee_de_publication               610 non-null    int64  
 1   nature                             610 non-null    object 
 2   organisme_preteur_ou_chef_de_file  610 non-null    object 
 3   date_d_emission                    610 non-null    object 
 4   date_de_derniere_echeance          610 non-null    object 
 5   capital_initial                    610 non-null    float64
 6   capital_restant                    610 non-null    float64
 7   type_de_taux_d_interet             610 non-null    object 
 8   index                              610 non-null    object 
 9   taux_initial_niveau_de_taux        610 non-null    float64
 10  taux_initial_taux_actuariel        610 non-null    float64
 11  profil_d_amortissement             610 non-null    object 
 12 

In [15]:
dataset

Unnamed: 0,annee_de_publication,nature,organisme_preteur_ou_chef_de_file,date_d_emission,date_de_derniere_echeance,capital_initial,capital_restant,type_de_taux_d_interet,index,taux_initial_niveau_de_taux,taux_initial_taux_actuariel,profil_d_amortissement,possibilite_de_remboursement,categorie_d_emprunt
0,2010,1641 - Emprunts établissements crédit,DEXIA CREDIT LOCAL,2003-12-22,2013-12-22,35000000.00,35000000.00,Indexé,TAG06M,0.1581,1.9644,Emprunt in fine,oui,A-1
1,2012,1641 - Emprunts établissements crédit,SOCIETE GENERALE,2005-12-28,2019-12-28,25000000.00,25000000.00,Indexé,TAG01M,0.0000,1.0218,Emprunt in fine,oui,A-1
2,2012,1641 - Emprunts établissements crédit,BNP Paribas,2009-12-30,2021-12-29,25000000.00,25000000.00,Indexé,EURIBOR03M,0.4210,0.7061,Emprunt in fine,oui,A-1
3,2008,16441 - Emprunts option tirage tréso,Caisse Nat. C.E.,2004-12-17,2010-12-17,75000000.00,75000000.00,Fixe,TAUX FIXE,0.0000,0.0000,Emprunt in fine,oui,A-1
4,2009,16311 - Emissions obligataires,HSBC,2005-11-09,2018-11-09,50651230.10,50651230.10,Indexé,EURIBOR03M,0.0210,1.3865,Emprunt in fine,oui,A-1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
691,2008,16311 - Emissions obligataires,BNP Paribas,2005-11-24,2014-11-24,96618357.49,96618357.49,Indexé,EURIBOR03M,0.1010,1.9012,Emprunt in fine,oui,A-1
692,2012,16311 - Emissions obligataires,HSBC,2012-10-26,2026-01-20,30000000.00,30000000.00,Fixe,TAUX FIXE,2.9090,2.9097,Emprunt in fine,oui,A-1
693,2013,16311 - Emissions obligataires,Crédit Suisse-BNPP,2008-11-05,2018-11-05,95328884.65,95328884.65,Indexé,EURIBOR03M,0.1190,0.6826,Emprunt in fine,oui,A-1
694,2008,16311 - Emissions obligataires,HSBC,2005-11-16,2015-11-16,14888865.00,14888865.00,Indexé,EURIBOR03M,-0.0120,1.7396,Emprunt in fine,oui,A-1


In [16]:
# Afficher les valeurs uniques pour chaque colonne
for column in dataset.columns:
    print(f"\n=== {column.upper()} ===")
    unique_values = dataset[column].unique()
    print(f"Nombre de valeurs uniques: {len(unique_values)}")
    print("Valeurs:", unique_values)


=== ANNEE_DE_PUBLICATION ===
Nombre de valeurs uniques: 11
Valeurs: [2010 2012 2008 2009 2017 2013 2016 2007 2014 2011 2015]

=== NATURE ===
Nombre de valeurs uniques: 5
Valeurs: ['1641 - Emprunts établissements crédit'
 '16441 - Emprunts option tirage tréso' '16311 - Emissions obligataires'
 '168 Autres emprunts et dettes assimilées'
 '16876 - C.R.A.M.I.F / S.I.A.A.P.']

=== ORGANISME_PRETEUR_OU_CHEF_DE_FILE ===
Nombre de valeurs uniques: 61
Valeurs: ['DEXIA CREDIT LOCAL' 'SOCIETE GENERALE' 'BNP Paribas' 'Caisse Nat. C.E.'
 'HSBC' 'Calyon-Dexia' '89 - SocGen (arrangeur)' 'Natixis' 'Goldman Sachs'
 'Crédit Suisse' 'Helaba' 'C.E. I.D.F PARIS' '2 - C.D.C.' '92 - HSBC'
 'BEI' 'CREDIT FONCIER' 'Dexia - Morgan Stanley' '31 - Helaba' '96 - BEI'
 'HSBC-Natixis' 'HSBC-Natixis-SociétéGénérale' 'LANDESBANK BERLIN AG'
 '100 - HSBC-Natixis-Banca IMI' '9 - SOCIETE GENERALE' 'S.I.A.A.P.'
 '103 - Crédit Agricole' 'Deutsche Bank' 'HSBC-Natixis-Banca IMI' 'C.D.C.'
 'HSBC-SG-CA' '99 - HSBC-Natixis-Soci

In [17]:
dataset = dataset.drop(columns=['categorie_d_emprunt'])

In [22]:
dataset.to_csv("dette_propre_final.csv", index=False, encoding="utf-8-sig")
