# Chargement et Exploration des Données

Ce notebook montre comment charger et explorer les données des clients de Tunisie Telecom.

In [1]:
# Import des bibliothèques nécessaires
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go

# Configuration de l'affichage
%matplotlib inline
plt.style.use('seaborn')
pd.set_option('display.max_columns', None)

OSError: 'seaborn' is not a valid package style, path of style file, URL of style file, or library style name (library styles are listed in `style.available`)

## 1. Chargement des données

In [None]:
# Chargement des données
df = pd.read_csv('../data/raw/donnees_clients.csv')

# Affichage des premières lignes
print("Aperçu des données :")
display(df.head())

# Informations sur le dataset
print("\nInformations sur le dataset :")
display(df.info())

## 2. Statistiques descriptives

In [None]:
# Statistiques descriptives
print("Statistiques descriptives :")
display(df.describe())

## 3. Visualisations initiales

In [None]:
# Création d'une figure avec plusieurs sous-graphiques
fig, axes = plt.subplots(2, 2, figsize=(15, 12))

# Distribution de l'âge
sns.histplot(data=df, x='age', bins=30, ax=axes[0,0])
axes[0,0].set_title('Distribution de l'âge')

# Distribution de la consommation
sns.histplot(data=df, x='montant_consommation', bins=30, ax=axes[0,1])
axes[0,1].set_title('Distribution de la consommation')

# Nombre d'appels par âge
sns.scatterplot(data=df, x='age', y='nombre_appels', ax=axes[1,0])
axes[1,0].set_title('Nombre d'appels par âge')

# Volume de données par consommation
sns.scatterplot(data=df, x='montant_consommation', y='volume_data', ax=axes[1,1])
axes[1,1].set_title('Volume de données par consommation')

plt.tight_layout()
plt.show()

## 4. Analyse des corrélations

In [None]:
# Matrice de corrélation
plt.figure(figsize=(10, 8))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm', center=0)
plt.title('Matrice de corrélation')
plt.show()