### ***Fusion des données entre le site internet et les réseaux sociaux***

In [1]:
import pandas as pd

# Explication des Données

## Colonnes de Données Réseaux Sociaux :

- **Couverture Facebook/Instagram**
  - **Description :** Nombre total de personnes qui ont vu le contenu sur Facebook/Instagram.

- **Visites Facebook/Instagram**
  - **Description :** Nombre de visites sur la page Facebook/Instagram.

- **Interactions Facebook/Instagram**
  - **Description :** Nombre total d'interactions sur les publications Facebook/Instagram (likes, commentaires, partages).

## Colonnes de Données du Site Web :

- **Sessions**
  - **Description :** Nombre de sessions (visites) sur le site web.

- **Total Users**
  - **Description :** Nombre total d'utilisateurs distincts qui ont visité le site web.

- **Screen Page Views**
  - **Description :** Nombre total de pages vues (écrans) sur le site web.

- **Average Session Duration**
  - **Description :** Durée moyenne des sessions en secondes.

- **Bounce Rate**
  - **Description :** Taux de rebond, représentant le pourcentage de sessions où les utilisateurs quittent le site web après avoir vu une seule page.

- **Engaged Sessions**
  - **Description :** Nombre de sessions où les utilisateurs ont interagi de manière significative avec le site web (par exemple, pages visitées).

- **New Users**
  - **Description :** Nombre d'utilisateurs qui visitent le site web pour la première fois.

- **Event Count**
  - **Description :** Nombre total d'événements enregistrés sur le site web (comme les clics sur des boutons, les soumissions de formulaires, etc.).

### chargement des données

In [10]:
reseaux = pd.read_csv('extraction_donnees_reseaux.csv', sep=',')
site = pd.read_csv('extraction_donnees_site.csv', sep=',')

In [12]:
reseaux

Unnamed: 0,Date,Couverture Facebook,Visites Facebook,Interactions FaceBook,Couverture Instagram,Interactions Instagram,Visites Instagram
0,06/08/2024,180,14,6,40,0,7
1,07/08/2024,40,2,3,112,0,3
2,08/08/2024,4,0,1,5,0,2
3,09/08/2024,2,0,0,4,0,3
4,10/08/2024,12,0,4,51,0,21
5,11/08/2024,26,3,7,48,0,6
6,12/08/2024,19,2,1,18,1,1
7,13/08/2024,4,6,0,4,0,8
8,14/08/2024,4,0,0,2,0,3
9,15/08/2024,5,0,0,0,0,1


In [14]:
print(reseaux.dtypes)

Date                      object
Couverture Facebook        int64
Visites Facebook           int64
Interactions FaceBook      int64
Couverture Instagram       int64
Interactions Instagram     int64
Visites Instagram          int64
dtype: object


In [16]:
print(site.dtypes)

Date                       object
sessions                    int64
totalUsers                  int64
screenPageViews             int64
averageSessionDuration    float64
bounceRate                float64
engagedSessions             int64
newUsers                    int64
eventCount                  int64
dtype: object


##### conversion des dates au bon format

In [25]:
reseaux['Date'] = pd.to_datetime(reseaux['Date'], format='%d/%m/%Y')
site['Date'] = pd.to_datetime(site['Date'], format='%d/%m/%Y')
print(reseaux.dtypes)
print(site.dtypes)

Date                      datetime64[ns]
Couverture Facebook                int64
Visites Facebook                   int64
Interactions FaceBook              int64
Couverture Instagram               int64
Interactions Instagram             int64
Visites Instagram                  int64
dtype: object
Date                      datetime64[ns]
sessions                           int64
totalUsers                         int64
screenPageViews                    int64
averageSessionDuration           float64
bounceRate                       float64
engagedSessions                    int64
newUsers                           int64
eventCount                         int64
dtype: object


##### Fusion des dataframes

In [32]:
donnees_fusionnees = pd.merge(reseaux, site, on='Date', how='outer')
donnees_fusionnees

Unnamed: 0,Date,Couverture Facebook,Visites Facebook,Interactions FaceBook,Couverture Instagram,Interactions Instagram,Visites Instagram,sessions,totalUsers,screenPageViews,averageSessionDuration,bounceRate,engagedSessions,newUsers,eventCount
0,2024-08-06,180,14,6,40,0,7,3.0,2.0,44.0,1116.839999,0.333333,2.0,1.0,68.0
1,2024-08-07,40,2,3,112,0,3,2.0,2.0,15.0,361.516415,0.0,2.0,2.0,34.0
2,2024-08-08,4,0,1,5,0,2,5.0,5.0,9.0,41.790813,0.4,3.0,5.0,29.0
3,2024-08-09,2,0,0,4,0,3,2.0,2.0,2.0,4.813599,1.0,0.0,2.0,7.0
4,2024-08-10,12,0,4,51,0,21,1.0,1.0,6.0,138.157754,0.0,1.0,0.0,10.0
5,2024-08-11,26,3,7,48,0,6,4.0,4.0,5.0,58.795034,0.25,3.0,4.0,18.0
6,2024-08-12,19,2,1,18,1,1,4.0,4.0,6.0,138.810361,0.5,2.0,3.0,14.0
7,2024-08-13,4,6,0,4,0,8,4.0,4.0,19.0,375.654016,0.25,3.0,4.0,52.0
8,2024-08-14,4,0,0,2,0,3,2.0,2.0,8.0,180.828602,0.0,2.0,2.0,24.0
9,2024-08-15,5,0,0,0,0,1,2.0,2.0,3.0,36.731941,0.0,2.0,2.0,10.0


##### nettoyage des données

In [39]:
donnees_fusionnees.dropna(inplace=True)
donnees_fusionnees

Unnamed: 0,Date,Couverture Facebook,Visites Facebook,Interactions FaceBook,Couverture Instagram,Interactions Instagram,Visites Instagram,sessions,totalUsers,screenPageViews,averageSessionDuration,bounceRate,engagedSessions,newUsers,eventCount
0,2024-08-06,180,14,6,40,0,7,3.0,2.0,44.0,1116.839999,0.333333,2.0,1.0,68.0
1,2024-08-07,40,2,3,112,0,3,2.0,2.0,15.0,361.516415,0.0,2.0,2.0,34.0
2,2024-08-08,4,0,1,5,0,2,5.0,5.0,9.0,41.790813,0.4,3.0,5.0,29.0
3,2024-08-09,2,0,0,4,0,3,2.0,2.0,2.0,4.813599,1.0,0.0,2.0,7.0
4,2024-08-10,12,0,4,51,0,21,1.0,1.0,6.0,138.157754,0.0,1.0,0.0,10.0
5,2024-08-11,26,3,7,48,0,6,4.0,4.0,5.0,58.795034,0.25,3.0,4.0,18.0
6,2024-08-12,19,2,1,18,1,1,4.0,4.0,6.0,138.810361,0.5,2.0,3.0,14.0
7,2024-08-13,4,6,0,4,0,8,4.0,4.0,19.0,375.654016,0.25,3.0,4.0,52.0
8,2024-08-14,4,0,0,2,0,3,2.0,2.0,8.0,180.828602,0.0,2.0,2.0,24.0
9,2024-08-15,5,0,0,0,0,1,2.0,2.0,3.0,36.731941,0.0,2.0,2.0,10.0
