# Exploration des Données

Ce notebook explore les données disponibles.

In [None]:

# Exploration du Dataset Amazon Reviews

## Importation des bibliothèques nécessaires

```python
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Pour charger et visualiser les données
```

## Chargement des données

```python
# Remplacer le chemin par le chemin du fichier CSV du dataset
data = pd.read_csv('C:/Projet/Test_technique_IRLY_Cleaned/data/amazon_reviews_real_subset.csv')

# Aperçu des premières lignes du dataset
data.head()
```

## Nettoyage des données

```python
# Suppression des valeurs manquantes dans les colonnes essentielles
data_clean = data.dropna(subset=['reviewText', 'overall'])

# Affichage des données nettoyées
data_clean.head()
```

## Distribution des évaluations (Ratings)

```python
# Visualisation de la distribution des évaluations (notes)
plt.figure(figsize=(10, 6))
sns.countplot(data=data_clean, x='overall')
plt.title('Distribution des évaluations des produits')
plt.xlabel('Note')
plt.ylabel('Nombre de commentaires')
plt.show()
```

## Analyse de la longueur des avis

```python
# Calcul de la longueur de chaque commentaire
data_clean['review_length'] = data_clean['reviewText'].apply(lambda x: len(str(x).split()))

# Visualisation de la distribution de la longueur des avis
plt.figure(figsize=(10, 6))
sns.histplot(data_clean['review_length'], kde=True)
plt.title('Distribution de la longueur des avis')
plt.xlabel('Nombre de mots dans l'avis')
plt.ylabel('Fréquence')
plt.show()
```

## Corrélation entre la note et la longueur de l'avis

```python
# Visualisation de la relation entre la note et la longueur de l'avis
plt.figure(figsize=(10, 6))
sns.scatterplot(data=data_clean, x='review_length', y='overall')
plt.title('Corrélation entre la longueur de l'avis et la note')
plt.xlabel('Longueur de l'avis')
plt.ylabel('Note')
plt.show()
```

## Conclusion

Dans cette section, vous pouvez ajouter vos propres analyses et résultats basés sur l'exploration des données.


In [None]:

# Connexion à l'API
import requests

# Définir l'URL de l'API (assurez-vous que l'API est en cours d'exécution)
api_url = "http://127.0.0.1:8000"

# Exemple de requête à l'API
response = requests.get(f"{api_url}/example_endpoint")
if response.status_code == 200:
    print("Réponse de l'API :", response.json())
else:
    print("Erreur lors de la requête à l'API :", response.status_code)
