# 🚗📈 Plan d’Analyse pour ton projet Tesla

---

## 1. 🗂️ Prise en main des données

- **Afficher les premières lignes, vérifier les types de variables**
- **Nettoyage de base** (valeurs manquantes, doublons, formats)

---

## 2. 🔎 Analyse exploratoire (EDA)

- **Statistiques descriptives** (moyenne, min, max, etc.)
- **Visualisation rapide** des tendances (courbe du prix de clôture, volume, etc.)

---

## 3. 💡 Questions business / Hypothèses

**Exemples :**
- Comment a évolué le cours de Tesla sur la période ?
- Y a-t-il une corrélation entre volume échangé et volatilité ?
- Identifier les plus fortes hausses/baisse, ou périodes intéressantes

---

## 4. 📊 Visualisation avancée

- Courbe d’évolution
- Histogrammes
- Boxplots
- Heatmap de corrélation

---

## 5. 📝 Insights clés & synthèse

- Ce que tu retiens, axes d’analyse complémentaires, prochaines étapes

---




In [1]:
import pandas as pd
import numpy as np

In [6]:
df = pd.read_csv('Tesla_stock_data.csv' , )

In [8]:
print(df.head())

         Date     Close      High       Low      Open     Volume
0  2010-06-29  1.592667  1.666667  1.169333  1.266667  281494500
1  2010-06-30  1.588667  2.028000  1.553333  1.719333  257806500
2  2010-07-01  1.464000  1.728000  1.351333  1.666667  123282000
3  2010-07-02  1.280000  1.540000  1.247333  1.533333   77097000
4  2010-07-06  1.074000  1.333333  1.055333  1.333333  103003500


In [9]:
# Affichage des informations sur le DataFrame
print(df.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3765 entries, 0 to 3764
Data columns (total 6 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   Date    3765 non-null   object 
 1   Close   3765 non-null   float64
 2   High    3765 non-null   float64
 3   Low     3765 non-null   float64
 4   Open    3765 non-null   float64
 5   Volume  3765 non-null   int64  
dtypes: float64(4), int64(1), object(1)
memory usage: 176.6+ KB
None


In [10]:
#verification des valeurs manquantes
print(df.isnull().sum())

Date      0
Close     0
High      0
Low       0
Open      0
Volume    0
dtype: int64


In [11]:
#addicher les statistiques descriptives
print(df.describe())

             Close         High          Low         Open        Volume
count  3765.000000  3765.000000  3765.000000  3765.000000  3.765000e+03
mean     88.567852    90.581117    86.465378    88.593070  9.707503e+07
std     113.754319   116.450259   110.987632   113.848771  7.689793e+07
min       1.053333     1.108667     0.998667     1.076000  1.777500e+06
25%      12.506000    12.764667    12.183333    12.446667  5.014650e+07
50%      18.807333    19.118668    18.466667    18.799999  8.319150e+07
75%     191.300003   196.360001   186.339996   191.456665  1.225740e+08
max     479.859985   488.540009   457.510010   475.899994  9.140820e+08


In [12]:
#verifier les doublons
print(df.duplicated().sum())

0


In [14]:
#optionnel : convversion de la colonne 'Date' en datetime
df['Date'] = pd.to_datetime(df['Date'])
print(df.dtypes)

Date      datetime64[ns]
Close            float64
High             float64
Low              float64
Open             float64
Volume             int64
dtype: object


## ✅ Étapes réalisées jusqu’ici

- ✔️ **Vérification des doublons**
- ✔️ **Conversion de la colonne `Date` au format datetime**
- ✔️ **Analyse des types de variables**
- ✔️ **Vérification des valeurs manquantes**
- ✔️ **Calcul des statistiques descriptives (moyenne, min, max, etc.)**

