## **Exemple d'ajustement linéaire**

Dans l'exemple présenté ci-dessous, nous souhaitons proposer un ajustement   
linéaire de la masse du cerveau en fonction de son volume.   
Nous utiliserons le fichier de données "volume_masse_cerveau.csv" et la fonction  
"**linregress**" de la librairie **scipy** pour réaliser cet ajustement linéaire.

### **Lecture et affichage des données**

In [1]:
import pandas as pd

url = 'http://perpendiculaire.fr/data/volume_masse_cerveau.csv'

data = pd.read_csv(url,sep=',')

In [None]:
data.head()

### **Représentation des données**

In [None]:
import matplotlib.pyplot as plt

X = data['volume']
# colonne 1 du data-frame (volume)

Y = data['masse']
# colonne 2 du data-frame (masse)

plt.scatter(X, Y, color = 'blue', s = 10)
plt.xlabel('Volume en centimètres cubes',fontsize=14)
plt.ylabel('Masse en grammes',fontsize = 14)
plt.gcf().set_size_inches(8,6)
plt.show()



### **Modélisation**

On se propose de modéliser la masse du cerveau en fonction de son volume  
par un modèle linéaire de la forme :  $masse = a \times volume + b$ 

In [None]:
from scipy.stats import linregress

resultats = linregress(X, Y)

a = resultats.slope      # pente
b = resultats.intercept  # ordonnée à l'origine
R2 = resultats.rvalue**2 # coefficient de détermination

def f(x):
  # ajustement linéaire
  return a*x + b

print("a =", a, "b =", b, "R2 =", R2)

plt.scatter(X, Y, color = 'blue', s = 10)
# nuage de points

plt.plot(X, f(X), 'r', label = 'ajustement')
# ajustement

plt.xlabel('Volume en centimètres cubes') 
plt.ylabel('Masse en grammes') 
plt.gcf().set_size_inches(8,6)
plt.legend(loc='upper left',scatterpoints=1,fontsize=14)
plt.show()