<a href="https://colab.research.google.com/github/arn1369/FormaPythonLSMI/blob/main/python_avanc%C3%A9.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!pip install yfinance --upgrade --no-cache-dir --quiet && echo "Installation de yfinance terminée."
import yfinance as yf

## **Le module yFinance**

Le module yFinance permet l'importation de tout type de **données financières**, en temps réel ou non. Par exemple, si j'ai un ticker, j'aimerais importer ses données :


In [None]:
argenx = yf.Ticker("ARGX")

On peut ensuite trouver les **informations** sur le ticker avec :

In [None]:
info = argenx.info
print(info)

On pourrait ensuite récupérer le secteur avec la clé :

In [None]:
sector = info['sector']
print(sector)

Si l'on souhaite importer les données financières d'une liste de tickers, on utilise la fonction <code>download</code> du module. Avec _start_ et _end_ qui sont les **dates** de début et de fin de la période dont on souhaite télécharger les données.

Notez que celles-ci sont du format YYYY-MM-DD (year-month-day).

In [None]:
tickers_list = ["ARGX", "SU.PA", "MC.PA"]
data_tickers = yf.download(tickers_list, start="2023-01-01", end = "2023-12-31")
# Remarque : on aurait pu utiliser une période à la place
# data_tickers = yf.download(tickers_list, start = "2023-01-01", period="1y")
# ou encore sans l'option start de la date pour prendre la dernière année
print(data_tickers.head())

Pour récupérer l'**historique**, on utilisera (pour une période de 3 mois) :

In [None]:
history_argenx = argenx.history(period="3mo")

Remarquez la différence entre <code>yf.download</code> et <code>yf.Ticker.history</code> : pour _download_, on récupère les informations pour **plusieurs** tickers, alors que pour _history_ on récupère les informations historiques d'un ticker **unique**. Les périodes (_start_, _end_ ou _period_) peuvent être utilisées dans les deux fonctions.

Pour voir les données les plus récentes, à l'inverse de la

méthode <code>head()</code>, on utilisera <code>tail()</code> :

In [None]:
print(history_argenx.tail())

In [None]:
# Exercice 2.1 :
# On aimerait récupérer les données de Schneider Electric (ticker : "SU.PA")
# Et afficher l'entête des données (donc les plus anciennes données sur
# une période de 6 mois).
# Ensuite, on aimerait récupérer uniquement le prix à l'ouverture le "2025-04-25"
schneider = yf.Ticker("SU.PA")
history_schneider = schneider.history(period="6mo")
print(history_schneider.head())

# Access the row with the date "2025-04-25" and get the 'Open' value
# Pour ça, on utilise la méthode "loc"
open_price_2025_04_25 = history_schneider.loc["2025-04-25", "Open"]
print(f"The opening price on 2025-04-25 was: {open_price_2025_04_25}")

yFinance permet de récupérer des informations plus spécifiques, comme le bilan ! Avec la variable <code>financials</code> et <code>balance_sheet</code> :

In [None]:
compte_de_resultat = schneider.financials
print(compte_de_resultat)
balance_sheet = schneider.balance_sheet
print(balance_sheet)

On peut donc récupérer des valeurs comme l'**EBITDA** avec :

In [None]:
print(compte_de_resultat.loc['EBITDA'])

On remarque ici que pour la dernière valeur, on obtient **NaN**, qui signifie _Not A Number_. Ce sont des "valeurs pirates", non définies. Il faut y prêter attention, car elles peuvent induire des **erreurs**, notamment si on calcule la moyenne d'une colonne par exemple. Des méthodes existes, notamment <code>dropna()</code>. Cela peut être pour diverses raisons : la valeur **n'existe pas**, elle n'est pas attribuée, ou bien même, il y a des erreurs d'importations !

Dans ce cas ci, on va simplement se contenter d'**ignorer** la valeur.

Et maintenant, place aux exercices !

In [None]:
# Exercice 2.2 :
# Calcul de la volatilité du cours de Goldman Sachs (ticker : "GS")
# On utilisera :
#   daily_returns = closing_price.pct_changes().dropna()
# Il faudra d'abord calculer closing_price (avec vos talents en python)
# Remarquez l'utilisation de dropna afin de supprimer les valeurs pirates
# On pourra ensuite calculer la volatilité :
#   volatility = daily_returns.std() * 100
# Qui est en fait la standard deviation (ecart-type) des retours journaliers,
# multipliée par 100 pour l'obtenir en pourcentages.
gs_ticker = yf.Ticker("ARGX")
history_gs = gs_ticker.history(period="1y")
closing_price = history_gs.loc[:, "Close"]
daily_returns = closing_price.pct_change().dropna()
volatility = daily_returns.std() * 100
print(volatility)

## **Matplotlib : Représenter graphiquement les données d'yFinance**


Matplotlib est une bibliothèque Python qui permet de créer des graphiques et des visualisations de données.
Elle est très utilisée en analyse financière, data science et statistiques pour représenter visuellement les données et les tendances.

Commençons par un exemple en important les données d'abinbev

In [None]:
import pandas as pd

In [None]:
# Téléchargement des données de AB InBev
abinbev = yf.download("BUD", start="2020-01-01", end="2025-10-01")

# visualisation
abinbev


 ## Visualisation du cours d'une action

Il est maintenant temps de visualiser le cours de clôture d'AbInBev grâce à plt

Pour créer un graphique sur base d'un data frame il suffit d'y ajouter la fonction .plot() de plt, cette fonction comporte des attributs personnalisables comme figsize ou encore title qui permettent de rendre plus lisible et interprétable le graphe.


plt.xlabel() permet de définir le titre pour l'axe des abscisses (la variable horizontale)

plt.ylabel() fait de même pour l'axe des ordonnées (la variable verticale)

plt.show() permet d'avoir comme output le graphique

In [None]:
import matplotlib.pyplot as plt

abinbev['Close'].plot(figsize=(10, 5), title="Cours de clôture de AB InBev")
plt.xlabel("Date")
plt.ylabel("Prix ($)")
plt.show()


In [None]:
# TO DO
# importer les données d'une action de votre choix via yfinance puis visualiser
# son cours de clôture grâce à plt
# tips : basez vous sur l'exemple ci-dessus
argenx = yf.download("ARGX", period="1y")
argenx["Close"].plot(figsize=(10, 5), title="Cours de Cloture d'ARGENX (ARGX)")
plt.xlabel("Date")
plt.ylabel("Price")
plt.show()

## Visualisation des rendements journaliers

L'objectif est maintenant de visualiser le rendement journalier sur un an.

Pour ce faire, on utilise la fonction pct_change qui permet de calculer la variation entre deux valeurs succesives.

In [None]:
# Calcul du rendement journalier (en %)
abinbev['Return'] = abinbev['Close'].pct_change()*100
abinbev.head()

In [None]:
# Visualisation du rendement sur une période donnée
abinbev['Return'].loc['2024-01-01':'2024-12-31'].plot(figsize=(10,5))
plt.title("Rendement journalier de AB InBev en 2024")
plt.xlabel("Date")
plt.ylabel("Rendement quotidien (%)")
plt.show()


In [None]:
# TO DO
# visualiser le rendement journalier (%) pour l'action que vous avez décidé d'importer
argenx['Return'] = argenx['Close'].pct_change()*100
argenx['Return'].plot(figsize=(10,5))
plt.title("Rendement journalier d'ARGENX")
plt.xlabel("Date")
plt.ylabel("Rendement quotidien (%)")
plt.show()

## Visualisation de la distribution des rendements via un histogramme

Nous allons maintenant visualiser la distribution des rendements via un histogramme (pour voir leur volatilité).

La fonction de Matplotlib correspondante est plt.hist()

In [None]:
plt.hist(abinbev['Return'].dropna(), bins=50)
# dropna() permet de supp les non-numériques (comme la première ligne de return)
# bins permet de fixer le nombre de barres que contient l'histogramme
plt.title("Distribution des rendements journaliers")
plt.xlabel("Rendement")
plt.ylabel("Fréquence")
plt.show()


On peut voir que la distribution des rendements ressemble à une gaussienne. Cependant, les rendements suivent-ils réellement une loi normale ?

C'est ce que nous allons vérifier dans cette troisième partie

## Superposition de plusieurs graphes et visualisation d'une loi normale

In [None]:
import numpy as np

# TO DO

# Création d'une distribution normale sur base des rendements
# tips : utilisez np.random.normal(mean, std, nbre d'observations (exemple 1000))
# pour mean et std, il faut se baser sur la variable return d'abinbev


###
plt.hist(abinbev['Return'], bins=50, alpha=0.5, label='Rendements réels', density = True)
#ici on utilise alpha=0.5 pour rendre les deux hist. semi-opaques étant donné
#qu'on va les superposer

#TO DO
# C'est à vous de créer l'histogramme de la loi normale

normale = np.random.normal(abinbev["Return"].mean(),abinbev["Return"].std(), 1000)

plt.hist(normale, bins=50, alpha=0.5, label='Loi normale', density = True)
##
plt.title("Comparaison rendements réels vs distribution normale")

plt.legend()
plt.show()


On peut observer que les rendements réels possèdent plus d'observations proches de 0 mais cependant la distribution des rendements réels possèdent aussi des queues plus épaisses. Il y a donc plus de valeurs extrêmes que ce qu'une loi normale prévoit. Les modèles basés sur la normale sous-estiment le risque extrême (crashs boursiers ou gros gains).

### Calcul et visualisation du béta

Le bêta $\beta$ est une mesure du risque systématique d'un actif par rapport au marché.
Il indique à quel point le rendement d'un actif varie en fonction du rendement du marché.

$ \beta =​ \frac{Cov(R_i​,R_m)​}{Var(R_m)​}$

où


$R_i$ = Rendement de l'actif


$R_m$ = Rendement du marché


On va calculer le bêta pour Ab InBev par rapport au BEL20.

In [None]:
# Importation des données du BEL20
abinbev= yf.download("ABI.BR", start="2020-01-01", end="2025-10-01")
bel20 = yf.download("^BFX", start="2020-01-01", end="2025-10-01")
bel20

In [None]:
# TO DO

# Calcul des rendements journaliers

Ri = abinbev['Close'].pct_change().dropna()
Rm = bel20['Close'].pct_change().dropna()

# ligne de code qui permet d'avoir la bonne dispositon pour np.cov
data = pd.concat([Ri, Rm], axis=1).dropna()
Ri = data.iloc[:,0].values
Rm = data.iloc[:,1].values

In [None]:
# TO DO

# calcul de la cov et de la var avec np
# la fonction np.cov() a comme output une matrice 2 x 2
# en (0,0) = var(x)
# en (0,1) = cov(x,y)
# en (1,0) = cov(y,x)
# en (1,1) = var(y)

# np.cov() prend en compte les deux rendements qu'on compare. Il faut aussi
# ajouter ddof = 1 car on prend des données empiriques
covariance= np.cov(Ri, Rm, ddof=1)
print(covariance)
# la variance se calcule grâce à np.var()
variance = np.var(Rm)

beta= covariance[0,1]/variance

ticker = yf.Ticker("ABI.BR")
info = ticker.info
print(info['beta'])
print(beta)



On voit que le bêta est supérieur, ça signifie donc que l'action est plus risquée que le marché et amplifie les mouvements. En effet, AB InBev est environ 14% plus volatile. Le rendement attendu devrait donc être légèrement plus élevé que celui du BEL20.

 ## **BONUS**

In [None]:
# calcul du alpha
alpha = Ri.mean() - beta * Rm.mean()
print(alpha)

Pour chaque unité de rendement du marché, AB InBev rapporte 0,02 % de moins que ce que prédirait son bêta. cette valeur est très faible, donc en réalité AB InBev suit presque parfaitement le marché belge, avec seulement une très légère sous-performance.

## Visualisation d'AB InBev en fonction du BEL20 par régression linéaire

In [None]:
regression = alpha + beta * Rm


plt.figure(figsize=(8,6))
# Tracé du nuage de points
plt.scatter(Rm, Ri, alpha=0.4, color='skyblue', label='Données réelles')
# Tracé de la droite de régression
plt.plot(Rm, regression, color='red', alpha=0.6, label='Droite de régression')
plt.xlabel("Rendements du BEL20")
plt.ylabel("Rendements d'AB InBev")
plt.title("Régression AB InBev vs BEL20")
plt.legend()
plt.show()