Le cahier est ici non exécuté, il faut le lancer en cliquant successivement sur les symboles en forme de flèche afin de voir le résultat des morceaux de code.


Ce cahier Jupyter vient **en complément** du polycopié de cours qui est disponible ici :
https://github.com/MartinVerot/ONP/blob/master/cours_python.pdf


# Nombres

<span id="nombres"></span>
## Entiers vs nombres flottants

On peut voir ici qu'en fonction de la manière dont on a déclaré la variable, le résultat est différent.

In [None]:
a = 3
b = 3.0
print(a, type(a))
print(b, type(b))

Cela peut alors avoir des conséquences par la suite sur les opérations possibles ou non avec les variables.

In [None]:
# a étant entier, l'opération est possible
for indix in range(a):
    print(indix)

In [None]:
# b étant un flottant, cela engendre une erreur
for indix in range(b):
    print(indix)

In [None]:
# Après une conversion de type, la fonction s'éxecute correctement
for indix in range(int(b)):
    print(indix)

# Division
<span id="division"></span>La division peut être entière ou non

In [None]:
a = 2
b = 5
# Division flottante, marche avec des entiers
print(b / a)
print(type(b / a))
# Division entière qui donne le quotient
print(b // a)
print(type(b // a))
# Pour obtenir le reste
print(b % a)

# Arithmétique en nombre flottant et approximations
<span id="arithfloat"></span>

## une égalité non vérifiée
Il faut **TOUJOURS** être conscient que la représentation d'un nombre flottant peut amener à des erreurs d'arrondis ou des problèmes de comparaison.

In [None]:
# 3*0.3 n'est pas égal à 0.9
print(0.3 + 0.3 + 0.3 == 0.9)

Le package decimal permet d'identifier le souci en affichant explicitement la valeur réellement stockées en mémoire par python.

In [None]:
from decimal import Decimal

print(Decimal.from_float(0.3 + 0.3 + 0.3))
print(Decimal.from_float(0.9))

## une variance négative

Un exemple de calcul de la variance qui donne une variance ... négative. [tiré d'une page de blog de Julia Evans](https://jvns.ca/blog/2023/01/13/examples-of-floating-point-problems/).

On peut suivre une implémentation naïve pour calculer la variance réduite :
$$ V(x) = \dfrac{1}{N-1} \sum_i (x_i - \bar{x})^2 =  \dfrac{1}{N-1} \left( \sum_i x_i^2\right) -  \dfrac{N}{N-1}\bar{x}^2$$ 
où $\bar{x}$ est la moyenne des points $\{x_i\}$ et $N$ est le nombre de points considérés.


In [None]:
import numpy as np

# Implémentation de la formule donnée ci-dessous qui peut donner des résultats catastrophiques
def calculate_bad_variance(nums):
    sum_of_squares = 0
    sum_of_nums = 0
    N = len(nums)
    for num in nums:
        sum_of_squares += num**2
        sum_of_nums += num
    mean = sum_of_nums / N
    variance = (sum_of_squares - N * mean**2) / (N - 1)
    return variance


# Un exemple où « ça se passe bien »
values = [0.1, 0.3, 0.6, 7.0, 0.003, -0.24]
print(
    "« Mauvais » calcul de la variance réduite  : {}".format(
        calculate_bad_variance(values)
    )
)
print(
    "Meilleur calcul de la variance réduite     : {}".format(
        np.std(values, ddof=1) ** 2
    )
)
# création de 100000 valeurs comprises entre 1e9 et 1e9+0.06
np.random.seed(45)
values = np.random.uniform(100000000, 100000000.06, 100000)
print(
    "« Mauvais » calcul de la variance réduite  : {}".format(
        calculate_bad_variance(values)
    )
)
print(
    "Meilleur calcul de la variance réduite     : {}".format(
        np.std(values, ddof=1) ** 2
    )
)

On peut voir qu'avec l'implémentation naïve de la variance, **qui est strictement positive par définition**, *on peut arriver à trouver une grandeur négative*...

Une des origines du problème est de mélanger des nombres qui ont plusieurs ordres de grandeur d'écart (1e9 par rapport à 6e-2).