In [None]:
import numpy as np
import matplotlib.pyplot as plt

# <div align="center"> Manipulation des tableaux en Python </div>


# Table des matières : 
1. **Les tableaux Numpy**
 1. Définitions & Propriétés
 2. Organisation en mémoire des tableaux
 3. Déclaration & Initialisation
 4. Sélection 
2. **Manipulation algébrique des tableaux** 
 1. Opérations algébrique élément par élément : +, -, *, /
 2. Opérations relationnels élément par élément : >, <, ==
 3. Opérations logiques élément par élément : and, or et not
 4. Application à l'utilisation des masques
3. **Manipulation des systèmes linéaires**
 1. Opération matricielle : le produit matricielle
 1. Opérations "optimisées"
 3. Inversion d'un système d'équations linéaires
 4. Traitement du signal : transformée de Fourier
4. **Manipulation des systèmes non linéaires**
 1. Regressions polynomiales
 2. Régression non-linéaire
 3. Résolution d'équations non-linéaires

# Exercice à rendre

Il vous est demandé de bien documenter vos codes et d'utiliser des notations explicites et lisibles afin de faciliter la correction. Ces critères seront pris en compte dans la correction.

- [Exercice 1](#Exercice-avancé-:-Résolution-d'un-système-quantique-discret) résolution d'un système quantique discret par l'utilisation de l'inversion de matrice ; 
- [Exercice 2](#Exercice-avancé-:-Résolution-d'équations-différentielles-linéaires) résolution d'un système d'équations différentielles linéaires à 2 dimensions par une inversion de matrice ;
- [Exercice 3](#Exercice-avancé-:-transformée-de-Fourier-d'une-Free-Induction-Decay) construction d'un spectre RMN par l'utilisation des outils de transformée de fourier rapide implementés dans Numpy;
- [Exercice 4](#Exercice-avancé-:-Détermination-de-la-concentration-à-l'équilibre-d'un-acide-faible) détermination de la concentration d'un acide faible de manière exacte à l'aide d'un algorithme de Newton-Raphson ;
- [Exercice 5](#Exercice-avancé-:-Détermination-de-la-stoechiométrie-d'un-complexe) réalisation d'une régression polynomiale pour déterminer la stoechiométrie d'un complexe entre le fer et l'anion thiocyanate ;
- [Exercice 6](#Exercice-avancé-:-dynamique-de-l'eau) réalisation d'une régression multiexponentielle pour déterminer le temps moyen associé à la réorientation de l'eau dans le bulk.





L'objet de ce TD-cours est d'utiliser quelques outils intégrés à Python pour le traitement des données ou la modélisation en physico-chimie : numpy (tableau et vectorisation), scipy (résolution d'équations, régression) et matplotlib (représentation graphique).

Le langage Python n'a pas été conçu à l'origine pour le calcul scientifique. Cependant, il aligne nombre de qualités utiles dans le traitement de données : simplicité de la syntaxe, modulabilité et interprétation. Dévéloppée en 2006, conjointement à Scipy, la bibliothèque Numpy permet la manipulation de tableaux à multiples dimensions ainsi que la réalisation d'opérations vectorisées : transposition, sommation, ...

# 1. Les tableaux Numpy

Les tableaux numpy [*numpy array*] constituent un type particulier dans python. Il faut bien les distinguer des types natifs de python : list, tuple ou dict. Par comparaison aux list, les tableaux numpy permettent : 

1. d'occuper moins d'espace en RAM ;
2. d'avoir de meilleures performances en terme de rapidité d'execution (taille + sur-couche du C++) ;
3. d'exéctuer nombre d'opérations numériques élémentaires : sommes, produits, algèbre linéaire, $\ldots$

Nous allons aborder ces aspects par la suite.

## 1.A. Définitions & propriétés

Ces tableaux sont des **matrices denses**, par opposition aux **matrices creuses** [*sparse matrix*], caractérisées par : 
* un **rang** [*rank*] d’un tableau est son nombre de dimensions;
* une (ou des) **étendue(s)** [*extent*], qui correspond(ent) au nombre(s) d'élément(s) dans cette dimension;
* un **profil** [*shape*], qui est un vecteur dont chaque élément est l’étendue du tableau dans la dimension correspondante;
* une **taille** [*size*], qui est le produit des éléments du vecteur correspondant à son profil;
* un **type**, qui est le type des valeurs dans le tableau.

Nous allons commencer par représenter deux matrices conformantes (3,3) : 

$$
A = \begin{pmatrix}
1 & 2 & 3 \\
4 & 5 & 6 \\
7 & 8 & 9 \\
\end{pmatrix}; B = \begin{pmatrix} 1 & 4 & 7 \\
2 & 5 & 8 \\
3 & 6 & 9 \\ \end{pmatrix}
$$


On peut identifier leurs propriétés associées. Pour cela, vous pouvez vous appuyer sur les propriétés associées aux objets numpy : .shape, .size, .ndim (le poids en RAM, en octet, est donné par .nbytes)

Afin de sélectionner un élément de ces tableaux, il suffit de donner les indices de l'élément qui vous intéressent. Par exemple,

$$
A[0,1] = 2\text{ et } B[0,1]= 4
$$

*Remarque :* les tableaux sont indexés de zéro à l'étendue moins l'unité dans chacune des dimensions.

 **Q.** Déterminer le rang, l'étendue, le profil et la taille de **A** et **B** en vous appuyant sur les propriétés des objets numpy.

## 1.B. Organisation en mémoire

Il est important de bien distinguer la représentation interprétée de A et B avec leur représentation en mémoire. L'instance associée à A est stockée sous la forme de :
* données, représentées sous la forme d'une suite de cases mémoires, dont chacune contient un élément de la matrice;
* métadonnées, contenant une ou plusieurs étiquettes (ici une seule, A) et les propriétés de l'array (ici le format (3,3)).

L'emplacement mémoire contigüe porte un numéro d'identification qu'il est possible de visualiser en utilisant la propriété .data .

Une manière simple d'avoir l'organisation d'une matrice est d'utiliser la méthode .ravel, évaluée au format 'C' (c.-à-d. que les données sont organisées comme dans les langages C/C++ par opposition à F pour fortran).

**Q.** En vous appuyant sur les matrices **A** et **B** précedente et en utilisant la fonction .ravel, montrer quel est l'axe rapide en Numpy.

**Q.** En déclarant que C = A et en réalisant une copie de A appelée D, montrer que C et A ont le même emplacement mémoire alors que D et A différent. 

Quelles sont la conséquence immédiate pour vous utilisateur de python ? Vous expliciterez cette conséquence en modifiant un terme de votre souhait dans la matrice.

*Remarque :* Vous pourrez utiliser le connecteur logique *"is"* de python pour montrer l'équivalence C/A et D/A


## 1.C. Déclaration & Initialisation

Pour déclarer et initialiser un tableau, il y a plusieurs manières de procéder : 
 1. élément par élément avec la fonction np.array;
 2. un array vide avec la fonction np.empty;
 3. un array plein composé exclusivement de 0 (np.zeros) ou exclusivement de 1 (np.ones);
 4. une suite arithmétique de valeur initiale, finale et de raison définie par l'utilisateur (np.arange) dont les dimensions peuvent être ajustées (np.reshape).
 
Pour initer un tableau, il est nécessaire de déclarer *a minima* les propriétés format et type.
    
 **Q.** Déclarer des matrices C, D, E et F de dimensions (3, 3), en entier 64, avec chacune des 4 manières précédentes

## 1.D. Sélection

Selon une dimension donnée de taille $N$, il est possible de sélectionner des sections régulières du tableau, (obtenues sous forme de tableau), en faisant varier le ou les indices à l'aide d'un triplet de la forme 
$$ [limite_1:limite_2:pas]$$

avec $limite_1$ : indice de début, $limite_2$ : indice de fin, $pas$ : l'incrément de l'indice.

Dans le cas d'une matrice de dimension 2, le premier triplet permet la sélection selon une **ligne** tandis que le second permet la selection selon une **colonne**.

Exemple:

In [None]:
M = np.array([[1,2,3,4],[4,5,6,7],[7,8,9,10]],np.float64)
print(M)
print(M[0:2,0:2])

**Q** Créer une matrice X composée de $90$ éléments, formattée en entier 32, dont chaque ligne correspond à une dizaine : 
$$
X = \begin{pmatrix}
0 & 1 & \cdots & 9 \\
10 & 11 & \cdots & 19\\
\dots & \dots & \dots & \dots \\
80 & 81 & \cdots & 89\\
\end{pmatrix}
$$

Sélectionner uniquement les nombres composés dont les dizaines sont un chiffre pair et les unités sont un chiffre impair. Représenter sous la forme d'un array de dimension 1 trié par ordre croissant.

**Q.** En utilisant la magic command "%%timeit", lisez la matrice X selon l'ordre de priorité ligne-colonne puis colonne-ligne et montrez quel sens de lecture est le plus rapide. Expliquez cette différence.

# 2. Manipulation des tableaux 

## 2.A. Opérations algébrique élément par élément : +, -, *, /

Les opérateurs algébriques binaires $\star$ sont exactement les mêmes que pour des entiers et des flottants. 

| Symbole | Expression | Interprétation |
| ------- | ---------- | -------------- |
| + | A + B | A s'additionne à B dans un nouvel emplacement mémoire |
| - | A - B | A se soustrait à B dans un nouvel emplacement mémoire |
| * | A * B | A se multiplie à B dans un nouvel emplacement mémoire |
| / | A / B | A se divise à B dans un nouvel emplacement mémoire |
| // | A // B | A se divise à B et donne la partie entière dans un nouvel emplacement mémoire |
| % | A % B | A se divise à B et donne le reste de la division euclidienne dans un nouvel emplacement mémoire |

Les opérandes A et B peuvent être : 
* des valeurs numériques;
* des tableaux numpy **conformants**;
* des expressions arithmétiques.

Lors de l'opération $A \star B$, plusieurs cas de figure peuvent se présenter : 
* les 2 opérandes $A$ et $B$ sont du même type, l'expression arithmétique résultante sera aussi de ce type,
* les 2 opérandes $A$ et $B$ sont d'un type différent, le type de l'expression arithmétique résultante sera exprimé de la manière suivante : 

$$
np.bool < np.int8 < np.int16 < np.int32 < np.float16 < np.float32 < np.float64 < np.float128 < np.complex128 < np.complex256
$$

La fonction np.resulte_type(type1, type2) permet de connaître le type résultant de l'opération arithmétique entre type1 et type2. 

**Q.** Définissez une matrice G, formattée en flottant 32, de dimension (3, 3) composée de 1.0. Définissez une matrice diagonale H composée de 2. Vous réaliserez les opérations arithmétiques de $H \star G$.

Vous pourrez le faire naïvement en utilisant une boucle mais aussi en vous appuyant éventuellement sur les fonctions *np.diag* pour extraire une diagonale et *fill_diagonal* pour remplir une diagonale.


## 2.B. Opérations relationnelles élément par élément : >, <, ==

Les opérateurs relationnels permet de comparer élément par élément les termes entre deux tableaux. Ces opérateurs sont utiles pour construire des masques (matrices booléennes permettant de selectionner uniquement certains élèments). L'opération $A \star B$ se traduit par : 

<div align="center"> Entre deux éléments de A et B d'indice, si A  est plus $\star$ que B, alors l'opération résulte en un booleen True au même indice. Sinon, le booleen est False. </div>

La matrice booléenne résultante est sauvée dans un nouvel emplacement mémoire.

| Symbole | Expression | Interprétation |
| ------- | ---------- | -------------- |
| >= | A >= B | A est strictement plus grand que B |
| > | A > B | A est plus grand ou égal que B |
| <= | A <= B | A est strictement plus petit que B |
| < | A < B | A est plus petit ou égal que B |
| == | A == B | A est égal à B |
| != | A != B | A n'est pas égal à B |

**Q.** Après avoir construit les matrices suivantes au format flottant 16 : 

$$Y = \begin{pmatrix} 1.0 & 1.1 \\ 2.0 & 3.0 \end{pmatrix} ; Z = \begin{pmatrix} 1.0 & 1.2 \\ 2.0 & 3.0 \end{pmatrix} $$ 

Testez les différentes opérations relationnelles.

## 2.C Opérations logiques élément par élément : and, or et not

Les opérateurs logiques permettent de comparer deux tableaux **conformants** booléens (c-à-d composé de np.True_/np.False_) élément par élément.

| Fonction | Symbole | Expression | Interprétation |
| -------- | ------- | ---------- | -------------- |
| np.logical_and | & |expr1 & expr2 | expr1 et expr2 |
| np.logical_or | \| |expr1 \| expr2 | expr1 ou expr2 |
| np.logical_xor | ~ |expr1 ~ expr2 | expr1 ou expr2 mais pas et |

En application numérique, on est souvent amené à créer des booléens en combinant opérateurs relationnels et logiques :

$$bA = (A > 1) ~ \& ~ (A < 2)$$

signifiant que l'on cherche tous les élément de A qui sont à la fois plus strictement supérieur à 1 et strictement inférieur à 2.

Les règles logiques sont données ci-dessous : 

| A | B | A & B | A \| B | A ~ B |
| - | - | ----- | ------ | ----- |
| True | True | True | True | False |
| False | True | False | True | True |
| True | False | False | True | True | 
| False | False | False | False | False |

Les masques permettent de créer des **masques**, employés pour sélectionner certaines parties d'un tableau lors d'opérations mathématiques.

*Remarque :* 
1. la fonction np.invert est particulièrement utile puisqu'elle permet d'obtenir la négation de A et de B ;
2. les fonctions np.logical possédent des keys arguments "where" et "out". Par défaut, out = None, where = True ce qui implique que le booléen A est réevalué.

**Q.** Vous testerez ces différentes possibilités sur deux tableaux A et B de valeurs : 

\begin{align*}
A & = ( True, False, True, False ) \\
B & = ( True, True, False, False )
\end{align*}

# 3. Manipulation des systèmes linéaires
## 3. A. Opération matricielle : le produit matriciel

Le produit matriciel est une opération courante en calcul formel. Si on considère une opération entre **A** de dimension (N, M) et **B** de dimension (M, L) où (N, M, L) sont trois entiers, on obtient chaque coeffient de la matrice produit C, de format (N, L), par : 

$$
\begin{align*}
c_{n, l} = \sum_{m=1}^M  a_{n,m} \cdot b_{m, l}
\end{align*}
$$

La méthode à utiliser pour réaliser cette opération est *np.dot*. Vous pouvez tout de fois employé l'opérateur associé : @

**Q.** Réaliser l'opération entre A et B : 
$$
A =\begin{pmatrix} 1 & 0 & 0 \\ 1 & 1 & 0 \\ 1 & 1 & 1 \end{pmatrix} ; B =\begin{pmatrix} 1 & 1 & 1 \\ 0 & 1 & 1 \\ 0 & 0 & 1 \end{pmatrix}
$$

## 3.B Opérations "optimisées"

L'objectif principal du calcul matriciel est de s'affranchir des boucles en Python qui sont en général extrêmement longues. Certaines opérations peuvent être réalisées sur une ou plusieurs dimensions d'une matrice. 

Ex : 
1. Sommation : np.sum
2. Moyenne : np.mean
3. Ecart-type : np.std

**Q.** Après avoir construit une matrice N de taille (1000, 1000) composé de 1, vous comparerez à l'aide de la magic command %%timeit le temps de calcul entre une fonction somme que vous aurez construite et la fonction somme de numpy.

## 3.C Inversion d'un système d'équations linéaires

On est souvent confrontés à des problèmes linéaires qui peuvent être résolus à l'aide d'outils matriciels : 

* Détermination des valeurs propres d'une matrice : *np.linalg.eigvals* (matrice queconque), *np.linalg.eigvalsh*, *np.linalg.eig* (matrice carrée quelconque), *np.linalg.eigh* (matrice hermitienne ou symmétrique réelle carrée)
* Inversion d'une matrice : *np.linalg.inv*
* Résolution de systèmes d'équations linéaires de la forme $A \cdot X = B$ : *np.linalg.solve*

**Q.** Soit les matrices A, B définies par : 
$$
A = \begin{pmatrix} 2 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 2 \end{pmatrix} ; \quad B = \begin{pmatrix} 2 & 0 & 0 \\ 1 & 2 & 0 \\ 1 & 1 & 2 \end{pmatrix} 
$$

Déterminez-en les valeurs propres et inversez-les. Les fonctions *np.linalg.eig* et *np.linalg.eigh* renvoient également une matrice contenant les vecteurs propres. Sous quelle forme sont-ils présentés ?

### Exercice avancé : Résolution d'un système quantique discret

Une première approche des orbitales moléculaires est la théorie de Hückel, laquelle permet de comprendre qualitativement les systèmes $\pi$ des orbitales d'un polyène linéaire. Cette méthode s'appuie sur les hypothèses suivantes  :

* l'approximation de Born-Oppenheimer
* l'approximation orbitalaire
* la combinaison linéaire d'orbitales atomiques
* la forme des intégrales pour un polyène linéaire est donnée par : 

$$
\begin{align*}
\langle i | \hat{H} | j \rangle &= \begin{cases} \alpha & \text{si }i=j \\
\beta & \text{si } |i - j| = 1 \\
0 & \text{sinon} \\
\end{cases} \\
\langle i | j \rangle &= \delta_{ij}
\end{align*}
$$

avec $\delta$ le symbôle de Kronecker.

Pour un polyène, composé de $N$ pair carbones, lesquels sont numérotés de [0, $\ldots$, N-1], on obtient le système composé des $N$ équations suivantes : 
$$
\begin{align*}
\alpha c_0 + \beta c_1 &= E c_0 \\
\forall i \in [1, N-2], \quad \beta c_{i-1} + \alpha c_i + \beta c_{i+1} &= E c_i \\
\alpha c_{N-1} + \beta c_{N-2} &= E c_{N-1}
\end{align*}
$$

À partir de ce système, vous construirez un algorithme permettant de déterminer la valeur des coefficients $c_i$ associés aux orbitales $p_i$ en posant $\alpha = 0$ et $\beta = 1$.

### Exercice avancé : Résolution d'équations différentielles linéaires

On cherche à résoudre un problème simple d'électrostatique en utilisant une *méthode des différences finies* : le condensateur dans le vide en 1D. Cette méthode consiste à définir une grille discrète, régulière et finie sur laquelle on va chercher à résoudre en chaque point la valeur du potentiel électrique.

L'opérateur contrôle la tension U et -U à chacune des bornes du condensateur dans une boîte de dimension L et une résolution $h$. A partir de l'équation de Poisson, le problème se traduit mathématiquement comme : 

$$ \Delta V (x) = 0 $$

avec pour conditions aux limites : 

$$
\begin{align*}
V(0) &= -U \\
V(L) &= U \\
\end{align*}
$$

On discrétise l'espace tel que pour tout $n \in [0, N-1]$ avec $N$ un entier positif, on a :

$$
\begin{align*}
x_n &= h \cdot n\\
\end{align*}
$$

Il en résulte que le problème physique s'écrit pour $V_{n, m} = V (x_n, y_m)$ :

$$
\begin{align*}
\forall n \in [1, N-2], \quad \Delta V_{n} &= \frac{V_{n+1} - 2 V_{n} + V_{n-1}}{h^2} = 0 \\
V_{0} &= -U \\
V_{N-1} &= U \\
\end{align*}
$$

Après avoir traduit ce système d'équations sous forme matriciel, résolvez numériquement le système. Tracez le potentiel électrostatique dans le condensateur.

## 3.D. Traitement du signal : la transformée de Fourier



La transformée de Fourier discrète est une opération courante en analyse du signal, en spectroscopie, $\ldots$ permettant de décomposer, le plus souvent, un signal temporel en signal fréquentiel. Cette opération est courante dans nombre d'objets de la vie quotidienne : oscilloscopes numériques, compression numérique, calculatrices, $\ldots$

Soit $f$ une fonction représentée par un $N$-uplet de points discret $\{ f_0, \ldots, f_{N-1} \}$ et $\hat{f}$ la transformée de Fourier discrète associée représentée par un $N$-uplet $\{ \hat{f}_0, \ldots, \hat{f}_{N-1} \}$. On a alors :


$$
\begin{align*}
\hat{f}_n = s_d \sum_{k=0}^{N-1} f_k e^{- j 2 \pi n \frac{k}{N}}
\end{align*}
$$

où $s_d$ est un facteur de normalisation.

La transformée inverse est définie comme : 

$$
\begin{align*}
f_n = s_u \sum_{k=0}^{N-1} \hat{f}_k e^{j 2 \pi n \frac{k}{N}}
\end{align*}
$$

où $s_u$ est un facteur de normalisation.

Cette opération discrète est le plus souvent programmée sous un algorithme appelé la "FFT : Fast Fourier Transform" (1965). Son principal avantage puisque l'opération a une complexité en $N \cdot \log N$. Cet algorithme est directement implémenté dans numpy par le biais de routines : 


* *np.fft.fft* (transformée d'un signal quelconque), *np.fft.ifft* (transformée inverse), *np.fft.fftfreq* (frequences associées), *np.fft.fftshift* (méthode pour centrer l'axe de fréquence sur 0)
* *np.fft.rfft* (transformée d'un signal réel), *np.fft.irfft* (transformée inverse), np.fft.rfftfreq (frequences associées)
* *np.fft.hfft* (transformée d'un signal hermitien), *np.fft.ihfft* (transformée inverse)

Une analyse de la formule de transformation discrète montre que :

1. il existe différentes conventions de normalisation. Par défaut, la convention est "backward" [$s_d = 1$, $s_u = 1/n$]. Il existe deux autres conventions courantes : 
 * [$s_d = 1/\sqrt{n}$, $s_u = 1/\sqrt{n}$] appelée convention "ortho"
 * [$s_d = 1/n$, $s_u = 1$] appelée convention "forward"
2. si le signal temporel a un pas de $\delta t$, la résolution dans l'espace de Fourier dépend de la taille $N$ de la "fenêtre" d'échantillonnage.
$$
\begin{align*}
\nu &\in \left[- \frac{1}{2 \delta t}, \frac{1}{2 \delta t} \right]\text{ si N pair} \\
&\in \left[- \frac{1}{2 \delta t} \left( 1 - \frac{1}{N} \right), \frac{1}{2 \delta t} \left( 1 - \frac{1}{N} \right) \right]\text{ si N impair}
\end{align*}
$$
3. la fenêtre dans l'espace de Fourier a une résolution en 
$$
\delta \nu = \frac{1}{\delta t N}
$$

**Q.** Nous allons simplement analyser un signal de la forme :

\begin{align*}
s(t) = \begin{cases}
0 &\text{si t < 0} \\
\cos \left( {2 \pi \frac{t}{T}} \right) \cdot  e^{- \frac{t}{\tau}} &\text{sinon}
\end{cases}
\end{align*}

Que se passe-t-il lorsque l'on réduit $dt$ à $t_{max}$ fixé ? Que se passe-t-il lorsque l'on change $t_{max}$ à $dt$ fixé ? 

### Exercice avancé : transformée de Fourier d'une Free Induction Decay

L'idée de cet exercice est de reproduire le spectre RMN H d'un alcool allylique à partir du signal de sortie du spectromètre. Le spectromètre donne en sortie un signal temporel appelé la "free induction decay" (FID) laquelle est traitée de manière numérique (logiciel Mestrenova à l'ENS Ulm). 

![Alcool allylique](img/alcool_allyl.png)

Après avoir tracé le spectre de fourier en pulsation $\omega$, expliquez l'origine physique expliquant la différence avec le spectre obtenu par le logiciel Mestrenova :

![FFT](img/FFT_alcool_allylique.png)

*Remarque :* Vous pourrez charger le signal temporel (échelle de temps : s) dans FID.npy en utilisant la routine np.load.


# 4.Méthodes utiles sur scipy

## 4.A. Résolution d'équations non-linéaires

Il existe plusieurs algorithmes permettant de chercher les racines d'une fonction $f$ : 
$$
f \left( \vec{x} \right) = 0
$$

La plupart sont dérivées de la méthode de Newton-Raphson, qui sera traitée plus en détail en projets de programmation, et nécessitent plusieurs informations essentielles : 

1. la fonction $f$ à minimiser ;
2. la valeur initiale de $\vec{x}$ à partir de laquelle on va chercher à minimiser la fonction $f$ ;
3. le seuil de tolérance en $\vec{x}$ et éventuellement en $f( \vec{x} )$ à partir duquel on considère que l'algorithme a convergé vers la valeur exacte ;
4. le nombre d'itération maximal autorisé par l'algorithme pour converger vers la solution exacte.

La méthode de Newton-Raphson est implementée dans *scipy.optimize* sous l'appellation *newton* et pourra être utilisée par la suite.

### Exercice avancé : Détermination de la concentration à l'équilibre d'un acide faible

On considère le mélange d'un acide faible : l'acide éthanoïque noté $AH (aq)$, dans l'eau. Celui-ci est introduit en concentration $10^{-6} mol \cdot L^{-1}$. Il existe deux équilibres acide-basiques détemrinant la quantité de proton en solution :

$$
\begin{align} HA (aq) &= H^+ (aq) + A^-(aq) & K_A\\ 
H_2O(l) &= H^+(aq) + HO^- (aq) & K_e\end{align}
$$

Ce système admet 4 degrés de liberté : $[H^+]$, $[HO^-]$, $[AH]$, $[A^-]$. A l'équilibre, le système admet 4 équations non linéaires décrivant l'équilibre : 2 équations de conservation et 2 lois d'action des masses.

Après avoir déterminer la composition du système par la méthode de la réaction prépondérante, établissez un polynôme de degré 3 $P_3([[H^+])$ vous donnant la composition exacte du système : 

$$
\begin{align*}
P_3\left( [H^+]_{eq} \right) = 0
\end{align*}
$$

*Données :* \
$pK_A (CH_3COOH/CH_3COO^-, 25 ^\circ C) = 4.8$

## 4.B Régression polynomiales

Bien que scipy soit le package présentant la majorité des fonctionnalités pour réaliser des régressions (cf ci-après), numpy permet de réaliser aisément des régressions polynomiales à une dimension.

Deux fonctions sont particulières utiles : 
* np.polyfit : permet la réalisation d'un fit sur un polynôme de votre choix, 
* np.poly1d : permet de créer une fonction polynomiale à partir d'un fit de votre choix.

Par exemple : 

### Exercice avancé : Détermination de la stoechiométrie d'un complexe

Lors d'un TP, des expérimentateurs cherchent à déterminer la stoechiométrie du complexe $\left[ Fe(III)SCN_n \right]^{(3-n) +}$ en réalisant l'équilibre : 

$$ Fe^{3+} (aq) + n ~ SCN^- (aq) = \left[ Fe(III)SCN_n \right]^{(3-n) +} $$

Seul complexe formé absorbe dans le visible.

Une solution, notée A, de chlorure de fer (III) est préparée à la concentration de 2 mmol/L en milieu acide. Une solution, notée B, de thiocyanate de potassium est préparée à la concentration de 2 mmol/L.

![title](img/A_fy.png)

Les solutions A et B sont mélangées en différents ratios volumiques comme suit et leurs absorbances mesurées à $\lambda_{max} = 457 nm$ : 

| Solution $n^\circ$ | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| ------------------ | - | - | - | - | - | - | - | - | - | -- |
| $V_A$ $[mL]$ | 4.0 | 4.0 | 4.0 | 4.0 | 4.0 | 0.5 | 1.0 | 1.5 | 2.0 | 2.5 |
| $V_B$ $[mL]$ | 0.5 | 1.0 | 1.5 | 2.0 | 2.5 | 4.0 | 4.0 | 4.0 | 4.0 | 4.0 |
| $A$ $[\emptyset]$ | 0.277 | 0.453 | 0.553 | 0.624 | 0.673 | 0.281 | 0.460 | 0.568 | 0.627 | 0.672 |

Un développement sur lequel nous ne nous attarderons pas a montré que la stœchiométrie $n$ est donnée au maximum d'absorbance de la fonction A = f(y) avec y défini comme : 

$$ y = \frac{V_A}{V_{tot}} $$

En utilisant un modèle polynomial approprié, déterminer la stœchiométrie du complexe dans ces conditions opératoires.

## 4.C. Régression non-linéaire

Scipy offre plusieurs outils permettant de réaliser des minimisations de régressions non-linéaires. Parmis ces méthodes, il existe deux types d'approche : les méthodes utilisant des gradients/hessiens et celles utilisant une approche Monte-Carlo.

On va se focaliser sur les premières méthodes qui sont proches des méthodes pour trouver les solutions d'une fonction. Ces regressions sont composées de trois choses : 
1. **un modèle** : il s'agit d'une fonction que l'on va utiliser pour modéliser un set de données $(x_i, y_i)$ ;
2. **une métrique** : il s'agit de la norme que l'on va utiliser pour trouver la "distance minimale" entre un set de donnée et le modèle. En général, on cherche à minimiser l'écart quadratique moyen entre les valeurs et le modèle, le tout de manière itérative. Si on considère $\vec{p}$ un vecteur contenant les paramètres à minimiser, la metrique $S$ associée au modèle $f$ et le set de données $(x_i, y_i)$ tel que :

$$
S(\vec{p}) = \frac{1}{N} \sum_{i=1}^{N} \left( y_i - f(x_i \lvert \vec{p}) \right)^2
$$

3. **un prior** : il s'agit du set initial de valeur $\vec{p}_0$ à partir duquel on va minimiser la métrique $S$

Une fonctionnalité particulièrement utile est *curve_fit* contenue dans *scipy.optimize* permettant de réaliser ces méthodes. Nous conseillons l'utilisation de l'algorithme de Levenberg-Marquardt (méthode du gradient) pour l'application suivante.

### Exercice avancé : dynamique de l'eau

Une application courante en thermodynamique statistique sont les fonctions d'autocorrélation temporelle. Leur sens physique est simple : si je considère une grandeur physique **A**  à un instant $t_0$, combien de temps $t_0 + t$ est nécessaire pour que cette grandeur décorréle. Pour cela, on note : 

$$ 
C(t) = \langle A(t_0) \cdot A(t_0 + t) \rangle_{t_0}$$

La dynamique d'un solvant est décrite par une fonction de corrélation temporelle caractérisant les temps de réorientation du solvant. La dynamique de réorientation (diffusion rotationelle) de l'eau est bien connue et caractérérisée par trois mouvements caractéristiques : 
- la *libration* : des mouvements rapides, avec des échelles de temps typique subpicosecondes caractérisant la rotation rapide du proton autour de sa position d'équilibre ;
- le *saut* : des mouvements plus lents associés à un saut angulaire. Une molécule d'eau passe d'un partenaire **A** à un partenaire **B** par une rupture angulaire de liaison hydrogène de l'ordre de 60$^\circ$ ;
- la *diffusion du réseau* : des mouvements extrêmement lent associé à la diffusion rotationelle d'une molécule et de ses partenaires sans rupture de liaison hydrogène.

![title](img/H2O-Dynamic.png)

Pour décrire ces processus, on utilise la fonction de corrélation temporelle du polynôme de Legendre de second ordre de l'angle entre le vecteur unitaire associé à la direction et au sens de la liaison O-H à un instant $t_0$ avec ce même vecteur à un instant $t_0 + t$. On note : 

$$
C_2 (t) = \langle P_2 \left[ \vec{u}_{OH} (t_0) \cdot \vec{u}_{OH} (t_0 + t) \right] \rangle_{t_0}
$$

En vous appuyant sur un modèle triexponentiel de la forme : 

$$
C_2 (t) = \alpha_0 e^\frac{-t}{\tau_0} +  \alpha_1 e^\frac{-t}{\tau_1} + \alpha_2 e^\frac{-t}{\tau_2}
$$

où $\tau_0 < \tau_1 < \tau_2$ et les populations sont contraintes par la relation $\alpha_0 + \alpha_1 + \alpha_2 = 1$.

Réalisez la régression des données de simulation enregistrées dans le fichier *TCF.npy* (colonne 0 : temps en fs, colonne 1 : C2) à l'aide de ce modèle. Validez le choix du modèle et donnez la valeur des différents paramètres ainsi que leurs incertitudes associées.

Sachant que le temps moyen associé à la réorientation de l'eau est donnée par :

$$\langle \tau_2 \rangle = \alpha_0 \tau_0 + \alpha_1 \tau_1 + \alpha_2 \tau_2$$

Comparez le résultat obtenu avec les mesures de RMN qui ont donnée un temps caractéristique moyen $\langle \tau_2 \rangle$ de l'ordre de $1.7-2.6 ~ ps$.

*Données :* Laage D. & al, Annu. Rev. Phys. Chem. 2011. 62:395-41 

# <div align="center"> Félicitations, le TD est terminé !  </div>