# Polynômes orthogonaux univariés et le problème des moments


## Résumé

Dans cette page, nous présentons les liens entre la construction de polynômes orthogonaux univariés et le problème des moments de Hamburger.

## Références

OpenTURNS :
* http://openturns.github.io/openturns/master/theory/meta_modeling/orthogonal_polynomials.html
* http://openturns.github.io/openturns/master/user_manual/_generated/openturns.HermiteFactory.html
* http://openturns.github.io/openturns/master/user_manual/_generated/openturns.AdaptiveStieltjesAlgorithm.html

Livres sur le chaos polynomial :
* Orthogonal Polynomials: Computation and Approximation, 2004, Walter Gautschi, Oxford Science Publications, Numerical Mathematics and Scientific Computation
* Chihara, Theodore Seio (1978). An Introduction to Orthogonal Polynomials. Dover Publications

Livres et article sur la loi log-normale :
* Rick Durrett, Probability: Theory and Examples, 4th edition, by Cambridge University Press (2010)
* C.C. Heyde (1963) On a property of the lognormal distribution. J. Royal. Stat. Soc. B. 29, 392–393
* Asmussen, Søren & Goffard, Pierre-Olivier & Laub, Patrick. (2016). Orthonormal polynomial expansions and lognormal sum densities.
* On the Convergence of Generalized Polynomial Chaos Expansions, Oliver G. Ernst, Antje Mugler, Hans-Jörg Starkloff and Elisabeth Ullmann, ESAIM: M2AN 46 (2012) 317–339
* The logarithmic skew-normal distributions are moment-indeterminate, Gwo Dong Lin, Jordan Stoyanov, Journal of Applied Probability 46(03):909-916 · September 2009
* An introduction to probability theory and its applications. W. Feller, Volume II. 2nd Edition. 1971. Chapitre VII.3. Theorem 2.
* Ernst 0.G. & al, "On the Convergence of Generalized Polynomial Chaos Expansions", ESAIM : Mathematical Modelling and Numerical Analysis, vol.46, pp317-339, 2011

## Note 

Le contre-exemple de (Heyde, 1963) est indiqué dans (Durett, 2010) est également mentionné dans (Feller, 1971).

## Introduction

Let $I$ be an interval in $\mathbb{R}$. A weight
function $w$ is a nonnegative continuous integrable function of $x\in I$.

**Definition : Weight function**

Let $I$ be an interval in $\mathbb{R}$. 
A weight function $w$ is a nonnegative continuous integrable 
function of $x\in I$. 

**Example**

The weight function for Hermite polynomials is
\begin{eqnarray}
w(x)=\exp\left(-\frac{x^2}{2}\right),
\end{eqnarray}
for $x\in\mathbb{R}$. 

**Definition: Weighted $L^2$ space**

Let $L^2_w(I)$ be the set of 
functions $g$ which are square integrable with respect to the weight 
function $w$, i.e. such that the integral 
\begin{eqnarray}
\|g\|^2 = \int_I g(x)^2 w(x) dx
\end{eqnarray}
is finite. 
In this case, the norm of $g$ is $\|g\|$.

**Définition**

On considère le produit scalaire :
$$
(g_1,g_2) = \int_{\mathbb{R}} g_1(x) g_2(x) w(x) dx,
$$
pour toutes fonctions $g_1,g_2$ de carré intégrable. 



## Polynôme univariés orthogonaux

Soit $X\in\mathbb{R}$ une variable aléatoire univariée. 

**Definition: Distribution from a weight**

The function:
\begin{eqnarray}
f(x) = \frac{w(x)}{\int_I w(x) dx},
\end{eqnarray}
for any $x\in I$, is a distribution function.

**Example: Distribution function for Hermite polynomials**

The distribution function for Hermite polynomials is
\begin{eqnarray*}
f(x)=\frac{1}{\sqrt{2 \pi}} \exp\left(-\frac{x^2}{2}\right),
\end{eqnarray*}
for $x\in\mathbb{R}$. 

**Definition: Polynomials**

We denote by $\mathbb{P}$ the set of real polynomials and $\mathbb{P}_n$ the set of real polynomials with 
degree $n$.
If the leading term of $\pi\in \mathbb{P}_n$ is equal to 1, then we say that the polynomial 
$\pi$ is $monic$. 

Soit $\left\{\pi_j\right\}_{j\geq 0}$ une famille de polynômes réels univariés.

## Produit scalaire et moments des distributions 

Les moments sont:
$$
\mu_n = \int_{\mathbb{R}} x^n w(x) dx,
$$
pour $n\geq 0$. 
Si la variable aléatoire est associée à une densité de probabilité, alors ses moments sont:
$$
m_n = E(X^n) = \int_{\mathbb{R}} x^n f(x) dx,
$$
pour $n\geq 0$. 

Faisons l'hypothèse que les moments $\mu_n$ sont finis pour tout $n\geq 0$.

Il est intéressant de pouvoir garantir que le produit scalaire est défini positif, car c'est un ingrédient essentiel pour de nombreux calculs associés aux polynômes orthogonaux. 

**Définition: Produit scalaire défini positif**

On dit que le produit scalaire est défini positif sur $\mathbb{P}$ si 
$$
\|\pi\|> 0
$$
pour tout polynôme $\pi\in\mathbb{P}$ non nul. 
On dit que le produit scalaire est défini positif sur $\mathbb{P}_n$ si 
$\|\pi\|> 0$ pour tout polynôme $\pi\in\mathbb{P}_n$ non nul. 

Il s'avère que l'on peut relier la propriété de positivité du produit scalaire aux moments de 

**Définition: Matrice de Hankel des moments**

Soit $M_n$ la matrice de Hankel des moments:
$$
M_n = 
\begin{pmatrix}
\mu_0 & \mu_1 & \cdots & \mu_{n-1} \\
\mu_1 & \mu_2 & \cdots & \mu_{n} \\
\vdots & \vdots &  & \vdots \\
\mu_{n-1} & \mu_n & \cdots & \mu_{2n-2}\
\end{pmatrix},
$$
pour $n\geq 1$. 
Soit $\Delta_n$ le déterminant de la matrice de Hankel des moments :
$$
\Delta_n = \det ( M_n ),
$$
pour $n\geq 1$. 

**Théorème: Produit scalaire défini positif**

Le produit scalaire est défini positif sur $\mathbb{P}$ si et seulement si 
$$
\Delta_n > 0,
$$
pour $n\geq 1$. 
Le produit scalaire est défini positif sur $\mathbb{P}_n$ si et seulement si 
$\Delta_n > 0$, pour $n= 1,...,n+1$. 

**Définition: Fonction génératrice des moments**

Pour une variable aléatoire réelle $X\in\mathbb{R}$, la fonction génératrice des moments est :
$$
M(t) = E[\exp(tX)]
$$
pour tout $t\in\mathbb{R}$.

On peut démontrer que la valeur en $t=0$ de la n-ième dérivée de $M$ est égale au n-ième moment de $X$ :
$$
M^{(n)}(0) = m_n,
$$
pour $n\geq 0$.

Comme nous allons le voir, certaines distributions posent une difficulté de ce point de vue dans le cas où la liste des moments ne détermine pas la distribution de manière unique.

## Le problème des moments de Hamburger

Etant donné la liste des moments $m_n$, pour $n\geq 0$, le problème des moments de Hamburger consiste à déterminer la densité de probabilité $f$ associée.

On peut démontrer que le problème des moments de Hamburger possède une solution si les déterminants de la matrice de Hankel des moments sont positifs, i.e. si :
$$
\Delta_n \geq 0,
$$
pour $n\geq 1$. 

## La loi log-normale

Soient $\mu\in\mathbb{R}$ et $\sigma>0$. 
La densité de probabilité de la loi log-normale est :
$$
f(x) = \frac{1}{x\sigma\sqrt{2\pi}} \exp\left(-\frac{(\ln(x) - \mu)^2}{2\sigma^2}\right) 
$$
pour tout $x> 0$.

Les moments de la loi log-normale sont :
$$
m_n = E(X^n) = \exp\left(n\mu + \frac{n^2\sigma^2}{2}\right)
$$
pour tout $n\geq 0$.

La fonction génératrice des moments de la loi log-normale n'existe pas. 

Etant donné une suite de moments $\{m_n\}_{n\geq 0}$, il existe une infinité de distributions qui possèdent les mêmes moments que la loi log-normale : la loi log-normale n'est pas déterminée de manière unique par ses moments.

Le contre-exemple suivant est proposé par (Heyde, 1963), chapitre 3 "Central limit theorems", section "The Moment Problem".

Considérons la loi log-normale de moyenne $\mu=0$ et d'écart-type $\sigma=1$ :
$$
f_0(x) = \frac{1}{x\sqrt{2\pi}} \exp\left(-\frac{\ln(x)^2}{2}\right) 
$$
pour tout $x> 0$.
Pour tout $-1\leq a\leq 1$, soit $f_a$ la fonction définie par :
$$
f_a(x) = f_0(x) (1+a\sin(2\pi\log(x)))
$$
pour tout $x> 0$.
Durrett démontre que les densités $f_0$ et $f_a$ ont les mêmes moments pour tout $n\geq 0$. De plus, Durrett fournit deux contre-exemples supplémentaires ayant cette propriété.

On peut construire une famille de polynômes orthogonaux pour la loi log-normale. Toutefois, la projection d'une fonction sur l'espace vectoriel engendré par ces polynômes peut être significativement différente de la fonction. 

Asmussen (2016) et ses co-auteurs (Proposition 1.1, page 6) démontrent que l'espace vectoriel engendré par les polynômes orthogonaux associés à la loi log-normale ne sont pas denses dans $L^2$. La figure 1.2 page 7 présente un exemple de non convergence. La base polynomiale est créée en fonction de la loi log-normale $\mathcal{LN}(0, 1.22^2)$. Les auteurs cherchent à décomposer la densité de probabilité cible $\mathcal{LN}(0, 1.50^2)$. Ils observent que l'approximation polynomiale ne semble pas converger vers la densité de probabilité cible malgré un degré polynomial de degré croissant jusqu'à 40. Les auteurs indiquent que les premiers moments de la densité cible et de la densité approchée sont identifiques. 