# Comportamento da distribuição gaussiana segundo os seus parâmetros

## O que vamos fazer?
- Implementar a função de densidade de probabilidade da distribuição gaussiana/normal multivariável. 
- Representar graficamente.
- Comprovar como varia o seu comportamento modificando os seus parâmetros de média e covariância.

A distribuição normal ou gaussiana é utilizada no ML em modelos como SVM de núcleo gaussiano e deteção de anomalias, que veremos numa sessão posterior.

A distribuição pode ser univariável, o que no ML iria representar uma característica única, ou multivariável, que iremos utilizar neste exercício. 

Esta distribuição é definida por 2 parâmetros:
- A média *mu* das variáveis, um vetor de tamanho *n*.
- A matriz de covariância *Sigma*, um vetor 2D de tamanho *n x n*.

In [None]:
import numpy as np
from scipy.stats import multivariate_normal
from matplotlib import pyplot as plt
from matplotlib import cm
from mpl_toolkits.mplot3d import Axes3D

## Implementar a função de densidade de probabilidade da distribuição gaussiana

Essa função ou *PDF* pode ser implementada com o método de SciPy [scipy.stats.multivariate_normal](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.multivariate_normal.html):

In [None]:
# TODO: Definir uns arrays de mu e sigma para 2 variáveis, características ou dimensões

# Definir uma média em array 1D de quaisquer 2 valores
mu = [...]

# Definir um Sigma em array 2D de quaisquer 2x2 valores
sigma = [...]

## Representá-la graficamente num intervalo de valores possíveis

Para isso, criar um espaço linear com Numpy de 100 valores no intervalo [-5, 5], p. ex.:

In [None]:
# TODO: Calcular o PDF sobre um espaço linear 2D

# Criar um meshgrid com esse espaço linear: 100 valores entre [-5, 5]

x1 = np.linspace([...])
x2 = np.linspace([...])
x1, x2 = np.meshgrid(x1, x2)

xy = np.empty(x1.shape + (2,)) 
xy[:,:,0] = x1
xy[:,:,1] = x2

# Calcular o PDF sobre essa meshgrid xy, com a mu e sigma atribuídas
z = multivariate_normal([...])

In [None]:
# TODO: Representar o PDF sobre esse espaço
fig = plt.figure(1)

ax = fig.gca(projection='3d')
ax.plot_surface(x1, x2, z, rstride=3, cstride=3, linewidth=1, antialiased=True, cmap=cm.viridis) 

cset = ax.contour(x1, x2, z, zdir='z', offset=-0.5, cmap=cm.viridis)

ax.set_zlim(-0,15, 0,2)
ax.set_zticks(np.linspace(0, 0,2, 5))
ax.view_init(27, -21)

plt.show()

*Bónus*: *apetece-lhe experimentar?* Pode modificar os parâmetros da representação anterior para comprovar como afeta ao gráfico 3D de Matplotlib.

## Comprovar como varia o seu comportamento modificando os seus parâmetros

Representar o PDF da distribuição gaussiana em 3D, utilizando os seus 2 parâmetros, *mu* e *Sigma*.

*Porque não verifica o que acontece quando se muda de mu e Sigma?*
*Como varia o gráfico quando se alteram os 2 valores de mu?* 
*Como varia quando se alteram os 4 valores de Sigma?*

Responda a estas perguntas com as suas conclusões:

Variando mu...

Variando Sigma...