
# Uma breve introdução ao Machine Learning
## Problemas propostos #02

- **Dia 2**: [Computação Tensorial]()

---

## Problema 1 

**a)** Use `np.einsum` para avaliar a expressão do tensor $g^{i\ell}\Gamma_{ki}^{m}x^{k}$ que surge em [derivadas contravariantes na Relatividade Geral](https://en.wikipedia.org/wiki/Christoffel_symbols#Covariant_derivatives_of_tensors). Observe que estamos usando a convenção GR de que índices repetidos $(k,\ell)$ são somados.

In [None]:
def tensor_expr(g, Gamma, x, D = 4):
    """Avalie a expressão tensorial acima.
    
    Parâmetros
    ----------
    g : array
        Numpy array de shape (D, D)
    Gamma : array
        Numpy array de shape (D, D, D)
    x : array
        Numpy array de shape (D,)
    D : int
       Dimensão dos tensores de entrada.
        
    Retorna
    -------
    array
        Numpy array de shape (D, D) que avalia a expressão tensorial.
    """
    assert g.shape == (D, D)
    assert Gamma.shape == (D, D, D)
    assert x.shape == (D,)
    
    # SEU CÓDIGO AQUI
    
    raise NotImplementedError()

**b)** Submeta seu código a uma série de testes (os chamados *sanity tests*):

In [None]:
g = np.arange(4 ** 2).reshape(4, 4)
Gamma = np.arange(4 ** 3).reshape(4, 4, 4)
x = np.arange(4)
y = tensor_expr(g, Gamma, x)

assert np.array_equal(
    y,
    [[ 1680,  3984,  6288,  8592], [ 1940,  4628,  7316, 10004],
     [ 2200,  5272,  8344, 11416], [ 2460,  5916,  9372, 12828]]

---

## Problema 2

**a)** Use `np.histogram` para calcular a [densidade de probabilidade](https://en.wikipedia.org/wiki/Probability_density_function) de que os valores em uma matriz de dados de entrada arbitrária estejam dentro dos compartimentos especificados pelo usuário. 

- **Dica**: `np.histogram` faz todo o trabalho para você com os argumentos corretos.

In [None]:
def estimate_probability_density(data, bins):
    """Estima a densidade de probabilidade de dados arbitrários.
    
    Parâmetros
    ----------
    data : array
        1D numpy array de valores aleatórios.
    bins : array
        1D numpy array of N+1 arestas de bin a serem usadas. 
        Devem estar aumentando.

    Retorna
    -------
    array
        1D numpy array de N densidades de probabilidade.
    """
    assert np.all(np.diff(bins) > 0)

    # SEU CÓDIGO AQUI
    
    raise NotImplementedError()

**b)** Submeta seu código aos *sanity tests* abaixo.

In [None]:
generator = np.random.RandomState(seed=123)
data = generator.uniform(size=100)
bins = np.linspace(0., 1., 11)
rho = estimate_probability_density(data, bins)

assert np.allclose(rho, [ 0.6,  0.8,  0.7,  1.7,  1.1,  1.3,  1.6,  0.9,  0.8,  0.5])

###################################

data = generator.uniform(size=1000)
bins = np.linspace(0., 1., 101)
rho = estimate_probability_density(data, bins)
dx = bins[1] - bins[0]

assert np.allclose(dx * rho.sum(), 1.)

---

## Problema 3

Defina uma função para calcular a [entropia](https://en.wikipedia.org/wiki/Entropy_estimation) $H(\rho)$ de uma densidade de probabilidade categorizada, definida como:

In [None]:
def binned_entropy(rho, bins):
    """Calcule a entropia binária.
    
    Parameters
    ----------
    rho : array
        1D numpy array de densidades, e.g., calculado pela função anterior.
    bins : array
        1D numpy array of N+1 arestas de bin a serem usadas. 
        Devem estar aumentando.

    Retorna
    -------
    float
        Value of the binned entropy.
    """
    assert np.all(np.diff(bins) > 0)
    
    # SEU CÓDIGO AQUI
    
    raise NotImplementedError()

**b)** Submeta seu código aos testes abaixo.

In [None]:
generator = np.random.RandomState(seed=123)
data1 = generator.uniform(size=10000)
data2 = generator.uniform(size=10000) ** 4
bins = np.linspace(0., 1., 11)
rho1 = estimate_probability_density(data1, bins)
rho2 = estimate_probability_density(data2, bins)
H1 = binned_entropy(rho1, bins)
H2 = binned_entropy(rho2, bins)

assert np.allclose(H1, -0.000801544)
assert np.allclose(H2, -0.699349908)

---

## Problema 4

**a)** A distribuição normal (também conhecida como gaussiana) é uma das densidades de probabilidade fundamentais que encontraremos com frequência. Implemente a função abaixo usando `np.random.multivariate_normal` para gerar amostras aleatórias de uma distribuição normal multidimensional arbitrária, para uma semente aleatória especificada.

In [None]:
def generate_normal(mu, C, n, seed = 123):
    """Gere amostras aleatórias de uma distribuição normal.
    
    Parâmetros
    ----------
    mu : array
        1D array de valores médios de comprimento N.
    C : array
        2D array de covariâncias de forma (N, N). Deve ser uma matriz positiva-definida.
    n : int
        Número de amostras aleatórias a serem geradas.
    seed : int
        Semente de número aleatório a ser usada.
        
    Retorna
    -------
    array
        2D array de shape (n, N) onde cada linha é uma amostra aleatória N-dimensional.
    """
    assert len(mu.shape) == 1, 'mu deve ser 1D.'
    assert C.shape == (len(mu), len(mu)), 'C deve ser N x N.'
    assert np.all(np.linalg.eigvals(C) > 0), 'C deve ser definida positiva.
    
    # SEU CÓDIGO AQUI
    
    raise NotImplementedError()

**b)** Submeta seu código aos *sanity tests* abaixo.

In [None]:
mu = np.array([-1., 0., +1.])
C = np.identity(3)
C[0, 1] = C[1, 0] = -0.9
Xa = generate_normal(mu, C, n=500, seed=1)
Xb = generate_normal(mu, C, n=500, seed=1)
Xc = generate_normal(mu, C, n=500, seed=2)

assert np.array_equal(Xa, Xb)
assert not np.array_equal(Xb, Xc)

###################################

X = generate_normal(mu, C, n=2000, seed=3)

assert np.allclose(np.mean(X, axis=0), mu, rtol=0.001, atol=0.1)
assert np.allclose(np.cov(X, rowvar=False), C, rtol=0.001, 

**c)** Escreva uma função para visualizar um conjunto de dados 3D gerado.

In [None]:
def visualize_3d():
    
    # SEU CÓDIGO AQUI
    
visualize_3d()

**d)** Leia sobre [correlação e covariância](https://en.wikipedia.org/wiki/Covariance_and_correlation) e, em seguida, implemente a função abaixo para criar uma matriz de covariância 2x2 com valores de $\sigma_{x}$ e $\sigma_{y}$ o coeficiente de correlação $\rho$:

In [None]:
def create_2d_covariance(sigma_x, sigma_y, rho):
    """Crie e retorne a matriz de covariância 2x2 especificada pelos argumentos de entrada.
    """
    assert (sigma_x > 0) and (sigma_y > 0), 'sigmas deve ser > 0.'
    
    # SEU CÓDIGO AQUI
    
    raise NotImplementedError()

**e)** Efetue os seguintes testes de validação para a função do item anterior:

In [None]:
assert np.array_equal(create_2d_covariance(1., 1., 0.0), [[1., 0.], [0., 1.]])
assert np.array_equal(create_2d_covariance(2., 1., 0.0), [[4., 0.], [0., 1.]])
assert np.array_equal(create_2d_covariance(2., 1., 0.5), [[4., 1.], [1., 1.]])
assert np.array_equal(create_2d_covariance(2., 1., -0.5), [[4., -1.], [-1., 1.]])

**e)** Execute a seguinte célula que usa suas funções `create_2d_covariance` e `generate_normal` para comparar as distribuições normais 2D com $\rho=0$ (azul), $\rho=+0.9$ (vermelho) e $\rho=-0.9$ (verde).

- Você pode ignorar o inofensivo `FutureWarning`.

In [None]:
def compare_rhos():
    mu = np.zeros(2)
    sigma_x, sigma_y = 2., 1.
    
    # SEU CÓDIGO AQUI
        
    plt.xlim(-4, +4)
    plt.ylim(-2, +2)
        
compare_rhos()

---

## Problema 5

**a)** Implemente a seguinte camada de rede neural usando `PyTorch`:

$$\textbf{x}_{\text{out}}=\tanh{(W\textbf{x}_{\text{in}}+b)},$$

Observe que essa camada usa a ativação $\tanh$ (em termos de elemento) em vez da *ativação relu* do exemplo em classe.

In [None]:
import torch

def xout(W, xin, b):
    
    # SEU CÓDIGO AQUI
    
    raise NotImplementedError()

**b)** Efetue os seguintes testes de validação para o `PyTorch`:

In [None]:
W = torch.tensor([[1., 2., 3.], [2., -1., 0.]], requires_grad=True)
xin = torch.tensor([0.5, -0.5, 1])
b = torch.tensor([-1., 1.])

assert torch.allclose(xout(W, xin, b), torch.tensor([0.9051, 0.9866]), rtol=1e-4)

---