$ \DeclareMathOperator{\vol}{vol} $
$ \newcommand{\mbf}{\mathbf} $

# Integração de Monte Carlo

## $ \S 1 $ Introdução

Nas regras do trapézio e de Simpson, escolhemos $ N + 1 $ pontos $ x_0, x_1, \dots, x_N $ igualmente espaçados no intervalo de integração $ [a, b] $ como membros da "amostra" tomada para se estimar a integral de uma função $ f $.

Estes métodos são chamados de **determinísticos** porque o resultado fornecido é completamente determinado pelos parâmetros: uma vez fixados o número $ N + 1 $ de pontos e a função contínua $ f \colon [a, b] \to \mathbb R $, cada aplicação do método resulta no mesmo valor. Além disto, é possível determinar uma cota superior para o erro cometido em função de $ N $.

Em contraste, o método da *integração de Monte Carlo* que estudaremos neste caderno é **probabilístico**. A idéia  é escolher os pontos onde $ f $ será avaliada *aleatoriamente* dentro do intervalo $ [a, b] $. Desta forma cada aplicação fornece uma aproximação diferente, mesmo mantendo-se $ N $ fixo. Ademais, dado $ \varepsilon > 0 $, não podemos garantir que o erro envolvido na aproximação seja menor que $ \varepsilon $ para  $ N $ suficientemente grande; podemos apenas estimar a *probabilidade* que isto aconteça como uma função de $ N $.

Na verdade a integração de Monte Carlo é um caso particular de um método muito mais geral e extremamente útil, amplamente empregado em Física, Química, Engenharia e outras áreas, o *método de Monte Carlo*, que foi discutido no caderno anterior.

## $ \S 2 $ Aplicação a integrais de funções de uma variável

Recorde do curso de Cálculo 1 que a integral
$$
\int_a^b f(x)\,dx
$$
é aproximada por *somas de Riemann*
$$
\sum_{i=1}^N f(\xi_i) \Delta_i
$$
onde
$$
[x_0, x_1],\ [x_1, x_2],\ \dots,\ [x_{N-1}, x_{N}]
$$
formam uma partição de $ [a, b] $,
$$
\Delta_i = x_i - x_{i-1}
$$
e os pontos
$$
\xi_i \in [x_{i-1}, x_i] \qquad (i = 1, \dots, N)
$$
podem ser escolhidos arbitrariamente. De fato, a integral é *definida* como o limite de somas deste tipo conforme o maior dos comprimentos $ \Delta_i $ vai a zero.

Considere o caso especial em que $ \Delta_i = \frac{b-a}{N} $ para cada $ i $, ou seja, os pontos são
$$
x_i = a +  i\,\frac{b-a}{N}
$$
e estão igualmente espaçados. Então a soma de Riemann se reduz a 
$$
\frac{b-a}{N}\sum_{i=1}^N f(\xi_i) = (b - a)\bigg(\frac{1}{N}\sum_{i=1}^Nf(\xi_i)\bigg)\,.
$$    
O último termo entre parênteses aqui pode ser visto como a média aritmética de uma amostra de $ N $ valores de $ f $ no intervalo, sujeitos à condição que o $ i $-ésimo ponto deve pertencer ao $ i $-ésimo intervalo da partição.

Suponha agora que os pontos $ \xi_i $ ($ i = 1, \dots, N $) sejam escolhidos *aleatoriamente* dentro de $ [a, b] $, sem qualquer restrição (ou seja, não imporemos que $ \xi_i $ pertença a $ [x_{i-1}, x_i] $). A Lei dos Grandes Números ainda garante que
$$
(b-a) \bigg(\frac{1}{N}\sum_{i=1}^Nf(\xi_i)\bigg) \longrightarrow \int_a^b f(x)\,dx \qquad \text{conforme }N \to \infty.
$$
A **integração de Monte Carlo** consiste da aproximação da integral à direita pelo valor à esquerda.

## $ \S 3 $ Implementação da integração de Monte Carlo em 1 dimensão

In [2]:
def int_monte_carlo(f, a, b, N):
    """
    Calcula a integral de uma função f : [a, b] -> R 
    usando o método de Monte Carlo com N ensaios.
    """
    import numpy as np
    
    amostra = []
    for _ in range(N):
        x = np.random.uniform(a, b)
        amostra.append(f(x))
    amostra = np.array(amostra)
    return (b - a) * np.mean(amostra)

**Problema 1:** Recorde que
$$
\int_0^1 \frac{1}{1+x^2}\,dx = \arctan(1) - \arctan(0)  = \frac{\pi}{4}\,.
$$
Use a integração de Monte Carlo para obter uma estimativa para $ \pi $.

*Solução:*

In [3]:
from numpy import pi
f = lambda x: 1 / (1 + x**2)
N = 10**5
estimativa = 4 * int_monte_carlo(f, 0, 1, N)
print(f"Valor de pi fornecido pelo NumPy:             {pi}")
print(f"Estimativa obtida pelo método de Monte Carlo: {estimativa}")
print("Cada vez que executamos a célula, obtemos um resultado diferente!")

Valor de pi fornecido pelo NumPy:             3.141592653589793
Estimativa obtida pelo método de Monte Carlo: 3.1435797646906023
Cada vez que executamos a célula, obtemos um resultado diferente!


## $ \S 4 $ Integração de Monte Carlo em qualquer dimensão

Para o cálculo de integrais definidas de funções de apenas uma variável, os métodos determinísticos como a regra de Simpson devem ser preferidos em relação à integração de Monte Carlo, por fornecerem resultados mais precisos com uso bem menor de recursos computacionais.

Contudo, em dimensões altas os métodos determinísticos não funcionam tão bem. A primeira dificuldade é que o número de operações necessárias aumenta rapidamente com a dimensão. Grosso modo, se para garantir uma determinada precisão eram necessárias $ N $ avaliações em dimensão $ 1 $, em dimensão $ 3 $ serão necessárias $ N^3 $. Outro obstáculo é que, enquanto em dimensão $ 1 $ quase sempre integramos sobre um intervalo, em dimensões $ \ge 2 $ a fronteira da região onde será calculada a integral pode ser muito mais complicada.

Seja
$$
f \colon D \to \mathbb R 
$$
uma função contínua de $ m $ variáveis $ x_1, \dots, x_m $ definida num domínio $ D $ qualquer de $ \mathbb R^m $, e seja $ R \subset D $ uma região regular o suficiente para que o seu volume faça sentido e possa ser calculado. Escolha aleatoriamente $ N $ pontos $ \boldsymbol{\xi_1}, \dots, \boldsymbol{\xi_N} $ dentro de $ R $. Pode-se mostrar que
$$
\vol(R)\,\bigg(\frac{1}{N}\sum_{i=1}^Nf(\boldsymbol{\xi_i})\bigg) \longrightarrow \int \int \cdots \int_R f(x_1,\,x_2,\cdots,x_m)\,\,dx_1\,dx_{2}\,\cdots dx_m \qquad \text{conforme }N \to \infty.
$$
O **método de integração de Monte Carlo** consiste da aproximação da integral múltipla à direita pela quantidade à esquerda.

## $ \S 5 $ Implementação da integração de Monte Carlo em qualquer dimensão

In [4]:
def integracao_monte_carlo(f, dimensao, volume, N, escolhe_ponto):
    """
    Aproxima a integral de uma função f sobre uma região R
    através do método de Monte Carlo.
    Entradas:
        * Uma função real f de uma ou mais variáveis.
        * A dimensão do domínio de f (número m de variáveis de f).
        * O volume da região R de integração.
        * O número N de pontos na amostra.
        * Uma função 'escolhe_ponto' sem argumentos que a cada chamada
          retorna um ponto em R escolhido aleatoriamente. O ponto
          deve ser representado como a lista (ou array) de suas coordenadas.
    Saída: o valor aproximado da integral.
    """
    import numpy as np
    
    assert isinstance(N, int) and N >= 1
    assert isinstance(dimensao, int) and dimensao >= 1
    
    amostra = []
    for _ in range(N):
        X = escolhe_ponto()
        amostra.append(f(*X))
    amostra = np.array(amostra)
    return volume * np.mean(amostra)

📝 A notação `*X` na linha que atualiza a soma é usada para extrair as entradas de uma lista ou array `X`. Informalmente, ela
transforma $ [x_1, ..., x_m] $ em $ x_1, x_2, ..., x_m $ para que possamos
então aplicar a função $ f $ a estes argumentos. Esta operação é chamada de *unpacking* (desempacotamento). Estamos assumindo aqui que $ f $ tenha sido implementada como uma função de $ m $ variáveis, e não como função de uma variável que é uma lista ou array.

**Problema 2:** Estime a integral tripla
$$
    \int_{-1}^{2}\int_{-1}^2\int_{-1}^2 \cos\big(xy\,(2 - z^2)\big)\,dx\,dy\,dz
$$
usando a integração de Monte Carlo com uma amostra de $ N = 10^5 $ pontos. *Aviso:* Dependendo do computador, a resposta pode demorar um pouco. Não se preocupe com a precisão do resultado fornecido.

*Solução:*

In [6]:
# Complete o esboço abaixo:
import numpy as np


def escolhe_ponto():
    from numpy.random import uniform
    
    ponto = uniform(-1, 2, size=3)     # Gere um vetor aleatório em [-1, 2)^3
    return ponto


f = lambda x, y, z: np.cos(x * y * (2 - z**2))
N = 10**5
dimensao = 3
volume = 27
integral = integracao_monte_carlo(f, dimensao, volume, N, escolhe_ponto)
print(f"integral = {integral}")

integral = 14.899365517774088
