$ \DeclareMathOperator{\vol}{vol} $
$ \newcommand{\mbf}{\mathbf} $

# Integra√ß√£o de Monte Carlo

## $ \S 1 $ Introdu√ß√£o

Nas regras do trap√©zio e de Simpson, escolhemos $ N + 1 $ pontos $ x_0, x_1, \dots, x_N $ igualmente espa√ßados no intervalo de integra√ß√£o $ [a, b] $ como membros da "amostra" tomada para se estimar a integral de uma fun√ß√£o $ f $.

Estes m√©todos s√£o chamados de **determin√≠sticos** porque o resultado fornecido √© completamente determinado pelos par√¢metros: uma vez fixados o n√∫mero $ N + 1 $ de pontos e a fun√ß√£o cont√≠nua $ f \colon [a, b] \to \mathbb R $, cada aplica√ß√£o do m√©todo resulta no mesmo valor. Al√©m disto, √© poss√≠vel determinar uma cota superior para o erro cometido em fun√ß√£o de $ N $.

Em contraste, o m√©todo da *integra√ß√£o de Monte Carlo* que estudaremos neste caderno √© **probabil√≠stico**. A id√©ia  √© escolher os pontos onde $ f $ ser√° avaliada *aleatoriamente* dentro do intervalo $ [a, b] $. Desta forma cada aplica√ß√£o fornece uma aproxima√ß√£o diferente, mesmo mantendo-se $ N $ fixo. Ademais, dado $ \varepsilon > 0 $, n√£o podemos garantir que o erro envolvido na aproxima√ß√£o seja menor que $ \varepsilon $ para  $ N $ suficientemente grande; podemos apenas estimar a *probabilidade* que isto aconte√ßa como uma fun√ß√£o de $ N $.

Na verdade a integra√ß√£o de Monte Carlo √© um caso particular de um m√©todo muito mais geral e extremamente √∫til, amplamente empregado em F√≠sica, Qu√≠mica, Engenharia e outras √°reas, o *m√©todo de Monte Carlo*.

 ## $ \S 2 $ Descri√ß√£o do m√©todo de Monte Carlo
 
Por **m√©todo de Monte Carlo** entende-se uma classe de algoritmos que consistem da execu√ß√£o de um alto n√∫mero $ N $ de *experimentos* ou *ensaios* e da an√°lise estat√≠stica dos resultados para se obter conclus√µes num√©ricas. 

**Exemplo 1:** Considere o disco $ D $ em $ \mathbb R^2 $ de raio $ 1 $ e centro na origem, determinado pela desigualdade
$$
x^2 + y^2 \le 1\,.
$$
Este disco tem √°rea $ \pi $ e est√° contido no quadrado $ Q $ de √°rea $ 4 $ descrito por
$$
\lvert{x}\rvert \le 1\,, \quad \lvert{y}\rvert \le 1\,.
$$
A probabilidade que um ponto escolhido de forma uniformemente aleat√≥ria em $ Q $ esteja dentro do disco $ D $ √© o quociente entre as √°reas, 
$$
\frac{\text{√°rea}(D)}{\text{√°rea}(Q)} = \frac{\pi}{4}\,.
$$
Suponha que escolhamos aleatoriamente $ 1, 2, 3, \dots $ at√© um total de $ N $ pontos dentro de $ Q $, e seja $ n $ o n√∫mero destes pontos pertencentes ao disco $ D $. Um teorema da Teoria da Probabilidade chamado de **Lei dos Grandes N√∫meros** implica que o quociente entre o n√∫mero de "sucessos" $ n $ e o n√∫mero total $ N $ de pontos na amostra tende √† probabilidade do sucesso:
$$
\lim_{N \to \infty} \frac{n}{N} = \frac{\pi}{4}\,.
$$
Mais ainda, fixado $ \varepsilon > 0 $ positivo qualquer,
$$
\lim_{N \to \infty} \text{pr}\bigg(\Big\lvert \frac{n}{N} - \frac{\pi}{4}\Big\rvert \le  \varepsilon \bigg) = 1\,.
$$
Em palavras, a probabilidade que a fra√ß√£o entre o n√∫mero de pontos dentro do disco ($ n $) e o n√∫mero total de pontos ($ N $) difira de $ \frac{\pi}{4} $ por mais que $ \varepsilon $ *tende a zero* conforme o n√∫mero de experimentos aumenta!

## $ \S 3 $ Implementa√ß√£o do m√©todo de Monte Carlo

A implementa√ß√£o do m√©todo de Monte Carlo gen√©rico √© muito simples:

In [1]:
def monte_carlo(ensaio, N):
    """
    Dada uma fun√ß√£o 'ensaio' (a ser implementada separadamente pelo usu√°rio)
    que simula um √∫nico experimento e o n√∫mero N de experimentos a serem
    realizados, contamos o n√∫mero n de sucessos e retornamos n / N. 
    'ensaio' deve ser uma fun√ß√£o sem argumentos que retorna True ou False.
    """
    n = 0
    for _ in range(N):
        if ensaio():
            n += 1
            
    return n / N

üìù Para simular escolhas uniformemente aleat√≥rias, utilizaremos os seguintes procedimentos do m√≥dulo `numpy.random`:
* `randint(a, b)` retorna um inteiro aleat√≥rio entre os inteiros $ a $ e $ b - 1 $ (inclusive);
* `rand()` retorna um float aleat√≥rio entre $ 0 $ e $ 1 $.

Em ambos os casos podemos tamb√©m gerar um array de dimens√µes especificadas contendo n√∫meros dos tipos acima.

**Exemplo 2:**

In [2]:
from numpy.random import rand, randint


# Gerando um inteiro aleat√≥rio entre 0 e 100:
print(randint(0, 101))
# Gerando um float aleat√≥rio entre 0 e 1:
print(rand())

25
0.045177057219597305


In [3]:
# Vetor com 5 coordenadas float aleat√≥rias entre 0 e 1:
print(rand(5))

[0.77001304 0.63498027 0.23242754 0.26547423 0.73817822]


In [4]:
# Matriz 2x4 com entradas inteiras e aleat√≥rias entre 0 e 9:
print(randint(0, 10, size=(2, 4)))

[[3 7 5 8]
 [7 9 5 4]]


In [5]:
# Matriz 3x3 com entradas float aleat√≥rias entre 0 e 1:
print(rand(3, 3))

[[0.57129825 0.86439541 0.43582549]
 [0.58715002 0.68652058 0.61285999]
 [0.96964435 0.08829535 0.18998686]]


## $ \S 4 $ Sobre o significado do termo "uniformemente aleat√≥rio"

Seja $ \Omega $ um conjunto. Informalmente, a distribui√ß√£o **uniforme** de probabilidade em $ \Omega $ √© aquela que atribiu a cada um de seus elementos $ \omega \in \Omega $ (chamados de **eventos** neste contexto) a mesma probabilidade.

No caso em que $ \Omega $ √© discreto e finito, digamos com $ N $ elementos, isto significa simplesmente que
$$
    \text{pr}(\omega) = \frac{1}{N} \qquad \text{para todo $ \omega \in \Omega $}.
$$
No caso cont√≠nuo, digamos em que $ \Omega $ √© um subconjunto de $ \mathbb R $, o significado √© que a probabilidade que um evento perten√ßa a um subconjunto $ S \subset \Omega $ √© dada por 
$$
    \frac{\text{comprimento}(S)}{\text{comprimento}(\Omega)} = \frac{\int_S 1\,dx}{\int_\Omega 1\,dx}\ .
$$
Nos casos que consideraremos, a integral no denominador ser√° sempre positiva e finita. Analogamente para dimens√µes mais altas, com √°rea, volume, etc. em lugar de comprimento.

Estritamente falando, por escolha *aleat√≥ria* entende-se uma escolha feita de acordo com uma distribui√ß√£o qualquer de probabilidade, por√©m neste caderno suporemos sempre que a distribui√ß√£o subjacente √© *uniforme*.

## $ \S 5 $ Estimando $ \pi $ via m√©todo de Monte Carlo

**Exemplo 3:** Use o m√©todo de Monte Carlo e o Exemplo 1 para obter uma estimativa para o valor de $ \pi $.

*Solu√ß√£o:*

In [6]:
from numpy.random import rand


def pertence_ao_disco() -> bool:
    """ Define um ensaio que escolhe um ponto (x, y) aleatoriamente
        dentro do quadrado Q definido por
            |x| <= 1,    |y| <= 1
        e retorna True se o ponto pertence ao disco D ou False caso contr√°rio.
    """
    # 'esticar' transforma o intervalo [0, 1] no intervalo [-1, 1]:
    esticar = lambda x: 2 * x - 1
    # Escolha n√∫meros aleat√≥rios x, y entre -1 e 1.
    # Recorde que rand() escolhe um float aleat√≥rio em [0, 1].
    x = esticar(rand())
    y = esticar(rand())
    
    # Retorne True se x**2 + y**2 <= 1 e False caso contr√°rio:
    return x**2 + y**2 <= 1

In [7]:
from numpy import pi


N = 10**5
estimativa = 4 * monte_carlo(pertence_ao_disco, N)

print(f"Valor de pi fornecido pelo NumPy: {pi}")
print(f"Estimativa obtida pelo m√©todo de Monte Carlo: {estimativa}")
print("A cada vez que executamos a c√©lula, obtemos um resultado diferente!")

Valor de pi fornecido pelo NumPy: 3.141592653589793
Estimativa obtida pelo m√©todo de Monte Carlo: 3.14396
A cada vez que executamos a c√©lula, obtemos um resultado diferente!


üìù No exemplo anterior, realizar $ 10 $ conjuntos de $ 10^4 $ ensaios cada e depois tomar a m√©dia aritm√©tica das $ 10 $ estimativas d√° no mesmo que realizar um √∫nico conjunto de $ 10^5 $ ensaios, como fizemos.

Mais geralmente, como no m√©todo de Monte Carlo assumimos que cada ensaio √© independente dos outros, n√£o faz diferen√ßa se realizamos $ m $  conjuntos de $ N_1,\dots,N_m $ ensaios cada e depois tomamos a m√©dia ponderada (pelo n√∫mero correspondente de ensaios) das $ m $ estimativas
$$
\frac{n_1}{N_1}\,, \quad \frac{n_2}{N_2}\,, \quad \cdots \quad \frac{n_m}{N_m}\,,
$$
ou se realizamos um √∫nico conjunto de $ N = N_1 + \cdots + N_m $ ensaios e calculamos o quociente do n√∫mero de sucessos pelo n√∫mero de ensaios. De fato:
$$
\frac{N_1\, \frac{n_1}{N_1} + N_2\, \frac{n_2}{N_2} + \cdots + N_m\, \frac{n_m}{N_m}}{N_1 + N_2 + \cdots + N_m} = \frac{n_1 + n_2 + \cdots + n_m}{N_1 + N_2 + \cdots + N_m}.
$$


**Problema 1:** Um teorema de E. C√®saro (1850‚Äî1906) diz que a probabilidade de dois naturais escolhidos ao acaso serem relativamente primos √© de $ \frac{6}{\pi^2} $. (Dois inteiros $ m $ e $ n $ s√£o *relativamente primos* caso $ \text{mdc}(m, n) = 1 $.)

(a) Construa um experimento que escolhe dois n√∫meros aleat√≥rios $ m $ e $ n $ entre $ 1 $ e $ 10^6 $ e retorna `True` caso eles sejam relativamente primos ou `False` caso contr√°rio.

(b) Use o m√©todo de Monte Carlo e o teorema citado para obter uma aproxima√ß√£o para $ \pi $.

*Solu√ß√£o:*

In [None]:
from numpy import sqrt, pi
from numpy.random import randint


def mdc(a, b):
    """Retorna o mdc de dois inteiros a, b. """
    assert isinstance(a, int) and isinstance(b, int)
    if b == 0:
        return a
    else:
        return mdc(b, a % b)

üìù O m√©todo de Monte Carlo √© especialmente conveniente para o c√°lculo de √°reas e volumes de regi√µes definidas atrav√©s de desigualdades.

**Problema 2:** Usando o m√©todo de Monte Carlo, calcule o volume $ V $ da regi√£o s√≥lida $ S $ em $ \mathbb R^3 $ determinada pelas desigualdades
$$
0 \le x \le y \le z \le 1
$$
com um erro menor que $ 10^{-3} $. *Dica:* Primeiramente monte um ensaio que escolhe aleatoriamente um ponto $ (x, y, z) $ dentro do cubo definido por $ 0 \le x,\,y,\,z \le 1 $ e decide se este ponto pertence a $ S $.

*Solu√ß√£o:*

## $ \S 6 $ Aplica√ß√£o a integrais de fun√ß√µes de uma vari√°vel

Recorde do curso de C√°lculo 1 que a integral
$$
\int_a^b f(x)\,dx
$$
√© aproximada por *somas de Riemann*
$$
\sum_{i=1}^N f(\xi_i) \Delta_i
$$
onde
$$
[x_0, x_1],\ [x_1, x_2],\ \dots,\ [x_{N-1}, x_{N}]
$$
formam uma parti√ß√£o de $ [a, b] $,
$$
\Delta_i = x_i - x_{i-1}
$$
e os pontos
$$
\xi_i \in [x_{i-1}, x_i] \qquad (i = 1, \dots, N)
$$
podem ser escolhidos arbitrariamente. De fato, a integral √© *definida* como o limite de somas deste tipo conforme o maior dos comprimentos $ \Delta_i $ vai a zero.

Considere o caso especial em que $ \Delta_i = \frac{b-a}{N} $ para cada $ i $, ou seja, os pontos s√£o
$$
x_i = a +  i\,\frac{b-a}{N}
$$
e est√£o igualmente espa√ßados. Ent√£o a soma de Riemann se reduz a 
$$
\frac{b-a}{N}\sum_{i=1}^N f(\xi_i) = (b - a)\bigg(\frac{1}{N}\sum_{i=1}^Nf(\xi_i)\bigg)\,.
$$    
O √∫ltimo termo entre par√™nteses aqui pode ser visto como a m√©dia aritm√©tica de uma amostra de $ N $ valores de $ f $ no intervalo, sujeitos √† condi√ß√£o que o $ i $-√©simo ponto deve pertencer ao $ i $-√©simo intervalo da parti√ß√£o.

Suponha agora que os pontos $ \xi_i $ ($ i = 1, \dots, N $) sejam escolhidos *aleatoriamente* dentro de $ [a, b] $, sem qualquer restri√ß√£o (ou seja, n√£o imporemos que $ \xi_i $ perten√ßa a $ [x_{i-1}, x_i] $). A Lei dos Grandes N√∫meros ainda garante que
$$
(b-a) \bigg(\frac{1}{N}\sum_{i=1}^Nf(\xi_i)\bigg) \longrightarrow \int_a^b f(x)\,dx \qquad \text{conforme }N \to \infty.
$$
A **integra√ß√£o de Monte Carlo** consiste da aproxima√ß√£o da integral √† direita pelo valor √† esquerda.

## $ \S 7 $ Implementa√ß√£o da integra√ß√£o de Monte Carlo em 1 dimens√£o

In [None]:
def int_monte_carlo(f, a, b, N):
    """
    Calcula a integral de uma fun√ß√£o f : [a, b] -> R 
    usando o m√©todo de Monte Carlo com N ensaios.
    """
    from numpy.random import rand
    
    # Transforma linearmente o intervalo [0, 1] no intervalo [a, b]:
    esticar = lambda x: a + (b - a) * x
    
    soma = 0
    for _ in range(N):
        x = esticar(rand())
        soma += f(x)
    
    return (b - a) * soma / N

**Problema 3:** Recorde que
$$
\int_0^1 \frac{1}{1+x^2}\,dx = \arctan(1) - \arctan(0)  = \frac{\pi}{4}\,.
$$
Use a integra√ß√£o de Monte Carlo para obter uma estimativa para $ \pi $.

*Solu√ß√£o:*

In [None]:
from numpy import pi

## $ \S 8 $ Integra√ß√£o de Monte Carlo em qualquer dimens√£o

Para o c√°lculo de integrais definidas de fun√ß√µes de apenas uma vari√°vel, os m√©todos determin√≠sticos como a regra de Simpson devem ser preferidos em rela√ß√£o √† integra√ß√£o de Monte Carlo, por fornecerem resultados mais precisos com uso bem menor de recursos computacionais.

Contudo, em dimens√µes altas os m√©todos determin√≠sticos n√£o funcionam t√£o bem. A primeira dificuldade √© que o n√∫mero de opera√ß√µes necess√°rias aumenta rapidamente com a dimens√£o. Grosso modo, se para garantir uma determinada precis√£o eram necess√°rias $ N $ avalia√ß√µes em dimens√£o $ 1 $, em dimens√£o $ 3 $ ser√£o necess√°rias $ N^3 $. Outro obst√°culo √© que, enquanto em dimens√£o $ 1 $ quase sempre integramos sobre um intervalo, em dimens√µes $ \ge 2 $ a fronteira da regi√£o onde ser√° calculada a integral pode ser muito mais complicada.

Seja
$$
f \colon D \to \mathbb R 
$$
uma fun√ß√£o cont√≠nua de $ m $ vari√°veis $ x_1, \dots, x_m $ definida num dom√≠nio $ D $ qualquer de $ \mathbb R^m $, e seja $ R \subset D $ uma regi√£o regular o suficiente para que o seu volume fa√ßa sentido e possa ser calculado. Escolha aleatoriamente $ N $ pontos $ \boldsymbol{\xi_1}, \dots, \boldsymbol{\xi_N} $ dentro de $ R $. Pode-se mostrar que
$$
\vol(R)\,\bigg(\frac{1}{N}\sum_{i=1}^Nf(\boldsymbol{\xi_i})\bigg) \longrightarrow \int \int \cdots \int_R f(x_1,\,x_2,\cdots,x_m)\,\,dx_1\,dx_{2}\,\cdots dx_m \qquad \text{conforme }N \to \infty.
$$
O **m√©todo de integra√ß√£o de Monte Carlo** consiste da aproxima√ß√£o da integral m√∫ltipla √† direita pela quantidade √† esquerda.

## $ \S 9 $ Implementa√ß√£o da integra√ß√£o de Monte Carlo em qualquer dimens√£o

In [None]:
def integracao_monte_carlo(f, dimensao, volume, N, escolhe_ponto):
    """
    Aproxima a integral de uma fun√ß√£o f atrav√©s do m√©todo de Monte Carlo.
    Entradas:
        * Uma fun√ß√£o real f de uma ou mais vari√°veis.
        * A dimens√£o do dom√≠nio de f (n√∫mero m de vari√°veis de f).
        * O volume da regi√£o R de integra√ß√£o.
        * O n√∫mero N de pontos na amostra.
        * Uma fun√ß√£o 'escolhe_ponto' sem argumentos que a cada chamada
          retorna um ponto em R escolhido aleatoriamente. O ponto
          deve ser representado como a lista de suas coordenadas.
    Sa√≠da: o valor aproximado da integral.
    """
    from numpy.random import rand
    from math import prod
    
    
    assert isinstance(N, int) and N >= 1
    assert isinstance(dimensao, int) and dimensao >= 1
    soma = 0
    for _ in range(N):
        x = escolhe_ponto()
        soma += f(*x)
    
    return volume * soma / N

üìù A nota√ß√£o `*x` na linha que atualiza a soma √© usada para extrair as entradas de uma lista ou array `x`. Informalmente, ela
transforma $ [x_1, ..., x_m] $ em $ x_1, x_2, ..., x_m $ para que possamos
ent√£o aplicar a fun√ß√£o $ f $ a estes argumentos. Esta opera√ß√£o √© chamada de *unpacking* (desempacotamento). Estamos assumindo aqui que $ f $ tenha sido implementada como uma fun√ß√£o de $ m $ vari√°veis, e n√£o como fun√ß√£o de uma vari√°vel que √© uma lista ou array.

**Problema 4:** Estime a integral tripla
$$
    \int_{-1}^{2}\int_{-1}^2\int_{-1}^2 \cos\big(x\,y\,(2 - z^2)\big)\,dx\,dy\,dz
$$
usando a integra√ß√£o de Monte Carlo com uma amostra de $ N = 10^5 $ pontos. *Aviso:* Dependendo do computador, a resposta pode demorar um pouco. N√£o se preocupe com a precis√£o do resultado fornecido.

*Solu√ß√£o:*

In [None]:
# Complete o esbo√ßo abaixo:


def escolhe_ponto():
    from numpy.random import rand
    
    esticar = lambda ...
    # Gerando um vetor aleat√≥rio em [0, 1] x [0, 1] x [0, 1]:
    ponto = ...
    # Transformando-no num vetor em [-1, 2] x [-1, 2] x [-1, 2]:
    ponto = ...
    
    return ponto


f = lambda ...
N = 10**5

<!---
## $ \S 7 $ Problema da agulha

Identifique o $ \mathbb R^2 $ com um peda√ßo de ch√£o e suponha que as retas de equa√ß√£o
$$
x = 0\ , \quad x = \pm 1\ , \quad x = \pm 2\ , \dots, \quad x = \pm n\ , \quad \dots \qquad (n \in \mathbb N)
$$
estejam todas demarcadas. Jogamos uma agulha de comprimento $ c $ no ch√£o de modo que sua posi√ß√£o e dire√ß√£o ao atingir um estado de repouso sejam determinadas aleatoriamente.

(a) Calcule a *probabilidade* de que a agulha cruze uma linha demarcada. Sua resposta deve depender apenas de $ c $.

*Dica:* Para facilitar as considera√ß√µes, seja $ P = (x_0, y_0) $ a posi√ß√£o de um das pontas da agulha (escolhida uma vez por todas, antes do lan√ßamento) e seja $ \theta \in [0, 2\pi) $ o √¢ngulo que o vetor que liga esta ponta com a outra forma com o eixo-$x$ positivo. Podemos supor sem perda de generalidade que $ 0 \le x_0 \le 1 $. Note que o valor de $ y $ √© irrelevante para se determinar se a agulha cruza uma linha demarcada. Determine o conjunto $ R $ de todos os pares
$$ (\theta, x(\theta)) $$
para os quais uma agulha de comprimento $ c $ com ponta inicial $ (x(\theta), y) $ formando um √¢ngulo de $ \theta $ com o eixo-$ x $ positivo n√£o cruza uma linha demarcada. A probabilidade ser√° dada por
$$
\frac{\text{√°rea}(R)}{2\pi}.
$$

(b) Use o m√©todo de Monte Carlo e o seu resultado do item (a) para estimar $ \pi $.
-->