# O m√©todo de Monte Carlo

## $ \S 1 $ Introdu√ß√£o
 
Por **m√©todo de Monte Carlo** entende-se uma classe de algoritmos que consistem da execu√ß√£o de um alto n√∫mero $ N $ de *experimentos* ou *ensaios* e da an√°lise estat√≠stica dos resultados para se obter conclus√µes num√©ricas. Ele √© amplamente empregado em F√≠sica, Qu√≠mica, Engenharia e outras √°reas. A melhor maneira de entend√™-lo √© por meio de alguns exemplos.

**Exemplo 1 (estimando $ \pi $ jogando dardos):** Considere uma pessoa que joga dardos num alvo que tem a forma do disco $ D $ em $ \mathbb R^2 $ de raio $ 1 $ e centro na origem, descrito pela desigualdade
$$
x^2 + y^2 \le 1\,.
$$
Este disco tem √°rea $ \pi $ e est√° contido no quadrado $ Q $ de √°rea $ 4 $ determinado por
$$
\lvert{x}\rvert \le 1\,, \quad \lvert{y}\rvert \le 1\,.
$$
Assuma que a pessoa √© competente o suficiente para sempre acertar o quadrado, mas fora isto os dardos s√£o jogados ao acaso. A probabilidade que um ponto escolhido de forma uniformemente aleat√≥ria em $ Q $ esteja dentro do disco $ D $ √© o quociente entre as √°reas, 
$$
\frac{\text{√°rea}(D)}{\text{√°rea}(Q)} = \frac{\pi}{4}\,.
$$

Suponha que escolhamos aleatoriamente $ 1, 2, 3, \dots $ at√© um total de $ N $ pontos dentro de $ Q $, e seja $ n $ o n√∫mero destes pontos pertencentes ao disco $ D $. Um teorema da Teoria da Probabilidade chamado de **Lei dos Grandes N√∫meros** implica que o quociente entre o n√∫mero de "sucessos" $ n $ e o n√∫mero total $ N $ de pontos na amostra quase certamente tende √† probabilidade do sucesso:
$$
\lim_{N \to \infty} \frac{n}{N} = \frac{\pi}{4}\,.
$$
Mais precisamente, fixado $ \varepsilon > 0 $ positivo qualquer,
$$
\lim_{N \to \infty} \text{pr}\bigg(\Big\lvert \frac{n}{N} - \frac{\pi}{4}\Big\rvert \le  \varepsilon \bigg) = 1\,.
$$
Em palavras, a probabilidade que a fra√ß√£o entre o n√∫mero de pontos dentro do disco ($ n $) e o n√∫mero total de pontos ($ N $) difira de $ \pi/4 $ por mais que $ \varepsilon $ *tende a zero* conforme o n√∫mero de experimentos aumenta! Portanto podemos obter uma estimativa para $ \pi $ usando o computador para simular um n√∫mero $ N $ grande de ensaios e calculando o quociente $4n/N $ correspondente.

## $ \S 2 $ Implementa√ß√£o do m√©todo de Monte Carlo

A implementa√ß√£o do m√©todo de Monte Carlo gen√©rico √© muito simples.

In [13]:
def monte_carlo(ensaio, N):
    """
    Dada uma fun√ß√£o 'ensaio' que simula um √∫nico experimento, a ser
    implementada separadamente pelo usu√°rio, e o n√∫mero N de experimentos
    a serem realizados, contamos o n√∫mero n de sucessos e retornamos n / N. 
    'ensaio' deve ser uma fun√ß√£o sem argumentos que retorna True ou False.
    """
    n = 0
    for _ in range(N):
        if ensaio():
            n += 1
            
    return n / N

üìù Para simular escolhas uniformemente aleat√≥rias, podemos utilizar os seguintes procedimentos do m√≥dulo `numpy.random`:
* `randint(a, b)` retorna um inteiro aleat√≥rio entre os inteiros $ a $ e $ b - 1 $ (inclusive);
* `uniform(a, b)` retorna um float aleat√≥rio em $ [a, b) $.

Em ambos os casos podemos tamb√©m gerar um array de dimens√µes especificadas contendo n√∫meros dos tipos acima usando um terceiro argumento `size=(<dimens√µes>)`.

**Exemplo 2:** Execute as c√©lulas abaixo v√°rias vezes e note como os resultados mudam.

In [2]:
from numpy.random import randint, uniform


# Gerando um inteiro aleat√≥rio entre 0 e 100:
print(randint(0, 101))
# Gerando um float aleat√≥rio entre 0 e 1:
print(uniform(0, 1))

14
0.3470915722168266


In [11]:
# Vetor com 5 coordenadas float aleat√≥rias em [-3, 3):
print(uniform(-3, 3, size=5))

[ 2.62521152  2.94100459 -1.52010793  0.51578468 -0.27325403]


In [11]:
# Matriz 2x4 com entradas inteiras e aleat√≥rias entre 0 e 9:
print(randint(0, 10, size=(2, 4)))

[[7 0 1 5]
 [3 8 8 0]]


In [30]:
# Matriz 3x3 com entradas float aleat√≥rias em [0, 10):
print(uniform(0, 10, size=(3, 3)))

[[7.07463351 9.21785701 8.2088755 ]
 [2.72329386 7.21032066 0.85734155]
 [5.3501414  0.67738912 0.08070317]]


**Problema 1:** Crie um gerador simples de senhas aleat√≥rias com ajuda do procedimento `randint` e da fun√ß√£o `chr`, que converte inteiros em caracteres segundo a [tabela ASCII](https://en.wikipedia.org/wiki/ASCII#Printable_characters).

*Solu√ß√£o:*

## $ \S 3 $ Aplicando o m√©todo de Monte Carlo para calcular $ \pi $

**Problema 2:** Agora vamos p√¥r em pr√°tica a id√©ia do Exemplo 1 para calcular $ \pi $.

(a) Crie um procedimento `pertence_ao_disco` (sem par√¢metros) que simula o
experimento descrito no Exemplo 1, ou seja, que gera dois n√∫meros aleat√≥rios $ x
$ e $ y $ entre $ [-1, 1] $ e retorna `True` se e somente se  $ x^2 + y^2 \le 1
$.

(b) Use o m√©todo de Monte Carlo e o seu experimento para obter uma aproxima√ß√£o
para o valor de $ \pi $ correta at√© a segunda casa decimal.

*Solu√ß√£o:*

In [14]:
from numpy.random import uniform


def pertence_ao_disco() -> bool:
    """
    Define um ensaio que escolhe um ponto (x, y) aleatoriamente
    dentro do quadrado Q definido por
        |x| <= 1,    |y| <= 1
    e retorna True se o ponto pertence ao disco D ou False caso contr√°rio.
    """
    x = uniform(-1, 1)
    y = uniform(-1, 1)
    
    return x**2 + y**2 <= 1

In [20]:
from numpy import pi


N = 10**5
estimativa = 4 * monte_carlo(pertence_ao_disco, N)

print(f"Valor de pi fornecido pelo NumPy: {pi:20f}")
print(f"Estimativa obtida pelo m√©todo de Monte Carlo: {estimativa}")
print("A cada vez que executamos a c√©lula, obtemos um resultado diferente!")

Valor de pi fornecido pelo NumPy:             3.141593
Estimativa obtida pelo m√©todo de Monte Carlo: 3.14316
A cada vez que executamos a c√©lula, obtemos um resultado diferente!


üìù No exemplo anterior, realizar $ 10 $ conjuntos de $ 10^4 $ ensaios cada e
depois tomar a m√©dia aritm√©tica das $ 10 $ estimativas d√° no mesmo que realizar
um √∫nico conjunto de $ 10^5 $ ensaios, como fizemos.
Mais geralmente, como no m√©todo de Monte Carlo assumimos que cada ensaio √©
independente dos outros, n√£o faz diferen√ßa se realizamos $ m $  conjuntos de $
N_1,\dots,N_m $ ensaios cada e depois tomamos a m√©dia ponderada (pelo n√∫mero
correspondente de ensaios) das $ m $ estimativas, ou se realizamos um √∫nico
conjunto de $ N_1 + \cdots + N_m $ ensaios e calculamos o quociente do n√∫mero de
sucessos pelo n√∫mero de ensaios.  De fato:
$$
\frac{\frac{n_1}{N_1}\,N_1 + \frac{n_2}{N_2}\,N_2 + \cdots + \frac{n_m}{N_m}\,N_m}{N_1 + N_2 + \cdots + N_m} = \frac{n_1 + n_2 + \cdots + n_m}{N_1 + N_2 + \cdots + N_m}.
$$


__Problema 3:__ Um teorema de E. Ces√†ro (1850‚Äî1906) diz que a probabilidade de dois naturais escolhidos ao acaso serem relativamente primos √© de $ \frac{6}{\pi^2} $. (Dois inteiros $ m $ e $ n $ s√£o *relativamente primos* caso $ \text{mdc}(m, n) = 1 $.)

(a) Construa um ensaio que escolhe aleatoriamente dois naturais entre um e um milh√£o ($ 10^6 $) e retorna `True` caso eles sejam relativamente primos ou `False` caso contr√°rio.

(b) Use o m√©todo de Monte Carlo e o teorema citado para obter uma aproxima√ß√£o para $ \pi $.

*Solu√ß√£o:*

In [37]:
# (a):
from numpy import sqrt, pi
from numpy.random import randint


def mdc(a, b):
    """Retorna o mdc de dois inteiros a, b. """
    assert isinstance(a, int) and isinstance(b, int)
    if b == 0:
        return a
    else:
        return mdc(b, a % b)
    
    
# (b):

## $ \S 4 $ Sobre o significado do termo "uniformemente aleat√≥rio"

Seja $ \Omega $ um conjunto. Informalmente, a distribui√ß√£o **uniforme** de probabilidade em $ \Omega $ √© aquela que atribiu a cada um de seus elementos $ \omega \in \Omega $ (chamados de **eventos** neste contexto) a mesma probabilidade. Nesta situa√ß√£o tamb√©m dizemos que todos os eventos s√£o **equiprov√°veis**.

No caso em que $ \Omega $ √© finito, digamos com $ N $ elementos, isto significa simplesmente que
$$
    \text{pr}(\omega) = \frac{1}{N} \qquad \text{para todo $ \omega \in \Omega $}.
$$
No caso cont√≠nuo, digamos em que $ \Omega $ √© um subconjunto de $ \mathbb R $, o significado √© que a probabilidade que um evento perten√ßa a um subconjunto $ S \subset \Omega $ √© dada por 
$$
    \frac{\text{comprimento}(S)}{\text{comprimento}(\Omega)} = \frac{\int_S 1\,dx}{\int_\Omega 1\,dx}\ .
$$
Nos casos considerados aqui, a integral no denominador √© sempre positiva e finita. Analogamente para dimens√µes mais altas, com √°rea, volume, etc. em lugar de comprimento.

Estritamente falando, por escolha *aleat√≥ria* entende-se uma escolha feita de acordo com uma distribui√ß√£o qualquer de probabilidade, por√©m neste caderno supomos sempre que a distribui√ß√£o subjacente √© *uniforme*.

## $ \S 5 $ Estimando $ e $ via m√©todo de Monte Carlo

**Exemplo 3 (urna de n√∫meros reais):** Imagine uma "urna" contendo uma c√≥pia de cada n√∫mero real. Suponha que dela retiremos aleatoriamente, em seq√º√™ncia e sem reposi√ß√£o, n√∫meros reais $ r_1, r_2, r_3, \dots $. A probabilidade que ao retirar o $k$-√©simo n√∫mero $ r_k $ tenhamos
$$
r_1 < r_2 < \cdots < r_k\quad \text{√©} \quad \frac{1}{k!}\,,
$$
j√° que todas as $ k! $ permuta√ß√µes destes n√∫meros s√£o equiprov√°veis, mas somente
uma delas tem a ordem correta.

Agora suponha que efetuemos estas retiradas at√© a primeira vez em que a lista resultante _n√£o_ possuir a ordem correta. A probabilidade que isto aconte√ßa exatamente na escolha do $ k $-√©simo n√∫mero √©:
$$
\frac{1}{(k - 1)!} - \frac{1}{k!} = \frac{1}{(k - 1)!}\bigg(1 - \frac{1}{k}\bigg).
$$
Deduz-se da√≠ que a probabilidade que o √≠ndice $ k $ da sele√ß√£o que causa a primeira desordena√ß√£o seja _√≠mpar_ √©
\begin{alignat*}{3}
&\bigg(\frac{1}{2!} - \frac{1}{3!}\bigg) + \bigg(\frac{1}{4!} - \frac{1}{5!}\bigg) + \bigg(\frac{1}{6!} - \frac{1}{7!}\bigg) + \cdots  \\
= &\sum_{k=2}^{\infty}\frac{(-1)^k}{k!} = \sum_{k=0}^{\infty}\frac{(-1)^k}{k!} = \frac{1}{e}\,.
\end{alignat*}
Podemos portanto estimar $ e $ criando um experimento que escolhe n√∫meros reais aleatoriamente at√© que o n√∫mero $ r_k $ que foi extra√≠do por √∫ltimo seja menor que $ r_{k - 1} $. Quando $ k $ √© _√≠mpar_, contabilizamos o resultado como um _sucesso_. Se realizarmos $ N $ ensaios como este e se $ n $ for o n√∫mero total de sucessos, ent√£o
$$
\frac{n}{N} \approx \frac{1}{e}
$$
para $ N $ grande, pela Lei dos Grandes N√∫meros.

**Problema 4:** Estime $ e $ usando o m√©todo de Monte Carlo aplicado ao ensaio do Exemplo 3, com $ N = 10^6 $. *Dica:* Tudo que foi discutido ainda √© v√°lido se os n√∫meros reais forem escolhidos dentro do intervalo $ [0, 1] $. Defina um procedimento que continua gerando n√∫meros aleat√≥rios at√© que o atual seja menor que o anterior.

*Solu√ß√£o:*

## $ \S 6 $ A agulha de Buffon

**Exemplo 4:** O seguinte problema famoso foi formulado pelo naturalista franc√™s Georges de Buffon (1707‚Äì1788). Identifique um peda√ßo de ch√£o com $ \mathbb R^2 $ e suponha que as retas de equa√ß√£o
$$
x = \pm 1\,, \quad x = \pm 3\,, \quad \cdots \quad  x = \pm 2n - 1\,, \quad \cdots \qquad (n \in \mathbb N)
$$
estejam todas demarcadas. Jogamos uma agulha de comprimento $ 2 $ no ch√£o de
modo que sua posi√ß√£o e dire√ß√£o ao atingir um estado de repouso sejam
determinadas de maneira uniformemente aleat√≥ria. Qual √© a probabilidade que a
agulha cruze uma linha demarcada?

![Agulha de Buffon](buffon_needle.png "100 lan√ßamentos da agulha de Buffon")

A posi√ß√£o final do centro da agulha est√° a uma dist√¢ncia $ d \in [0, 1] $ de alguma das retas demarcadas, e todas estas dist√¢ncias s√£o equiprov√°veis. Similarmente, cada um dos √¢ngulos $ \theta \in \big[0, \frac{\pi}{2}\big] $ que podem ser formados pela agulha com a reta horizontal que passa pelo seu centro √© equiprov√°vel. Se $ x $ √© a coordenada do centro da agulha, ent√£o as duas pontas t√™m coordenadas $ x \pm \cos \theta $. Portanto, ela cruzar√° uma linha demarcada se e somente se
$$
0 \le d \le \cos \theta\,.
$$
Conclu√≠mos da√≠ que a probabilidade procurada √© o quociente da √°rea sob o gr√°fico da fun√ß√£o $ \theta \mapsto \cos \theta $ para $ \theta \in \big[0, \frac{\pi}{2}\big] $ pela √°rea do ret√¢ngulo $ \big[0, \frac{\pi}{2}\big] \times [0, 1] $:
$$
\frac{\int_0^\frac{\pi}{2} \cos \theta\,d\theta}{\int_0^{\frac{\pi}{2}} 1\,d\theta} = \frac{1}{\tfrac{\pi}{2}} = \frac{2}{\pi}\,.
$$

**Problema 5:** 

(a) Crie um ensaio que simula o lan√ßamento de uma agulha nos moldes do Exemplo 4 e utilize o m√©todo de Monte Carlo para obter uma estimativa para $ \pi $.

(b) Suponha que a situa√ß√£o seja aquela descrita no Exemplo 4, mas que a agulha agora tenha comprimento $ a \le 2 $. Calcule a probabilidade $ p(a) $ que ela cruze alguma das linhas demarcadas.

*Solu√ß√£o:*

# $ \S 7 $ O m√©todo de Monte Carlo aplicado √† otimiza√ß√£o

A __otimiza√ß√£o__ de uma fun√ß√£o √© a busca pelos seus pontos de m√°ximo e m√≠nimo.
O m√©todo de Monte Carlo pode ser aplicado para resolver problemas de otimiza√ß√£o
de maneira aproximada.

Suponha inicialmente que $ f \colon I \to \mathbb R $ seja uma fun√ß√£o definida
num intervalo $ I $. Para buscar os extremos globais de $ f $ a√≠, podemos gerar
aleatoriamente uma quantidade grande de pontos $ x \in I $ e avaliar $ f $ em
cada um deles. Ent√£o tomamos como aproxima√ß√£o para o m√≠nimo global de $ f $
em $ I $ aquele valor de $ x $ que produziu o menor valor de $ f(x) $;
analogamente para o m√°ximo.
O procedimento para otimiza√ß√£o de uma fun√ß√£o de v√°rias vari√°veis √©
essencialmente o mesmo. A √∫nica diferen√ßa √© que precisamos gerar os pontos
aleat√≥rios dentro da regi√£o $ R $ de interesse. Idealmente $ R $ deve ser um
paralelep√≠pedo, ou um subcojunto deste definido por desigualdades.

A principal vantagem do m√©todo de Monte Carlo √© a sua simplicidade. Entretanto,
sendo um m√©todo probabil√≠stico, ele n√£o garante que o m√≠nimo ou m√°ximo global da
fun√ß√£o ser√£o encontrados. Al√©m disto, o m√©todo √© computacionalmente caro para
fun√ß√µes que s√£o custosas de avaliar, uma vez que requer a avalia√ß√£o da fun√ß√£o em
muitos pontos para que a aproxima√ß√£o seja boa. Como em outras aplica√ß√µes, o
m√©todo √© mais √∫til quando a fun√ß√£o a ser otimizada est√° definida num espa√ßo de
dimens√£o muito alta. Muitas vezes ele √© empregado em combina√ß√£o com alguma outra
t√©cnica mais sofisticada que melhore o desempenho gerando amostras de maneira
mais sistem√°tica.

__Problema 6:__
Use o m√©todo de Monte Carlo para estimar o m√≠nimo e o m√°ximo das fun√ß√µes
abaixo. Em ambos os casos, compare as aproxima√ß√µes com os valores exatos,
que podem ser obtidos atrav√©s das t√©cnicas do C√°lculo.

(a)
$$
f(x) = x^3 - 6x^2 + 9x + 15
$$
no intervalo $ [-2, 4] $.

(b) 
$$
f(x, y) = (x - 2)^2 + (y + 3)^2
$$
para $ x \in [-5, 5] $ e $ y \in [-5, 5] $.

_Solu√ß√£o:_

__Problema 7:__ O __Problema do Caixeiro Viajante__ (_Travelling Salesman
Problem_) √© um problema cl√°ssico da teoria da computa√ß√£o e pesquisa operacional.
Dado um conjunto de cidades e as dist√¢ncias entre elas, o problema consiste em
encontrar o percurso mais curto que visita todas as cidades exatamente uma vez e
retorna √† cidade de origem.

(a) Suponha que o n√∫mero de cidades seja $ N $. Explique como o conjunto de
dist√¢ncias poderia ser armazenado numa matriz $ N \times N $. Que propriedades
especiais tem esta matriz? _Dica:_ Para quaisquer cidades $ A $ e $ B $, a
dist√¢ncia de $ A $ a $ B $ √© igual √† dist√¢ncia de $ B $ a $ A $; e a dist√¢ncia
de $ A $ a $ A $ √© nula.

(b) Explique a rela√ß√£o entre uma rota que visita cada cidade exatamente uma vez
e retorna √† cidade original e a soma de certas entradas na matriz do item (a).
Quais restri√ß√µes estas entradas precisam satisfazer para representar uma rota
v√°lida?

(c) Como o m√©todo de Monte Carlo poderia ser utilizado para aproximar a melhor
solu√ß√£o?

_Solu√ß√£o:_

## $ \S 8 $ Implementa√ß√£o de um visualizador de lan√ßamentos de agulhas √† la Buffon

In [None]:
import matplotlib.pyplot as plt
from numpy import cos, sin, pi
from numpy.random import uniform


def display_buffon_needles(throws=50, needle_length=2,
                           line_spacing=2, grid_lines=6) -> None:
    """
    Display the results of several trials of Buffon's needle problem.
    Parameters:
        * The number of throws.
        * The length of the needle.
        * The spacing between demarcated lines.
        * The number of grid (demarcated) lines to be displayed.
    """
    # Set up the figure:
    plt.xlim(-grid_lines * line_spacing / 2 - needle_length,
             grid_lines * line_spacing / 2 + needle_length)
    plt.ylim(-grid_lines * line_spacing / 2 - needle_length,
             grid_lines * line_spacing / 2 + needle_length)
    grid_line_coordinates = []
    # Draw the horizontal grid lines and vertical auxiliary lines:
    for i in range(0, grid_lines):
        grid_line_coordinate = (-(grid_lines - 1) * line_spacing / 2 
                    + i * line_spacing)
        grid_line_coordinates.append(grid_line_coordinate)
        plt.axvline(x = grid_line_coordinate, linewidth=1,
                    color="green", linestyle='--',
                    label="demarcated lines" if i == 0 else "")
    count = 0    # Number of needles crossing the demarcated lines.
    for _ in range(throws):
        # Choose the angle between the needle and the lines (0 <= angle <= pi):
        angle = uniform(0, pi / 2)
        # Choose the position of the needle's center and compute its endpoints:
        x_center, y_center = uniform(-(grid_lines - 1) * line_spacing / 2,
                                      (grid_lines - 1) * line_spacing / 2,
                                      size=2)
        x1 = x_center - (needle_length / 2) * cos(angle)
        y1 = y_center - (needle_length / 2) * sin(angle)
        x2 = x_center + (needle_length / 2) * cos(angle)
        y2 = y_center + (needle_length / 2) * sin(angle)
        # Draw the needle:
        plt.plot([x1, x2], [y1, y2], color='red', linewidth=1.5,
                 label="needles" if _ == 0 else "")
        lines_in_between = [x for x in grid_line_coordinates if x1 < x < x2]
        if lines_in_between:
            count += 1
    
    plt.title(f"Buffon's needle problem: {throws} throws with needle length "
              f"{needle_length}\nand line spacing {line_spacing}. Needles "
              f"crossing the demarcated lines: {count}.")
    plt.xlabel("$ x $")
    plt.ylabel("$ y $")
#    plt.legend()
    plt.show()

# Example usage
display_buffon_needles(throws=100, needle_length=2,
                       line_spacing=2, grid_lines=6)