In [30]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

# Laços encaixados e uma introdução à sua otimização

### Exercício: _Dada uma sequência arbitrária de inteiros não-negativos, encontrar o par mais próximo_
Ler uma sequência arbitrária $S$ de $n$ inteiros não-negativos e ___depois___ encontrar $i, 0 \le i \lt n$ e $j, 0 \le j \lt n$, $i \ne j$, tais que a distância entre $S_i$ e $S_j$, isto é,  $\lvert S_i - S_j \rvert$, seja mínima.

#### Desenvolvimento da solução

Em nível mais abstrato, a solução deste problema tem estrutura semelhante à de vários exemplos anteriores:
```python
ler a sequência S
encontrar os dois elementos mais próximos em S
exibir a solução
```

Para **`ler a sequência S`** temos pelo menos duas saídas já conhecidas:

In [31]:
n = int(input('Número de elementos? '))
S = []
for i in range(n):
    S.append(int(input('Próximo elemento? ')))
print(S)

[12, 56, 32, 47, 23]


In [33]:
S = [int(x) for x in input('Sequência de elementos? ').split()]
print(S)

[12, 56, 32, 47, 23]


Em problemas como esse, em geral vamos querer trabalhar com sequências mais longas. Isso inviabiliza a digitação de valores, especialmente quando se lembra que a execução poderá ter que ser repetida diversas vezes enquanto depuramos o algoritmo.

Uma saída mais apropriada é gerar uma sequência de valores aleatórios usando o módulo _random_.

In [34]:
from random import choices

n = int(1e1)
S = choices(range(1000000), k=n)
print(S[:10])
print(S[-10:])

[692740, 183108, 193425, 230325, 453521, 389855, 703510, 493842, 969079, 568289]
[692740, 183108, 193425, 230325, 453521, 389855, 703510, 493842, 969079, 568289]


Uma vez obtida a sequência, vamos procurar o par mais próximo. Para isso temos que comparar todos os pares possíveis, isto é, o problema pede uma solução por enumeração exaustiva.

Aproveitando exemplos anteriores, podemos esboçar nossa solução como:
```Python
for i in range(n):
    for j in range(n):
        se i diferente de j e distância entre S[i] e S[j] menor que a menor já observada:
            salvar i, j, distância entre S[i] e S[j]
```

Vamos representar esse esboço em Python?

In [35]:
min_dist = 10e10
for i in range(n):
    for j in range(n):
        if i != j and abs(S[i] - S[j]) < min_dist:
            min_i, min_j, min_dist = i, j, abs(S[i] - S[j])

Agora só falta exibir o resultado...

In [36]:
print(f'{n:7}  {min_i:6}  {S[min_i]:6}  {min_j:6}  {S[min_j]:6}  {min_dist:6}')

     10       1  183108       2  193425   10317


E se quisermos testar nosso programa com diferentes sequências?  
*   Podemos, por exemplo, gerar uma longa sequência S e depois extrair dela subsequências a serem estudadas.

In [57]:
from random import choices

S = choices(range(100000000), k=10000000)
print(S[:10])
print(S[-10:])

[98407840, 21042563, 62893417, 20904970, 93990986, 92644486, 44667688, 70465378, 35434483, 81557034]
[5578617, 5395612, 1791275, 1947635, 61741716, 95241674, 60734795, 33576551, 66715032, 59041332]


Para poder comparar o desempenho do nosso algoritmo para sequências de diversos tamanhos, vamos usar a função `time` do módulo `time`.

In [58]:
from time import time

print(f"{'n':>7}  {'tempo':>10}  {'i':>6}  {'S[i]':>6}  {'j':>6}  {'S[j]':>6}  {'dist':>6}")
for n in [10, 100, 1000, 10000]:
    start = time()
    min_dist = 10e10
    for i in range(n):
        for j in range(n):
            if i != j and abs(S[i] - S[j]) < min_dist:
                min_i, min_j, min_dist = i, j, abs(S[i] - S[j])
    end = time()
    print(f'{n:7}  {end - start:10.5f}  {min_i:6}  {S[min_i]:6}  {min_j:6}  {S[min_j]:6}  {min_dist:6}')

      n       tempo       i    S[i]       j    S[j]    dist
     10     0.00004       1  21042563       3  20904970  137593
    100     0.00309      20  60582056      94  60603757   21701
   1000     0.23875      70  49922913     828  49922951      38
  10000    22.62248    3088  61909424    7878  61909429       5


O que você espera que vá acontecer se tivermos 100.000 elementos para examinar?

*   A execução vai demorar cerca de 40 minutos!  

Será possível melhorar esse desempenho?

-   Como tanto $i$ quanto $j$ assumem valores em `range(n)` estamos calculando não só $\lvert\, S[i] - S[j] \,\rvert$ mas também $\lvert\, S[j] - S[i] \,\rvert$.  
    Deve ser possível eliminar o teste redundante. Você consegue fazer isso?

In [61]:
from time import time

print(f"{'n':>7}  {'tempo':>10}  {'i':>6}  {'S[i]':>6}  {'j':>6}  {'S[j]':>6}  {'dist':>6}")
for n in [10, 100, 1000, 10000]:
    start = time()
    min_dist = 10e10
    for i in range(n):
        for j in range(n):
            if i != j and abs(S[i] - S[j]) < min_dist:
                min_i, min_j, min_dist = i, j, abs(S[i] - S[j])
    end = time()
    print(f'{n:7}  {end - start:10.5f}  {min_i:6}  {S[min_i]:6}  {min_j:6}  {S[min_j]:6}  {min_dist:6}')

      n       tempo       i    S[i]       j    S[j]    dist
     10     0.00004       1  21042563       3  20904970  137593
    100     0.00320      20  60582056      94  60603757   21701
   1000     0.24325      70  49922913     828  49922951      38
  10000    23.60740    3088  61909424    7878  61909429       5


##### Solução

In [59]:
from time import time

print(f"{'n':>7}  {'tempo':>10}  {'i':>6}  {'S[i]':>6}  {'j':>6}  {'S[j]':>6}  {'dist':>6}")
for n in [10, 100, 1000, 10000]:
    start = time()
    min_dist = 10e10
    for i in range(n):
        for j in range(i + 1, n):
            if i != j and abs(S[i] - S[j]) < min_dist:
                min_i, min_j, min_dist = i, j, abs(S[i] - S[j])
    end = time()
    print(f'{n:7}  {end - start:10.5f}  {min_i:6}  {S[min_i]:6}  {min_j:6}  {S[min_j]:6}  {min_dist:6}')

      n       tempo       i    S[i]       j    S[j]    dist
     10     0.00003       1  21042563       3  20904970  137593
    100     0.00155      20  60582056      94  60603757   21701
   1000     0.12242      70  49922913     828  49922951      38
  10000    11.77428    3088  61909424    7878  61909429       5


Melhorou, mas, ainda assim, quando o tamanho da amostra cresce 10 vezes, o tempo gasto cresce 100.  
De uma maneira mais formal, dizemos que a complexidade desse algoritmo é da ordem de $n^2$ e representamos essa relação como $\mathcal{O}(n^2)$.  
Esse comportamento pode inviabilizar o uso desta solução para grandes amostras.

Você consegue identificar onde está essa demora e por que isso acontece?

-   O problema é que temos dois _loops_ aninhados percorrendo a amostra. Para cada valor do _loop_ externo, o _loop_ interno faz uma varredura completa, isto é, examina da ordem de $n$ valores. O _loop_ externo também examina $n$ valores.  
    Portanto, para uma amostra de tamanho $n$, os dois _loops_ combinados realizam da ordem de $n^2$ operações, o que explica o comportamento do algoritmo. 

Não importa o que a gente faça, se continuarmos com dois _loops_ aninhados como esses, o tempo gasto na solução será da ordem de $n^2$.

Para alterar esse comportamento, temos que mudar a nossa abordagem.

Você consegue pensar em algum caso particular no qual a solução do problema seria mais rápida?

-   Por exemplo, se a lista estivesse ordenada, isso nos ajudaria?  
    Sim, porque aí o par mais próximo seria sempre composto por dois elementos adjacentes.

-   E daí?  
    Daí, nós poderíamos dispensar o _loop_ interno.

Como a lista pode não estar ordenada, vamos ordená-la usando uma função disponível em Python.  
Um bom algoritmo de ordenação de listas tem complexidade $\mathcal{O}(n \cdot \log_2 n)$, o que é muito melhor do que $\mathcal{O}(n^2)$.

Você consegue incorporar essas alterações à nossa solução?

In [59]:
from time import time

print(f"{'n':>7}  {'tempo':>10}  {'i':>6}  {'S[i]':>6}  {'j':>6}  {'S[j]':>6}  {'dist':>6}")
for n in [10, 100, 1000, 10000]:
    start = time()
    min_dist = 10e10
    for i in range(n):
        for j in range(i + 1, n):
            if i != j and abs(S[i] - S[j]) < min_dist:
                min_i, min_j, min_dist = i, j, abs(S[i] - S[j])
    end = time()
    print(f'{n:7}  {end - start:10.5f}  {min_i:6}  {S[min_i]:6}  {min_j:6}  {S[min_j]:6}  {min_dist:6}')

      n       tempo       i    S[i]       j    S[j]    dist
     10     0.00003       1  21042563       3  20904970  137593
    100     0.00155      20  60582056      94  60603757   21701
   1000     0.12242      70  49922913     828  49922951      38
  10000    11.77428    3088  61909424    7878  61909429       5


#### Resposta

In [66]:
from time import time

print(f"{'n':>8}  {'tempo':>10}  {'i':>8}  {'S[i]':>8}  {'j':>8}  {'S[j]':>8}  {'dist':>8}")
for n in [10, 100, 1000, 10000, 100000, 1000000, 10000000]:
    start = time()
    Sord = sorted(S[:n])
    min_dist = 10e10
    for i in range(n - 1):
        if abs(Sord[i] - Sord[i + 1]) < min_dist:
            min_i, min_dist = i, abs(Sord[i] - Sord[i + 1])
    end = time()
    print(f'{n:8}  {end - start:10.5f}  {min_i:8}  {Sord[min_i]:8}  {min_i + 1:8}  {Sord[min_i + 1]:8}  {min_dist:8}')

       n       tempo         i      S[i]         j      S[j]      dist
      10     0.29265         0  20904970         1  21042563    137593
     100     0.00008        60  60582056        61  60603757     21701
    1000     0.00078       519  49922913       520  49922951        38
   10000     0.00893      6242  61909424      6243  61909429         5
  100000     0.06503        50     58795        51     58795         0
 1000000     0.88734       276     28316       277     28316         0
10000000    13.81924        29       209        30       209         0


Nosso algoritmo agora passa a ter um bom desempenho, mesmo para grandes valores de $n$.  

### Exercício: _Gerar todos os números primos menores que um valor dado_
Ler um inteiro $n$ e criar uma lista com todos os números primos menores do que $n$.

Este problema também pode ser resolvido por _enumeração exaustiva_. Vamos tentar?

In [None]:
# ler n

In [None]:
primos = []
for k in range(2, n):
    # verificar se k é primo
    # se k é primo: adicionar k à lista de primos

In [None]:
print(primos)

Feito o primeiro esboço, podemos começar a detalhá-lo...

In [70]:
# ler n
n = int(input('Primos até quanto? '))

In [71]:
primos = []
for k in range(2, n):
    # testar se k é primo
    k_eh_primo = True
    for d in range(2, k):
        if k % d == 0:
            k_eh_primo = False
    # se k é primo: adicionar k à lista primos
    if k_eh_primo:
        primos += [k]

In [72]:
print(primos)

[2, 3, 5, 7, 11, 13, 17, 19]


Lembrando do exemplo anterior...  
Será que esse algoritmo funciona bem para qualquer tamanho de amostra?

Você consegue antecipar uma resposta antes de testá-lo?  
Por que?

In [102]:
from time import perf_counter


for n in [10, 100, 1000, 10000]:
    start = perf_counter()
    
    primos = []
    for k in range(2, n):
        # testar se k é primo
        k_eh_primo = True
        for d in range(2, k):
            if k % d == 0:
                k_eh_primo = False
        # se k é primo: adicionar k à lista primos
        if k_eh_primo:
            primos += [k]
    
    end = perf_counter()
    
    print(f'{n:8} {end - start:10.5f} {len(primos):6} {primos[:6]} {primos[-6:]}')

      10    0.00002      4 [2, 3, 5, 7] [2, 3, 5, 7]
     100    0.00042     25 [2, 3, 5, 7, 11, 13] [71, 73, 79, 83, 89, 97]
    1000    0.05060    168 [2, 3, 5, 7, 11, 13] [967, 971, 977, 983, 991, 997]
   10000    4.12050   1229 [2, 3, 5, 7, 11, 13] [9929, 9931, 9941, 9949, 9967, 9973]


Com os dois _loops_ aninhados, o tempo gasto por este algoritmo para examinar $n$ candiadatos é da ordem de $n^2$, o que o torna impraticável para grandes valores de $n$. 

Podemos melhorar esse desempenho, se lembrarmos de que:

-   O único primo par é $2$ e, portanto, podemos examinar apenas candidatos ímpares.
-   Como os candidatos serão ímpares, não faz sentido tentar dividi-los por números pares, o que também reduz o número de divisores à metade.
-   O loop interno pode ser interrompido assim que concluirmos que _k não é primo_,

Vamos incorporar essas alterações ao nosso algoritmo.

In [101]:
from time import perf_counter


for n in [10, 100, 1000, 10000]:
    
    start = perf_counter()
    
    primos = [2]
    for k in range(3, n, 2):
        # testar se k é primo
        k_eh_primo = True
        for d in range(3, k, 2):
            if k % d == 0:
                k_eh_primo = False
                break
        # se k é primo: adicionar k à lista primos
        if k_eh_primo:
            primos += [k]
    end = perf_counter()
    
    print(f'{n:8} {end - start:10.5f} {len(primos):6} {primos[:6]} {primos[-6:]}')

      10    0.00135      4 [2, 3, 5, 7] [2, 3, 5, 7]
     100    0.00012     25 [2, 3, 5, 7, 11, 13] [71, 73, 79, 83, 89, 97]
    1000    0.00399    168 [2, 3, 5, 7, 11, 13] [967, 971, 977, 983, 991, 997]
   10000    0.25984   1229 [2, 3, 5, 7, 11, 13] [9929, 9931, 9941, 9949, 9967, 9973]


O desempenho melhorou, mas mudou a sua relação com $n$?  
Não, sua complexidade continua sendo $\mathcal{O}(n^2)$.

Por que será?

Você consegue pensar em alguma melhoria simples?  
Você está satisfeito com os limites dos _loops_?

-   Não parece ser possível alterar o _loop_ externo.
-   Mas é possível limitar a `range` do _loop_ interno a $\sqrt{n}$.  
    Por que?

In [100]:
from time import perf_counter


for n in [10, 100, 1000, 10000, 100000, 1000000]:
    
    start = perf_counter()
    
    primos = [2]
    for k in range(3, n, 2):
        # testar se k é primo
        k_eh_primo = True
        for d in range(3, int(k**0.5) + 1, 2):
            if k % d == 0:
                k_eh_primo = False
                break
        # se k for primo, adicionar k à lista primos
        if k_eh_primo:
            primos.append(k)
    end = perf_counter()
    
    print(f'{n:8} {end - start:10.5f} {len(primos):6} {primos[:6]} {primos[-6:]}')

      10    0.00010      4 [2, 3, 5, 7] [2, 3, 5, 7]
     100    0.00006     25 [2, 3, 5, 7, 11, 13] [71, 73, 79, 83, 89, 97]
    1000    0.00070    168 [2, 3, 5, 7, 11, 13] [967, 971, 977, 983, 991, 997]
   10000    0.00975   1229 [2, 3, 5, 7, 11, 13] [9929, 9931, 9941, 9949, 9967, 9973]
  100000    0.15851   9592 [2, 3, 5, 7, 11, 13] [99923, 99929, 99961, 99971, 99989, 99991]
 1000000    2.89983  78498 [2, 3, 5, 7, 11, 13] [999931, 999953, 999959, 999961, 999979, 999983]


O desempenho já melhorou bastante e talvez seja suficiente para um grande número de aplicações.  
Mas, e se quiséssemos algo mais rápido?

Podemos tentar outra abordagem.  
Por exemplo, criar uma lista de _não primos_ e, a partir dela, derivar uma lista de _primos_.

Para criar a lista de _não primos_, para cada candidato $k$ vamos colocar na lista todos os seus múltiplos ímpares.

In [99]:
from time import perf_counter


for n in [10, 100, 1000, 10000, 100000]:
    raiz_n = int(n**0.5)
    
    start = perf_counter()
    nao_primos = []

    for k in range(3, raiz_n + 1, 2):
        for ik in range(3*k, n, 2*k):
            nao_primos += [ik]
            
    primos = [2]
    for p in range(3, n, 2):
        if p not in nao_primos:
            primos += [p]
    end = perf_counter()
    
    print(f'{n:8} {end - start:10.5f} {len(primos):6} {primos[:6]} {primos[-6:]}')

      10    0.00125      4 [2, 3, 5, 7] [2, 3, 5, 7]
     100    0.00003     25 [2, 3, 5, 7, 11, 13] [71, 73, 79, 83, 89, 97]
    1000    0.00213    168 [2, 3, 5, 7, 11, 13] [967, 971, 977, 983, 991, 997]
   10000    0.22219   1229 [2, 3, 5, 7, 11, 13] [9929, 9931, 9941, 9949, 9967, 9973]
  100000   24.68445   9592 [2, 3, 5, 7, 11, 13] [99923, 99929, 99961, 99971, 99989, 99991]


O desempenho piorou bastante... o que terá acontecido?

-   Você consegue ver quantos _loops_ __explícitos__ e __implícitos__ existem agora na nossa solução?  
    Será possível melhorar isso?
-   Examine as _ranges_ dos _loops_?  
    Há algo estranho? Algo que possa ser melhorado?

Vamos exibir também o número de elementos na lista de *não primos*.  
Veja se isso ajuda...

In [98]:
from time import perf_counter


for n in [10, 100, 1000, 10000, 100000]:
    raiz_n = int(n**0.5)
        
    start = perf_counter()
    nao_primos = []

    for k in range(3, raiz_n + 1, 2):
        for ik in range(3*k, n, 2*k):
            nao_primos.append(ik)
            
    primos = [2]
    for p in range(3, n, 2):
        if p not in nao_primos:
            primos.append(p)
    end = perf_counter()
    
    print(f'{n:8} {end - start:10.5f} {len(nao_primos):8} {len(primos):6} {primos[:6]} {primos[-6:]}')

      10    0.01180        1      4 [2, 3, 5, 7] [2, 3, 5, 7]
     100    0.00006       36     25 [2, 3, 5, 7, 11, 13] [71, 73, 79, 83, 89, 97]
    1000    0.00400      668    168 [2, 3, 5, 7, 11, 13] [967, 971, 977, 983, 991, 997]
   10000    0.22621     9639   1229 [2, 3, 5, 7, 11, 13] [9929, 9931, 9941, 9949, 9967, 9973]
  100000   23.40795   125493   9592 [2, 3, 5, 7, 11, 13] [99923, 99929, 99961, 99971, 99989, 99991]


Você vê algo estranho?  

Observe o comprimento da lista de _não primos_.  
Faz sentido? O que terá causado isso?

Veja o que fazemos nos _loops_ das linhas 10 e 11.  
Para cada $k$ na faixa $\left[\,3, 5, \ldots \sqrt{n}\,\right]$ colocamos todos os seus múltiplos na lista de _não primos_.  

Pense no que acontece para $k = 3, 5$ e $7$.  
Agora pense no que acontece para $k = 9$.  
Nós vamos acrescentar à lista todos os múltiplos de $9$. 
Mas eles já estão lá porque todos são múltiplos de $3$.  
Nossa lista de _não primos_ cresce desnecessariamente. 
E isso vai nos prejudicar severamente quando formos usá-la para buscar $p$ na linha 16.

Veja o que acontece quando trocamos _listas_ por _conjuntos_ nesse mesmo algoritmo.

In [97]:
from time import perf_counter


for n in [10, 100, 1000, 10000, 100000, 1000000]:
    raiz_n = int(n**0.5)
        
    start = perf_counter()
    nao_primos = set()

    for k in range(3, raiz_n + 1, 2):
        for ik in range(3*k, n, 2*k):
            nao_primos.add(ik)
            
    primos = [2]
    for p in range(3, n, 2):
        if p not in nao_primos:
            primos.append(p)
    end = perf_counter()
    
    print(f'{n:8} {end - start:10.5f} {len(nao_primos):8} {len(primos):6} {primos[:6]} {primos[-6:]}')

      10    0.01794        1      4 [2, 3, 5, 7] [2, 3, 5, 7]
     100    0.00005       25     25 [2, 3, 5, 7, 11, 13] [71, 73, 79, 83, 89, 97]
    1000    0.00056      332    168 [2, 3, 5, 7, 11, 13] [967, 971, 977, 983, 991, 997]
   10000    0.00769     3771   1229 [2, 3, 5, 7, 11, 13] [9929, 9931, 9941, 9949, 9967, 9973]
  100000    0.09603    40408   9592 [2, 3, 5, 7, 11, 13] [99923, 99929, 99961, 99971, 99989, 99991]
 1000000    0.98827   421502  78498 [2, 3, 5, 7, 11, 13] [999931, 999953, 999959, 999961, 999979, 999983]


Além de ser menor, a representação de `nao_primos` como _conjunto_ ao invés de _lista_ leva uma grande vantagem na hora dos testes de pertinência na linha 16.

A desvantagem da _lista_ pode ser revertida se adotarmos a estratégia do _crivo de Eratóstenes_:

1.  Criamos uma lista com todos os candidatos possíveis.
1.  Percorremos a lista da esquerda para a direita e, para cada candidato, eliminamos todos os seus múltiplos.
1.  Ao chegar ao final, todos os candidatos remanescentes serão primos.

Para evitar o custo da _eliminação_ dos múltiplos, vamos apenas marcá-los como _não primos_.  
Para isso criamos uma lista cujos elementos são todos `True` e convertemos esse valor para `False` quando o elemento é eliminado.

Vamos ver como fica...

In [96]:
from time import perf_counter


for n in [10, 100, 1000, 10000, 100000, 1000000]:
    raiz_n = int(n**0.5)
        
    start = perf_counter()
    crivo = [True] * n
    for k in range(3, raiz_n + 1, 2):
        if crivo[k]:
            for i in range(k*k, n, 2*k):
                crivo[i] = False
    primos = [2] + [i for i in range(3, n, 2) if crivo[i]]
    end = perf_counter()
    
    print(f'{n:8} {end - start:10.5f} {len(primos):6} {primos[:6]} {primos[-6:]}')

      10    0.00264      4 [2, 3, 5, 7] [2, 3, 5, 7]
     100    0.00002     25 [2, 3, 5, 7, 11, 13] [71, 73, 79, 83, 89, 97]
    1000    0.00009    168 [2, 3, 5, 7, 11, 13] [967, 971, 977, 983, 991, 997]
   10000    0.00091   1229 [2, 3, 5, 7, 11, 13] [9929, 9931, 9941, 9949, 9967, 9973]
  100000    0.01119   9592 [2, 3, 5, 7, 11, 13] [99923, 99929, 99961, 99971, 99989, 99991]
 1000000    0.18400  78498 [2, 3, 5, 7, 11, 13] [999931, 999953, 999959, 999961, 999979, 999983]


Finalmente, podemos acelerar nosso algoritmo ainda mais substituindo o _loop_ das linhas 11-12 por uma _list comprehension_...
-   Os elementos selecionados pela `range` da linha 11 são `crivo[k*k], crivo[k*k + 2*k], ...`.  
-   Numa faixa `[esq...dir)` há `(dir - 1 - esq) // larg` intervalos de largura `larg`.
    - Por exemplo, veja a figura abaixo, supondo $esq = 1$, $dir = 10$ e $larg = 1, 2, \dots5$  
    ![](img/intervalos.png)
-   Adaptando para o nosso caso e incluindo o elemento inicial, ao todo serão afetados  
`(n - 1 - k*k) // (2*k) + 1` elementos, cujos valores devem passar para `False`.

Essa alteração está implementada no código abaixo:

In [109]:
from time import perf_counter

print(f"{'n':>8}  {'demora':>10}  {'#primos':>8}  {'primos[:6] + primos[-6:]'}")
for n in [10, 100, 1000, 10000, 100000, 1000000]:
    raiz_n = int(n**0.5)
        
    start = perf_counter()
    crivo = [True] * n
    for k in range(3, raiz_n + 1, 2):
        if crivo[k]:
            crivo[k*k::2*k] = [False] * ((n - 1 - k * k) // (2 * k) + 1)
    primos = [2] + [i for i in range(3, n, 2) if crivo[i]]
    # primos = [2] + [i for (i, eh_primo) in enumerate(crivo) if eh_primo] 
    end = perf_counter()
    
    print(f'{n:8}  {end - start:10.5f}  {len(primos):8}  {primos[:6]}  {primos[-6:]}')

       n      demora   #primos  primos[:6] + primos[-6:]
      10     0.01191         4  [2, 3, 5, 7]  [2, 3, 5, 7]
     100     0.00002        25  [2, 3, 5, 7, 11, 13]  [71, 73, 79, 83, 89, 97]
    1000     0.00006       168  [2, 3, 5, 7, 11, 13]  [967, 971, 977, 983, 991, 997]
   10000     0.00045      1229  [2, 3, 5, 7, 11, 13]  [9929, 9931, 9941, 9949, 9967, 9973]
  100000     0.00471      9592  [2, 3, 5, 7, 11, 13]  [99923, 99929, 99961, 99971, 99989, 99991]
 1000000     0.05900     78498  [2, 3, 5, 7, 11, 13]  [999931, 999953, 999959, 999961, 999979, 999983]


Agora nosso algoritmo tem desempenho de gente grande...

In [110]:
from time import perf_counter


# Given integer x, this returns the integer floor(isqrt(x)).
def _isqrt(x):
    assert x >= 0
    i = 1
    while i * i <= x:
        i *= 2
    y = 0
    while i > 0:
        if (y + i)**2 <= x:
            y += i
        i //= 2
    return y

def isqrt(n):
    # print('babylonian(', n, ')')
    x = n
    y = 1
    # print(x, y)
    while (x > y):
        x = (x + y) // 2
        y = n // x
        # print(x, y)
    return x

# Returns a list of True and False indicating whether each number is prime.
# For 0 <= i <= n, result[i] is True if i is a prime number, False otherwise.
def list_primality(n):
    # Sieve of Eratosthenes
    result = [True] * (n + 1)
    result[0] = result[1] = False
    for i in range(isqrt(n) + 1):
        if result[i]:
            # for j in range(i * i, len(result), i):
                # result[j] = False
            result[i*i::i] = [False] * ((len(result) - 1 - i * i) // i + 1)
    return result

# Returns all the prime numbers less than or equal to n, in ascending order.
# For example: listPrimes(97) = [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, ..., 83, 89, 97].
def list_primes(n):
    # return [i for (i, isprime) in enumerate(list_primality(n)) if isprime]
    crivo = list_primality(n)
    return [2] + [i for i in range(3, n, 2) if crivo[i]]

print(f"{'n':>8}  {'demora':>10}  {'#primos':>8}  {'primos[:6] + primos[-6:]'}")
for n in [10, 100, 1000, 10000, 100000, 1000000]:
        
    start = perf_counter()
    primos = list_primes(n)
    end = perf_counter()
    
    print(f'{n:8}  {end - start:10.5f}  {len(primos):8}  {primos[:6]}  {primos[-6:]}')

       n      demora   #primos  primos[:6] + primos[-6:]
      10     0.00084         4  [2, 3, 5, 7]  [2, 3, 5, 7]
     100     0.00001        25  [2, 3, 5, 7, 11, 13]  [71, 73, 79, 83, 89, 97]
    1000     0.00005       168  [2, 3, 5, 7, 11, 13]  [967, 971, 977, 983, 991, 997]
   10000     0.00045      1229  [2, 3, 5, 7, 11, 13]  [9929, 9931, 9941, 9949, 9967, 9973]
  100000     0.00419      9592  [2, 3, 5, 7, 11, 13]  [99923, 99929, 99961, 99971, 99989, 99991]
 1000000     0.05615     78498  [2, 3, 5, 7, 11, 13]  [999931, 999953, 999959, 999961, 999979, 999983]
