In [3]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

# Revisão

## Exemplo 1
Dada uma lista de inteiros não negativos, encontre o perímetro máximo dos triângulos cujos lados fazem parte da lista.

**Entrada:**  
A primeira linha contém um inteiro $t$, que é o número de casos de teste.  
Para cada caso de teste, a primeira linha contém um inteiro $n$, que é o tamanho da lista.  
A próxima linha contém $n$ números inteiros não negativos, separados por espaços.

**Saída:**  
Para cada caso de teste, a saída é o valor do perímetro máximo, se o triângulo for possível, ou $-1$, caso não seja.

**Restrições:**  
$1 \le t \le 100$  
$3 \le n \le 100$

In [83]:
%reset -f
import timeit

# solução "força bruta": x, y e z varrem todas as combinações possíveis
def sol1(n, pts):
    maxper = -1
    for x in range(n - 2):
        i = pts[x]
        for y in range(x + 1, n - 1):
            j = pts[y]
            for z in range(y + 1, n):
                k = pts[z]
                triang = sorted([i, j, k])
                é_triang = (triang[2] < triang[0] + triang[1])
                per = i + j + k
                if é_triang and per > maxper:
                    maxper = i + j + k
    return maxper

# solução melhorada (usando for): a lista de pontos é colocada em ordem inversa antes da busca
#     a resposta é o perímetro do triângulo pts[i], pts[i+1], pts[i+2] mais próximo do início da lista
#     se o triângulo não existir, a resposta é -1
def sol2(n, pts):
    pts.sort(reverse=True)
    per = -1
    for i in range(n - 2):
        é_triângulo = (pts[i] < pts[i + 1] + pts[i + 2])
        if é_triângulo:
            per = sum(pts[i:i + 3])
            break
    return per

# solução melhorada (usando while): a lista de pontos é colocada em ordem inversa antes da busca
#     a resposta é o perímetro do triângulo pts[i], pts[i+1], pts[i+2] mais próximo do início da lista
#     se o triângulo não existir, a resposta é -1
def sol3(n, pts):
    pts.sort(reverse=True)
    i = 0
    ainda_não_achei = True
    while ainda_não_achei and i < n - 2:
        é_triângulo = (pts[i] < pts[i + 1] + pts[i + 2])
        if é_triângulo:
            ainda_não_achei = False
        else:
            i += 1
    if ainda_não_achei:
        return -1
    else:
        return sum(pts[i:i + 3])

with open("../data/aula14ex1.txt", "r") as f:
    t = int(f.readline().split()[0])

    for it in range(t):
        print(f'\n*** Teste {it + 1} ***')
        n = int(f.readline().split()[0])
        pts = f.readline()
        pts = pts.split()[:n]
        pts = [int(x) for x in pts]
        
        print('sol1', timeit.timeit("sol1(n, pts)", number=100000, setup="from __main__ import sol1, n, pts"))
        maxper = sol1(n, pts)
        print(maxper)
        
        print('sol2', timeit.timeit("sol2(n, pts)", number=100000, setup="from __main__ import sol2, n, pts"))
        maxper = sol2(n, pts)
        print(maxper)
        
        print('sol3', timeit.timeit("sol3(n, pts)", number=100000, setup="from __main__ import sol3, n, pts"))
        maxper = sol3(n, pts)
        print(maxper)



*** Teste 1 ***
sol1 1.3800289939972572
20
sol2 0.11898300895700231
20
sol3 0.0901119569898583
20

*** Teste 2 ***
sol1 2.1064786450006068
-1
sol2 0.1323430429911241
-1
sol3 0.1633589050034061
-1


### Observações

#### Como obter a raiz quadrada “inteira” de $n$
Caso você não queira usar o dicionário para relacionar os valores de $x^2$ e $x$, uma forma muito rápida para obter a raiz quadrada de um inteiro não negativo é o chamado “método babilônico”...

In [81]:
%reset -f

def isqrt(n):
    x = n
    y = 1
    while x > y:
        x = (x + y) // 2
        y = n // x
    return x

In [82]:
print(isqrt(0), isqrt(1), isqrt(35), isqrt(36), isqrt(37))

0 1 5 6 6


#### Como separar os itens da lista na linha de entrada

Vamos recriar uma situação do exemplo e depois examinar quatro maneiras de transformar uma linha de texto em uma lista de inteiros.  
A última foi adotada no exemplo.

In [89]:
# vamos supor que a execução do comando "pts = f.readline()" no exemplo (linha 57)
# deixe pts no mesmo estado que os comando abaixos
n = 7
pts = '7 55 20 1 4 33 12'

# linha 58: separa os itens da entrada, coloca todos numa lista e pega uma fatia com os n primeiros
pts = pts.split()[:n]

# note que os itens de pts continuam sendo strings
print('pts após split =', pts, '\n')

# vamos salvar uma cópia de pts para poder restaurá-la antes de cada exemplo
cópia_pts = pts[:]

# Maneira 1: percorrer a lista usando um comando for e converter item a item
for i in range(len(pts)):
    pts[i] = int(pts[i])

print('Maneira 1:', pts)
pts = cópia_pts[:]
    
# Maneira 2: percorrer a lista usando um comando for e converter item a item, criando uma nova lista
pts = []
for x in cópia_pts:
    pts.append(int(x))

print('Maneira 2:', pts)
pts = cópia_pts[:]
    
# Maneira 3: percorrer a lista usando um comando for e converter item a item usando enumerate para manipular os índices
for (i, x) in enumerate(pts):
    pts[i] = int(x)

print('Maneira 3:', pts)
pts = cópia_pts[:]
    
# Maneira 4: usar uma "list comprehension" para converter item a item, enquanto atualiza a lista
#     esta foi a técnica adotada no exemplo (linha 59)
pts = [int(x) for x in pts]

print('Maneira 4:', pts)

pts após split = ['7', '55', '20', '1', '4', '33', '12'] 

Maneira 1: [7, 55, 20, 1, 4, 33, 12]
Maneira 2: [7, 55, 20, 1, 4, 33, 12]
Maneira 3: [7, 55, 20, 1, 4, 33, 12]
Maneira 4: [7, 55, 20, 1, 4, 33, 12]


## Exemplo 2
Se $p$ é o perímetro de um triângulo retângulo com lados de comprimento inteiro, $\{a, b, c\}$, com $ a \lt b \lt c$, há exatamente três soluções para $p = 120$.

$\{20,48,52\}$, $\{24,45,51\}$, $\{30,40,50\}$

Para qual valor de $p \le 1000$ há o maior número de soluções?

** Desenvolvimento**  
O perímetro de um triângulo é dado por $p = a + b + c$.  
Como $a \lt b \lt c$, o limite teórico para $a$ corresponderá a $b = a + 1$ e $c = a + 2$. Substituindo esses valores na equação do perímetro e resolvendo-a para $a$, obtemos $a_{máx} = \dfrac{p - 3}{3}$.  
Analogamente, o limite teórico para $b$ corresponderá a $c = b + 1$. Substituindo esse valor na equação do perímetro e resolvendo-a para $b$, 
obtemos $b_{máx} = \dfrac{p - a - 1}{2}$.

In [92]:
%reset -f

p = 1000

# um dicionário relacionando x*x e x, evita a extração repetida da raiz quadrada inteira
#     o limite para o índice é p // 2, que é a “maior” hipotenusa possível num triângulo de perímetro p
#     somamos 1 porque range não inclui o valor de “stop”
x2_x = {x * x: x for x in range(p // 2 + 1)}

# criamos uma lista para conter as soluções encontradas
# soluções[k] = lista de todos os triângulos retângulos inteiros com perímetro k
# nessa lista, cada triângulo é representado por uma tupla (a, b, c)
# inicialmente, a lista está vazia
soluções = [[] for _ in range(p + 1)]

# vamos examinar a e b exaustivamente, sujeitos aos limites calculados acima
# para cada par de catetos (a, b) calculamos a hipotenusa c e, se ela for inteira, salvamos o triângulo

for a in range(1, (p - 3) // 3 + 1):
    for b in range (a + 1, (p - a - 1) // 2 + 1):
        c2 = a * a + b * b
        # se c2 for um quadrado perfeito estará no dicionário
        c = x2_x.get(c2, None)
        
        # se c2 for um quadrado perfeito, c não é None
        # nesse caso, se o perímetro do triângulo estiver na faixa desejada, salvamos a solução
        if c is not None and (a + b + c) <= p:
            soluções[a + b + c].append((a, b, c))

# criamos uma lista paralela a sols, com o número de soluções encontradas para cada perímetro
len_soluções = [len(x) for x in soluções]

# para conferir... vamos exibir a resposta para um perímetro 120 (resposta no enunciado)
print(f'perímetro  = 120')
print(f'# soluções = {len_soluções[120]}')
print(f'soluções   = {soluções[120]}')
print()

# agora vamos calcular a resposta do problema: o maior número de soluções é max(len_soluções) e
#     esse valor está na posição len_soluções.index(max(len_soluções))
ip = len_soluções.index(max(len_soluções))
print(f'perímetro  = {ip}')
print(f'# soluções = {len_soluções[ip]}')
print(f'soluções   = {soluções[ip]}')
print()


perímetro  = 120
# soluções = 3
soluções   = [(20, 48, 52), (24, 45, 51), (30, 40, 50)]

perímetro  = 840
# soluções = 8
soluções   = [(40, 399, 401), (56, 390, 394), (105, 360, 375), (120, 350, 370), (140, 336, 364), (168, 315, 357), (210, 280, 350), (240, 252, 348)]



## Exemplo 3

Há 100 lâmpadas em fila, numeradas sequencialmente de 1 a 100. Inicialmente todas estão apagadas.  
Você vai passar 100 vezes pela fila, examinando as lâmpadas de acordo com as seguintes regras:

-   Ao examinar uma lâmpada você sempre muda o estado dela (se a lâmpada estiver apagada, você a acende; se estiver acesa, você a apaga).  
-   Na primeira vez, examine todas as lâmpadas.   
-   Na segunda vez, examine apenas as lâmpadas 2, 4, 6, ...  
-   Na terceira vez, examine apenas as lâmpadas 3, 6, 9, ...  
-   Repita esse processo até examinar apenas a lâmpada número 100.  

Quando você terminar, quais lâmpadas estarão acesas?

**Desenvolvimento**
Vamos usar uma lista de *bools* para representar o estado das lâmpadas (True = acesa, False = apagada).  
Vamos modelar o processo usando dois comandos *for* aninhados:

-   O *for i...* externo modelará as 100 passagens pela fila de lâmpadas
-   O *for j...* interno modelará o que acontece na passagem *i*.  
    Portanto, ele começará na lâmpada *i* e irá até o fim, examinando as lâmpadas de *i* em *i*.  
    Cada lâmpada examinada terá seu estado mudado.

In [93]:
lâmpadas = [False] * 101
for i in range (1, 101):
    for j in range (i, 101, i):
        lâmpadas[j] = not lâmpadas[j]

# se lâmpadas[i] for True, ela está acesa
acesas = [i for i in range(1, 101) if lâmpadas[i]]
print('lâmpadas acesas =', acesas)

lâmpadas acesas = [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


**Análise do resultado**  
Só ficaram acesas as lâmpadas cujos números são quadrados perfeitos. Será que conseguimos explicar isso?
> Toda lâmpada $i$, onde $i$ é primos, estará apagada. Ela foi acesa no primeiro passo e foi apagada no passo $i$. Como $i$ é primo, ela não foi examinada em qualquer outro passo.

> Toda lâmpada $i$, onde $i$ não é primo, pode ter seu número expresso como um produto de potências de números primos, isto é $i = p_1^{e_1} \cdot p_2^{e_2} \cdot \dots p_n^{e_n}$.  
  Essa lâmpada será examinada em todo passo que seja um fator de $i$, isto é, $(e_1 + 1) \cdot (e_2 + 1) \cdot \dots (e_n + 1)$ vezes.  
  Para que ela esteja acesa ao final, é preciso que esse produto seja ímpar.  
  Para que esse produto seja ímpar, é preciso que todos os fatores sejam ímpares.  
  Para que todos os fatores $(e_k + 1)$ sejam ímpares, todos $e_k$ devem ser pares.  
  Se $e_k$ é par, ele pode ser escrito como $2 \frac{e_k}{2}$.  
  Assim, para toda lâmpada $i$ que estiver acesa no final do processo, poderemos escrever $i = p_1^{2\frac{e_1}{2}} \cdot p_2^{2\frac{e_2}{2}} \cdot \dots p_n^{2\frac{e_n}{2}}$ e, portanto, $i = (p_1^{\frac{e_1}{2}} \cdot p_2^{\frac{e_2}{2}} \cdot \dots p_n^{\frac{e_n}{2}})^2$, isto é, $i$ é um quadrado perfeito.  
  Conhecida essa relação, podemos reescrever nossa solução como...

In [103]:
%reset -f

acesas = [i * i for i in range(1, int(100 ** 0.5) + 1)]
print('lâmpadas acesas =', acesas)

lâmpadas acesas = [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


## Exemplo 4
Dada uma lista de tamanho $n$ e um número $k$, encontre todos os elementos que aparecem na lista mais do que $\dfrac{n}{k}$ vezes.  
Por exemplo, se a lista de entrada for $[3, 1, 2, 2, 1, 2, 3, 3]$ e $k = 4$, a saída deverá ser $[2, 3]$.  
Note que o tamanho da lista é $8$ (ou $n = 8$), portanto, precisamos encontrar todos os elementos que aparecem mais de $2$ (ou $\dfrac{8}{4}$) vezes.  
Existem dois elementos que aparecem mais de duas vezes, $2$ e $3$.

Vamos usar um gerador de aleatórios para criar listas de tamanho arbitrário...

Uma solução simples é percorrer a lista e, para cada novo valor encontrado, contar quantos iguais a ele existem até o final da lista, salvando todos aqueles que aparecerem mais do que $\frac{n}{k}$ vezes.

In [117]:
%reset -f

from time import perf_counter
from random import seed, choices

for p in range(1, 7):
    n = 10 ** p
    k = n // p
    seed(10)
    lista = choices(range(1, n+1), k=n)
    
    start = perf_counter()
    vistos = []
    resp = []
    for i, li in enumerate(lista):
        if li not in vistos:
            vistos.append(li)
            cnt = 0
            for lj in lista[i:]:
                if lj == li:
                    cnt += 1
                    if cnt > n // k:
                        resp.append(li)
                        break
    end = perf_counter()
    print(f'{n:8} {end-start:10.5f} {k:5} {n // k:5} {len(resp):6} {sorted(resp)[:10]}')

      10    0.00002    10     1      2 [6, 9]
     100    0.00050    50     2      7 [17, 25, 44, 49, 53, 59, 61]
    1000    0.03257   333     3     15 [51, 155, 176, 328, 361, 424, 490, 536, 610, 628]
   10000    2.38959  2500     4     33 [232, 759, 1344, 1852, 1947, 2524, 2657, 2693, 2776, 3022]


KeyboardInterrupt: 

O problema é que essa solução tem complexidade $\mathcal{O}(n^2)$, o que pode não ser aceitável.  
Uma solução com complexidade $\mathcal{O}(n \cdot \log_{2}{n})$ pode ser obtida ordenando-se primeiramente a lista, como mostrado abaixo.

In [116]:
%reset -f

from time import perf_counter
from random import seed, choices

for p in range(1, 7):
    n = 10 ** p
    k = n // p
    seed(10)
    lista = choices(range(1, n+1), k=n)

    start = perf_counter()
    resp = []
    lista.sort()
    ia = None
    cnt = 0
    for i in lista:
        if i != ia:
            if cnt > n // k:
                resp.append(ia)
            cnt = 1
            ia = i
        else:
            cnt += 1
    if cnt > n // k:
        resp.append(ia)

    end = perf_counter()
    print(f'{n:8} {end-start:10.5f} {k:8} {n // k:5} {len(resp):6} {sorted(resp)[:10]}')

      10    0.00001       10     1      2 [6, 9]
     100    0.00004       50     2      7 [17, 25, 44, 49, 53, 59, 61]
    1000    0.00039      333     3     15 [51, 155, 176, 328, 361, 424, 490, 536, 610, 628]
   10000    0.00494     2500     4     33 [232, 759, 1344, 1852, 1947, 2524, 2657, 2693, 2776, 3022]
  100000    0.06476    20000     5     61 [297, 2927, 3549, 4273, 5158, 5715, 7310, 8570, 8662, 12029]
 1000000    0.87014   166666     6     87 [5104, 6475, 12461, 14135, 24975, 39261, 41184, 46269, 73676, 109298]


Esse desempenho pode ser melhorado ainda mais se, em vez de uma lista, usarmos um dicionário.

In [119]:
%reset -f

from time import perf_counter
from random import seed, choices

for p in range(1, 7):
    n = 10 ** p
    k = n // p
    seed(10)
    lista = choices(range(1, n+1), k=n)

    start = perf_counter()
    resp = {}
    for i in lista:
        if i not in resp:
            resp[i] = 1
        else:
            resp[i] += 1
    resp = [key for key, cnt in resp.items() if cnt > n // k]
    
    end = perf_counter()
    print(f'{n:8} {end-start:10.5f} {k:8} {n // k:5} {len(resp):6} {sorted(resp)[:10]}')

      10    0.00001       10     1      2 [6, 9]
     100    0.00003       50     2      7 [17, 25, 44, 49, 53, 59, 61]
    1000    0.00026      333     3     15 [51, 155, 176, 328, 361, 424, 490, 536, 610, 628]
   10000    0.00286     2500     4     33 [232, 759, 1344, 1852, 1947, 2524, 2657, 2693, 2776, 3022]
  100000    0.02617    20000     5     61 [297, 2927, 3549, 4273, 5158, 5715, 7310, 8570, 8662, 12029]
 1000000    0.40616   166666     6     87 [5104, 6475, 12461, 14135, 24975, 39261, 41184, 46269, 73676, 109298]


## Exemplo 5
Dada uma lista de inteiros positivos, colocar os itens pares em ordem crescente e os ímpares em ordem decrescente, mantendo os respectivos grupos em suas posições originais.

In [124]:
%reset -f

from random import choices

def pprint(título, lista, n):
    print(título)
    cnt = 0
    for k in range(n):
        print(f'{lista[k]:5}', end='')
        cnt += 1
        if cnt % 10 == 0:
            print()
    if cnt % 10 != 0:
        print()
    print()

n = 50
lista = choices(range(1, n+1), k=n)
pprint('lista original', lista, n)

é_par = [x % 2 == 0 for x in lista]
pares = sorted([x for x in lista if x % 2 == 0])
pprint('pares ordenados', pares, len(pares))

ímpares = sorted([x for x in lista if x % 2 == 1], reverse=True)
pprint('ímpares ordenados', ímpares, len(ímpares))

ip = 0
ii = 0
resp = []
for i in range(len(lista)):
    if é_par[i]:
        resp.append(pares[ip])
        ip += 1
    else:
        resp.append(ímpares[ii])
        ii += 1
pprint('lista ordenada', resp, n)

lista original
   35    7   14   30   19    2   25   47   47    2
   18   39   15    9   10    7   45   31   37   29
   23    4   29   44   46   34   37   47   50   20
   38   48   36   15   15   13   31   27   41   24
   38   12   27   26    2   27   11   19   14   19

pares
    2    2    2    4   10   12   14   14   18   20
   24   26   30   34   36   38   38   44   46   48
   50

ímpares
   47   47   47   45   41   39   37   37   35   31
   31   29   29   27   27   27   25   23   19   19
   19   15   15   15   13   11    9    7    7

lista ordenada
   47   47    2    2   47    2   45   41   39    4
   10   37   37   35   12   31   31   29   29   27
   27   14   27   14   18   20   25   23   24   26
   30   34   36   19   19   19   15   15   15   38
   38   44   13   46   48   11    9    7   50    7



## Exercício 2: Contagem de letras
Escreva um programa que:

1. leia uma linha de texto
2. imprima uma tabela com cada uma das letras que existem no texto, em ordem alfabética, junto com o número de vezes em que essa letra ocorre. 

Ignore maiúsculas/minúsculas e acentuação.

In [141]:
%reset -f
import string

#ler uma linha de texto
texto = 'O problema é que essa solução tem complexidade  O(n2), o que pode não ser aceitável.'

# converter para minúsculas
texto = texto.lower()

# remover acentos
com_acento = ['á', 'à', 'ã', 'â', 'é', 'ê', 'í', 'ó', 'õ', 'ô', 'ú', 'ç']
sem_acento = ['a', 'a', 'a', 'a', 'e', 'e', 'i', 'o', 'o', 'o', 'u', 'c']
for i, c in enumerate(com_acento):
    texto = texto.replace(c, sem_acento[i])

# remover algarismos e pontuação
for c in string.digits + string.punctuation + string.whitespace:
    texto = texto.replace(c, '')
    
# criar um dicionário contando as ocorrências de cada caractere
ocorrências = {}
for c in texto:
    if c in ocorrências:
        ocorrências[c] += 1
    else:
        ocorrências[c] = 1

for c in sorted(ocorrências):
    print(c, ocorrências[c])


a 7
b 1
c 3
d 3
e 12
i 2
l 4
m 3
n 2
o 9
p 3
q 2
r 2
s 4
t 2
u 3
v 1
x 1


## Exercício 3: Substituição de texto
Escreva um programa que:

1.   leia uma linha de texto 
2.   leia uma segunda linha, com duas *strings* `antes` e `depois` separadas por espaços
3.   exiba o texto lido inicialmente com todas as ocorrências de `antes` substituídas por `depois`.

In [144]:
%reset -f

#ler uma linha de texto

texto = input()
print('texto original:', texto)
strs = input().split()
antes, depois = strs[:2]
print('antes:', antes)
print('depois:', depois)

novo_texto = ''
i = 0
while i < len(texto) - len(antes):
    if texto[i : i + len(antes)] == antes:
        novo_texto += depois
        i += len(antes)
    else:
        novo_texto += texto[i]
        i += 1
novo_texto += texto[i:]
print('novo texto:', novo_texto)

texto original: Laranja madura na beira da estrada... tá bichada, Zé... ou tem marimbondo no pé...
antes: ra
depois: RA
novo texto: LaRAnja maduRA na beiRA da estRAda... tá bichada, Zé... ou tem marimbondo no pé...
