In [1]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

In [2]:
from time import perf_counter
import random

# Exercícios de revisão 1
#### MC102-2018s1-Aula28-180614

## 1. Função para calcular uma aproximação de $\pi$.
Escreva uma função chamada $myPi$ que retorne uma aproximação de $\pi \;(3.14159\dots)$, usando a fórmula de Leibniz:

$$1 - \frac{1}{3} + \frac{1}{5} - \frac{1}{7} + \dots = \frac{\pi}{4}$$

Como referência, o valor aproximado de $\pi$ usado por Python é...

In [3]:
import math
print(math.pi)

3.141592653589793


### 1.1 Discussão
Este problema envolve o cálculo de uma soma parcial de uma sequência infinita.   

$$s_n = t_0 + t_1 + \dots + t_n$$

Essa sequência pode ser expressa de forma recorrente como

\begin{align*}
s_0 &= t_0           \\
s_1 &= s_0 + t_1     \\
    &\vdots          \\
s_n &= s_{n-1} + t_n \\
\end{align*}

Numa implementação, nosso objetivo será calcular $s_n$ para $n$ suficientemente grande ou $t_n$ suficientemente pequeno de modo que $s_n$ possa ser considerada uma aproximação aceitável de $s_\infty$.

Por sua vez, a sequência $t$ é dada por

$$
t = \left\{ \frac{1}{1},  \frac{-1}{3}, \frac{1}{5}, 
            \frac{-1}{7}, \dots \right\}
$$

e pode ser expressa de forma direta ou recorrente.

Para desenvolver a expressão direta, o principal cuidado é notar que nos termos com índice par o numerador da fração é igual a $1$, enquanto que nos termos com índice ímpar ele é igual a $-1$. 
Isso nos leva a:
$$
t_i = \frac{(-1)^i}{2i+1}
$$

A implementação direta normalmente será feita por um laço _while_ ou _for_.   
Se escolhermos o laço _while_, a repetição será normalmente interrompida depois de um certo número de iterações ou quando os termos da sequência ficarem menores do que um valor $\varepsilon$ pré-especificado.   
Se escolhermos o laço _for_ a interrupção naturalmente acontecerá após um certo número de iterações.

#### 1.1.1 Implementação direta com um laço _while_

In [4]:
def myPi(epsilon):
    i = 0
    t = 1.0   
    s = t
    while abs(t) > epsilon:
        i += 1
        t = (-1) ** i / (2 * i + 1)
        s += t
    return 4 * s

print(myPi(1e-7))

3.1415928535897395


#### 1.1.2 Implementação direta com um laço _for_

In [5]:
def myPi(n):
    t = 0.0
    s = t
    for i in range(n):
        t = (-1) ** i / (2 * i + 1)
        s += t
    return 4 * s

print(myPi(10**7))

3.1415925535897915


Para desenvolver uma solução por recorrência, vamos primeiro expressar o numerador e o denominador da fração também como sequências, isto é

$$
t_i = \frac{num_i}{den_i}
$$

onde $num = \left\{1, -1, 1, -1, \dots \right\}$ e 
$den = \left\{1, 3, 5, 7, \dots \right\}$.

Com isso já é possível escrever as expressões recorrentes

\begin{align*}
num_i &= -num_{i-1}    \\
den_i &= den_{i-1} + 2 \\
t_i   &= \frac{num_i}{den_i}
\end{align*}

e aproveitar do desenvolvimento anterior
$$ s_i = s_{i-1} + t_i$$

Nas implementações abaixo, as atribuições que precedem os laços, definem os valores iniciais $num_0, den_0, t_0$ e $s_0$ necessários na primeira iteração.

#### 1.1.3 Implementação recorrente com um laço _while_

In [6]:
def myPi(epsilon):
    num = 1
    den = 1
    t = num / den
    s = t
    while abs(t) > epsilon:
        num *= -1
        den += 2
        t = num / den
        s += t
    return 4 * s

print(myPi(1e-6))

3.1415946535856922


#### 1.1.4 Implementação recorrente com um laço _for_

In [7]:
def myPi(num_termos):
    num = 1
    den = 1
    t = num / den
    s = t
    for i in range(num_termos):
        num *= -1
        den += 2
        t = num / den
        s += t
    return 4 * s

print(myPi(10**7))

3.1415927535897814


## 2. Função para reconhecer se um triângulo é retângulo
Escreva uma função $\mathit {é\_retângulo}$ que, dado o comprimento dos três lados de um triângulo, em qualquer ordem, determine se o triângulo é retângulo, 
retornando $\mathit{True}$ caso ele o seja, ou $ \mathit{False}$, caso contrário.

### 2.1 Discussão
De acordo com o enunciado, 
os três valores dados correspondem aos lados de um triângulo, 
portanto não é preciso verificar a existência da figura.

De acordo com o Teorema de Pitágoras, num triângulo retângulo a soma dos quadrados dos menores lados é igual ao quadrado do maior lado. 

Esta é a primeira dificuldade deste problema: os lados são dados em qualquer ordem. 

A segunda dificuldade está no fato de a aritmética de ponto flutuante quase nunca ser exata. Por isso não é seguro testar a igualdade de números de ponto flutuante. Para determinar se $x$ é “igual” a $y$ escreve-se algo como...
```python
if abs(x - y) < epsilon:     # se x é aproximadamente igual a y
    ...
```
que permite avaliar se a diferença entre $x$ e $y$ está dentro de uma tolerância $\varepsilon$ preestabelecida.

### 2.1 Solução direta

Neste caso, identificamos a hipotenusa e ajustamos a fórmula do teorema de Pitágoras adequadamente.

In [8]:
def é_retângulo(a, b, c):
    if c > a and c > b:     # c é o maior lado?
        return abs(a ** 2 + b ** 2 - c ** 2) < 0.001
    elif a > b and a > c:   # a é o maior lado?
        return abs(c ** 2 + b ** 2 - a ** 2) < 0.001
    else:                   # então o maior lado é b
        return abs(a ** 2 + c ** 2 - b ** 2) < 0.001

é_retângulo(3, 5, 4.0)
é_retângulo(3, 5, 4.001)
é_retângulo(3, 5, 4.0001)

True

False

True

### 2.1 Solução simples

Neste caso, identificamos o maior lado e, se necessário, permutamos  dois parâmetros para que ele sempre seja $c$. 
Com isso, não é necessário ajustar a fórmula do teorema de Pitágoras.

In [9]:
def é_retângulo(a, b, c):
    if a > b and a > c:      # a é o maior lado: trocamos com c
        a, c = c, a
    elif b > a and b > c:    # b é o maior lado: trocamos com c
        b, c = c, b        
    return abs(a ** 2 + b ** 2 - c ** 2) < 0.001

é_retângulo(3, 5, 4.0)
é_retângulo(3, 5, 4.001)
é_retângulo(3, 5, 4.0001)

True

False

True

### 2.2 Solução usando uma lista

Neste caso, criamos e ordenamos uma lista com os três parâmetros. Dessa forma, o maior lado sempre será o último item da lista. 
A atribuição converte a lista ordenada em uma tupla (no caso, expressa sem os parênteses, que são opcionais).

In [10]:
def é_retângulo(a, b, c):
    a, b, c = sorted([a, b, c])
    return abs(a ** 2 + b ** 2 - c ** 2) < 0.001

é_retângulo(3, 5, 4.0)
é_retângulo(3, 5, 4.001)
é_retângulo(3, 5, 4.0001)

True

False

True

## 3. Funções sobre listas
Embora Python ofereça muitos métodos de lista, é muito instrutivo entender como eles são implementados. Implemente funções Python que retornem o mesmo resultado que os métodos abaixo.

### 3.1 count
Conta e retorna quantas vezes um dado $objeto$ aparece em uma $lista$.

In [11]:
def my_count(objeto, lista):
    n = 0
    for item in lista:
        if item == objeto:
            n += 1
    return n

In [12]:
%%timeit lista = [1, 2, 1, 1, 3, 2, 1, 2, 3, 5]
my_count(1, lista)

467 ns ± 5.81 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


Uma solução equivalente pode ser criada usando uma _list comprehension_.
Esta solução será mais compacta mas menos eficiente devido ao custo da criação da lista adicional.

In [13]:
def my_count(objeto, lista):
    return len([True for x in lista if x == objeto])

In [14]:
%%timeit lista = [1, 2, 1, 1, 3, 2, 1, 2, 3, 5]
my_count(1, lista)

684 ns ± 11.5 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


Também é possível criar uma solução recursiva, desde que a $lista$ também seja vista dessa forma.
Por exemplo,
$$lista = [\,] \enspace | \enspace [item] + lista$$
isto é, _uma lista é vazia_ ou é _uma lista com um único item seguida por uma lista_.

In [15]:
def my_count(objeto, lista):
    if len(lista) == 0:
        return 0
    elif lista[0] == objeto:
        return 1 + my_count(objeto, lista[1:])
    else:
        return my_count(objeto, lista[1:])

In [16]:
%%timeit lista = [1, 2, 1, 1, 3, 2, 1, 2, 3, 5]
my_count(1, lista)

2.86 µs ± 162 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


Veja como o _overhead_ da chamada recursiva e a clonagem da lista comprometeram a eficiência da função.   
Visando atenuar um pouco esse prejuízo, na implementação abaixo foi acrescentado um terceiro parâmetro (opcional) que dá a posição da lista em que a busca se encontra, evitando a clonagem da $lista$ nas sucessivas chamadas.

In [17]:
def my_count(objeto, lista, i=0):
    if i >= len(lista):
        return 0
    elif lista[i] == objeto:
        return 1 + my_count(objeto, lista, i+1)
    else:
        return my_count(objeto, lista, i+1)

In [18]:
%%timeit lista = [1, 2, 1, 1, 3, 2, 1, 2, 3, 5]
my_count(1, lista)

2.19 µs ± 20.8 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


### 3.2 in
Testar se em uma $lista$ existe pelo menos um item com valor igual ao de um dado $objeto$ e retornar $True$ ou $False$, conforme o resultado do teste.

In [19]:
def my_in(objeto, lista):
    for item in lista:
        if item == objeto:
            return True
    return False

In [20]:
%%timeit lista = random.choices(range(1000), k=500)
for i in range(1000): 
    x = my_in(i, lista)

11.2 ms ± 336 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


### 3.3 reverse
Altera uma $lista$ dada, invertendo a ordem de seus itens, e retorna $None$.

#### 3.3.1 Solução iterativa
Percorremos a lista até o meio, permutando os itens em posições simétricas em relação ao centro da lista.

In [21]:
def my_reverse(lista):
    for i in range(len(lista) // 2):
        lista[i], lista[-1-i] = lista[-1-i], lista[i]

teste = list('a grama é amarga')
my_reverse(teste)
print(teste)

teste = list('anotaram a data da maratona')
my_reverse(teste)
print(teste)

teste = [1, 'abc', 3.14, True]
my_reverse(teste)
print(teste)


['a', 'g', 'r', 'a', 'm', 'a', ' ', 'é', ' ', 'a', 'm', 'a', 'r', 'g', ' ', 'a']
['a', 'n', 'o', 't', 'a', 'r', 'a', 'm', ' ', 'a', 'd', ' ', 'a', 't', 'a', 'd', ' ', 'a', ' ', 'm', 'a', 'r', 'a', 't', 'o', 'n', 'a']
[True, 3.14, 'abc', 1]


In [22]:
%%timeit
teste = list('a grama é amarga')
my_reverse(teste)
teste = list('anotaram a data da maratona')
my_reverse(teste)
teste = [1, 'abc', 3.14, True]
my_reverse(teste)

5.13 µs ± 105 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


#### 3.3.2 Solução recursiva
É possível desenvolver uma solução recursiva, desde que a $lista$ também seja vista dessa forma.
Por exemplo,
$$lista = [\;] \enspace \vert \enspace [item] \enspace | \enspace [item] + lista + [item]$$
isto é, _uma lista é vazia_ ou é _uma lista com um único item_ ou é _uma lista com mais um item no início e outro no final_.

A implementação abaixo identifica e ignora os casos-base (a $lista$ inversa é igual à original) e faz a chamada recursiva nos demais casos. O índice de controle do laço _for_ da solução iterativa aqui é transmitido pelo segundo parâmetro.    
Isso permite evitar a clonagem da $lista$ nas sucessivas chamadas, que é uma das maiores causas de ineficiência em algoritmos recursivos.


In [23]:
def my_reverse(lista, i=0):
    if i < len(lista) // 2:
        lista[i], lista[-1-i] = lista[-1-i], lista[i]
        my_reverse(lista, i+1)

teste = list('a grama é amarga')
my_reverse(teste)
print(teste)

teste = list('anotaram a data da maratona')
my_reverse(teste)
print(teste)

teste = [1, 'abc', 3.14, True]
my_reverse(teste)
print(teste)

['a', 'g', 'r', 'a', 'm', 'a', ' ', 'é', ' ', 'a', 'm', 'a', 'r', 'g', ' ', 'a']
['a', 'n', 'o', 't', 'a', 'r', 'a', 'm', ' ', 'a', 'd', ' ', 'a', 't', 'a', 'd', ' ', 'a', ' ', 'm', 'a', 'r', 'a', 't', 'o', 'n', 'a']
[True, 3.14, 'abc', 1]


In [24]:
%%timeit
teste = list('a grama é amarga')
my_reverse(teste)
teste = list('anotaram a data da maratona')
my_reverse(teste)
teste = [1, 'abc', 3.14, True]
my_reverse(teste)

11.5 µs ± 2.66 µs per loop (mean ± std. dev. of 7 runs, 100000 loops each)


### 3.4 index
Retorna o índice do primeiro item de uma dada $lista$ com valor igual ao de um dado $objeto$ ou $None$ se ele não existir.

Uma solução direta usa um comando _for_ para percorrer a $lista$ e ao encontrar um item com valor igual ao de $objeto$ retorna seu índice.

In [25]:
def my_index_1(objeto, lista):
    for ix in range(len(lista)):
        if lista[ix] == objeto:
            return ix
    return None

l = [1, 'abc', 3.14, True]
print(my_index_1(3.14, l), my_index_1(3.1416, l))

2 None


Para evitar a manipulação direta do índice é possível usar $enumerate(lista)$ no lugar da $range$.

In [26]:
def my_index_2(objeto, lista):
    for ix, item in enumerate(lista):
        if item == objeto:
            return ix
    return None

lista = [1, 'abc', 3.14, True]
print(my_index_2(3.14, lista), my_index_2(3.1416, lista))

2 None


Neste caso, a solução com $enumerate$ é ligeiramente mais eficiente.

In [27]:
%%timeit lista = random.choices(range(1000), k=500)
for i in range(1000): x = my_index_1(i, lista)

29.9 ms ± 5.84 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [28]:
%%timeit lista = random.choices(range(1000), k=500)
for i in range(1000): x = my_index_2(i, lista)

24.3 ms ± 5.29 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


## 4. Arquivos de texto
O arquivo-exemplo abaixo ($studentdata.txt$) contém uma linha para cada aluno de uma turma imaginária. 
O nome do aluno não contém espaços e é a primeira coisa em cada linha, seguido por algumas notas de provas. O número de notas pode variar de um aluno para outro.
```
josé 10 15 20 30 40 52
antonio 23 16 19 22
maria 8 22 17 14 32 17 24 21 2 9 11 17
lúcia 12 28 21 45 26 10
joão 14 32 25 16 89
```
Escreva um programa que leia o arquivo de texto $studentdata.txt$ e imprima os nomes de alunos que tenham pelo menos seis notas de provas.

In [29]:
dados = '../data/studentdata.txt'
with open(dados) as arq:
    linha = arq.readline()
    while linha:
        itens = linha.split()
        if (len(itens) - 1 >= 6):
            print(itens[0])
        linha = arq.readline()

josé
maria
lúcia


## 5. Dicionários

Escreva uma função que receba uma cadeia de caracteres e imprima uma tabela com as letras do alfabeto que ocorrem nessa cadeia, em ordem alfabética, junto com o número de vezes em que cada letra ocorre. 

Maiúsculas e minúsculas devem ser consideradas equivalentes e qualquer outro caractere deve ser ignorado.

### 5.1 Discussão
Esta é uma aplicação típica para um _dicionário_.
A cadeia de caracteres recebida deve ser convertida para minúsculas e depois examinada caractere a caractere, 
já ignorando os caracteres não-alfabéticos.

A primeira ocorrência de uma letra causará sua inserção no dicionário com valor 1. Esse valor é incrementado a cada nova ocorrência da letra. 

Ao final, o dicionário deverá ser ordenado e exibido no seguinte formato
```
a 7
c 3
d 1
```

In [30]:
texto = 'Esta Cadeia 123 tEm letras MAIÚSCULAS e minúsculas.,:'
qtd = dict()
for letra in texto.lower():
    if 'a' <= letra <= 'z':
        if letra in qtd:
            qtd[letra] += 1
        else:
            qtd[letra] = 1
for letra in sorted(qtd):
    print(letra, qtd[letra])

a 7
c 3
d 1
e 5
i 3
l 3
m 3
n 1
r 1
s 6
t 3
u 2
