# Exercícios de 1 a 5

1 - Enquanto `N` é um inteiro positivo, considere a função `f(n)`, que satisfaz as seguintes sentenças:

```
f(0) = 0
f(1) = 1
f(n) = f(n-1) + f(n-2)
```

Crie um programa que determine `f(n)`.

In [12]:
# https://stackoverflow.com/questions/47564765/how-to-make-this-recursive-function-faster-in-python-or-java

def f_all(n):
    
    res = (n+1)*[0]
    res[1] = 1
    for i in range(2, n+1):
        res[i] = res[i-1] + res[i-2]
    return res[-1]

----------------

2 - Utilize o programa anterior para calcular `f(10000)`. Estime a complexidade do algoritmo.

Complexidade:

São n iterações, onde cada uma a lista precisa ser acessada. Como a lista do python é uma linked-list então o custo de acesso é n. Portanto, o algorítimo é O($n^2$).

In [11]:
f_all(10000)

3364476487643178326662161200510754331030214846068006390656476997468008144216666236815559551363373402558206533268083615937373479048386526826304089246305643188735454436955982749160660209988418393386465273130008883026923567361313511757929743785441375213052050434770160226475831890652789085515436615958298727968298751063120057542878345321551510387081829896979161312785626503319548714021428753269818796204693609787990035096230229102636813149319527563022783762844154036058440257211433496118002309120828704608892396232883546150577658327125254609359112820392528539343462090424524892940390170623388899108584106518317336043747073790855263176432573399371287193758774689747992630583706574283016163740896917842637862421283525811282051637029808933209990570792006436742620238978311147005407499845925036063356093388383192338678305613643535189213327973290813373264265263398976392272340788292817795358057099369104917547080893184105614632233821746563732124822638309210329770164805472624384237486241145309381220656491403

-------------------

3 - Implemente um programa que liste todos os nós de um nível de uma árvore binária.

Você basicamente tem que fazer um BFS. 

1. Primeiro definimos uma classe que monta a Binary Tree. Adaptei de um código encontrado na referência.
2. Depois, basta aplicar um BFS, salvar os resultados em uma lista e retornar os valores.

In [24]:
# https://www.tutorialspoint.com/python/python_binary_tree.htm
class Node:

    def __init__(self, data):

        self.left = None
        self.right = None
        self.data = data

    def insert(self, data):

        if self.data:
            if data < self.data:
                if self.left is None:
                    self.left = Node(data)
                else:
                    self.left.insert(data)
            elif data > self.data:
                if self.right is None:
                    self.right = Node(data)
                else:
                    self.right.insert(data)
        else:
            self.data = data


    def print_tree(self):
        if self.left:
            self.left.print_tree()
        print( self.data),
        if self.right:
            self.right.print_tree()

In [74]:
root = Node(1)
root.insert(3)
root.insert(2)
root.insert(5)
root.insert(4)

In [75]:
root.print_tree()

1
2
3
4
5


In [81]:
# https://stackoverflow.com/questions/48535063/binary-tree-get-all-nodes-for-every-level

# OBS: esse código foi um pouco inspirado na minha experiência com LISP. Ele faz bem mais sentido
# para trabalhar com grafos.
def get_nodes_at_level(root, level): 
    
    def func(root, level):
        if root is None:
            return

        if level >= len(list_of_lists):
            level_list = []
            list_of_lists.append(level_list)
        list_of_lists[level].append(root.data)
        func(root.left, level+1)
        func(root.right, level+1)
        
    list_of_lists=[]
    func(root, 0)
    return list_of_lists[level]

In [79]:
get_nodes_at_level(root, 3)

[4]

----------------------------

4 - Você possui um site com um bilhão de usuários, cujos IDs são inteiros, positivos e sequenciais (de 1 até um bilhão).<br>
O log de acesso do seu servidor no último mês tem 500GB, onde constam esses IDs.<br>
Você quer saber quantos usuários únicos acessaram o site nesse período, mas sua máquina só tem 512 MB de memória.<br>
Como você desenvolveria uma aplicação para esse fim sem usar ferramentas externas?


Esse problema só apresenta limitações na memória RAM, portanto, não vou me preocupar com a velocidade. 

A solução mais simples é ler o arquivo de 500GB em chuncks que caibam na memória e comparar com um arquivo de usuários únicos.

Supondo que o arquivo está em .txt e tem somente os ids, podemos gerar um para teste.

In [83]:
import random

In [100]:
ids = [random.randint(1,1000000000) for x in range(100)]

with open('ids.txt', 'w') as f:
    for i in ids:
        f.write(str(i) + '\n')

Aparentemente, para arquivos baseados em quebra de linha o python já carrega o arquivo em 'lazy mode'

https://stackoverflow.com/questions/519633/lazy-method-for-reading-big-file-in-python

Como carregar uma lista de ids únicos possívelmente 1 bi pode consumir até 8GB de RAM. Podemos separar em diversos arquivos que tenham no máximo 300MB (por segunrança). De 62.5 milhões em 62.5 milhões é suficiente, mas podemos diminuir esse número para aumentar a velocidade de busca. Então, vamos com 6.25 milhões de intervalo.

In [110]:
def check_if_exists(line):
    
    current_id = int(line)
    file_name = str(int(round(current_id / 6250000, 0))) + '.txt'
    
    try:
        for existent in open('unique_ids/' + file_name):
            if current_id == int(existent):
                return
    except FileNotFoundError:
        pass
    
    open('unique_ids/' + file_name, 'a').write(line)
       
for line in open('ids.txt'):
    check_if_exists(line)

Finalmente, podemos consolidar os arquivos usando bash.

In [112]:
!cd unique_ids; cat *.txt >> ../all_ids.txt

Dessa forma, o máximo de memória usada será ditado pelo tamanho máximo do arquivo de unique_ids. Basta dividi-lo para suprir as limitações

--------------------------

5 - Recebemos recentemente um arquivo de texto com nomes de diversos procurados pela justiça no seguinte formato:

```nome: Fulano da Silvanome: Beltrano José Pereira nome: Ciclano Feliciano Marcianonome: Ildo Vieira Pereiranome: João Ninguém nome: Fulaninha```

Não é um dos melhores formatos de arquivo para se trabalhar, precisamos de uma solução!<br>
Produza uma **Regex Python** que obtenha apenas os nomes completos 

Usando o exemplo da questão, temos:

In [114]:
texto = 'nome: Fulano da Silvanome: Beltrano José Pereira nome: Ciclano Feliciano Marcianonome: Ildo Vieira Pereiranome: João Ninguém nome: Fulaninha'

In [119]:
texto_tratado = [t.strip() for t in texto.split('nome: ') if len(t) > 0 ]

In [120]:
texto_tratado

['Fulano da Silva',
 'Beltrano José Pereira',
 'Ciclano Feliciano Marciano',
 'Ildo Vieira Pereira',
 'João Ninguém',
 'Fulaninha']

Agora basta colocar no arquivo de preferência.