# Lista 4 - Árvores - EDAII
#### Alunos: Ícaro Pires (15/0129815) e Vinicius Bernardo (15/0151331)

## Descrição

Abaixo é utilizada uma árvore AVL para mostrar o índice de violência de todas as cidades disponíveis no site do governo. Depois são buscadas cidades aleatórias na árvore o tempo das buscas é calculado para ilustrar a velocidade de busca numa árvore bem balanceada.

Também é gerada uma ilustração da árvore para que possa-se checar os resultados e observar como a árvore está bem estruturada.

### Leitura do Dataset

In [1]:
import pandas as pd
police_reports_df = pd.read_csv('ocorrencias/ocorrencias_2017_2004.csv', sep=';', encoding='latin-1', dtype={'Código IBGE Município': pd.np.str})

In [2]:
import numpy as np

all_county = np.array(police_reports_df['Município'].unique())

def calculate_violence(row):
    weight_crimes = {
        'Estupro': 9,
        'Furto de veículo': 3,
        'Homicídio doloso': 8,
        'Roubo de veículo': 5,
        'Roubo seguido de morte (latrocínio)': 10,
        'Lesão corporal seguida de morte': 7
    }
    
    return weight_crimes[row['Tipo Crime']] * float(row['PC-Qtde Ocorrências'])

police_reports_df['Indice Violencia'] = police_reports_df.apply(calculate_violence, axis=1)

tuples = []
for county in all_county:
    records = police_reports_df.loc[police_reports_df['Município'] == county]
    tuples += [(records['Indice Violencia'].sum(), county)]

In [3]:
import pydotplus
import avltree
from IPython.display import Image

graph = pydotplus.Dot(graph_type='digraph')

tree = avltree.avltree()

for i in tuples:
    tree.insert(i)
    
def get_city_str(node):
    return f'{str(node.index[1])}: {str(node.index[0])}'
    
def build_graph(root):
    if root.child[0]:
        edge = pydotplus.Edge(get_city_str(root), get_city_str(root.child[0]))
        graph.add_edge(edge)
        build_graph(root.child[0])
    
    if root.child[1]:
        edge = pydotplus.Edge(get_city_str(root), get_city_str(root.child[1]))
        graph.add_edge(edge)
        build_graph(root.child[1])
        
build_graph(tree.root)
graph.write_pdf('arvore_gigante.pdf')

True

In [4]:
import random
from timeit import default_timer as timer

some_cities = [random.choice(tuples) for i in range(100)]

result = []
start_time = timer()
for city in some_cities:
    result += [tree.find_node(city).index[1]]
end_time = timer()
total_time = end_time - start_time

print('As cidades escolhidas foram: {}.\n\nE o tempo levado foi {}.'.format(', '.join(result), total_time))

As cidades escolhidas foram: Ananás, Ariranha Do Ivaí, Jaru, Santa Helena De Goiás, Acará, Monte Castelo, Garanhuns, Jussara, Piquerobi, Caxambu Do Sul, Caputira, Armação Dos Búzios, Selvíria, Feliz Natal, Ipuã, Araioses, Heitoraí, Gandu, Coromandel, Sousa, São Sebastião Do Rio Preto, Tangará, Orobó, Carpina, Ipecaetá, Paiçandu, Candelária, Rio Brilhante, São João De Iracema, Ariquemes, Araucaria, Itaú De Minas, Sumé, Goiatuba, São João Nepomuceno, Cristalina, Pindobaçu, Tavares, Entre Rios, Bocaiúva, Quixabeira, Lamim, Itapuã Do Oeste, Coroaci, São Bento, Mogi Guacu, Marabá Paulista, Bandeirantes, Votuporanga, Goiandira, Bebedouro, Machados, Ponto Dos Volantes, Vidal Ramos, Palmitinho, Aporá, Milagres Do Maranhão, Santa Cruz Da Baixa Verde, São José Dos Pinhais, Santo Augusto, Guaratingueta, Anguera, São Vicente Ferrer, Nova Esperança Do Piriá, Cunhataí, Ingazeira, Feliz Deserto, Lavras Do Sul, Coroaci, Francisco Badaró, Inhuma, Juarez Távora, Currais, Palmeirândia, Sananduva, Mococa,

## Referências


Dados: http://dados.gov.br/dataset/sistema-nacional-de-estatisticas-de-seguranca-publica

Implementação da árvore AVL: https://github.com/SamYaple/avltree-python