## 1. Motivação

Estes são tempos difíceis, o cenário sociopolítico atual está em um estado de abjeção turbulenta. Neste laboratório, iremos usar vetores para avaliar objetivamente a mentalidade política dos deputados que nos representam. O registro de voto de cada deputado será representado por um vetor, no qual cada elemento representa como ele votou numa dada lei.

A partir da diferença entre os "vetores de votação" de dois deputados, nós podemos dissipar a neblina da política e ver como nossos representantes se posicionam.

Neste projeto, nós iremos representar o registro de votação de um deputado como um vetor sobre o $\mathbb{R}$, e vamos usar produto interno para comparar tais registros.

## 2. Lendo o arquivo de dados

A informação que precisamos para trabalhar virá armazenada num arquivo csv, separado por vírgula. E representa o registro de votação de deputados brasileiros entre os anos de 2015 e 2018 para algumas votações. Cada linha representa o registro de votação de um deputado distinto. O arquivo de dados está disponível [aqui](data/votos.csv).

Abaixo, você pode ver um exemplo de como ler e manipular um arquivo csv em Python. Isto já esta pronto e pode ser encontrado [aqui](src/file_reader.py).

In [17]:
import csv

file = open('data/exemplo.csv', 'r')
csv_file = csv.reader(file)

headers = next(csv_file, None)

dep_nomes = []
dep_estados = []
dep_partidos = []
dep_votos = []

for row in csv_file:
    dep_nomes.append(row[0])
    dep_estados.append(row[1])
    dep_partidos.append(row[2])
    dep_votos.append(list(map(int, row[3:len(row)])))

print(dep_nomes)
print(dep_estados)
print(dep_partidos)
print(dep_votos)
    

['4930', '4931']
['PE', 'DF']
['AVANTE', 'PSDB']
[[-1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -

O posicionamento do senador quanto a uma determinada lei será representado por um valor do conjunto $P = \{-1, 0, 1\}$, onde 1 significa voto <strong>sim</strong>, -1 significa <strong>não</strong> e 0 significa <strong>abstenção</strong>.

## 3. Representando um vetor

Sua primeira tarefa neste laboratório será implementar as funções da classe Vetor, que está disponível [aqui](src/vetor.py), e descrita abaixo.

* **Tarefa 01:** Implementar as seguintes funções na classe Vetor

        - Adição entre vetores
        - Produto por escalar
        - Produto interno
        - Igualdade entre vetores

In [18]:
#coding: utf-8

class Vetor:
    
    '''
    Inicializa o vetor a partir de uma lista.
    '''
    def __init__(self, lista):
        self.entradas = lista
        self.size = len(lista)
    
    '''
    Retorna a dimensão do vetor.
    '''
    def __len__(self):
        return self.size
    
    '''
    Retorna o item numa dada posição.
    '''
    def __getitem__(self, index):
        return self.entradas[index]
    
    '''
    Implementa a operação de soma entre vetores.
    Deve retornar um objeto da classe Vetor representando o resultado da operação.
    Você pode assumir que ambos os vetores têm a mesma dimensão.
    '''
    def __add__(self, vetor):
        raise NotImplementedError
    
    def __radd__(self, vetor):
        return self.__add__(vetor)
    
    '''
    Implementa a operação de multiplicação por escalar e o produto interno.
    Você pode assumir que ambos os vetores têm a mesma dimensão.
    Deve retornar:
     - um objeto da classe Vetor representando o vetor resultante, caso mult seja escalar
     - um escalar com o valor do produto interno caso mult seja outro vetor.
    '''
    def __mul__(self, mult):
        
        '''
        Implementa a multiplicação por escalar
        '''
        if isinstance(mult, float) or isinstance(mult, int):
            raise NotImplementedError
        
        '''
        Implementa o produto vetorial
        '''
        if isinstance(mult, Vetor):
            raise NotImplementedError
    
    def __rmul__(self, mult):
        return self.__mul__(mult)
    
    '''
    Implementa a subtração.
    '''
    def __sub__(self, vetor):
        return self.__add__(vetor * -1)
    
    def __rsub__(self, vetor):
        return vetor.__sub__(self)
    
    '''
    Implementa a divisão por escalar.
    '''
    def __truediv__(self, fator):
        return self.__mul__(1.0/fator);
    
    '''
    Implementa a igualdade entre vetores
    Deve retornar True caso sejam iguais e False caso sejam diferentes.
    '''
    def __eq__(self, vetor):
        raise NotImplementedError
    
    def __neq__(self, vetor):
        return not self.__eq__(vetor)
    
    '''
    Implementa uma representação textual para o vetor.
    '''
    def __str__(self):
        return "Vetor" + str(self.entradas)

## 4. Representando o Deputado

A classe Deputado está disponível [aqui](src/deputado.py) e descrita abaixo. Ela já está totalmente implementada, você deverá apenas utilizá-la como no exemplo abaixo. Abaixo segue ainda um exemplo de como o dicionário *deputados* funciona. Note que no nosso arquivo de [dados](data/votos.csv), o nome do parlamentar é representado por um ID.

In [19]:
#coding: utf-8

class Deputado:
    
    def __init__(self, nome, estado, partido, votos):
        self.nome = nome
        self.estado = estado
        self.partido = partido
        self.votos = votos
    
    def __str__(self):
        return self.nome + ", " + self.estado + ", " + self.partido

deputados = {}    

for i in range(len(dep_nomes)):
    deputados[dep_nomes[i]] = Deputado(dep_nomes[i], dep_estados[i], dep_partidos[i], Vetor(dep_votos[i]))
    
print(deputados['4930'].votos)

Vetor[-1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1

## 5. Usando o produto interno para comparar vetores

Suponha que $u$ e $v$ são dois vetores no $\mathbb{R}^n$, cujas entradas pertencem ao conjunto $P = {-1, 0, 1}$.

Inicialmente, recordemos a definição de produto interno de dois vetores: $$u \cdot v = \sum_{i=1}^{n} u[i] \cdot v[i]$$, com a definição em mente sigamos para dar interpretação a resposta.

Considere a k-ésima entrada:
* Se ambos $u[k]$ e $v[k]$ são 1, o termo corresponde da soma é 1. Se ambos são -1, o termo corresponde da soma é 1. Dessa forma, um termo da soma que é 1 indica concordância.
* Se $u[k]$ e $v[k]$ tem sinais distintos, o termo corresponde da soma é -1. Assim, um termo na soma que é -1 indica discordância.
* Se $u[k]$ e/ou $v[k]$ são 0, então o termo é zero, refletindo o fato de que estas entradas não proveem evidências de concordância ou discordância.

Disso, podemos concluir que o produto interno de $u$ e $v$ é portanto uma medida de quão $u$ e $v$ estão em concordância.

## 6. Comparação de Políticas

Nosso objetivo é determinar quão alinhados politicamente dois deputados estão. Para conseguirmos tal feito, usaremos produto interno para julgar quão frequentemente dois deputados estão em concordância.

* **Tarefa 02:** Comparar o alinhamento de dois deputados, implementado a função descrita a seguir.

In [20]:
'''
Tarefa 02 - Comparar o alinhamento de dois deputados
A função abaixo recebe o nome de dois deputados e o
dicionário mapeando o nome do deputado com seu objeto
da classe Deputado, e retorna o produto interno representando
o grau de similaridade entre a política de voto dos dois deputados dados.
'''
def comparar(dep_a, dep_b, senadores):
    raise NotImplementedError

* **Tarefa 03:** Encontrar o deputado mais similar com um deputado dado, implementado a função descrita a seguir.

In [21]:
'''
Tarefa 03 - Encontrar o deputado mais similar com um deputado dado
A função deve receber o nome de um deputado e o dicionário mapeando
o nome do deputado com seu objeto da classe Deputado, e retornar 
o nome do deputado mais similar ao que foi dado como entrada.
No caso, de haver mais de um deputado com o grau de similaridade máxima,
todos os nomes devem ser retornados em uma lista.
'''
def mais_similar(dep, deputados):
    raise NotImplementedError

* **Tarefa 04:** Encontrar o deputado menos similar com um deputado dado, implementado a função descrita a seguir.

In [22]:
'''
Tarefa 04 - Encontrar o deputado menos similar com um deputado dado
Similar a tarefa 03, porém deve retornar o nome do deputado menos similar
ou uma lista com todos os nomes, em caso de empate.
'''
def menos_similar(dep, deputados):
    raise NotImplementedError

## 7. Comparações envolvendo conjuntos

Neste momento, já somos capazes de fazer comparações entre dois deputados. Agora, sua tarefa envolverá avaliar similaridade entre um deputado e um conjunto de deputados.

* **Tarefa 05:** Implementar a função encontra_similaridade_media(dep, dep_set, deputados) que, dado o nome de um deputado, compara seu registro de votos com o registro de votos com todos os deputados cujos nomes estão em dep_set, computando um produto interno para cada, e então retornando o produto interno médio.

In [23]:
'''
Tarefa 05 - Implementar a função encontra_similaridade_media(dep, dep_set, deputados) que,
dado o nome de um deputado, compara seu registro de votos com o registro de votos com todos
os deputados cujos nomes estão em dep_set, computando um produto interno para cada, e então
retornando o produto interno médio.
'''
def encontra_similaridade_media(dep, dep_set, deputados):
    raise NotImplementedError

Reflita um pouco sobre o procedimento implementado acima! Você acha que ele poderia ser otimizado de alguma maneira? Talvez utilizando alguma propriedade do produto interno? Vamos relembrar, brevemente, uma propriedade muito importante do produto interno.

**Propriedade Distributiva:**
Sejam $u$, $v$ e $w$ vetores no $\mathbb{R}^n$, temos que $u \cdot (v + w) = u \cdot v + u \cdot w$.

Diante disto, você consegue ver uma outra forma de implementar a função a acima?

* **Tarefa 06:** Implemente a função encontra_registro_medio(dep_set, voting_dict) que, dado um conjunto com o nome dos deputados, encontra a média do registro de votação. Isto é, realize adição vetorial nas listas representando o registro de suas votações, e então divida a soma pelo número de vetores. O resultado deve ser um vetor.

In [24]:
'''
Tarefa 06 - Implemente a função encontra_registro_medio(dep_set, voting_dict) que,
dado um conjunto com o nome dos deputados, encontra a média do registro de votação.
Isto é, realize adição vetorial nas listas representando o registro de suas votações,
e então divida a soma pelo número de vetores. O resultado deve ser um vetor.
'''
def encontra_registro_medio(dep_set, deputados):
    raise NotImplementedError

Utilizando essa função, iremos criar outras derivadas, como descrito abaixo:

* **Tarefa 07** Implemente as funções a seguir:
    - registro_medio_partido(partido, deputados) que, dado o nome de um partido encontra o registro médio de votação deste partido;
    - registro_medio_estado(estado, deputados) que, dado o nome de um estado do Brasil encontra o registro médio de votação deste estado;
    - registro_medio_regiao(regiao, deputados) que, dada o nome de uma região do Brasil encontra o registro médio de votação desta região.

In [25]:
'''
Tarefa 07 - Implemente as funções a seguir
- registro_medio_partido(partido, deputados) que, dado o nome de um partido 
  encontra o registro médio de votação deste partido;
- registro_medio_estado(estado, deputados) que, dado o nome de um estado do
  Brasil encontra o registro médio de votação deste estado;
- registro_medio_regiao(regiao, deputados) que, dada o nome de uma região do
  Brasil encontra o registro médio de votação desta região.

O retorno de todas as funções descritas nesta tarefa deve ser um vetor.
'''

def registro_medio_partido(partido, deputados):
    raise NotImplementedError
    
def registro_medio_estado(estado, deputados):
    raise NotImplementedError
    
def registro_medio_regiao(regiao, deputados):
    raise NotImplementedError

De posse das funções criadas na **Tarefa 07**, iremos implementar mais algumas, derivadas destas.

* **Tarefa 08:** Implemente as funções a seguir:
    - similaridade_no_partido(dep, deputados) que, dado o nome de um deputado encontra o grau de similaridade dele com seu partido.
    - similaridade_no_estado(dep, deputados) que, dado o nome de um deputado encontra o grau de similaridade dele com seu estado.
    - similaridade_na_regiao(dep, deputados) que, dado o nome de um deputado encontra o grau de similaridade dele com sua regiao.
    - encontra_mais_alinhado_partido(partido, deputados) que, dado o nome de um partido encontra o senador mais similar ao partido

In [26]:
'''
Tarefa 08 - Implemente as funções a seguir:
- similaridade_no_partido(dep, deputados) que,
  dado o nome de um deputado encontra o grau de similaridade dele com seu partido.
- similaridade_no_estado(dep, deputados) que,
  dado o nome de um deputado encontra o grau de similaridade dele com seu estado.
- similaridade_na_regiao(dep, deputados) que,
  dado o nome de um deputado encontra o grau de similaridade dele com sua regiao.
- encontra_mais_alinhado_partido(partido, deputados) que,
  dado o nome de um partido encontra o deputado mais similar ao partido.
  
Para as funções acima o retorno deve ser uma lista contendo o nome do deputado e seu respectivo
grau de similaridade.
'''

def similaridade_no_partido(dep, deputados):
    raise NotImplementedError

def similaridade_no_estado(dep, deputados):
    raise NotImplementedError

def similaridade_na_regiao(dep, deputados):
    raise NotImplementedError

def encontra_mais_alinhado_partido(partido, deputados):
    raise NotImplementedError

## 8. Rivalidades e amizades

Voltaremos agora a comparação deputados entre sim, desta vez queremos encontrar os dois deputados mais alinhados, bem como os dois menos alinhados.

* **Tarefa 09:** Implemente as funções a seguir:
    - rivais_amargos(deputados) que encontra os dois deputados menos similares do conjunto inteiro.
    - amigos_adocicados(deputados) que encontra os dois deputados mais similares do conjunto inteiro.

In [27]:
'''
Tarefa 09 - Implemente as funções a seguir:
- rivais_amargos(deputados) que encontra os dois deputados menos similares do conjunto inteiro.
- amigos_adocicados(deputados) que encontra os dois deputados mais similares do conjunto inteiro.

O retorno deve ser uma lista contendo os nomes dos dois deputados.
'''

def rivais_amargos(deputados):
    raise NotImplementedError

def amigos_adocicados(deputados):
    raise NotImplementedError

Por fim, iremos lidar com similaridade dentro de um partido.

* **Tarefa 10:** Implemente as funções a seguir:
    - encontra_partido_mais_coerente(deputados) que encontra o partido cujos congressistas são mais similares entre si, ou seja, cuja média das similaridades entre cada deputado é a maior.
    - encontra_partido_menos_coerente(deputados) que encontra o partido cujos congressistas são menos similares entre si, ou seja, cuja média das similaridades entre cada deputado é a menor.

In [28]:
'''
Tarefa 10 - Implemente as funções a seguir:
- encontra_partido_mais_coerente(deputados) que encontra o partido
  cujos congressistas são mais similares entre si, ou seja, cuja média das
  similaridades entre cada deputado é a maior.
- encontra_partido_menos_coerente(deputados) que encontra o partido
  cujos congressistas são menos similares entre si, ou seja, cuja média das
  similaridades entre cada deputado é a menor.
  
O retorno, para ambas, deve ser o nome do partido.
'''

def encontra_partido_mais_coerente(deputados):
    raise NotImplementedError
    
def encontra_partido_menos_coerente(deputados):
    raise NotImplementedError

## 8. Algumas observações

* Para saber como proceder na realização deste laboratório, consulte o [guia](https://docs.google.com/document/d/162TmGRQ2o7vUckoTaYBL53ranCZcChZ_qjesmfxMzL0/edit?usp=sharing)
* As funções descritas nas tarefas 2 a 10, devem ser implementadas [aqui](src/main.py).
* Você poderá criar variáveis globais, bem como funções auxiliares se achar necessário.
* É estritamente proibido mudar o nome e/ou a assinatura das funções descritas acima, uma vez que a correção será feita de forma automática, e tais mudanças irão comprometer a correção.
* O arquivo de dados está disponível [aqui](data/votos.csv).
* É recomendado que você realize testes antes de submeter, você pode implementar seus testes [aqui](src/my_tests.py).