# Comparando registros de votação usando produto interno
Neste projeto, nós iremos representar o registro de votação de um senador como um vetor sobre o $\mathbb{R}$, e vamos usar produto interno para comparar tais registros.

## 1. Motivação

Estes são tempos difíceis, o cenário sociopolítico atual está em um estado de abjeção turbulenta. Neste laboratório, iremos usar vetores para avaliar objetivamente a mentalidade política dos senadores que nós representam. O registro de voto de cada senador será representado por um vetor, no qual cada elemento representa como o senador votou numa dada lei.

A partir da diferença entre os "vetores de votação" de dois senadores, nós podemos dissipar a neblina da política e ver como nossos representantes se posicionam.

## 2. Lendo o arquivo de dados

A informação que precisamos para trabalhar virá armazenada num arquivo csv, separado por vírgula. E representa o registro de votação de senadores brasileiros entre os anos de 2015 e 2018 para algumas votações. Cada linha representa o registro de votação de um senador distinto. O arquivo de dados está disponível [aqui](data).

Abaixo, você pode ver um exemplo de como ler e manipular um arquivo csv em Python. Isto já esta pronto e pode ser encontrado [aqui](src/file_reader.py).

In [73]:
import csv

file = open('data/exemplo.csv', 'r')
csv_file = csv.reader(file)

sen_nomes = []
sen_estados = []
sen_partidos = []
sen_votos = []

for row in csv_file:
    sen_nomes.append(row[0])
    sen_estados.append(row[1])
    sen_partidos.append(row[2])
    sen_votos.append(list(map(int, row[3:len(row)])))

print(sen_nomes)
print(sen_estados)
print(sen_partidos)
print(sen_votos)
    

['Marty McFly', 'Doc Brown']
['Future', 'Future']
['BTF', 'BTF']
[[1, 1, 1, 1], [0, 1, 1, -1]]


O posicionamento do senador quanto a uma determinada lei será representado por um valor do conjunto $P = \{-1, 0, 1\}$, onde 1 significa voto <strong>sim</strong>, -1 significa <strong>não</strong> e 0 significa <strong>abstenção</strong>.

## 3. Representando um vetor

Sua primeira tarefa neste laboratório será implementar as funções da classe Vetor, que está disponível [aqui](src/vetor.py), e descrita abaixo.

* **Tarefa 01:** Implementar as seguintes funções na classe Vetor

        - Adição entre vetores
        - Produto por escalar
        - Produto interno
        - Igualdade entre vetores

In [74]:
#coding: utf-8

class Vetor:
    
    '''
    Inicializa o vetor a partir de uma lista.
    '''
    def __init__(self, lista):
        self.entradas = lista
        self.size = len(lista)
    
    '''
    Retorna a dimensão do vetor.
    '''
    def __len__(self):
        return self.size
    
    '''
    Retorna o item numa dada posição.
    '''
    def __getitem__(self, index):
        return self.entradas[index]
    
    '''
    Implementa a operação de soma entre vetores.
    Deve retornar um objeto da classe Vetor representando o resultado da operação.
    Você pode assumir que ambos os vetores têm a mesma dimensão.
    '''
    def __add__(self, vetor):
        raise NotImplementedError
    
    def __radd__(self, vetor):
        return self.__add__(vetor)
    
    '''
    Implementa a operação de multiplicação por escalar e o produto interno.
    Você pode assumir que ambos os vetores têm a mesma dimensão.
    Deve retornar:
     - um objeto da classe Vetor representando o vetor resultante, caso mult seja escalar
     - um escalar com o valor do produto interno caso mult seja outro vetor.
    '''
    def __mul__(self, mult):
        
        '''
        Implementa a multiplicação por escalar
        '''
        if isinstance(mult, float) or isinstance(mult, int):
            raise NotImplementedError
        
        '''
        Implementa o produto vetorial
        '''
        if isinstance(mult, Vetor):
            raise NotImplementedError
    
    def __rmul__(self, mult):
        return self.__mul__(mult)
    
    '''
    Implementa a subtração.
    '''
    def __sub__(self, vetor):
        return self.__add__(vetor * -1)
    
    def __rsub__(self, vetor):
        return vetor.__sub__(self)
    
    '''
    Implementa a divisão por escalar.
    '''
    def __truediv__(self, fator):
        return self.__mul__(1.0/fator);
    
    '''
    Implementa a igualdade entre vetores
    Deve retornar True caso sejam iguais e False caso sejam diferentes.
    '''
    def __eq__(self, vetor):
        raise NotImplementedError
    
    def __neq__(self, vetor):
        return not self.__eq__(vetor)
    
    '''
    Implementa uma representação textual para o vetor.
    '''
    def __str__(self):
        return "Vetor" + str(self.entradas)

## 4. Representando o Senador

A classe Senador está disponível [aqui](src/senador.py) e descrita abaixo. Ela já está totalmente implementada, você deverá apenas utilizá-la como no exemplo abaixo. Abaixo segue ainda um exemplo de como o dicionário *senadores* funciona.

In [75]:
#coding: utf-8

class Senador:
    
    def __init__(self, nome, estado, partido, votos):
        self.nome = nome
        self.estado = estado
        self.partido = partido
        self.votos = votos
    
    def __str__(self):
        return self.nome + ", " + self.estado + ", " + self.partido

senadores = {}    

for i in range(len(sen_nomes)):
    senadores[sen_nomes[i]] = Senador(sen_nomes[i], sen_estados[i], sen_partidos[i], sen_votos[i])
    
print(senadores['Marty McFly'].votos)

[1, 1, 1, 1]


## 5. Usando o produto interno para comparar vetores

Suponha que $u$ e $v$ são dois vetores no $\mathbb{R}^n$, cujas entradas pertencem ao conjunto $P$.

Inicialmente, recordemos a definição de produto interno de dois vetores: $$u \cdot v = \sum_{i=1}^{n} u[i] \cdot v[i]$$, com a definição em mente sigamos para dar interpretação a resposta.

Considere a k-ésima entrada:
* Se ambos $u[k]$ e $v[k]$ são 1, o termo corresponde da soma é 1. Se ambos são -1, o termo corresponde da soma é 1. Dessa forma, um termo da soma que é 1 indica concordância.
* Se $u[k]$ e $v[k]$ tem sinais distintos, o termo corresponde da soma é -1. Assim, um termo na soma que é -1 indica discordância.
* Se $u[k]$ e/ou $v[k]$ são 0, então o termo é zero, refletindo o fato de que estas entradas não proveem evidências de concordância ou discordância.

Disso, podemos concluir que o produto interno de $u$ e $v$ é portanto uma medida de quão $u$ e $v$ estão em concordância.

## 6. Comparação de Políticas

Nosso objetivo é determinar quão alinhados politicamente dois senadores estão. Para conseguirmos tal feito, usaremos produto interno para julgar quão frequentemente dois senadores estão em concordância.

* **Tarefa 02:** Comparar o alinhamento de dois senadores, implementado a função descrita a seguir.

In [76]:
'''
Tarefa 02 - Comparar o alinhamento de dois senadores
A função abaixo recebe o nome de dois senadores e o
dicionário mapeando o nome do senador com seu objeto
da classe Senador, e retornar o produto interno representando
o grau de similaridade entre a política de voto dos dois senadores dados.
'''
def comparar(sen_a, sen_b, senadores):
    raise NotImplementedError

* **Tarefa 03:** Encontrar o senador mais similar com um senador dado, implementado a função descrita a seguir.

In [77]:
'''
Tarefa 03 - Encontrar o senador mais similar com um senador dado
A função deve receber o nome de um senador e o dicionário mapeando
o nome do senador com seu objeto da classe Senador, e o nome do senador 
mais similar ao que foi dado como entrada. No caso, de haver mais de um
senador com o grau de similaridade máxima, todos os nomes devem ser retornados
em uma lista.
'''
def mais_similar(sen, senadores):
    raise NotImplementedError

* **Tarefa 04:** Encontrar o senador menos similar com um senador dado, implementado a função descrita a seguir.

In [78]:
'''
Tarefa 04 - Encontrar o senador menos similar com um senador dado
Similar a tarefa 03, porém deve retornar o nome do senador menos similar
ou uma lista com todos os nomes, em caso de empate.
'''
def menos_similar(sen, senadores):
    raise NotImplementedError

## 7. Comparações envolvendo conjuntos

Neste momento, já somos capazes de fazer comparações entre dois senadores. Agora, sua tarefa envolverá avaliar similaridade entre um senador e um conjunto de senadores.

* **Tarefa 05:** Implementar a função encontra_similaridade_media(sen, sen_set, senadores) que, dado o nome de um senador, compara seu registro de votos com o registro de votos com todos os senadores cujos nomes estão em sen_set, computando um produto interno para cada, e então retornando o produto interno médio.

In [79]:
'''
Tarefa 05 - Implementar a função encontra_similaridade_media(sen, sen_set, senadores)
que, dado o nome de um senador, compara seu registro de votos com o registro de votos
com todos os senadores cujos nomes estão em sen_set, computando um produto interno para
cada, e então retornando o produto interno médio.
'''
def encontra_similaridade_media(sen, sen_set, senadores):
    raise NotImplementedError

Reflita um pouco sobre o procedimento implementado acima! Você acha que ele poderia ser otimizado de alguma maneira? Talvez utilizando alguma propriedade do produto interno? Vamos relembrar, brevemente, uma propriedade muito importante do produto interno.

**Propriedade Distributiva:**
Sejam $u$, $v$ e $w$ vetores no $\mathbb{R}^n$, temos que $u \cdot (v + w) = u \cdot v + u \cdot w$.

Diante disto, você consegue ver uma outra forma de implementar a função a acima?

* **Tarefa 06:** Implemente a função encontra_registro_medio(sen set, voting dict) que, dado um conjunto com o nome dos senadores, encontre a média do registro de votação. Isto é, realize adição vetorial na listas representando o registro de suas votações, e então divida a soma pelo número de vetores. O resultado deve ser um vetor.

In [80]:
'''
Tarefa 06 - Implemente a função encontra_registro_medio(sen set, voting dict) que,
dado um conjunto com o nome dos senadores, encontre a média do registro de votação.
Isto é, realize adição vetorial na listas representando o registro de suas votações,
e então divida a soma pelo número de vetores. O resultado deve ser um vetor.
'''
def encontra_registro_medio(sen_set, senadores):
    raise NotImplementedError

Utilizando essa função, iremos criar outras derivadas, como descrito abaixo:

* **Tarefa 07** Implemente as funções a seguir:
    - registro_medio_partido(partido, senadores) que, dado o nome de um partido encontra o registro médio de votação deste partido;
    - registro_medio_estado(estado, senadores) que, dado o nome de um estado do Brasil encontra o registro médio de votação deste estado;
    - registro_medio_regiao(regiao, senadores) que, dada o nome de uma região do Brasil encontra o registro médio de votação desta região.

In [81]:
'''
Tarefa 07 - Implemente as funções a seguir
- registro_medio_partido(partido, senadores) que, dado o nome de um partido 
  encontra o registro médio de votação deste partido;
- registro_medio_estado(estado, senadores) que, dado o nome de um estado do
  Brasil encontra o registro médio de votação deste estado;
- registro_medio_regiao(regiao, senadores) que, dada o nome de uma região do
  Brasil encontra o registro médio de votação desta região.

O retorno de todas as funções descritas nesta tarefa deve ser um vetor.
'''

def registro_medio_partido(partido, senadores):
    raise NotImplementedError
    
def registro_medio_estado(estado, senadores):
    raise NotImplementedError
    
def registro_medio_regiao(regiao, senadores):
    raise NotImplementedError

De posse das funções criadas na **Tarefa 07**, iremos implementar mais algumas, derivadas destas.

* **Tarefa 08:** Implemente as funções a seguir:
    - similaridade_no_partido(sen, senadores) que, dado o nome de um senador encontra o grau de similaridade dele com seu partido.
    - similaridade_no_estado(sen, senadores) que, dado o nome de um senador encontra o grau de similaridade dele com seu estado.
    - similaridade_na_regiao(sen, senadores) que, dado o nome de um senador encontra o grau de similaridade dele com sua regiao.
    - encontra_mais_alinhado_partido(partido, senadores) que, dado o nome de um partido encontra o senador mais similar ao partido

In [82]:
'''
Tarefa 08 - Implemente as funções a seguir:
- similaridade_no_partido(sen, senadores) que,
  dado o nome de um senador encontra o grau de similaridade dele com seu partido.
- similaridade_no_estado(sen, senadores) que,
  dado o nome de um senador encontra o grau de similaridade dele com seu estado.
- similaridade_na_regiao(sen, senadores) que,
  dado o nome de um senador encontra o grau de similaridade dele com sua regiao.
  
Para as funções acima o retorno deve ser uma lista contendo o nome do senador e seu respectivo
grau de similaridade.

- encontra_mais_alinhado_partido(partido, senadores) que,
  dado o nome de um partido encontra o senador mais similar ao partido.
  
Para esta última o retorno deve ser o nome do senador.
'''

def similaridade_no_partido(sen, senadores):
    raise NotImplementedError

def similaridade_no_estado(sen, senadores):
    raise NotImplementedError

def similaridade_na_regiao(sen, senadores):
    raise NotImplementedError

def encontra_mais_alinhado_partido(partido, senadores):
    raise NotImplementedError

## 8. Rivalidades e amizades

Voltaremos agora a comparação senadores entre sim, desta vez queremos encontrar os dois senadores mais alinhados, bem como os dois menos alinhados.

* **Tarefa 09:** Implemente as funções a seguir:
    - rivais_amargos(senadores) que encontra os dois senadores menos similares do conjunto inteiro.
    - amigos_adocicados(senadores) que encontra os dois senadores mais similares do conjunto inteiro.

In [83]:
'''
Tarefa 09 - Implemente as funções a seguir:
- rivais_amargos(senadores) que encontra os dois senadores menos similares do conjunto inteiro.
- amigos_adocicados(senadores) que encontra os dois senadores mais similares do conjunto inteiro.

O retorno deve ser uma lista contendo os nomes dos dois senadores.
'''

def rivais_amargos(senadores):
    raise NotImplementedError

def amigos_adocicados(senadores):
    raise NotImplementedError

Por fim, iremos lidar com similaridade dentro de um partido.

* **Tarefa 10:** Implemente as funções a seguir:
    - encontra_partido_mais_coerente(senadores) que encontra o partido cujos congressistas são mais similares entre si, ou seja, cuja média das similaridades entre cada senador é a maior.
    - encontra_partido_menos_coerente(senadores) que encontra o partido cujos congressistas são menos similares entre si, ou seja, cuja média das similaridades entre cada senador é a menor.

In [84]:
'''
Tarefa 10 - Implemente as funções a seguir:
- encontra_partido_mais_coerente(senadores) que encontra o partido
  cujos congressistas são mais similares entre si, ou seja, cuja média das
  similaridades entre cada senador é a maior.
- encontra_partido_menos_coerente(senadores) que encontra o partido
  cujos congressistas são menos similares entre si, ou seja, cuja média das
  similaridades entre cada senador é a menor.
  
O retorno, para ambas, deve ser o nome do partido.
'''

def encontra_partido_mais_coerente(senadores):
    raise NotImplementedError
    
def encontra_partido_menos_coerente(senadores):
    raise NotImplementedError

## 8. Algumas observações

* Para saber como copiar este repositório para você, consulte o [README](README.md)
* As funções descritas nas tarefas 2 a 10, devem ser implementadas [aqui](src/main.py).
* Você poderá criar variáveis globais, bem como funções auxiliares se achar necessário.
* É estritamente proibido mudar o nome e/ou a assinatura das funções descritas acima, uma vez que a correção será feita de forma automática, e tais mudanças irão comprometer a correção.
* O arquivo de dados está disponível [aqui](data).
* Para detalhes de como submeter, consulte o [tutorial](submissao.md).
* É recomendado que você realize testes antes de submeter, você pode implementar seus testes [aqui](src/my_tests.py).