# Lista 1 - NumPy

## Exercícios

Para a resolução dos exercícios abaixo, utilize todas as ferramentas e métodos do NumPy aprendidos em aula e existe algumas outras métodos que podem ser úteis na documentação [_NumPy Documentation_](https://numpy.org/doc/). Durante a correção, não será considerado exercícios que não utilizar a ferramenta (muitos deles da pra responder apenas com Python, mas não é esse o intuito da lista).

__Funcionamento dos Exercícios:__ todos os exercícios são do estilo onde será preciso criar uma função para resolver a proposta do enunciado. Será avaliado apenas a função, mas sugiro que crie casos de testes para avaliar se a função está operando corretamente.

__Avaliação e Entrega:__ São 5 exercícios que valem 10 pontos, e a entrega vai ser na forma de um notebook através da tarefa criada no Class.

__Data Limite para Entrega:__ Próxima aula 03/02


In [2]:
import numpy as np

### 1) Restaurantes Mais Próximos

Perto da casa de João existem vários restaurantes que entregam comida e João deseja fazer um pedido, mas ele tem um compromisso marcado e não pode esperar muito tempo. Então João quer saber qual é o restaurante mais próximo da residencial dele utilizando da distância Euclidiana, cuja a fórmula é dado pela equação a seguir:

<img align="center" src="https://i.upmath.me/svg/%20d(A%2C%20B)%20%3D%20%5Csqrt%7B(x_%7BA%2C%201%7D%20-%20x_%7BB%2C%201%7D)%5E%7B2%7D%20%2B%20(x_%7BA%2C%202%7D%20-%20x_%7BB%2C%202%7D)%5E%7B2%7D%20%2B%20...%20%2B%20(x_%7BA%2C%20n%7D%20-%20x_%7BB%2C%20n%7D)%5E%7B2%7D%7D" alt=" d(A, B) = \sqrt{(x_{A, 1} - x_{B, 1})^{2} + (x_{A, 2} - x_{B, 2})^{2} + ... + (x_{A, n} - x_{B, n})^{2}}" />

Desenvolva uma função chamada `restaurante_mais_proximo` que irá receber como parâmetros respectivamente __uma lista de coordenadas da casa do João__ e __uma lista com 4 listas com as coordenadas dos restaurantes a verificar__ e o retorno da função deve ser __o número referente ao restaurante mais próximo__. Importante ressaltar que o número do restaurante começa pelo 1 e que em caso de empate, deve-se indicar __o primeiro restaurante a apresentar a menor distância__.

In [9]:
# exemplo de entrada
# lembrando que pode ter n coordenadas
restaurantes = [[1, 3, 5], [2, 4, 0], [3, 3, 3], [1, 6, 6]]
joao = [0, 1, 2]

In [21]:
def restaurante_mais_prodimo(coord_home: list, coord_restaurants: list) -> int:

    coord_home = np.array(coord_home)
    coord_restaurants = np.array(coord_restaurants)

    dists = np.array([])
    for coord in coord_restaurants:
        dist = np.sqrt(np.sum(np.square(coord_home - coord)))
        dists = np.append(dists, dist)

    closest = np.argmin(dists) + 1
    return closest

# restaurante_mais_prodimo(coord_home=joao, coord_restaurants=restaurantes)

In [22]:
restaurante_mais_prodimo(coord_home=joao, coord_restaurants=restaurantes)

1

## 2) Ordenando pelo MMC

O Mínimo Múltiplo Comum (MMC) de dois ou mais números é definido pelo múltiplo comum corresponde a todos os números observados. Por exemplo o MMC entre 6 e 10 é o 30 devido aos número 2, 3 e 5. O objetivo deste exercício, além de calcular o MMC será ordenar a lista utilizando o MMC. Portanto desenvolva a função `ordenar_mmc` onde como entrada irá receber uma lista de números e um número a parte de referência. A função deve calcular O MMC de cada um dos números da lista em relação ao de referência e em seguida ordenar os números originais de acordo com o MMC do menor valor para o maior, como o exemplo a seguir:

```python
# lista de entrada
lista = [12, 8, 10]

# numero de referência
ref = 4

# utilizando a função
print(ordenar_mmc(lista, ref))

# Resultado da função, pois o mmcs = [12, 8, 20] 
[8, 12, 10]
```

In [23]:
lista = [12, 8, 10]
ref = 4

In [28]:
def ordenar_mmc(numbers: list, ref: int) -> list:
    
    lcm_list = []

    for n in numbers:
        lcm_list.append(np.lcm(n, ref))

    idx = np.argsort(np.array(lcm_list))
    return np.array(numbers)[idx]

# ordenar_mmc(numbers=lista, ref=ref)

In [29]:
ordenar_mmc(numbers=lista, ref=ref)

array([ 8, 12, 10])

### 3) Normalização ou Z-Score

A normalização (também conhecido como Z-Score) é uma ferramenta muito importante da estatística onde para um conjunto de dados, calcula-se quais serão os respectivos valores se aquele conjunto de dados seguir uma dstribuição normal. O objetivo deste exercício será desenvolver a função `z_score`, onde dado uma lista de entrada com um conjunto de dados quaisquer, devolve a lista com os respectivos Z-Scores dos dados, seguindo a função $z = \frac{x - \mu}{\sigma}$, onde $\mu$ é a média do conjunto de dados e $\sigma$ é o desvio padrão do mesmo (arredonde os valores para 4 casas decimais).

In [48]:
lista = [4, 6, 7, 8, 9]

# primeiro passo = calcular a media da lista
# segundo passo = calcular o desvio padrao
# terceiro passo calcular o z = (x- media)/desvio padrao
# por fim arredonda com o np.round(numero, 4)


In [46]:
def z_score(numbers: list) -> float:

    mean = np.mean(numbers)
    std_dev = np.std(numbers)
    # print(f'mean: {mean}; std_dev: {std_dev}')

    z_scores = (numbers - mean) / std_dev
    return np.round(z_scores,  4).tolist()


In [47]:
z_score(lista)

[-1.6275, -0.465, 0.1162, 0.6975, 1.2787]

### 4) Escalonamento MinMaxScaler

De forma anáçoga a normalização, o MinMaxScaler altera a escala a ser utilizada em um conjunto de dados, onde busca-se os valores máximo e mínimo de um conjunto de dados para depois transformar em uma escala que varia entre esses valores. O objetivo deste exercício será desenvolver uma função chamada `minmaxscaler` que irá receber como entrada um conjunto de dados e de saída será uma lista com os valores na nova escala seguindo a função $y = \frac{x - min}{max - min}$ (arredonde para 3 casas decimais).

In [50]:
# primeiro passo = calcula o min e max
# segundo passo = calcula o y = (x-min)/(max-min)
# por fim arredonda com 4 casas

lista = [5, 10, 15, 20]

In [53]:
def minmaxscaler(numbers: list) -> list:
    min = np.min(numbers)
    max = np.max(numbers)
    scaled = (numbers - min) / (max - min)
    return np.round(scaled, 3).tolist()


In [54]:
minmaxscaler(numbers=lista)

[0.0, 0.333, 0.667, 1.0]

### 5) Matching entre Vetores

No contexto de Machine Learning, um processo bem comum é de comparar respostas entre vetores para entender o quão acertivo foi um determinado modelo. Dado um contexto, desenvolva a função `vector_matching` que verifica posição a posição destes vetores, que valores de zeros e uns foram acertados. Para esta função têm-se como entrada __dois vetores de dimensões iguais__ preenchidos com 0 ou 1 e a saída da função será o percentual de acerto entre os vetores (arredonde o percentual para 1 casa decimal).

In [56]:
v1 = [0, 0, 0, 1, 1, 1, 1, 0]
v2 = [1, 0, 0, 1, 1, 0, 0, 1]

In [60]:
def vector_matching(v1: list, v2: list) -> float:
    
    v1 = np.array(v1)
    v2 = np.array(v2)

    n_hits = np.sum(v1 == v2)
    accuracy = n_hits / len(v1)
    # print(f'n_hits: {n_hits}, accuracy: {accuracy}')
    
    return np.round(accuracy * 100, 1)


In [61]:
vector_matching(v1=v1, v2=v2)

50.0