# Alguns métodos úteis para usar em um array NumPy que vão ter uma boa performance se comparados com listas por conta da homogeneidade 

In [2]:
import numpy as np

# np.sum()

Retorna a soma de todos os valores de um array.

In [3]:
array = np.array([1910, 1954, 1977, 1990, 2000, 2012])
sum_of_array = np.sum(array)
sum_of_array

11843

# np.mean()

Retorna a média dos valores de um array.

In [4]:
array = np.array([1990, 1998, 1999, 2005, 2011, 2015, 2017])
avg_of_array = np.mean(array)
avg_of_array

2005.0

# np.max() e np.min()

`max()` retorna o maior valor de um array enquanto `min()`

In [7]:
array = np.array([1995, 2002, 2009])
max_value = np.max(array)
min_value = np.min(array)

print(min_value, max_value)

1995 2009


# np.sort()

Retorna a lista ordenada

In [7]:
array = np.array([1998, 2005, 2011, 1990, 2017, 1999, 2015])
array_sorted = np.sort(array)
array_sorted    

array([1990, 1998, 1999, 2005, 2011, 2015, 2017])

# np.dot()

Retorna o produto escalar de dois arrays.

In [9]:
products_amount = np.array([10, 20, 30, 40])
products_price  = np.array([20, 40, 60, 80])

dot_result = np.dot(products_amount, products_price)

# É equivalente a:

dot_v2 = np.sum(products_amount * products_price)

print(dot_result)
print(dot_v2)

6000
6000


# np.argmax()

Retorna o indice do maior item do array.

In [3]:
array = np.array([1998, 2005, 2011, 1990, 2017, 1999, 2015])
index_bigger_item = np.argmax(array)
index_bigger_item    

4

# np.argmin()

Retorna o indice do menor item do array.

In [5]:
array = np.array([1998, 2005, 2011, 1990, 2017, 1999, 2015])
index_smaller_item = np.argmin(array)
index_smaller_item    

3

# np.median()

Retorna a mediana (Mediana é um valor que divide um conjunto de dados em duas partes iguais. Para encontrá-la, devemos organizar os dados em uma ordem crescente ou decrescente e escolher o valor do meio. Se houver um número ímpar de dados, a mediana será exatamente o valor central. Se houver um número par de dados, a mediana será a média dos dois valores do meio).median

In [8]:
array = np.array([1998, 2005, 2011, 1990, 2017, 1999, 2015])
median = np.median(array)
median    

2005.0

# np.percentile()

O percentil é uma medida estatística que indica a posição relativa de um dado dentro de um conjunto de dados. Ele informa a porcentagem de valores que estão abaixo desse dado. Por exemplo, o percentil 50 (também conhecido como mediana) divide os dados em duas partes iguais, com 50% dos valores abaixo dele e 50% acima.

https://www.youtube.com/watch?v=WGrrDcoG2A8

In [16]:
array = np.array([1998, 2005, 2011, 1990, 2017, 1999, 2015])
percentile = np.percentile(array, 33)
percentile    

1998.98

# np.std()

Retorna o desvio padrão entre os dados.

Lembrando que:
 - O desvio padrão é o resultado da raiz quadrada do desvio, que por sua vez o desvio é o resultado do elemento menos a média.

Na prática: 

    [1, 2, 3, 4] --> Média é a soma de todos os elementos dividivo pelo tamanho da array
    
    (1 + 2 + 3 + 4) / 4 ==> Média é igual a 2.5

    O desvio é a subtração de cada elemento pela média: 

    1 - 2.5 = (-1.5)² = 2.25 --> Desvio
    2 - 2.5 = (-0.5)² = 0.25 --> Desvio
    3 - 2.5 =  0.5²   = 0.25 --> Desvio
    4 - 2.5 =  1.5²   = 2.25 --> Desvio


    Finalmente para obtermos a variância (desvio padrão)

    2.25 + 0.25 + 0.25 + 2.25       =  5    =  1.25 --> Raiz quadrada de 1.25 é igual a 1.118
    -------------------------------   ---- 
                  4                    4              

In [10]:
list = np.array([1, 2, 3, 4])
list.mean() # Média

2.5

In [13]:
import math

print(math.sqrt(1.25))
print(list.std())

1.118033988749895
1.118033988749895
