<a href="https://colab.research.google.com/github/vitormiro/estatistica_ppger_ufc/blob/main/python_fundamentos_5_numpy_p1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Numpy

O **NumPy**, abreviatura para *Numerical Python* (Python Numérico), é uma biblioteca Python que fornece um grande conjunto de funções e operações para executar facilmente cálculos numéricos.

A estrutura de dados mais importante que o NumPy fornece é um objeto poderoso, um tipo de *array* (arranjo), chamada **ndarray**. 

No Python, um array é um objeto semelhante a uma lista, mas é uma estrutura de dados que armazena informações de um mesmo tipo.

Podemos pensar em um array em NumPy como uma tabela multidimensional de elementos do mesmo tipo, indexados por uma tupla de inteiros positivos. 
A vantagem dos arrays (ndarrays) é a possibilidade de realizar operações matemáticas em blocos inteiros de dados usando uma sintaxe semelhante às operações com elementos escalares.

[Documentação do Numpy](https://numpy.org/doc/stable/contents.html#)

### Recursos do NumPy





In [None]:
# Se for necessário, primeiro devemos instalar o NumPy (retirar o # da linha abaixo antes de executar)
#!pip install numpy

# E importar o NumPy com o alias 'np'
import numpy as np

Vamos criar um array


In [None]:
# criando um array de números inteiros
np.array([1, 4, 2, 5, 3])

Vamos criar um array convertendo uma lista

In [None]:
# cria uma lista
x = [1, 4, 2, 5, 3]
x

In [None]:
# converter para array
x = np.array(x)
x

In [None]:
type(x)

In [None]:
# Soma
x.sum()

In [None]:
# valor mínimo
x.min()

In [None]:
# valor máximo
x.max()

In [None]:
# soma de arrays (elemento por elemento)
# Exemplo: notas de duas provas
nota1 = np.array([2.5, 4, 3.5, 3, 4])
nota2 = np.array([3.5, 3.5, 3.5, 4, 4.5])
nota = nota1 + nota2
nota

In [None]:
# soma com escalar
notaf = nota + 0.5
notaf

In [None]:
# operação de comparação
aprovados = notaf >=7
aprovados

In [None]:
# multiplicação de arrays (elemento por elemento)
x = np.array([1, 2, 3, 4])
y = np.array([5, 6, 7, 8])
prod = x * y
prod

In [None]:
# multiplicação por um escalar
x2 = x * 2
x2

Vejamos algumas operações de interesse no nosso curso (Estatística Aplicada).

**Produto escalar de dois vetores**

$$\sum_{i=0}^{n-1} x_i * y_i = x_0*y_0 + x_1*y_1 + \dots + x_{n-1}*y_{n-1}$$



In [None]:
# produto escalar
x = np.array([1, 2, 3, 4])
y = np.array([5, 6, 7, 8])
pxy = np.dot(x, y)
pxy

**Soma dos quadrados**

$$\sum_{i=0}^{n-1} x_i^2 = x_0^2 + x_1^2 + \dots + x_{n-1}^2$$


In [None]:
# soma dos quadrados
xquad = np.dot(x, x)
xquad

## Operações com matrizes

Sobre o [numpy.matrix](https://numpy.org/doc/stable/reference/generated/numpy.matrix.html?highlight=matrix#numpy.matrix).


In [None]:
# criar matriz
A = np.matrix([[1, 2, 3, 4],
               [5, 6, 7, 8]])
A

In [None]:
type(A)

Soma de matrizes
$$ 
\begin{pmatrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{pmatrix} + 
\begin{pmatrix} b_{11} & b_{12} & b_{13}\\ b_{21} & b_{22} & b_{23} \\ b_{31} & b_{32} & b_{33}\end{pmatrix} = 
\begin{pmatrix} a_{11}+b_{11} & a_{12}+b_{12} & a_{13}+b_{13}\\ a_{21}+b_{21} & a_{22}+b_{22} & a_{23}+b_{23} \\ a_{31}+b_{31} & a_{32}+b_{32} & a_{33}+b_{33}\end{pmatrix}
 $$

In [None]:
# soma de matrizes
A = np.matrix([[1, 2, 3, 4], 
               [5, 6, 7, 8]])
B = np.matrix([[1, 2, 3, 4], 
               [5, 6, 7, 8]])

S = A + B
S

Transposta
$$ \begin{pmatrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{pmatrix}^T = 
\begin{pmatrix} a_{11} & a_{21} & a_{31}\\ a_{21} & a_{22} & a_{23} \\ a_{13} & a_{23} & a_{33} \end{pmatrix} $$

In [None]:
# Transposta
A.T

Multiplicação de matrizes
$$ 
\begin{pmatrix} a_{11} & a_{12} & a_{13}\\ a_{21} & a_{22} & a_{23} \end{pmatrix}_{2\times3} * 
\begin{pmatrix} b_{11} & b_{12} \\ b_{21} & b_{22} \\ b_{31} & b_{32} \end{pmatrix}_{3\times2} = 
\begin{pmatrix} a_{11}b_{11}+a_{12}b_{21}+a_{13}b_{31} & a_{11}b_{12}+a_{12}b_{22}+a_{13}b_{32} \\ 
a_{21}b_{11}+a_{22}b_{21}+a_{23}b_{31} & a_{21}b_{12}+a_{22}b_{22}+a_{23}b_{32}  \end{pmatrix}_{2\times2} 
$$

In [None]:
# multiplicação
P = A*B

Temos um erro por `B` foi definida como uma matriz (2 X 4). Devemos fazer a transposta de `B`.

In [None]:
Bt = B.T
Bt

In [None]:
P = A*Bt
P

### Manipulação de Arrays

Vamos usar um **gerador de números aleatórios** do NumPy - `np.random`.

Sobre o [`np.random`](https://numpy.org/doc/1.16/reference/routines.random.html).

Também usaremos uma "semente aleatória" para garantir a geração dos mesmos valores.


In [None]:
np.random.seed(1)  # "seed" para gerar os mesmos valores

x1 = np.random.randint(10, size=3)  # array de 1 dimensão
x2 = np.random.randint(10, size=(3, 3))  # array de 2 dimensões
x3 = np.random.randint(10, size=(3, 2, 2))  # array de 3 dimensões

In [None]:
# mostrar x1
x1

In [None]:
# mostrar x2
x2

In [None]:
# mostrar x3
x3

**Acessando elementos em um array**

In [None]:
x1[0]

In [None]:
x2[2,2]

In [None]:
x2[0,0]

In [None]:
x3[0, 0, 0]

In [None]:
x3[1]

**Modificando elementos**


In [None]:
x2[0, 0] = 12
x2

In [None]:
x3[2, 1, 1] = 20
x3[2]

**Fatiamento**

`x[start:stop:step]`


In [None]:
x = np.arange(10)
x

In [None]:
x[:5]  # primeiros 5 elementos

In [None]:
x[5:]  # elementos após o índice 5

In [None]:
x[4:7]  # sub-array

In [None]:
x[0:8:2]

**Remodelagem de um array**

A maneira mais fácil de fazer isso é com um método `reshape`.


In [None]:
y = np.arange(1, 10)
y

In [None]:
y = np.arange(1, 10).reshape((3, 3))
print(y)

In [None]:
y = np.arange(0,20,2).reshape((2, 5))
y

Observe que, para que isso funcione, o tamanho do array inicial deve corresponder ao tamanho da matriz remodelada. 

**Concatenação**

A concatenação ou junção de dois arrays no NumPy é realizada, principalmente, com o emprego das rotinas `np.concatenate`, `np.vstack` e `np.hstack`.

O `np.concatenate` usa uma tupla ou lista de matrizes como seu primeiro argumento:

In [None]:
x = np.array([1, 2, 3])
y = np.array([3, 2, 1])
np.concatenate([x, y])

Usando o `np.vstack` (concatenação vertical)

In [None]:
x = np.array([1, 2, 3])
w = np.array([[9, 8, 7], [6, 5, 4]])

np.vstack([x, w])

Usando o `np.hstack` (concatenação horizontal)

In [None]:
x = np.array([[3],[2]])
w = np.array([[9, 8, 7], [6, 5, 4]])

print(x)
print(w)

np.hstack([w, x])

**Separação**

O oposto da concatenação é a separação, que é implementada pelas funções `np.split`, `np.hsplit` e `np.vsplit`.

In [None]:
x = np.arange(9.0)
x

In [None]:
np.split(x, 3)

In [None]:
x = [1, 2, 3, 4, 5, 6, 7, 8]
x1, x2 = np.split(x, [4])
print(x1, x2)

In [None]:
A = np.arange(16).reshape(4,4)
A

In [None]:
np.hsplit(A, 2)

In [None]:
A1, A2 = np.hsplit(A, 2)
print('A1 =', A1)
print('A2 =', A2)

In [None]:
B = np.arange(12).reshape(4,3)
B

In [None]:
np.vsplit(B, 2)