# Introdução ao Numpy
Numpy é uma biblioteca poderosa para computação numérica em Python. É amplamente utilizada em Ciência de Dados, Engenharia e outras áreas que requerem cálculos matemáticos rápidos e eficientes. Nesta seção, vamos explorar o que é Numpy, por que é tão importante e como começar a usá-lo.

## O que é Numpy?
Numpy (Numerical Python) é uma biblioteca para a linguagem de programação Python para processamento numérico. A maior parte das bibliotecas de processamento com funcionalidades científicas utiliza objetos array do NumPy para a troca de dados.

## Por que usar Numpy em Ciência de Dados?
Numpy é fundamental para a Ciência de Dados por várias razões:
- **Desempenho**: É escrito em C e fornece operações eficientes em arrays.
- **Flexibilidade**: Pode lidar com uma ampla variedade de tipos de dados.
- **Integração**: Funciona bem com outras bibliotecas de Ciência de Dados como Pandas, Matplotlib, Scikit-learn, etc.

## Instalação e Importação
Numpy pode ser instalado usando pip ou conda, e é geralmente importado com o alias `np`.

Para instalar usando pip:
```bash
pip install numpy
```

Para instalar usando conda:
```bash
conda install numpy
```

Para importar Numpy em seu código Python:
```python
import numpy as np
```

In [None]:
import numpy as np

### Principais recursos encontrados no NumPy:

* ndarray: estrutura multidimensional de dados numéricos
* Funções matemáticas
* Recursos de álgebra linear e geração de números aleatórios



### A compreensão dos arrays NumPy ajudará você a utilizar ferramentas com semântica orientada a arrays, como o Pandas.

NumPy foi projetado para ser eficaz em arrays de grandes dados, daí vem a sua importância para processamentos numéricos em Python.

In [None]:
# Um exemplo da velocidade do NumPy

my_array = np.arange(1000000)
my_list = list(range(1000000))

# Vamos multiplicar cada sequência por 2

%time for _ in range(10): my_array2 = my_array * 2

%time for _ in range(10): my_list2 = [x * 2 for x in my_list]



o `%time` é um comando mágico utilizado em ambientes como o Jupyter Notebook para medir o tempo de execução de uma única instrução ou de um bloco de código.

No código `%time for _ in range(10):`, o `_` é usado como uma convenção para representar uma variável temporária que não será usada no corpo do `loop`. Normalmente, quando você itera sobre algo usando um loop for, precisa atribuir um nome a cada item que está sendo iterado, como por exemplo for item in lista:. No entanto, em algumas situações, você pode não se importar com o valor individual de cada item na iteração, mas apenas com a execução do loop um certo número de vezes.

Nesse contexto, a convenção de usar _ como nome da variável é uma maneira de indicar que o valor da variável não é relevante para a lógica do loop. Isso é especialmente útil quando você está interessado apenas em executar uma operação repetidas vezes, sem se preocupar com os valores dos itens individuais na iteração. Portanto, o _ é uma maneira de informar aos leitores do código que você está ignorando a variável de iteração.

No código em questão, a multiplicação `my_arr * 2` é executada 10 vezes consecutivas, mas o resultado de cada iteração não é utilizado. O _ é utilizado para "receber" os valores da iteração, mas como esses valores não são usados, o _ indica que esses valores não são relevantes nesse contexto.

### Os algoritmos utilizando NumPy são de 10 a 100 vezes mais rápidos do que aqueles em Python puro. Também utilizam menos memória.

# Arrays Numpy
Arrays são a estrutura de dados central em Numpy. Eles são eficientes, flexíveis e formam a base para muitas operações matemáticas. Nesta seção, vamos explorar como criar arrays, entender seus atributos e aprender a indexar e fatiar arrays.

## Criação de Arrays
Arrays podem ser criados de várias maneiras, incluindo a partir de listas, usando funções específicas como `np.zeros`, `np.ones`, `np.arange`, etc. Vamos começar com alguns exemplos básicos de criação de arrays.

In [None]:
import numpy as np

# Criando um array a partir de uma lista
array_from_list = np.array([1, 2, 3, 4, 5])
array_from_list

In [None]:
# Criando um array de zeros
zeros_array = np.zeros(5)

In [None]:
# Criando um array de uns
ones_array = np.ones(3)

In [None]:
# Criando um array com um intervalo de valores
range_array = np.arange(0.5, 10.7, 1)
range_array

In [None]:
# Criando um array com valores espaçados uniformemente
linspace_array = np.linspace(0, 10, 5)
linspace_array

* Um ndarray é uma estrutura de que armazena dados homogêneos - todos os elementos devem ser do mesmo tipo.
* Todo array possui
  * um `shape` - uma tupla que dá o tamanho de cada dimensão do array
  * um `dtype`- um objeto que descreve o tipo de dados armazenado no array

In [None]:
mix = np.array([2,3,4])
mix

In [None]:
mix.shape

In [None]:
mix.dtype

## Funções NumPy para números aleatórios

**numpy.random.randn( )**

Gera uma amostra (ou amostras) a partir de uma distribuição normal padrão, também conhecida como distribuição Gaussiana.

In [None]:
# Retorna um array nas dimensões indicadas com distribuição normal (média=0, variância =1)

np.random.randn(3, 4)

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Gerar 1000 amostras de uma distribuição normal padrão
data = np.random.randn(100000)

# Criar um histograma dos dados
plt.hist(data, bins=100, edgecolor='black', alpha=0.7)

# Adicionar títulos e rótulos aos eixos
plt.title('Histograma de uma Distribuição Normal Padrão')
plt.xlabel('Valor')
plt.ylabel('Densidade')

# Mostrar o gráfico
plt.show()



**numpy.random.rand( )**

Gera valores aleatórios de ponto flutuante uniformemente distribuídos no intervalo [0, 1). Esses valores são distribuídos de maneira uniforme, o que significa que qualquer valor dentro desse intervalo tem a mesma probabilidade de ser escolhido.

In [None]:
# Cria um array nas dimensões indicadas com uma distribuição uniforme no intervalo [0, 1).

np.random.rand(3, 4)

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Gerar 1000 amostras de uma distribuição uniforme no intervalo [0, 1)
data = np.random.rand(10000)

# Criar um histograma dos dados
plt.hist(data, bins=100, density=True, edgecolor='black', alpha=0.7)

# Adicionar títulos e rótulos aos eixos
plt.title('Histograma de uma Distribuição Uniforme')
plt.xlabel('Valor')
plt.ylabel('Densidade')

# Mostrar o gráfico
plt.show()


**numpy.random.randint( )**

Gera inteiros aleatórios de uma distribuição uniforme discreta dentro de um intervalo especificado.

`numpy.random.randint(low, high=None, size=None)`

* low: O valor mais baixo (inclusivo) na distribuição.
* high: O valor mais alto (exclusivo) na distribuição. Se high for None, os valores serão gerados no intervalo [0, low).
* size: O tamanho da saída. Pode ser um inteiro ou uma tupla para gerar uma matriz multidimensional.

In [None]:
# Retorna um inteiro aletório no intervalo indicado: inferior(inclusivo) até superior (exclusivo)

np.random.randint(1, 100)

In [None]:
# O primeiro argumento define o valor máximo (exclusivo) de cada elemento para a criação do array

np.random.randint(5, size=5)

In [None]:
# Aqui, definimos o tamanho do array que queremos retornar com números aleatórios. Os dois primeiros parâmetros
#indicam o intervalo desejado

np.random.randint(5, 15, size=(2, 4))

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Gerar 1000 inteiros aleatórios no intervalo [0, 10)
data = np.random.randint(0, 10, 1000)

# Criar um histograma dos dados
plt.hist(data, bins=10, range=(0,10), edgecolor='black', alpha=0.7)

# Adicionar títulos e rótulos aos eixos
plt.title('Histograma de uma Distribuição Uniforme Discreta')
plt.xlabel('Valor')
plt.ylabel('Densidade')

# Mostrar o gráfico
plt.show()

## Atributos de Arrays
Cada array Numpy possui vários atributos que fornecem informações sobre sua forma, tamanho, tipo de dados, etc. Vamos explorar alguns dos atributos mais comuns:
- **shape**: Retorna a forma do array (número de linhas, colunas, etc.).
- **size**: Retorna o número total de elementos no array.
- **dtype**: Retorna o tipo de dados dos elementos no array.
- **ndim**: Retorna o número de dimensões do array.

Vamos examinar esses atributos em um exemplo.

In [None]:
# Criando um array bidimensional
two_dimensional_array = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

In [None]:
# Examinando os atributos
shape = two_dimensional_array.shape
shape

In [None]:
size = two_dimensional_array.size

In [None]:
dtype = two_dimensional_array.dtype

In [None]:
ndim = two_dimensional_array.ndim

## Indexação e Fatiamento
A indexação e o fatiamento permitem acessar e modificar elementos específicos ou subconjuntos de um array. Isso é semelhante à indexação de listas em Python, mas com a capacidade de acessar múltiplas dimensões.

### Indexação
Podemos acessar um elemento específico em um array fornecendo o índice de sua posição. Em um array bidimensional, fornecemos dois índices: um para a linha e outro para a coluna.

### Fatiamento
O fatiamento permite acessar uma subseção do array usando a notação `start:stop:step`. Podemos fatiar ao longo de qualquer dimensão de um array.

Vamos ver alguns exemplos de indexação e fatiamento.

In [None]:
# Exemplo de array bidimensional
example_array = np.array([[10, 20, 30], [40, 50, 60], [70, 80, 90]])

In [None]:
example_array

In [None]:
# Indexação: Acessando o elemento na segunda linha e terceira coluna (índices 1 e 2)
indexed_element = example_array[1, 2]
indexed_element

In [None]:
# Fatiamento: Acessando a primeira coluna (todas as linhas, coluna de índice 0)
sliced_column = example_array[:, 0]
sliced_column

In [None]:
# Fatiamento: Acessando as duas primeiras linhas e duas primeiras colunas
sliced_subarray = example_array[:2, :2]

In [None]:
# criamos o array
b = np.arange(10)
print(b)

In [None]:
# Extraindo elementos pelo índice (index)

print(b[0])
print(b[1])
print(b[2])
print(b[8])
print(b[-10])

In [None]:
# Slicing

b[0:10]

In [None]:
b[:4] # do início (:) até o elemento anterior ao index 4

In [None]:
b[2:]

In [None]:
b[2:9:2]    # [início:fim:incremento]

In [None]:
b[:] # do início ao fim do array

In [None]:
b[::-1] # do início ao fim do array com passo de 2

In [None]:
novo_arr = b[3:]

In [None]:
novo_arr


Atenção!!! Uma operação de corte cria uma visualização do array original, a qual é apenas uma forma de se acessar dos dados da array. Assim, a matriz original não é copiada na memória.

### Mais um pouquinho de Slicing: 2-D Arrays

In [None]:
matriz = np.array([[1,2,3],[6,5,4],[8,7,9]])
matriz

In [None]:
matriz[0, 1]  # da linha de índice 0, pegue o elemento de índice 1, ou seja, da coluna 1

In [None]:
matriz[0:2, 1] # das linhas 0 e 2, pegue os elementos da coluna 1

In [None]:
matriz[0:3, 1]  # da linha de indice 0 até a linha de indice 2, pegue os elementos da coluna 1

In [None]:
matriz[0:2, 0:2] # da linha de indice 0 até a linha de indice 2, pegue os elementos da coluna de indice 0 até a coluna de indice 2

In [None]:
matriz[:, 2:]

# Operações com Arrays
Arrays Numpy suportam uma ampla variedade de operações matemáticas e estatísticas. Essas operações são otimizadas para desempenho e são fundamentais para a análise e manipulação de dados numéricos.

## Operações Aritméticas
Podemos realizar operações aritméticas básicas, como adição, subtração, multiplicação e divisão, diretamente em arrays. Essas operações são aplicadas elemento a elemento e seguem as regras de transmissão (broadcasting) quando os arrays têm formas diferentes.

Vamos ver alguns exemplos de operações aritméticas em arrays.

In [None]:
# Definindo dois arrays para operações
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

In [None]:
# Adição
addition = a + b
addition

In [None]:
# Subtração
subtraction = a - b

In [None]:
# Multiplicação
multiplication = a * b

In [None]:
# Divisão
division = a / b

## Funções Universais (Ufuncs)
Funções Universais (Ufuncs) são funções que operam em arrays Numpy de forma eficiente. Elas fornecem uma interface simples para operações complexas e são otimizadas para desempenho. Algumas ufuncs comuns incluem funções trigonométricas, logarítmicas, exponenciais e muito mais.

Vamos explorar alguns exemplos de ufuncs aplicadas a um array.

In [None]:
# Definindo um array para aplicar ufuncs
x = np.array([0, np.pi / 2, np.pi])  #ângulos em radianos
x

In [None]:
#Transformando os ângulos de radianos para graus (apenas para ilustrar)
# radianos = np.pi / 2
graus = np.degrees(x) # x em radianos
[graus for grau in x]

print(graus)

In [None]:
# Aplicando funções trigonométricas - argumento em radianos
sin_values = np.sin(x)
cos_values = np.cos(x)

In [None]:
sin_values

In [None]:
# Aplicando função logarítmica (log natural)
log_values = np.log(np.array([1, np.e, np.e**2]))

In [None]:
log_values

In [None]:
np.e # constante de Euler

O valor de `e` é é aproximadamente 2.718281828459045, e é a base do logaritmo natural.

In [None]:
# Aplicando função exponencial
exp_values = np.exp(np.array([0, 1, 2]))

In [None]:
exp_values

## Agregações
Agregações são operações que resumem um conjunto de valores em um único valor. Elas são fundamentais para a análise estatística e permitem entender e resumir grandes conjuntos de dados. Numpy fornece várias funções de agregação, como soma, média, mínimo, máximo, desvio padrão, etc.

Vamos explorar alguns exemplos dessas agregações aplicadas a um array.

In [None]:
# Definindo um array para aplicar agregações
data = np.array([10, 20, 30, 40, 50])

In [None]:
# Calculando a soma
total_sum = np.sum(data)

In [None]:
# Calculando a média
mean_value = np.mean(data)

In [None]:
# Encontrando o valor mínimo
min_value = np.min(data)

In [None]:
# Encontrando o valor máximo
max_value = np.max(data)

In [None]:
# Calculando o desvio padrão
std_dev = np.std(data)

# Manipulação de Forma
A manipulação de forma em arrays Numpy permite organizar e transformar dados em uma estrutura desejada. Isso é útil para preparar dados para análise, visualização ou entrada em modelos de aprendizado de máquina. Algumas operações comuns de manipulação de forma incluem:

- **Remodelar (reshape)**: Alterar a forma de um array sem alterar seus dados.
- **Transpor (T)**: Inverter as dimensões de um array (por exemplo, trocar linhas por colunas).
- **Achatar (flatten)**: Converter um array multidimensional em um array unidimensional.

Vamos explorar alguns exemplos dessas operações para entender como elas funcionam.

In [None]:
array_1d = np.array([1, 2, 3, 4, 5, 6])

In [None]:
# Exemplo 1: Remodelar um array
reshaped_matrix = array_1d.reshape(2, 3)

In [None]:
reshaped_matrix

In [None]:
# Exemplo 2: Transpor uma matriz
transposed_matrix = reshaped_matrix.T

In [None]:
transposed_matrix

In [None]:
# Exemplo 3: Achatar uma matriz
flattened_array = reshaped_matrix.flatten()

In [None]:
flattened_array

# Combinação e Divisão de Arrays
Combinar e dividir arrays são operações fundamentais para manipular conjuntos de dados em Numpy. Elas permitem concatenar diferentes conjuntos de dados ou dividir um conjunto de dados em partes menores. Algumas operações comuns incluem:

- **Concatenação**: Combinar vários arrays em um único array.
- **Empilhamento**: Empilhar arrays ao longo de um novo eixo, como empilhar matrizes verticalmente ou horizontalmente.
- **Divisão**: Dividir um array em várias partes menores, seja em partes iguais ou com base em índices específicos.

Vamos explorar alguns exemplos dessas operações para entender como elas funcionam.

In [None]:
array1 = np.array([1, 2, 3])
array2 = np.array([4, 5, 6])

In [None]:
# Exemplo 1: Concatenação de arrays
concatenated_array = np.concatenate([array1, array2])

### Empilhamento Vertical (vstack)
A função `np.vstack` empilha matrizes verticalmente. Isso significa que as matrizes são unidas em uma nova matriz ao longo das linhas (eixo 0).

In [None]:
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6]])

C = np.vstack((A, B))
C

In [None]:
# Exemplo 2: Empilhamento de matrizes
matrix1 = np.array([[1, 2], [3, 4]])
matrix2 = np.array([[5, 6], [7, 8]])

In [None]:
stacked_vertically = np.vstack([matrix1, matrix2])

In [None]:
stacked_vertically

### Empilhamento Horizontal (hstack)
A função `np.hstack` empilha matrizes horizontalmente. Isso significa que as matrizes são unidas em uma nova matriz ao longo das colunas (eixo 1).

In [None]:
A = np.array([[1, 2], [3, 4]])
B = np.array([[5], [6]])

C = np.hstack((A, B))
C

In [None]:
# Exemplo 2: Empilhamento de matrizes
matrix1 = np.array([[1, 2], [3, 4]])
matrix2 = np.array([[5, 6], [7, 8]])

In [None]:
stacked_horizontally = np.hstack([matrix1, matrix2])

In [None]:
stacked_horizontally

### Split

In [None]:
# Exemplo 3: Divisão de um array
array_to_split = np.array([1, 2, 3, 4, 5, 6])
split_arrays = np.split(array_to_split, 3)

In [None]:
type(split_arrays)

# Indexação Avançada
A indexação avançada em Numpy permite acessar partes específicas de um array de maneira flexível e eficiente. Isso é útil para filtrar, selecionar e manipular dados de maneira complexa. Algumas técnicas comuns de indexação avançada incluem:

- **Indexação Sofisticada (Fancy Indexing)**: Usar arrays de índices para acessar elementos específicos em um array.

- **Indexação Booleana**: Usar uma matriz booleana para filtrar elementos com base em uma condição.


Vamos explorar alguns exemplos dessas técnicas para entender como elas funcionam.

In [None]:
matrix = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
matrix

In [None]:
# Indexação Avançada (Fancy Indexing)
rows = np.array([0, 1, 1])
cols = np.array([1, 2, 1])
selected_elements = matrix[rows, cols]
selected_elements

In [None]:
matrix

In [None]:
# Indexação Booleana
filtered_elements = matrix[matrix > 4]

In [None]:
filtered_elements

In [None]:
mask = matrix % 2 == 0
even_numbers = matrix[mask]

In [None]:
print(even_numbers)

In [None]:
mask = matrix > 3
filtered_values = matrix[mask]

In [None]:
print(filtered_values)

In [None]:
mask = (matrix > 3) & (matrix < 8)
filtered_values = matrix[mask]

In [None]:
print(filtered_values)

## 5. Álgebra Linear Básica
A álgebra linear é um campo fundamental em matemática e ciência da computação. NumPy fornece ferramentas para realizar operações básicas de álgebra linear, como soma e produto escalar.

### 5.1 Soma de Matrizes
A soma de matrizes é realizada adicionando os elementos correspondentes das matrizes.

### 5.2 Produto Escalar
O produto escalar, ou produto ponto, é uma operação que pega duas matrizes do mesmo tamanho e retorna uma matriz do mesmo tamanho, onde cada elemento é o produto dos elementos correspondentes das matrizes de entrada.

Vamos explorar esses conceitos com exemplos de código.

In [None]:
# Soma de Matrizes
matriz_A = np.array([[1, 2], [3, 4]])
matriz_B = np.array([[5, 6], [7, 8]])

In [None]:
matriz_A

In [None]:
matriz_B

In [None]:
soma_matrizes = matriz_A + matriz_B

In [None]:
# Produto Escalar
produto_escalar = np.dot(matriz_A, matriz_B)
produto_escalar

## Exercícios
Aqui estão as soluções para os exercícios propostos na seção anterior. É altamente recomendável tentar resolver os exercícios por conta própria antes de verificar as respostas aqui.

### Exercício 1: Crie um Array 1D

Crie um array 1D com os números de 1 a 10 usando o NumPy.

In [None]:
# @title Resolução do Exercício 1
array_1d = np.arange(1, 11)
array_1d

### Exercício 2: Reshape e Transposição

Pegue o array 1D criado no exercício anterior e transforme-o em uma matriz 2x5. Em seguida, transponha a matriz.

In [None]:
# @title Resolução do Exercício 2
matriz_2x5 = array_1d.reshape(2, 5)
matriz_transposta = matriz_2x5.T
matriz_2x5, matriz_transposta

### Exercício 3: Operações Aritméticas

Crie dois arrays 2D e realize operações de adição, subtração, multiplicação e divisão entre eles.

In [None]:
# @title Resolução do Exercício 3
array_A = np.array([[1, 2], [3, 4]])
array_B = np.array([[5, 6], [7, 8]])
soma_arrays = array_A + array_B
subtracao_arrays = array_A - array_B
multiplicacao_arrays = array_A * array_B
divisao_arrays = array_A / array_B
soma_arrays, subtracao_arrays, multiplicacao_arrays, divisao_arrays

### Exercício 4: Estatísticas de um Array

Calcule a média, mediana e desvio padrão de um array.

In [None]:
# @title Resolução do Exercício 4
array_estatisticas = np.array([10, 20, 30, 40, 50])
media = np.mean(array_estatisticas)
mediana = np.median(array_estatisticas)
desvio_padrao = np.std(array_estatisticas)
media, mediana, desvio_padrao