# Introdução ao Numpy 

NumPy é uma biblioteca que serve para trabalhar com vetores dentro da programação. Uma lista de números pode ser um vetor, por exem- plo. Por mais que a biblioteca NumPy seja feita para trabalhar dentro do Python, sua estrutura é construída pela linguagem de programação C, que é considerada uma das linguagens mais rápidas do mundo.

O NumPy é o alicerce da computação numérica em Python, projetado especificamente para realizar operações matemáticas em vetores e matrizes de forma extremamente eficiente. O segredo de sua velocidade reside em sua arquitetura: enquanto o Python é uma linguagem interpretada, as operações centrais do NumPy são executadas em código C compilado, eliminando gargalos de performance.

Embora as listas nativas do Python possam parecer similares aos arrays do NumPy por armazenarem sequências de dados, a diferença de desempenho entre eles é abismal. Os arrays do NumPy são homogêneos (todos os elementos são do mesmo tipo) e armazenam seus dados em um bloco de memória contínuo. 


![image.png](attachment:c1e48aa6-a1ae-45a8-82d6-b16ce11d7c8d.png)

## Criando Arrays (matrizes) através de Listas

Uma array, ou matriz, é uma estrutura de dados com linhas e colunas. Já vimos essas estruturas nas aulas de Álgebra Linear. O Numpy é uma biblioteca que permite criar matrizes numéricas de qualquer tipo de forma eficiente. Vejamos como isso é feito.

In [2]:
import numpy as np # np é a forma habital de chamar a biblioteca

In [52]:
lista = [1,2,3,4,5,6,7,8,9] #Lista em Python
lista

[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [53]:
array = np.array(lista)

In [4]:
array

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

Ao contrário das listas do Python, as matrizes do Numpy só podem ter um tipo de dados. Ex: Todos inteiros, todos Floats etc.

In [55]:
np.array(lista,dtype='float32') # forçando que os número da lista sejam float

array([1., 2., 3., 4., 5., 6., 7., 8., 9.], dtype=float32)

Podemos também criar matrizes com mais de uma linha. Vejamos:

In [56]:
lista2 = [x*2 for x in lista] #List Comprehension
lista2

[2, 4, 6, 8, 10, 12, 14, 16, 18]

In [57]:
np.array([lista,lista2]) # cria uma matriz 2 x 9 (2 linhas e 9 colunas)

array([[ 1,  2,  3,  4,  5,  6,  7,  8,  9],
       [ 2,  4,  6,  8, 10, 12, 14, 16, 18]])

## Criando Arrays do zero

In [58]:
# Cria uma matriz de zeros
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [59]:
# Cria uma matrix de n linhas e m colunas de numeros 1. Ex: Matriz 3 x 4
np.ones( (3,4) )

array([[1., 1., 1., 1.],
       [1., 1., 1., 1.],
       [1., 1., 1., 1.]])

In [10]:
# Cria uma matrix de n linhas e m colunas de valores escolhidos. Ex: Matriz 3 x 4
np.full((3,4),10,dtype='float32')

array([[10., 10., 10., 10.],
       [10., 10., 10., 10.],
       [10., 10., 10., 10.]], dtype=float32)

In [11]:
# a mesma matriz acima poderia ser criada multiplicando por 10 a matriz np.ones
np.ones((3,4))*10

array([[10., 10., 10., 10.],
       [10., 10., 10., 10.],
       [10., 10., 10., 10.]])

In [60]:
# Cria uma matriz que contém números em uma data sequencia. Ex: Numeros de 0 a 10 pulando de 3 em 3.
np.arange(0,10,3)

array([0, 3, 6, 9])

### Podemos criar matrizes usando distribuições de probabilidade também. Vejamos alguns exemplos.

In [63]:
# Cria matriz 2x5 usando a distribuição Uniforme (valores de 0 a 1)
np.random.random((2,5))

array([[0.14335329, 0.94466892, 0.52184832, 0.41466194, 0.26455561],
       [0.77423369, 0.45615033, 0.56843395, 0.0187898 , 0.6176355 ]])

In [67]:
# Cria matriz 3x3 de números inteiros usando a distribuição Uniforme (com valores de 5 a 200)
np.random.randint(5,200,(3,3))

array([[ 89,  73,  11],
       [ 52, 132, 136],
       [105, 185,  83]])

In [5]:
# Cria vetor 4 de números inteiros usando a distribuição Uniforme (com valores de 5 a 15)
print("O vetor de numeros inteiros : ",np.random.randint(5,15,4))

O vetor de numeros inteiros :  [ 5 14  6  7]


In [71]:
# Cria matriz usando 2x2 a distribuição Normal (média 2 e desvio padrao 5)
matriz = np.random.normal(2,5,10000)

In [72]:
matriz.mean()

np.float64(2.050529121412916)

O que é uma Distribuição Uniforme?
Significa que todos os números dentro de um intervalo específico têm a mesma probabilidade de serem sorteados.

In [6]:
import numpy as np

# Gera um único float aleatório entre 0.0 e 1.0
valor_aleatorio = np.random.uniform()
print(valor_aleatorio)
# Possível saída: 0.6126839393809041

0.6227642266101613


In [7]:
# Gerar um Único Número em um Intervalo Específico
# Você pode definir seu próprio intervalo com os parâmetros low e high.
# Simula a medição de uma temperatura aleatória entre 18.5 e 25.5 graus
temperatura = np.random.uniform(low=18.5, high=25.5)
print(f"A temperatura atual é: {temperatura:.2f}°C")
# Possível saída: A temperatura atual é: 21.74°C

A temperatura atual é: 20.27°C


In [10]:
# Gerar um Array Unidimensional (Vetor)
# Use o parâmetro size para especificar o número de valores a serem gerados.
# Gera um vetor com 5 alturas aleatórias entre 1.50 e 2.00 metros
alturas = np.random.uniform(low=1.5, high=2.0, size=5)
print(alturas)

[1.58881913 1.88932841 1.62102477 1.94199414 1.59293441]


💡 Dica: Como obter resultados consistentes?

Lembre-se que as funções de distribuições de probabilidade do NumPy geram números pseudoaleatórios, o que significa que os valores em suas matrizes mudarão a cada execução. Para garantir que seus resultados sejam sempre os mesmos — o que é crucial para testes e compartilhamento de código —, você precisa fixar um ponto de partida. Isso é feito definindo uma "semente" (seed). No NumPy, a função para isso é np.random.seed().

In [76]:
np.random.seed(546546546)
np.random.random((2,5))

array([[0.87808901, 0.13756216, 0.13052313, 0.41726905, 0.30432715],
       [0.51063342, 0.09599142, 0.96396118, 0.83842188, 0.25257693]])

## Acessando elementos da matriz

Vamos falar agora de uma série de formas de se acessar determinados elementos de uma matriz. Veja:

In [79]:
linha = np.arange(10)+10
linha

array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19])

In [80]:
linha[:3] # acessa os primeiros 3 elementos (da esquerda para a direita)

array([10, 11, 12])

In [81]:
linha[3:5] # acessa o elemento de indice 3 até o elemento de indice 4 (o elemento 5 não é incluído)

array([13, 14])

In [82]:
linha[5:] # acessa a partir do elemento de indice 5

array([15, 16, 17, 18, 19])

In [22]:
np.random.seed(3)
matriz = np.random.randint(5,50,(3,3))
matriz

array([[47, 29,  8],
       [13,  5, 26],
       [24, 15, 48]])

In [23]:
matriz[0,0] # elemento da linha 0 e coluna 0. Lembrando que os índices das linhas e colunas começam no 0 (zero).

np.int64(47)

In [24]:
matriz[1,2]

np.int64(26)

In [25]:
matriz[:2,:] # acessa as primeiras duas linhas e todas as colunas

array([[47, 29,  8],
       [13,  5, 26]])

In [26]:
matriz[2:,:2] # acessa a partir da linha de indice 2 (2:) até a coluna de indice 1 (:2). Ou seja, a coluna de indice 2 não é incluída

array([[24, 15]])

## Concatenando elementos da matriz

Uma operação importante em matriz é a concatenação, ou seja, o empilhamento de linhas e colunas de matrizes diferentes para formar uma só. Veja:

In [17]:
arr1 = [1,2,3]
arr2 = [4,5,6]
arr3 = [7,8,9]
arr2D = np.array([arr1, arr2])
arr3D = np.array([arr1, arr2, arr3])
print("Array Bidimensional :",arr2D)
print("Array Tridimensional :",arr3D)

Array Bidimensional : [[1 2 3]
 [4 5 6]]
Array Tridimensional : [[1 2 3]
 [4 5 6]
 [7 8 9]]


array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

# Atributos e Métodos

Entender a diferença entre atributos e métodos é fundamental para usar bibliotecas como o NumPy de forma eficaz. É um conceito-chave de programação orientada a objetos que se aplica diretamente aos arrays do NumPy.

Vamos usar uma analogia simples: **pense em um array NumPy como um "carro".**

Atributos são as propriedades do carro: sua cor, seu modelo, o número de portas. São características que você consulta.

Métodos são as ações que o carro pode fazer: ligar_motor(), acelerar(), frear(). São funções que você executa.

A diferença visual na sintaxe é a mais importante:
Atributos são acessados diretamente: **meu_array.shape**

Métodos são chamados com parênteses (): **meu_array.sum()**


In [24]:
import numpy as np2

arr = np2.arange(10)
print("O Array é :",arr)
print("Numero de Bytes do Array :",arr.nbytes)
print("Numero de N Bytes dentro do Array  :",arr.itemsize)

O Array é : [0 1 2 3 4 5 6 7 8 9]
Numero de Bytes do Array : 80
Numero de N Bytes dentro do Array  : 8


In [None]:
# 1. Array de 0 Dimensões (Escalar)
# Um array que contém apenas um único número.

import numpy as np

escalar = np.array(42)
print(f"Array: {escalar}")
print(f"Número de dimensões (ndim): {escalar.ndim}")
# Saída: Número de dimensões (ndim): 0


Array: 42
Número de dimensões (ndim): 0


In [26]:
# 2.  Array de 1 Dimensão (Vetor)
# Uma sequência de números, como uma lista.

vetor = np.array([10, 20, 30, 40])
print(f"\nArray: {vetor}")
print(f"Número de dimensões (ndim): {vetor.ndim}")
# Saída: Número de dimensões (ndim): 1


Array: [10 20 30 40]
Número de dimensões (ndim): 1


In [27]:
# 3. Array de 2 Dimensões (Matriz)
# Uma lista de listas, onde todas as listas internas têm o mesmo tamanho.

matriz = np.array([[1, 2, 3],
                   [4, 5, 6]])
print(f"\nArray:\n{matriz}")
print(f"Número de dimensões (ndim): {matriz.ndim}")
# Saída: Número de dimensões (ndim): 2


Array:
[[1 2 3]
 [4 5 6]]
Número de dimensões (ndim): 2


In [28]:
# 4. Array de 3 Dimensões (Tensor)
# Uma lista de listas de listas. Pense nisso como uma pilha de matrizes.

tensor = np.array([[[1, 2], [3, 4]],
                   [[5, 6], [7, 8]]])
print(f"\nArray:\n{tensor}")
print(f"Número de dimensões (ndim): {tensor.ndim}")
# Saída: Número de dimensões (ndim): 3


Array:
[[[1 2]
  [3 4]]

 [[5 6]
  [7 8]]]
Número de dimensões (ndim): 3


In [None]:
# Isso nos diz que o array tem uma única dimensão com 6 elementos. O (6,) indica uma tupla com um único item.

import numpy as np

vetor = np.array([10, 20, 30, 40, 50, 60])

print(f"Vetor: {vetor}")
print(f"Shape do vetor: {vetor.shape}")

Vetor: [10 20 30 40 50 60]
Shape do vetor: (6,)


In [32]:
# Isso nos diz que o array tem 2 dimensões: 
# a primeira dimensão tem tamanho 2 (são 2 linhas) e a segunda tem tamanho 3 (são 3 colunas).

matriz = np.array([[1, 2, 3],
                   [4, 5, 6]])

print(f"\nMatriz: {matriz}")
print(f"Shape da matriz: {matriz.shape}")


Matriz: [[1 2 3]
 [4 5 6]]
Shape da matriz: (2, 3)


# Exemplos Práticos
# Não importa o formato do array, .size sempre contará todos os elementos.

In [33]:
#1. Em um Vetor (1D)
import numpy as np

vetor = np.array([10, 20, 30, 40, 50]) # 5 elementos
print(f"Vetor .size: {vetor.size}")
# Saída: Vetor .size: 5

#2. Em uma Matriz (2D)
matriz = np.array([[1, 2, 3],
                   [4, 5, 6]]) # 2 linhas x 3 colunas = 6 elementos
print(f"Matriz .size: {matriz.size}")
# Saída: Matriz .size: 6
#3. Em um Tensor (3D)

tensor = np.zeros((4, 5, 2)) # 4 x 5 x 2 = 40 elementos
print(f"Tensor .size: {tensor.size}")
# Saída: Tensor .size: 40

Vetor .size: 5
Matriz .size: 6
Tensor .size: 40


In [19]:
lista = np.arange(-5,5,1)
lista

array([-5, -4, -3, -2, -1,  0,  1,  2,  3,  4])

In [30]:
np.concatenate([linha1,linha2]) # junta as linhas uma ao lado da outra

array([1, 2, 3, 4, 5, 6])

In [31]:
np.vstack([linha1,linha2]) # junta as linhas uma embaixo da outra

array([[1, 2, 3],
       [4, 5, 6]])

# Operações matemáticas e de comparação no Numpy

Como qualquer linguagem de programação, precisamos realizar contas e operações de comparação com os tipos de dados. Veja as principais:

## Operações matemáticas

In [32]:
lista = np.arange(-5,5,1)
lista

array([-5, -4, -3, -2, -1,  0,  1,  2,  3,  4])

In [33]:
# soma 2 a cada elemento da matriz
lista + 2 

array([-3, -2, -1,  0,  1,  2,  3,  4,  5,  6])

In [34]:
# multiplica 2 a cada elemento da matriz
lista * 2 

array([-10,  -8,  -6,  -4,  -2,   0,   2,   4,   6,   8])

In [35]:
# divide por 2 a cada elemento da matriz
lista / 2 

array([-2.5, -2. , -1.5, -1. , -0.5,  0. ,  0.5,  1. ,  1.5,  2. ])

In [36]:
# eleva ao quadrado (potencia de 2) a cada elemento da matriz
lista ** 2 

array([25, 16,  9,  4,  1,  0,  1,  4,  9, 16])

In [37]:
# retorna o valor absoluto
abs(lista)

array([5, 4, 3, 2, 1, 0, 1, 2, 3, 4])

In [38]:
lista = np.arange(1,10)
lista

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [39]:
# retorna o logaritmo natural ln(x) de cada número
np.log(lista)

array([0.        , 0.69314718, 1.09861229, 1.38629436, 1.60943791,
       1.79175947, 1.94591015, 2.07944154, 2.19722458])


<br>
Existem várias outras funções matemáticas. Seguem algumas:

<br>Funções trigonométricas:

- np.sin(x)
- np.cos(x)
- np.tan(x)

Funções logarítmicas:

- np.log2(x)
- np.log10(x)

## Operações de comparação

In [84]:
lista = np.arange(10)
lista

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [85]:
lista > 4 # Com o operador > (maior) o Numpy faz a comparação em cada elemento da matriz "linha" retorna uma nova matriz com os resultados

array([False, False, False, False, False,  True,  True,  True,  True,
        True])

A mesma lógica funciona para todos os outros operadores de comparação. São eles:

- "<" (menor)
- "<=" (menor ou igual)
- ">=" (maior ou igual)
- "==" (igual)
- "!=" (diferente)

Podemos inclusive contar os valores <b>True</b> de uma matriz. Veja:

In [86]:
np.sum(lista > 4) # Usamos a função de agregação "sum" (soma) para isso. Vamos entender quais funções de agregação estão disponíveis abaixo.

np.int64(5)

# Funções de Agregação no Numpy

Nesta última seção, vamos falar das funções de agregação (em geral, as medidas resumo da estatística). Vejamos:

In [87]:
np.random.seed(0)
lista = np.random.randint(1,10,5)

In [88]:
lista

array([6, 1, 4, 4, 8])

In [89]:
np.sum(lista) # soma os elementos da matriz

np.int64(23)

In [90]:
np.mean(lista) # retorna a média dos elementos da matriz

np.float64(4.6)

In [91]:
np.percentile(lista,75) # retorna o percentil 75% (ou Q3) da matriz

np.float64(6.0)

Seguem outra funções de agregação:

| Função | Descrição |
| ------ | ------ |
| np.median(M) | Retorna a mediana dos elementos da matrix M |
| np.prod(M) | Retorna o produto dos elementos da matrix M |
| np.var(M) | Retorna a variancia dos elementos da matrix M |
| np.std(M) | Retorna o desvio padrao dos elementos da matrix M |
| np.min(M) | Retorna o mínimo da matrix M |
| np.max(M) | Retorna o máximo da matrix M |

As funções de agregação também funciona nas linhas ou colunas de uma matriz. Veja:

In [48]:
np.random.seed(0)
lista = np.random.randint(1,10,(2,4))
lista

array([[6, 1, 4, 4],
       [8, 4, 6, 3]])

In [49]:
np.sum(lista,axis=0) # retorna uma matriz com a soma dos elementos de cada coluna (axis = 0) da matriz 

array([14,  5, 10,  7])

In [50]:
np.sum(lista[:1],axis=1) # retorna uma matriz com a soma dos elementos de cada linha (axis = 1) da matriz 

array([15])

**Missão Cumprida: Fundamentos do NumPy Dominados!**

Chegamos ao fim desta imersão no NumPy. Você agora compreende os pilares da biblioteca que forma a espinha dorsal da ciência de dados em Python.

É claro que o NumPy oferece muito mais do que vimos aqui. Parte fundamental da jornada de um desenvolvedor é aprender a navegar por conta própria e aprofundar o conhecimento conforme a necessidade. Por isso, quero que você se sinta à vontade para consultar as melhores fontes de informação da área:

Para respostas definitivas: A Documentação Oficial é o lugar ideal para entender cada detalhe de uma função.

Para soluções práticas: O Stack Overflow é o maior acervo de perguntas e respostas sobre problemas reais de programação.

Continuaremos aplicando e descobrindo mais sobre o NumPy nos próximos módulos. 

**Excelente trabalho até aqui!**

Na próxima aula, vamos falar sobre o <b>Pandas</b>! Até lá !!!