# Numpy para cientistas de dados


### Funções essenciais para manipulação de dados numéricos em Python

Numpy é uma biblioteca essencial para qualquer cientista de dados pois atualmente é uma das melhores bibliotecas para manipulação de dados numéricos em Python.

- np.array
- np.arange
- np.reshape
- np.random.rand

Vamos começar por importar o Numpy e listar as funções cobertas neste notebook.

In [35]:
# instalar o numpy via pip
!pip install numpy 

# importar o numpy
import numpy as np 



## Função 1 - numpy.array()

Cria um array N-dimensional

Usado para armazenar dados de mesma tipagem em estruturas de dados compactas para análise numérica. Por exemplo, em processamento de sinais ou dados científicos.

In [36]:
a = np.array([1, 2, 3]) # Cria um array unidimensional com os elementos 1, 2, 3
print(f"Arry N-Dimensional: {a}") 

Arry N-Dimensional: [1 2 3]


## Função 2 - numpy.arange()

Retorna valores uniformemente espaçados dentro de um intervalo dado.

Útil para gerar sequências numéricas para iterações, gráficos ou como base para matrizes. Por exemplo, na criação de eixos de tempo ou índices.

In [37]:
b = np.arange(0, 10, 2)  # Gera um array com números de 0 a 10 (exclusivo) em passos de 2
print(f'Array com números de 0 a 10 (exclusivo) em passos de 2: {b}')

Array com números de 0 a 10 (exclusivo) em passos de 2: [0 2 4 6 8]


## Função 3 - numpy.reshape()

Altera a forma de um array sem alterar seus dados

 Amplamente utilizado em manipulação de dados e preparação para modelos de machine learning, ajustando o formato dos dados de entrada.

In [38]:
c = np.arange(6).reshape((3, 2))  # Transforma um array de 6 elementos em uma matriz 3x2
print(f'Matriz 3x2: {c}')

Matriz 3x2: [[0 1]
 [2 3]
 [4 5]]


## Função 4 - numpy.random.rand()

Gera números aleatórios em uma distribuição uniforme no intervalo [0, 1).

  Útil em simulações, testes de algoritmos, e inicialização de pesos em redes neurais. Por exemplo, na inicialização de parâmetros de um modelo de machine learning antes do treinamento.

In [39]:
e = np.random.rand(3, 2)  # Gera uma matriz 3x2 de números aleatórios entre 0 e 1
print(f'Matriz 3x2 de números aleatórios entre 0 e 1: {e}')


Matriz 3x2 de números aleatórios entre 0 e 1: [[0.81990814 0.19741727]
 [0.58797811 0.18438186]
 [0.65052729 0.56348965]]


## Conclusão

Algumas funções aprensentadas nesse notebook são amplamentes utilizadas na manipulações de dados de alta performance e são fundamentais para a preparação de dados, análise exploratória, e para a implementação e teste de algoritmos de machine learning, onde a eficiência e precisão numérica são cruciais. 