# 🚀 NumPy — Comparação de Performance

Este notebook demonstra **comparação de performance entre diferentes abordagens de operações numéricas** no NumPy, mostrando técnicas para **otimização e vetorização**.  
O objetivo é evidenciar como pequenas mudanças podem melhorar significativamente a velocidade e o uso de memória, habilidades essenciais para **Ciência de Dados e Machine Learning**.

---

## 1️⃣ Operações com loops vs vetorização


In [4]:
import numpy as np
import time

# Criando um array grande
arr = np.arange(1_000_000)

# Soma usando loop Python
start = time.time()
soma = 0
for x in arr:
    soma += x
print('Loop Python:', time.time() - start, 'segundos')

# Soma usando NumPy (vetorizado)
start = time.time()
soma_np = np.sum(arr)
print('Vetorizado NumPy:', time.time() - start, 'segundos')

  soma += x


Loop Python: 0.38979578018188477 segundos
Vetorizado NumPy: 0.0009815692901611328 segundos


## 2️⃣ Uso de funções universais (ufuncs)

Comparação de funções universais do NumPy com operações manuais.

In [5]:
# Operação elementwise manual vs ufunc
arr2 = np.arange(1_000_000)

# Multiplicação manual (loop)
start = time.time()
resultado = [x*2 for x in arr2]
print('Loop manual:', time.time() - start, 'segundos')

# Multiplicação usando ufunc
start = time.time()
resultado_np = np.multiply(arr2, 2)
print('ufunc np.multiply:', time.time() - start, 'segundos')


Loop manual: 0.2708466053009033 segundos
ufunc np.multiply: 0.0019974708557128906 segundos


## 3️⃣ Diferença entre arrays e listas

In [6]:
import sys

lista = list(range(1_000_000))
array = np.arange(1_000_000)

print('Tamanho em memória - lista:', sys.getsizeof(lista), 'bytes')
print('Tamanho em memória - array:', array.nbytes, 'bytes')


Tamanho em memória - lista: 8000056 bytes
Tamanho em memória - array: 4000000 bytes


## 4️⃣ Memory layout: cópias vs views

In [7]:
arr_original = np.arange(10_000_000)

# Criando view
arr_view = arr_original[:]
# Criando cópia
arr_copy = arr_original.copy()

print('View compartilha memória:', arr_view.base is arr_original)
print('Copy não compartilha memória:', arr_copy.base is arr_original)


View compartilha memória: True
Copy não compartilha memória: False


## 5️⃣ Casos práticos

Simulação de dataset grande e demonstração de ganho de performance usando vetorização e broadcasting.

In [8]:
# Criando dataset grande
data = np.random.rand(10_000_000)

# Operação vetorizada
start = time.time()
resultado = np.sqrt(data) * np.log(data + 1)
print('Operação vetorizada:', time.time() - start, 'segundos')


Operação vetorizada: 0.31378746032714844 segundos


## ✅ Conclusão  
Este notebook demonstrou como **otimizar operações numéricas no NumPy**, comparando:  
- Loops vs vetorização  
- Funções universais (ufuncs)  
- Arrays vs listas 
Uso eficiente de memória com cópias e views  
Essas técnicas são fundamentais para **trabalhar com datasets grandes em Ciência de Dados e Machine Learning**.