# üöÄ NumPy ‚Äî Compara√ß√£o de Performance

Este notebook demonstra **compara√ß√£o de performance entre diferentes abordagens de opera√ß√µes num√©ricas** no NumPy, mostrando t√©cnicas para **otimiza√ß√£o e vetoriza√ß√£o**.  
O objetivo √© evidenciar como pequenas mudan√ßas podem melhorar significativamente a velocidade e o uso de mem√≥ria, habilidades essenciais para **Ci√™ncia de Dados e Machine Learning**.

---

## 1Ô∏è‚É£ Opera√ß√µes com loops vs vetoriza√ß√£o


In [4]:
import numpy as np
import time

# Criando um array grande
arr = np.arange(1_000_000)

# Soma usando loop Python
start = time.time()
soma = 0
for x in arr:
    soma += x
print('Loop Python:', time.time() - start, 'segundos')

# Soma usando NumPy (vetorizado)
start = time.time()
soma_np = np.sum(arr)
print('Vetorizado NumPy:', time.time() - start, 'segundos')

  soma += x


Loop Python: 0.38979578018188477 segundos
Vetorizado NumPy: 0.0009815692901611328 segundos


## 2Ô∏è‚É£ Uso de fun√ß√µes universais (ufuncs)

Compara√ß√£o de fun√ß√µes universais do NumPy com opera√ß√µes manuais.

In [5]:
# Opera√ß√£o elementwise manual vs ufunc
arr2 = np.arange(1_000_000)

# Multiplica√ß√£o manual (loop)
start = time.time()
resultado = [x*2 for x in arr2]
print('Loop manual:', time.time() - start, 'segundos')

# Multiplica√ß√£o usando ufunc
start = time.time()
resultado_np = np.multiply(arr2, 2)
print('ufunc np.multiply:', time.time() - start, 'segundos')


Loop manual: 0.2708466053009033 segundos
ufunc np.multiply: 0.0019974708557128906 segundos


## 3Ô∏è‚É£ Diferen√ßa entre arrays e listas

In [6]:
import sys

lista = list(range(1_000_000))
array = np.arange(1_000_000)

print('Tamanho em mem√≥ria - lista:', sys.getsizeof(lista), 'bytes')
print('Tamanho em mem√≥ria - array:', array.nbytes, 'bytes')


Tamanho em mem√≥ria - lista: 8000056 bytes
Tamanho em mem√≥ria - array: 4000000 bytes


## 4Ô∏è‚É£ Memory layout: c√≥pias vs views

In [7]:
arr_original = np.arange(10_000_000)

# Criando view
arr_view = arr_original[:]
# Criando c√≥pia
arr_copy = arr_original.copy()

print('View compartilha mem√≥ria:', arr_view.base is arr_original)
print('Copy n√£o compartilha mem√≥ria:', arr_copy.base is arr_original)


View compartilha mem√≥ria: True
Copy n√£o compartilha mem√≥ria: False


## 5Ô∏è‚É£ Casos pr√°ticos

Simula√ß√£o de dataset grande e demonstra√ß√£o de ganho de performance usando vetoriza√ß√£o e broadcasting.

In [8]:
# Criando dataset grande
data = np.random.rand(10_000_000)

# Opera√ß√£o vetorizada
start = time.time()
resultado = np.sqrt(data) * np.log(data + 1)
print('Opera√ß√£o vetorizada:', time.time() - start, 'segundos')


Opera√ß√£o vetorizada: 0.31378746032714844 segundos


## ‚úÖ Conclus√£o  
Este notebook demonstrou como **otimizar opera√ß√µes num√©ricas no NumPy**, comparando:  
- Loops vs vetoriza√ß√£o  
- Fun√ß√µes universais (ufuncs)  
- Arrays vs listas 
Uso eficiente de mem√≥ria com c√≥pias e views  
Essas t√©cnicas s√£o fundamentais para **trabalhar com datasets grandes em Ci√™ncia de Dados e Machine Learning**.