<a href="https://colab.research.google.com/github/vitoriaferreirap/DeepLearning/blob/main/vectorization_example.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# L03 - Vectorization Example

In [1]:

# NumPy será usado para trabalhar com vetores e operações matemáticas.
# Em redes neurais reais, essa biblioteca (ou equivalentes) executa
# operações vetorizadas muito mais rápido que loops em Python.
import numpy as np

In [2]:
# FOR LOOP
# Este código representa o NÚCLEO LINEAR DE UM NEURÔNIO.
# Aqui acontece apenas:
#   entradas (x) * pesos (w) -> soma ponderada
# NÃO é um perceptron completo:
# - não tem bias
# - não tem função de ativação
#
# Este trecho é usado para estudar o CUSTO COMPUTACIONAL
# da soma ponderada quando feita com loop explícito em Python.

def forloop(x, w):
    z = 0.  # z representa a soma ponderada (parte linear do neurônio)
    for i in range(len(x)):
        z += x[i] * w[i]  # multiplicação entrada * peso
    return z  # retorna somente a parte linear


In [3]:
# LIST COMPREHENSION
# Continua sendo APENAS o núcleo linear de um neurônio.
# A lógica matemática é idêntica ao for loop:
#   z = soma(x_i * w_i)
# A diferença aqui é apenas sintática.
# Ainda existe custo computacional por estar em Python puro.
def listcomprehension(x, w):
    return sum(x_i * w_i for x_i, w_i in zip(x, w))



In [4]:
# VETORIZAÇÃO
# Esta é a forma usada em bibliotecas de Deep Learning.
# Aqui vemos POR QUE USAMOS VETORIZAÇÃO:
# - o cálculo é delegado para código otimizado (C/Fortran)
# - pode ser paralelizado
# - é muito mais rápido
# Este é exatamente o que acontece "POR BAIXO DO CAPÔ"
# das redes neurais em frameworks como TensorFlow e PyTorch.

def vectorized(x_vec, w_vec):
    return x_vec.dot(w_vec)

In [5]:

# Entradas e pesos grandes para evidenciar a diferença de desempenho
x, w = np.random.rand(100000), np.random.rand(100000)

# Conversão para arrays NumPy (necessário para vetorização)
x_vec, w_vec = np.array(x), np.array(w)


In [6]:


# MEDINDO TEMPO DE EXECUÇÃO
# O objetivo aqui NÃO é treinar um modelo.
# O objetivo é:
# - comparar o custo computacional da soma ponderada
# - entender por que loops são evitados em redes neurais
# - visualizar o ganho da vetorização

%timeit -r 100 -n 10 forloop(x, w)
%timeit -r 100 -n 10 listcomprehension(x, w)
%timeit -r 100 -n 10 vectorized(x_vec, w_vec)

39.2 ms ± 10.2 ms per loop (mean ± std. dev. of 100 runs, 10 loops each)
27.3 ms ± 7.43 ms per loop (mean ± std. dev. of 100 runs, 10 loops each)
The slowest run took 5.96 times longer than the fastest. This could mean that an intermediate result is being cached.
74.6 µs ± 47.3 µs per loop (mean ± std. dev. of 100 runs, 10 loops each)
