# Construyendo un Motor de Autodiferenciación

<a href="https://colab.research.google.com/github/Antonio-Tresol/ai_workshop_2025_minigrad/blob/main/blank.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## 0. Introducción

Un motor de autodiferenciación es un motor que permite definir funciones arbitrarias y calcular sus derivadas de manera automática.
Para ello, un motor de autodiferenciación necesita realizar dos cosas:

- construir un grafo que represente la función
- saber las dependencias de cada nodo en el grafo
- conocer el comportamiento local de cada operación definida en la función

Un ejemplo de un motor de autodiferenciación muy famoso es PyTorch Autograd. En este notebook, construiremos un motor de autodiferenciación simple desde cero.

Primero, veamos cómo se ve PyTorch Autograd en acción.

Este taller esta basado en <a href="https://github.com/karpathy/micrograd/tree/master">micrograd</a> de <a href="https://github.com/karpathy">Andrej Karpathy</a>.

------------------------------------------------------


Ejecute la celda a continuación para instalar las dependencias necesarias.

In [None]:
%git clone https://github.com/Antonio-Tresol/ai_workshop_2025_minigrad.git
%cd ai_workshop_2025_minigrad
%apt -qqq install graphviz
%pip install matplotlib
%pip install numpy
%pip install graphviz
%pip install torch

--------------------------------------------------------------------------------

## 1. PyTorch Autograd y Nuestro Mini-Grad

PyTorch Autograd es un motor de autodiferenciación que trabaja a nivel de tensores. En pocas palabras, un objeto matemático que contiene valores y dimensiones. Un tensor puede ser un escalar, un vector, una matriz o un tensor de orden superior. PyTorch Autograd construye un grafo dinámico que representa la función y calcula las derivadas de manera automática.

In [7]:
import torch

# Crear tensores con seguimiento de gradiente
x = torch.tensor(2.0, requires_grad=True)
y = torch.tensor(3.0, requires_grad=True)

# Operaciones simples
z = x**2 + y
w = z + y * x

# Calcular una función escalar final
f = w**2 / 2.0

# Imprimir resultado del paso hacia adelante
print(f"Resultado: {f.item():.4f}")

# Calcular gradientes
f.backward()

# Imprimir los gradientes
print(f"df/dx: {x.grad.item():.4f}")
print(f"df/dy: {y.grad.item():.4f}")

Resultado: 84.5000
df/dx: 91.0000
df/dy: 39.0000


Mini-Grad es un motor de autodiferenciación simple que construiremos en este notebook. Mini-Grad también construirá un grafo que representa la función y calculará las derivadas de manera automática. Sin embargo, Mini-Grad tiene su building block en el nivel de escalares.

In [9]:
from engine.engine import Value

# Crear valores con seguimiento de gradiente
x = Value(2.0)
y = Value(3.0)

# Operaciones simples
z = 3 * x + y
w = z + y * x

# Calcular una función escalar final
f = w**2 / 2.0

# Imprimir resultado del paso hacia adelante
print(f"Resultado: {f.data:.4f}")

# Calcular gradientes
f.backward()

# Imprimir los gradientes
print(f"df/dx: {x.grad:.4f}")
print(f"df/dy: {y.grad:.4f}")

Resultado: 112.5000
df/dx: 90.0000
df/dy: 45.0000


## 2. Conceptos Básicos y todo a mano

## 3. Automatizando la diferenciación

## 4. Implementación de Mini-Grad Final

## 5. Una Red Neuronal Simple con Mini-Grad