In [4]:
import numpy as np 
import matplotlib.pyplot as plt
import copy
import math

In [7]:
# 1. FUNCIÓN DE COSTO
def compute_cost(X, y, w, b):
    m = X.shape[0]
    cost_sum = 0
    for i in range(m):
        f_wb_i = np.dot(X[i], w) + b
        error_i = (f_wb_i - y[i])**2
        cost_sum += error_i
    total_cost = cost_sum / (2 * m)
    return total_cost

# 2. FUNCIÓN DE GRADIENTE (El motor que calcula las derivadas)
def compute_gradient(X, y, w, b):
    m, n = X.shape
    dj_dw = np.zeros((n,))
    dj_db = 0.

    for i in range(m):                             # Recorre cada casa
        err = (np.dot(X[i], w) + b) - y[i]         # Error de la predicción
        for j in range(n):                         # Recorre cada característica
            dj_dw[j] = dj_dw[j] + err * X[i,j]     # Sumatoria para w
        dj_db = dj_db + err                        # Sumatoria para b

    dj_dw = dj_dw / m
    dj_db = dj_db / m
    return dj_dw, dj_db 

# 3. DESCENSO DE GRADIENTE (El algoritmo que actualiza w y b)
def gradient_descent(X, y, w_in, b_in, cost_function, gradient_function, alpha, num_iters):
    w = copy.deepcopy(w_in)
    b = b_in
    J_history = []
    
    for i in range(num_iters):
        # Usamos el "apodo" gradient_function que apunta a compute_gradient
        dj_dw, dj_db = gradient_function(X, y, w, b)
        
        # Actualización de parámetros
        w = w - alpha * dj_dw
        b = b - alpha * dj_db

        # Guardar historial de costo
        if i < 100000:
            J_history.append(cost_function(X, y, w, b))
            
        # Imprimir progreso cada 10%
        if i % math.ceil(num_iters / 10) == 0:
            print(f"Iteración {i:4d}: Costo {J_history[-1]:8.2f}")
            
    return w, b, J_history

# ---------------------------------------------------------
# EJEMPLO DE USO CON DATOS REALES
# ---------------------------------------------------------

# Datos: [Tamaño (m2), Habitaciones]
X_train = np.array([[2104, 5], [1416, 3], [852, 2]])
y_train = np.array([460, 232, 178]) # Precios en miles de dólares

# Configuración inicial
initial_w = np.zeros(X_train.shape[1])
initial_b = 100.
iterations = 1000
alpha = 5.0e-7 # Alpha pequeño porque los valores de X son grandes

# Ejecutar el entrenamiento
w_final, b_final, J_hist = gradient_descent(X_train, y_train, initial_w, initial_b,
                                            compute_cost, compute_gradient, 
                                            alpha, iterations)

print(f"\nResultado final: b = {b_final:0.2f}, w = {w_final}")

# Probar una predicción
casa_nueva = X_train[0] # Probemos con la primera casa
prediccion = np.dot(casa_nueva, w_final) + b_final
print(f"Predicción para la primera casa: {prediccion:0.2f}")
print(f"Valor real: {y_train[0]}")

Iteración    0: Costo  2613.16
Iteración  100: Costo  1727.24
Iteración  200: Costo  1727.22
Iteración  300: Costo  1727.21
Iteración  400: Costo  1727.19
Iteración  500: Costo  1727.18
Iteración  600: Costo  1727.16
Iteración  700: Costo  1727.14
Iteración  800: Costo  1727.13
Iteración  900: Costo  1727.11

Resultado final: b = 99.99, w = [0.14121228 0.00463395]
Predicción para la primera casa: 397.13
Valor real: 460
