In [21]:
import pandas as pd
import numpy as np
import plotly.express as px
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D  # Para graficar en 3-D

In [22]:
observaciones = 1

x1 = np.random.uniform(low=-10, high=10, size=(observaciones,1))
x2 = np.random.uniform(-10, 10, (observaciones,1))

X = np.column_stack((x1,x2))

print (X.shape)

(1, 2)


In [23]:
ruido = np.random.uniform(-1, 1, (observaciones,1))

metas = 2 * x1 - 3 * x2 + 5 + ruido

# Veamos las dimensiones. Deben ser n x m, donde m es el número de variables de salida.
print (metas.shape)

(1, 1)


In [24]:
print(x1.shape)
print(x2.shape)
print(metas.shape)

(1, 1)
(1, 1)
(1, 1)


In [25]:
x1N = x1.reshape(observaciones,)
x2N = x2.reshape(observaciones,)
metasN = metas.reshape(observaciones,)

fig = px.scatter_3d(x = x1N, y = x2N, z = metasN)

fig.update_layout(
    width = 500,
    height = 500,)

fig.show()

In [26]:
rango_inicial = 0.1

pesos = np.random.uniform(low = -rango_inicial, high = rango_inicial, size=(2, 1))

sesgos = np.random.uniform(low = -rango_inicial, high = rango_inicial, size=1)

#Veamos cómo fueron inicializados.
print (pesos)
print (sesgos)

pesos.shape

[[0.08450068]
 [0.07452272]]
[0.01192581]


(2, 1)

In [27]:
eta = 0.01

for i in range (100):
    
    # Esta es la ecuacion del modelo lineal: y = xw + b 
    y = np.dot(X, pesos) + sesgos
    
    # Las deltas son las diferencias entre las salidas y las metas (targets)
    # deltas es un vector 1000 x 1
    deltas = y - metas
        
    perdida = np.sum(deltas ** 2) / 2 / observaciones
    
    print(perdida)
    
    deltas_escaladas = deltas / observaciones
      
    pesos = pesos - eta * np.dot(X.T, deltas_escaladas)
    sesgos = sesgos - eta * np.sum(deltas_escaladas)
    
    # Los pesos son actualizados en una forma de algebra lineal(una matriz menos otra)
    # Sin embargo, los sesgos en este caso son solo un número (solo estamos calculando una salida), 
    #       es necesario transformar las deltas a un escalar.      
    # Ambas lineas son consistentes con la metodología de decenso de gradiente-

602.4011712929852
45.3754087160387
3.4178680491744546
0.25744830365436566
0.019392097091202362
0.0014606949211034164
0.00011002573071406286
8.287604238410038e-06
6.24257467477966e-07
4.7021717552522055e-08
3.5418750068472496e-09
2.6678903298444934e-10
2.0095680430342117e-11
1.5136918003109456e-12
1.1401768180786189e-13
8.588295473822274e-15
6.469065320532999e-16
4.8727737109098436e-17
3.670382771222852e-18
2.764683858982134e-19
2.0824748620201166e-20
1.568676769168083e-21
1.1810368564732685e-22
8.876868750722035e-24
6.789504930183787e-25
4.8871510800252123e-26
3.6350710512584224e-27
2.271919407036514e-28
2.524354896707238e-29
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0


In [28]:
print(pesos, sesgos)      

[[ 2.05185999]
 [-3.4618675 ]] [0.49032686]


In [29]:
yN = y.reshape(observaciones,)
metasN = metas.reshape(observaciones,)
fig = px.scatter(x = yN, y =  metasN)

fig.update_layout(
    width = 400,
    height = 400,)

fig.show()

## Usando las mil observaciones vs cien mil
### 1. El tiempo de ejecución para resolver el problemas
    la mayoria se tardo menos de un segundo en ejecutarse mientras que al usar cien mil se tardo un poco mas pero no se nota.
### 2. El resultado final vrs lo encontrado en clase: es igual, o diferente...¿porqué?
    el resultado es diferente, las graficas parecen figuras entereas en lugar de varios puntos en el plano.
### 3. Las graficas para representar los datos/resultados
    la primera grafica (3D) parece un cuadrado y la ultima grafica parece una linea mientras que usando solo mil iteraciones, si se puede diferenciar la mayoria de los puntos

---------------------------------------------------

## Usando las mil observaciones vs 1,000,000
### 1. El tiempo de ejecución para resolver el problemas
    Hubieron partes del codigo donde se tardo hasta 6 segundos en ejecutarse
### 2. El resultado final vrs lo encontrado en clase: es igual, o diferente...¿porqué?
    Siguen siendo diferentes los resultados, las graficas que se muestran son mas marcadas.
### 3. Las graficas para representar los datos/resultados
    Si se acerca y se analiza bien la grfica se pueden notar partes donde se miran los puntos individuales pero a simple vista si se nota que hay varias iteraciones

----

## Usando las mil observaciones vs una
### 1. ¿Qué ocurre con el tiempo de ejecución?
    es menor y termina mas rapido que usar mas iteraciones
### 2. ¿Qué ocurre con la minimización de la pérdida?
    La perdida comienza con un gran numero y luego baja hasta llegar a 0
### 3. ¿Qué ocurre con los pesos y los sesgos?
    Los pesos son parecidos pero los sesgos si cambia el valor del numero negativo
### 4. ¿Qué ocurre con las iteraciones?
    al usar una observacion entonces solo se itera una vez
### 5. ¿El problema queda resuelto o no?

### 6. ¿Cuál es la apariencia de la última gráfica? ¿Se cumple con la condición de que sea de 45 grados?

----