In [None]:
import pandas as pd

In [None]:
# Importar libreria para dividir entrenamiento y prueba
from sklearn.model_selection import train_test_split

In [None]:
# Especificar la ruta del archivo
file_path = "/content/pima-indians-diabetes.csv"

In [None]:
# Asignar encabezado
nombre_columnas = ['Number of times pregnant', 'Plasma glucose concentration a 2 hours in an oral glucose tolerance test', 'Diastolic blood pressure (mm Hg)', 'Triceps skin fold thickness (mm)', '2-Hour serum insulin (mu U/ml)', 'Body mass index (weight in kg/(height in m)^2)', 'Diabetes pedigree function', 'Age (years)', 'Class variable (0 or 1)']

# Leer dataset
data = pd.read_csv(file_path, header=None, delimiter=',', skiprows=9, names=nombre_columnas)

In [None]:
print(data)

In [None]:
data.info()

In [None]:
# Division de dataset en entrenamiento y prueba
train_data, test_data = train_test_split(data, test_size=0.2, random_state=42)

In [None]:
print(train_data)

In [None]:
print(test_data)

In [None]:
train_data.info()

In [None]:
test_data.info()

In [None]:
train_data.to_csv("train.csv", index=False)

In [None]:
test_data.to_csv("test.csv", index=False)

In [None]:
#Carga de dataset
data = pd.read_csv('/content/train.csv')

In [None]:
X = data.iloc[:, :8]
y = data.iloc[:, 8]
m = y.size

In [None]:
print(X)
print('*'*25)
print(y)

In [None]:
# se utiliza para el manejo de rutas y directorios.
import os

# Calculo cientifico y vectorial para python
import numpy as np

# Librerias para graficar
from matplotlib import pyplot

# Modulo de optimización de scipy
from scipy import optimize

# le dice a matplotlib que incruste gráficos en el cuaderno
%matplotlib inline

In [None]:
def sigmoid(z):
    # Calcula la sigmoide de una entrada z
    # convierte la intrada a un arreglo numpy
    z = np.array(z)

    g = np.zeros(z.shape)

    g = 1 / (1 + np.exp(-z))

    return g

In [None]:
# Configurar la matriz adecuadamente, y agregar una columna de unos que corresponde al termino de intercepción.
m, n = X.shape
# Agraga el termino de intercepción a A
X = np.concatenate([np.ones((m, 1)), X], axis=1)

In [None]:
print(X)

In [None]:
def calcularCosto(theta, X, y):
    # Inicializar algunos valores utiles
    m = y.size  # numero de ejemplos de entrenamiento

    J = 0
    h = sigmoid(X.dot(theta.T))
    J = (1 / m) * np.sum(-y.dot(np.log(h)) - (1 - y).dot(np.log(1 - h)))

    return J

In [None]:
def descensoGradiente(theta, X, y, alpha, num_iters):
    # Inicializa algunos valores
    m = y.shape[0] # numero de ejemplos de entrenamiento

    # realiza una copia de theta, el cual será acutalizada por el descenso por el gradiente
    theta = theta.copy()
    J_history = []

    for i in range(num_iters):
        h = sigmoid(X.dot(theta.T))
        theta = theta - (alpha / m) * (h - y).dot(X)

        J_history.append(calcularCosto(theta, X, y))
    return theta, J_history

In [None]:
#Carga de dataset
data = pd.read_csv('/content/test.csv')
print(data)

In [None]:
fila_deseada = 152

if fila_deseada < len(data):
  fila_completa = data.iloc[fila_deseada].to_numpy()
  print(fila_completa)
else:
  print("La fila no existe")

In [None]:
# Elegir algun valor para alpha (probar varias alternativas)
alpha = 0.0001
num_iters = 10000

# inicializa theta y ejecuta el descenso por el gradiente
theta = np.zeros(9)
theta, J_history = descensoGradiente(theta, X, y, alpha, num_iters)

# Grafica la convergencia del costo
pyplot.plot(np.arange(len(J_history)), J_history, lw=2)
pyplot.xlabel('Numero de iteraciones')
pyplot.ylabel('Costo J')

# Muestra los resultados del descenso por el gradiente
print('theta calculado por el descenso por el gradiente: {:s}'.format(str(theta)))

# verificar si ingresa o no a la universidad
X_array = [1, 2.00e+00, 1.46e+02, 7.00e+01, 3.80e+01, 3.60e+02, 2.80e+01, 3.37e-01, 2.90e+01]

aprueba = sigmoid(np.dot(X_array, theta))   # Se debe cambiar esto

print(f"Un estudiante con nota del examen 1: {X_array[1]} y nota del examen 2: {X_array[2]} (usando el descenso por el gradiente):{aprueba}")