## Caso HESPE
### Contexto del Problema
Usted ha sido contratado como parte de un equipo de análisis del rendimiento de estudiantes en 
la facultad de ingeniería y de ciencias de la universidad de Wisconsin, para participar en el 
proyecto HESPE (Higher Education Student Performance Evaluation). Deberá, por lo tanto, poner a 
prueba todas las habilidades y conocimientos adquiridos a lo largo de este curso. 
Su primer desafío consiste en predecir el resultado de los estudiantes al momento de cursar una 
asignatura en la universidad. Para esto, se ha construido un set de datos con 32 características, en 
donde las 10 primeras de ellas corresponden a información personal, de la 11 a la 16 
corresponden a preguntas familiares, y el resto corresponde a hábitos de estudio. Se recolectaron 
145 instancias para este estudio, que fue llevado a cabo durante 2019. Cada instancia corresponde 
a lo contestado por un estudiante en una encuesta.

A continuación, se describe el set de datos:
1. student_id
2. age - Student Age (1: 18-21, 2: 22-25, 3: above 26)
3. sex - Sex (1: female, 2: male)
4. graduated_h_school_type - Graduated high-school type: (1: private, 2: state, 3: other)
5. scholarship_type - Scholarship type: (1: None, 2: 25%, 3: 50%, 4: 75%, 5: Full)
6. additional_work - Additional work: (1: Yes, 2: No)
7. activity -Regular artistic or sports activity: (1: Yes, 2: No)
8. partner - Do you have a partner: (1: Yes, 2: No)
9. total_salary - Total salary if available (1: USD 135-200, 2: USD 201-270, 3: USD 271-340, 4: 
USD 341-410, 5: above 410)
10. transport - Transportation to the university: (1: Bus, 2: Private car/taxi, 3: bicycle, 4: Other)
11. accomodation - Accommodation type in Cyprus: (1: rental, 2: dormitory, 3: with family, 4: 
Other)
12. mother_ed - Mother's education: (1: primary school, 2: secondary school, 3: high school, 
4: university, 5: MSc., 6: Ph.D.)
13. farther_ed - Father's education: (1: primary school, 2: secondary school, 3: high school, 4: 
university, 5: MSc., 6: Ph.D.)
14. siblings - Number of sisters/brothers (if available): (1: 1, 2:, 2, 3: 3, 4: 4, 5: 5 or above)
15. parental_status - Parental status: (1: married, 2: divorced, 3: died - one of them or both)
16. mother_occup - Mother's occupation: (1: retired, 2: housewife, 3: government officer, 4: 
private sector employee, 5: self-employment, 6: other)
17. father_occup - Father's occupation: (1: retired, 2: government officer, 3: private sector 
employee, 4: self-employment, 5: other)
18. weekly_study_hours - Weekly study hours: (1: None, 2: <5 hours, 3: 6-10 hours, 4: 11-20 
hours, 5: more than 20 hours)
19. reading_non_scientific - Reading frequency (non-scientific books/journals): (1: None, 2: 
Sometimes, 3: Often)
Talento Digital / Kibernum / Ciencia de Datos / M05 – Supervised Learning
20. reading_scientific - Reading frequency (scientific books/journals): (1: None, 2: Sometimes, 
3: Often)
21. attendance_seminars_dep -Attendance to the seminars/conferences related to the 
department: (1: Yes, 2: No)
22. impact_of_projects - Impact of your projects/activities on your success: (1: positive, 2: 
negative, 3: neutral)
23. attendances_classes - Attendance to classes (1: always, 2: sometimes, 3: never)
24. preparation_midterm_company - Preparation to midterm exams 1: (1: alone, 2: with 
friends, 3: not applicable)
25. preparation_midterm_time - Preparation to midterm exams 2: (1: closest date to the 
exam, 2: regularly during the semester, 3: never)
26. taking_notes - Taking notes in classes: (1: never, 2: sometimes, 3: always)
27. listenning - Listening in classes: (1: never, 2: sometimes, 3: always)
28. discussion_improves_interest - Discussion improves my interest and success in the course: 
(1: never, 2: sometimes, 3: always)
29. flip_classrom - Flip-classroom: (1: not useful, 2: useful, 3: not applicable)
30. grade_previous - Cumulative grade point average in the last semester (/4.00): (1: <2.00, 2: 
2.00-2.49, 3: 2.50-2.99, 4: 3.00-3.49, 5: above 3.49)
31. grade_expected - Expected Cumulative grade point average in the graduation (/4.00): (1: 
<2.00, 2: 2.00-2.49, 3: 2.50-2.99, 4: 3.00-3.49, 5: above 3.49)
32. course_id
33. grade - OUTPUT Grade (0: Fail, 1: DD, 2: DC, 3: CC, 4: CB, 5: BB, 6: BA, 7: AA  
  
`El objetivo del proyecto es elaborar un modelo de aprendizaje de máquina que permita 
realizar predicciones sobre el resultado académico (variable “grade”)`

### Importar Librerías

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score

%matplotlib inline
sns.set()

### Ánalisis Exploratorio 

In [None]:
df=pd.read_csv('hespe-data.csv',delimiter=';')

In [None]:
df

In [None]:
df.columns = ['student_id', 'age', 'sex', 'graduated_h_school_type', 'scholarship_type', 'additional_work', 'activity', 'partner', 'total_salary', 'transport', 'accomodation', 'mother_ed', 'farther_ed', 'siblings', 'parental_status', 'mother_occup', 'father_occup', 'weekly_study_hours', 'reading_non_scientific', 'reading_scientific', 'attendance_seminars_dep', 'impact_of_projects', 'attendances_classes', 'preparation_midterm_company', 'preparation_midterm_time', 'taking_notes', 'listenning', 'discussion_improves_interest', 'flip_classrom', 'grade_previous', 'grade_expected', 'course_id', 'grade']

In [None]:
df.head()

In [None]:
df.isnull().sum()

In [None]:
df.duplicated().sum()

In [None]:
df.groupby('grade').mean()

In [None]:
df.info()

In [None]:
df.T

In [None]:
df.shape

In [None]:
sns.countplot(x="grade", hue="weekly_study_hours", data=df)

In [None]:
df.describe()

In [None]:
df['grade'].mean() 

In [None]:
df['grade'].median() 

In [None]:
df['grade'].value_counts()

In [None]:
df['grade'].plot(kind='hist', bins=20)

Las personas con grado 1: DD representan la mayoría.

In [None]:
df['grade'].plot(kind='kde')

### Analisis de Outliers 'Grade'

In [None]:
# Calculo de los Cuartiles
q1 = df['grade'].quantile(q=.2)
q2 = df['grade'].quantile(q=.4)
q3 = df['grade'].quantile(q=.6)
q4 = df['grade'].quantile(q=.8)

#Calculo del rango intercuartil
iqr = q3 - q1
#Calculo del limite superior e inferior y outliers
linf = max(q1 - 1.5*iqr, min(df['grade']))
lsup = min(q3 + 1.5*iqr, max(df['grade']))
outliers = df[(df['grade'] < linf) | (df['grade'] > lsup)]
cantidad_outliers = len(outliers)

#Imprime las variables calculadas
print('IQR', iqr)
print('LINF', linf)
print('LSUP', lsup)
print('Cant Outliers',cantidad_outliers)

In [None]:
outliers

Al observar el DataFrame la cantidad de Outliers son 17 los cuales corresponden a estudiantes con grade 7

In [None]:
df['grade'].plot(kind='box')

## DataWrangling

Se realizarán transformaciones del DataFrame para utilizar etiquetas que ayudan a mejorar la legibilidad y comprensión de los datos. Estas transformaciones utilizarán funciones lambda para modificar los valores de ciertas columnas en el DataFrame.  

Al cambiar valores numéricos en categorías más descriptivas, facilita el análisis y la interpretación de los datos, especialmente si se planea realizar cálculos, gráficos u otras operaciones basadas en estas categorías. Además, estas transformaciones podrían ser útiles para preparar los datos antes de aplicar algoritmos de aprendizaje automático, ya que algunos modelos pueden requerir que los datos estén en un formato específico para funcionar de manera efectiva.

In [None]:
df['sex'] = df['sex'].apply(lambda x: 'female' if x == 1 else 'male')
df['additional_work'] = df['additional_work'].apply(lambda x: 0 if x==2 else 1)
df['activity'] = df['activity'].apply(lambda x: 0 if x==2 else 1)
df['partner'] = df['partner'].apply(lambda x: 0 if x==2 else 1)
df['attendance_seminars_dep'] = df['attendance_seminars_dep'].apply(lambda x: 0 if x==2 else 1)
df['graduated_h_school_type'] = df['graduated_h_school_type'].apply(lambda x: 'private_hs' if x==1 else 'state_hs' if x==2 else 'other_hs')
df['transport'] = df['transport'].apply(lambda x: 'bus' if x==1 else 'private_car_taxi' if x==2 else 'bicycle' if x==3 else 'other')
df['accomodation'] = df['accomodation'].apply(lambda x: 'acc_rental' if x==1 else 'acc_dormitory' if x==2 else 'acc_with_family' if x==3 else 'acc_other')
df['parental_status'] = df['parental_status'].apply(lambda x: 'parent_married' if x==1 else 'parent_divorced' if x==2 else 'parent_died' )
df['mother_occup'] = df['mother_occup'].apply(lambda x: 'mom_retired' if x==1 else 'mom_housewife' if x==2 else 'mom_governmentofficer' if x==3 else 'mom_private_sector_employee' if x== 4 else 'mom_self_employment' if x==5 else 'mom_occup_other')
df['father_occup'] = df['father_occup'].apply(lambda x: 'dad_retired' if x==1 else  'dad_governmentofficer' if x==2 else 'dad_private_sector_employee' if x== 3 else 'dad_self_employment' if x==4 else 'dad_occup_other')
df['reading_non_scientific'] = df['reading_non_scientific'].apply(lambda x: 'non_r_nsci' if x==1 else 'sometime_r_nsci' if x==2 else 'often_r_nsci')
df['reading_scientific'] = df['reading_scientific'].apply(lambda x: 'non_r_sci' if x==1 else 'sometime_r_sci' if x==2 else 'often_r_sci')
df['impact_of_projects'] = df['impact_of_projects'].apply(lambda x: 'impact_proj_positive' if x==1 else 'impact_proj_negative' if x==2 else 'impact_proj_neutral')
df['attendances_classes'] = df['attendances_classes'].apply(lambda x: 'attendance_classes_always' if x==1 else 'attendance_classes_sometimes' if x==2 else 'attendance_classes_never')
df['preparation_midterm_company'] = df['preparation_midterm_company'].apply(lambda x: 'prep_midterm_comp_alone' if x==1 else 'prep_midterm_comp_w_friends' if x==2 else 'prep_midterm_comp_not_app')
df['preparation_midterm_time'] = df['preparation_midterm_time'].apply(lambda x: 'prep_midterm_time_closest' if x==1 else 'prep_midterm_time_reg' if x==2 else 'prep_midterm_time_never')
df['discussion_improves_interest'] = df['discussion_improves_interest'].apply(lambda x: 'disc_imp_int_never' if x==1 else 'disc_imp_int_sometimes' if x==2 else 'disc_imp_int_always')
df['flip_classrom'] = df['flip_classrom'].apply(lambda x: 'flip_classrom_not_useful' if x==1 else 'flip_classrom_useful' if x==2 else 'flip_classrom_not_app')

In [None]:
df['sex'] = pd.get_dummies(df['sex'],drop_first=True)
df_ghs = pd.get_dummies(df['graduated_h_school_type'])
df_transport = pd.get_dummies(df['transport'])
df_accomodation = pd.get_dummies(df['accomodation'])
df_parental_status = pd.get_dummies(df['parental_status'])
df_mother_occup = pd.get_dummies(df['mother_occup'])
df_father_occup = pd.get_dummies(df['father_occup'])
df_reading_non_sci = pd.get_dummies(df['reading_non_scientific'])
df_reading_sci = pd.get_dummies(df['reading_scientific'])
df_impact_projects = pd.get_dummies(df['impact_of_projects'])
df_attendances_classes = pd.get_dummies(df['attendances_classes'])
df_preparation_midterm_company = pd.get_dummies(df['preparation_midterm_company'])
df_prep_midterm_time = pd.get_dummies(df['preparation_midterm_time'])
df_disc_imp_int = pd.get_dummies(df['discussion_improves_interest'])
df_flip_classrom = pd.get_dummies(df['flip_classrom'])

In [None]:
df = pd.concat([df, df_ghs], axis=1)
df = pd.concat([df, df_transport], axis=1)
df = pd.concat([df,df_accomodation], axis=1)
df = pd.concat([df,df_parental_status], axis=1)
df = pd.concat([df,df_mother_occup], axis=1)
df = pd.concat([df,df_father_occup],axis=1)
df = pd.concat([df,df_reading_non_sci],axis=1)
df = pd.concat([df,df_reading_sci], axis=1)
df = pd.concat([df,df_impact_projects], axis=1)
df = pd.concat([df,df_attendances_classes], axis=1)
df = pd.concat([df,df_preparation_midterm_company], axis=1)
df = pd.concat([df,df_prep_midterm_time],axis=1)
df = pd.concat([df,df_disc_imp_int],axis=1)
df = pd.concat([df,df_flip_classrom], axis=1)

In [None]:
#Eliminamos las columnas innecarias y que ya no se utilizarán
df.drop(columns='private_hs', inplace=True)
df.drop(columns='graduated_h_school_type', inplace=True)
df.drop(columns='student_id', inplace=True)
df.drop(columns=['transport','bicycle'], inplace=True)
df.drop(columns=['acc_other','accomodation'], inplace=True)
df.drop(columns=['parental_status','parent_died'], inplace=True)
df.drop(columns=['dad_occup_other','mom_self_employment', 'mother_occup','father_occup'],inplace=True)
df.drop(columns=['non_r_sci','often_r_nsci','reading_scientific', 'reading_non_scientific'], inplace=True)
df.drop(columns=['impact_proj_negative','impact_of_projects'],inplace=True)
df.drop(columns=['attendance_classes_sometimes', 'attendances_classes'], inplace=True)
df.drop(columns=['prep_midterm_comp_not_app','preparation_midterm_company'],inplace=True)
df.drop(columns=['prep_midterm_time_never','preparation_midterm_time'],inplace=True)
df.drop(columns=['disc_imp_int_never','discussion_improves_interest'],inplace=True)
df.drop(columns=['flip_classrom_not_app','flip_classrom'], inplace=True)

In [None]:
#Renombrar columnas binarias
df = df.rename(columns={'sex':'sex_male'})
df = df.rename(columns={'other': 'other_transport'})

In [None]:
df.head()

In [None]:
# Exportar archivo csv
df.to_csv('clean_data.csv', index=False)

In [None]:
X = ['age', 'sex_male', 'scholarship_type', 'additional_work', 'activity',
       'partner', 'total_salary', 'mother_ed', 'farther_ed', 'siblings',
       'weekly_study_hours', 'attendance_seminars_dep', 'taking_notes',
       'listenning', 'grade_previous', 'grade_expected', 'course_id',
       'other_hs', 'state_hs', 'bus', 'other_transport', 'private_car_taxi',
       'acc_dormitory', 'acc_rental', 'acc_with_family', 'parent_divorced',
       'parent_married', 'mom_governmentofficer', 'mom_housewife',
       'mom_private_sector_employee', 'mom_retired', 'dad_governmentofficer',
       'dad_private_sector_employee', 'dad_retired', 'dad_self_employment',
       'non_r_nsci', 'sometime_r_nsci', 'often_r_sci', 'sometime_r_sci',
       'impact_proj_neutral', 'impact_proj_positive',
       'attendance_classes_always', 'prep_midterm_comp_alone',
       'prep_midterm_comp_w_friends', 'prep_midterm_time_closest',
       'prep_midterm_time_reg', 'disc_imp_int_always',
       'disc_imp_int_sometimes', 'flip_classrom_not_useful',
       'flip_classrom_useful']

In [None]:
for columna in X:
    sns.barplot(x=df[columna], y=df['grade'])
    plt.xlabel(columna)
    plt.ylabel('grade')
    plt.title(f'grade vs {columna}')
    plt.show()

### Insights

- Con el aumento de la edad, se observa una tendencia a tener calificaciones promedio más bajas, pero al mismo tiempo, la variabilidad en las calificaciones también tiende a ser mayor.

- Los estudiantes que reciben una beca del 25% muestran un mejor rendimiento promedio en comparación con aquellos que reciben becas de mayor porcentaje. Sin embargo, la dispersión de las calificaciones es mayor en el grupo de estudiantes con becas del 25%.

- Contrario a lo esperado, se observa que a medida que aumenta el número de hermanos que tiene un estudiante, sus calificaciones tienden a ser más altas en promedio, y también se nota una mayor amplitud entre las calificaciones mínimas y máximas.

- La cantidad óptima de horas semanales de estudio parece estar en el rango de <5 horas, ya que los estudiantes que dedican este tiempo obtienen mejores resultados académicos en promedio.

- Los estudiantes que toman notas durante las clases tienden a tener calificaciones considerablemente más altas que aquellos que no lo hacen.

- La lectura de artículos, independientemente de si son científicos o no, parece tener un efecto positivo en el rendimiento académico de los estudiantes.

- El impacto de los proyectos parece ser un indicador relevante para predecir el rendimiento académico, ya que aquellos estudiantes que participan en proyectos tienden a obtener mejores calificaciones en general.

# 1. Aprendizaje de máquina Supervisado

In [None]:
df_encoded = pd.read_csv('clean_data.csv') 

In [None]:
# Dividir el set de entrenamiento en Trainingg set y Test set
from sklearn.model_selection import train_test_split

In [None]:
#y = df['grade'].astype('category')
X = df_encoded.drop([ "grade"], axis=1)  # características
y = df_encoded["grade"]  # variable objetivo

In [None]:
X

In [None]:
y

In [None]:
from tensorflow.keras.utils import to_categorical

In [None]:
y_dum=to_categorical(y)

In [None]:
y_dum.shape

### Escalado de Datos

In [None]:
# Escalar los datos
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

### Balance de Datos

In [None]:
from imblearn.over_sampling import SMOTE

In [None]:
oversample=SMOTE()
X_resampled,y_resampled=oversample.fit_resample(X_scaled,y)

### Validación Cruzada

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.25, random_state=0)

## Regresión Logistica

In [None]:
from sklearn.linear_model import LogisticRegression

In [None]:
classifier = LogisticRegression(random_state=0,max_iter=1000)

In [None]:
classifier.fit(X_train, y_train)

In [None]:
y_pred = classifier.predict(X_test)

In [None]:
y_pred

In [None]:
print(y_test)

In [None]:
type(y_test)

In [None]:
from sklearn.metrics import confusion_matrix, accuracy_score, classification_report

In [None]:
print( confusion_matrix(y_test, y_pred) )

In [None]:
print(accuracy_score(y_test, y_pred))

In [None]:
print(classification_report(y_test, y_pred))

## Random Forest

In [None]:
from sklearn.ensemble import RandomForestClassifier

In [None]:
rfc=RandomForestClassifier(n_estimators=100, random_state=0)
rfc.fit(X_train,y_train)

### Evaluación del Modelo RF

In [None]:
y_pred = rfc.predict(X_test)

In [None]:
accuracy_score(y_test,y_pred)

In [None]:
rfc.score(X_test,y_test)

In [None]:
confusion_matrix(y_test,y_pred)

In [None]:
print(classification_report(y_test,y_pred))

Aplicando el Algoritmo Random Forest nuestro accuracy es mayor al aplicado con Regresión Logistica 

## Modelo Decision Tree


In [None]:
from sklearn.tree import DecisionTreeClassifier

In [None]:
clf = DecisionTreeClassifier(max_depth=2,random_state=0)

In [None]:
clf.fit(X_train, y_train)

In [None]:
from sklearn.tree import plot_tree

In [None]:
plt.figure(figsize=(12,6))
plot_tree(clf,feature_names=X.columns,filled=True)
plt.show

In [None]:
y_pred = clf.predict(X_test)

In [None]:
accuracy_score(y_test,y_pred)

In [None]:
clf.score(X_test,y_test)

In [None]:
confusion_matrix(y_test,y_pred)

In [None]:
print(classification_report(y_test,y_pred))

## Modelo KNN

In [None]:
from sklearn.neighbors import KNeighborsClassifier

In [None]:
knn=KNeighborsClassifier()
knn.fit(X_train,y_train)

In [None]:
y_pred=knn.predict(X_test)

In [None]:
from sklearn.metrics import confusion_matrix,accuracy_score

In [None]:
accuracy_score(y_test,y_pred)

In [None]:
print(confusion_matrix(y_test,y_pred))

## Modelo SVM Lineal

In [None]:
from sklearn.svm import SVC

In [None]:
classifier=SVC(kernel='linear',random_state=0)
classifier.fit(X_train,y_train)

#### Métricas de Evaluación

In [None]:
from sklearn.metrics import confusion_matrix, accuracy_score

In [None]:
y_pred=classifier.predict(X_test)

In [None]:
accuracy_score(y_test,y_pred)

In [None]:
confusion_matrix(y_test,y_pred)

## Modelo SVM Kernel RGF

In [None]:
classifier=SVC(kernel='rbf',random_state=0)
classifier.fit(X_train,y_train)

In [None]:
y_pred=classifier.predict(X_test)

In [None]:
accuracy_score(y_test,y_pred)

In [None]:
confusion_matrix(y_test,y_pred)

## Modelo ADABOOST


In [None]:
from sklearn.ensemble import AdaBoostClassifier

In [None]:
clf = AdaBoostClassifier(random_state=0)

In [None]:
clf.fit(X_train,y_train)

In [None]:
clf.score(X_train,y_train)

In [None]:
clf.score(X_test,y_test)

In [None]:
y_pred=clf.predict(X_test)

In [None]:
accuracy_score(y_test,y_pred)

### Hiperparametros


In [None]:
from sklearn.ensemble import RandomForestClassifier

In [None]:
clf = AdaBoostClassifier(random_state = 0,
                         base_estimator=RandomForestClassifier(),
                         n_estimators=100,
                         learning_rate=0.01)

In [None]:
clf.fit(X_train,y_train)

In [None]:
# score en set de test
clf.score(X_test,y_test)

In [None]:
y_pred=clf.predict(X_test)

In [None]:
accuracy_score(y_test,y_pred)

## Modelo Bayesian


In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.20, random_state=0)

In [None]:
from sklearn.naive_bayes import GaussianNB

In [None]:
clf = GaussianNB()

In [None]:
clf.fit(X_train, y_train)

In [None]:
from sklearn.metrics import confusion_matrix, accuracy_score,classification_report

In [None]:
y_pred = clf.predict(X_test)

In [None]:
accuracy_score(y_test,y_pred)

In [None]:
print(classification_report(y_test,y_pred))

## Modelo Gradient Boosting


In [None]:
from sklearn.ensemble import GradientBoostingClassifier

In [None]:
clf = GradientBoostingClassifier(random_state=0)

In [None]:
clf.fit(X_train,y_train)

In [None]:
# score en set de entrenamiento
clf.score(X_train,y_train)

In [None]:
# score en set de test
clf.score(X_test,y_test)

In [None]:
clf = GradientBoostingClassifier(
                random_state = 0,
                n_estimators=150,
                learning_rate=0.01,
                max_depth=8,
                subsample=0.75)

In [None]:
clf.fit(X_train,y_train)

In [None]:
# score en set de entrenamiento
clf.score(X_train,y_train)

In [None]:
# score en set de test
clf.score(X_test,y_test)

In [None]:
y_pred = clf.predict(X_test)

In [None]:
accuracy_score(y_test,y_pred)

## Modelo XGBOOST


In [None]:
from xgboost import XGBClassifier

In [None]:
clf = XGBClassifier()

In [None]:
clf.fit(X_train,y_train)

In [None]:
# score en set de entrenamiento
clf.score(X_train,y_train)

In [None]:
# score en set de test
clf.score(X_test,y_test)

In [None]:
# Hiperparametros
xgb = XGBClassifier(n_estimators=4, 
                    max_depth=10, 
                    learning_rate=0.01, 
                    colsample_bytree=0.8)

In [None]:
clf.fit(X_train,y_train)

In [None]:
# score en set de entrenamiento
clf.score(X_train,y_train)

In [None]:
# score en set de test
clf.score(X_test,y_test)

In [None]:
y_pred = clf.predict(X_test)

In [None]:
accuracy_score(y_test,y_pred)

## Conclusiones Modelos Supervisados

Dentro del Entrenamiento Supervisado para la variable grade,junto a sus features correspondientes, el modelo Decision Tree y Gradient Boosting, resultan ser los modelos con mejor accuracy_score de 0.3513 y 0.379 correspondientemente. Esto indica que los modelos tienen un rendimiento relativamente mejor en términos de predicción precisa en comparación con los otros modelos evaluados. El enfoque basado en el árbol de decision y el gradiente puede estar capturando mejor las relaciones entre los datos y logrando una mayor precisión en las predicciones.

## Optimización del Modelo

# 2. Aprendizaje de maquina No Supervisado  

A continuación, se describe el set de datos:
1. student_id

12. mother_ed - Mother's education: (1: primary school, 2: secondary school, 3: high school, 
4: university, 5: MSc., 6: Ph.D.)
13. farther_ed - Father's education: (1: primary school, 2: secondary school, 3: high school, 4: 
university, 5: MSc., 6: Ph.D.)
14. siblings - Number of sisters/brothers (if available): (1: 1, 2:, 2, 3: 3, 4: 4, 5: 5 or above)
15. parental_status - Parental status: (1: married, 2: divorced, 3: died - one of them or both)
16. mother_occup - Mother's occupation: (1: retired, 2: housewife, 3: government officer, 4: 
private sector employee, 5: self-employment, 6: other)
17. father_occup - Father's occupation: (1: retired, 2: government officer, 3: private sector 
employee, 4: self-employment, 5: other)

Su obje?vo en este proyecto es distinguir grupos o categorías de estudiantes que 
presentan similaridad a nivel de caracterís?cas de familia. Por lo tanto, lo que se espera en 
su análisis es poder contestar al menos las siguientes preguntas:  

- ¿Cuántos grupos con caracterís?cas homogéneas se aprecian en el set de datos?
- De acuerdo a las características de cada grupo identificado, ¿qué nombre le pondría a cada uno de ellos a modo de categorización?
- Dado los grupos que encontré utilice la variable grade, y determine si existe alguna relación entre el rendimiento de los estudiantes y su similaridad en caracterís?cas de familia

In [None]:
X = df_encoded[['mother_ed','farther_ed','siblings','parent_married','parent_divorced','mom_retired','mom_housewife','mom_governmentofficer','mom_private_sector_employee','dad_retired','dad_governmentofficer','dad_private_sector_employee','dad_self_employment']]

#'student_id'

### Escalamiento

In [None]:
# Escalar los datos
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

In [None]:
plt.figure(figsize=(10, 8))
plt.scatter(X_scaled[:,0], X_scaled[:,1], c='b')
plt.title('Datos de Ejemplo')

## Clusterización Jerarquica

In [None]:
from scipy.cluster.hierarchy import dendrogram,linkage

In [None]:
Z=linkage(X_scaled,method='ward')

In [None]:
from scipy.cluster.hierarchy import cophenet
from scipy.spatial.distance import pdist
c,coph_dists=cophenet(Z,pdist(X))

In [None]:
Z[0]

In [None]:
Z[1]

In [None]:
Z[:20]

In [None]:
# Graficando los resultados
plt.figure(figsize=(10,8))
plt.scatter(X_scaled[:,0],X_scaled[:,1]) #GRAFICA TODOS LOS puntos
plt.scatter(X_scaled[[111,138],0],X_scaled[[111,138],1],c='r')
plt.scatter(X_scaled[21,0],X_scaled[21,1],c='y')
plt.show

In [None]:
# Gráfica de Dendograma
plt.figure(figsize=(25,10))
plt.title('Dendograma de Clustering Jerarquico')
plt.xlabel('Indice de la muestra')
plt.ylabel('Distancia')
dendrogram(
    Z,
    leaf_rotation=90,
    leaf_font_size=8.,
)
plt.show()

In [None]:
plt.figure(figsize=(25,10))
plt.title('Dendograma de Clustering Jerarquico')
plt.xlabel('Indice de la muestra')
plt.ylabel('Distancia')
dendrogram(
    Z,
    truncate_mode='lastp',
    p=10,
    show_leaf_counts=False,
    show_contracted=True
)
plt.show()

#### Seleccionar cantidad de clusters

In [None]:
max_d=12
plt.figure(figsize=(25,10))
plt.title('Dendograma de Clustering Jerarquico')
plt.xlabel('Indice de la muestra')
plt.ylabel('Distancia')
dendrogram(
    Z,
    truncate_mode='lastp',
    p=10,
    show_leaf_counts=True
)
plt.axhline(y=max_d,c='k')
plt.show()

In [None]:
from scipy.cluster.hierarchy import fcluster

In [None]:
clusters=fcluster(Z,max_d,criterion='distance')
clusters

In [None]:
clusters=fcluster(Z,3,criterion='maxclust')
clusters

In [None]:
plt.figure(figsize=(10,8))
plt.scatter(X_scaled[:,0],X_scaled[:,1],c=clusters,cmap='coolwarm')

## K-means

### Metodo del Codo

In [None]:
wcss=[]
for i in range(1,11):
    kmeans=KMeans(n_clusters=i,init='k-means++',random_state=42)
    kmeans.fit(X_scaled)
    wcss.append(kmeans.inertia_)
plt.plot(range(1,11),wcss)
plt.title('The Elbow Method')
plt.xlabel('Number of Clusters')
plt.ylabel('Inercia')
plt.show()

### Determinando los clusters por metodo de la Silueta

In [None]:
savg=[]
for i in range(2,11):
    kmeans=KMeans(n_clusters=i,init='k-means++',random_state=42)
    kmeans.fit(X_scaled)
    silhouette_avg=silhouette_score(X_scaled,kmeans.labels_)
    savg.append(silhouette_avg)

plt.plot(range(2,11),savg)
plt.title('The Silhouette Coefficients')
plt.xlabel('Number of Clusters')
plt.ylabel('Inercia')
plt.show()

In [None]:
# Aplicar el algoritmo K-Means con el número óptimo de clusters
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(X_scaled)

In [None]:
kmeans.cluster_centers_

In [None]:
kmeans.labels_

In [None]:
kmeans.inertia_

### Análisis de Dimensionalidad

In [None]:
from sklearn.decomposition import PCA

In [None]:
pca = PCA().fit(X_scaled)


In [None]:
pca.explained_variance_ratio_

In [None]:
np.cumsum(pca.explained_variance_ratio_)

In [None]:
plt.plot(range(1,len(pca.explained_variance_ratio_)+1), np.cumsum(pca.explained_variance_ratio_))
plt.xlabel('Numero de componentes')
plt.ylabel('Varianza Explicada Acumulada')
plt.title('Varianza Explicada por Componentes Principales')
plt.show()

In [None]:
pca = PCA(n_components=2)
pca.fit(X_scaled)
x_pca = pca.transform(X_scaled)

In [None]:
import pandas as pd
from sklearn.decomposition import PCA

# Realiza el PCA con el número deseado de componentes (en este caso, 2)
num_componentes = 2
pca = PCA(n_components=num_componentes)
componentes_principales = pca.fit_transform(df_encoded.drop(["grade"], axis=1))

# Crea un DataFrame con los componentes principales y establece nombres de columna
column_names = [f"Componente {i+1}" for i in range(num_componentes)]
componentes = pd.DataFrame(data=componentes_principales, columns=column_names)

# Ahora componentes es un DataFrame con 2 columnas: "Componente 1" y "Componente 2"
print(componentes)


In [None]:
# Antes de aplicar la reducción de dimensionalidad
X_scaled.shape

In [None]:
# Después de aplicar la reducción de dimensionalidad
x_pca.shape

In [None]:
pd.DataFrame(x_pca,columns=['PC1','PC2'])

In [None]:
# Visualización de los datos con 2 Componentes
plt.scatter(x_pca[:,0],x_pca[:,1])
plt.xlabel('PC1')
plt.ylabel('PC2')
plt.title('Visualización de Datos con 2 Componenter Principales')
plt.show()

In [None]:
from sklearn.cluster import KMeans

In [None]:
# Método del Codo
wcss = []
for i in range(1, 11):
    kmeans = KMeans(n_clusters = i, init = 'k-means++', random_state = 42)
    kmeans.fit(x_pca)
    wcss.append(kmeans.inertia_)
plt.plot(range(1, 11), wcss)
plt.title('Método del Codo')
plt.xlabel('Número de clusters')
plt.ylabel('Inercia')
plt.show()

In [None]:
kmeans = KMeans(n_clusters=3)
kmeans.fit(x_pca)

In [None]:
kmeans.cluster_centers_

In [None]:
kmeans.labels_

In [None]:
clases = y
clases

In [None]:
plt.figure(figsize=(12,5))
plt.subplot(1,2,1)
plt.title('Clusterización K-Means K=3')
plt.xlabel('PC1')
plt.ylabel('PC2')
plt.scatter(x_pca[:,0],x_pca[:,1], c=kmeans.labels_)
plt.scatter(kmeans.cluster_centers_[:,0],kmeans.cluster_centers_[:,1], c='g', marker='*', lw=3)


### Clusterización con Gaussian Mixture

In [None]:
from sklearn.mixture import GaussianMixture

In [None]:
# now let's try GMM clustering, which tries to fit normally-distributed clusters, 
# and might be the case when measuring things like petal and sepal sizes...
gmm = GaussianMixture(n_components=3)
gmm.fit(x_pca)

In [None]:
# predict the cluster for each data point
y_cluster_gmm = gmm.predict(x_pca)
y_cluster_gmm

In [None]:
plt.figure(figsize=(12,5))
plt.subplot(1,2,1)
plt.title('Clusterización K-Means K=3')
plt.xlabel('PC1')
plt.ylabel('PC2')
plt.scatter(x_pca[:,0],x_pca[:,1], c=y_cluster_gmm)

## Conclusiones
Respondiendo las preguntas: 

- ¿Cuántos grupos con caracterís?cas homogéneas se aprecian en el set de datos?

Se puede apreciar según el metodo del codo y el metodo de la silueta, la cantidad de clusters óptima son 3. Lo que indica que existen 3 grupos con caracteristicas homogoneas dentro de los datos. 

- De acuerdo a las características de cada grupo identificado, ¿qué nombre le pondría a cada uno de ellos a modo de categorización?

Tras realizar la reducción de dimensionalidad, y solo dejar el modelo con 2 componentes, se aprecia en el gráfico que los 3 grupos pueden corresponder a datos positivos, negativos y ambos.  Los grupos serian los siguientes:

`Grupo 1: "Educación Universitaria, Padres Casados, Ocupación del Sector Privado"`

Este grupo podría caracterizarse por tener estudiantes cuyas madres y padres tienen una educación universitaria (valor 4) o superior (MSc. o Ph.D.), están casados y trabajan en el sector privado (private sector employee). Podría representar un grupo de estudiantes con una fuerte influencia académica y una estabilidad familiar.

`Grupo 2: "Educación Secundaria, Padres Divorciados o Fallecidos, Ocupaciones Variadas"`

En este grupo, podríamos encontrar estudiantes cuyos padres tienen una educación secundaria (valor 2) y su estado marital es divorciado o uno de ellos falleció. Las ocupaciones de los padres pueden ser diversas, ya que no se especifica una categoría dominante. Este grupo puede representar una variedad de situaciones familiares y ocupacionales.

`Grupo 3: "Educación Primaria o sin Escolaridad, Ocupaciones Diversas"`

El tercer grupo podría estar compuesto por estudiantes cuyos padres tienen una educación primaria (valor 1) o no tienen escolaridad registrada. Las ocupaciones de los padres también pueden ser diversas, ya que se mencionan diferentes opciones. Este grupo puede reflejar una menor influencia académica en el hogar y una variedad de ocupaciones laborales.  




# 3. Redes Neuronales 

### Diseño 1

Diseño arquitectura ANN
---
Input vector (79 nodos) activacion 'linear'  
Hidden Layer 1 (20 nodos) activacion 'linear'  
Hidden Layer 2 (10 nodos) activacion 'linear'  
Hidden Layer 3 (8 nodos) activacion 'softmax'  
Optimizador sgd 


In [None]:
# Modelo 
X = df_encoded.drop(["grade"], axis=1)  # características
y = df_encoded["grade"]  # variable objetivo

In [None]:
from tensorflow.keras.utils import to_categorical

In [None]:
y_dum=to_categorical(y)

In [None]:
y_dum.shape

In [None]:
# Escalar los datos
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

In [None]:
from imblearn.over_sampling import SMOTE

In [None]:
oversample=SMOTE()
X_resampled,y_resampled=oversample.fit_resample(X_scaled,y_dum)

In [None]:
X_resampled.shape

In [None]:
y_resampled.shape

In [None]:
from sklearn.model_selection import train_test_split

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X_resampled, y_resampled, test_size=0.33, random_state=42)

In [None]:
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense, Input, Dropout, Flatten
from tensorflow.keras.optimizers import SGD, Adam
from tensorflow.keras.utils import plot_model


In [None]:
model = Sequential()
model.add(Input(shape=(50,)))  
model.add(Dense(20, activation='linear'))
model.add(Dense(10, activation='linear'))
model.add(Dense(8, activation='softmax'))
model.compile(loss='categorical_crossentropy',
              optimizer='sgd',
              metrics=['accuracy'])
model.summary()

In [None]:
history=model.fit(X_train,y_train,batch_size=128,epochs=60,validation_data=(X_test,y_test))

## Evaluación

In [None]:
from sklearn.metrics import accuracy_score

In [None]:
y_pred=model.predict(X_test)

In [None]:
y_pred[:5]

In [None]:
y_pred_clase=np.argmax(y_pred,axis=1)
y_test_clase=np.argmax(y_test,axis=1)

In [None]:
y_pred_clase

In [None]:
y_test_clase

In [None]:
accuracy_score(y_test_clase,y_pred_clase)

In [None]:
#Evolucion del entrenamiento 
#history.history

In [None]:
plt.subplot(2,1,1)
plt.title('Train Set - Loss')
plt.plot(history.history['loss'])

plt.subplot(2,1,2)
plt.title('Train Set - Accuracy')
plt.plot(history.history['accuracy'])
plt.tight_layout()

In [None]:
plt.subplot(2,1,1)
plt.title('Validation Set - Loss')
plt.plot(history.history['val_loss'])

plt.subplot(2,1,2)
plt.title('Validation Set - Accuracy')
plt.plot(history.history['val_accuracy'])
plt.tight_layout()

## Diseño 2

#### Preprocesamiento de los datos

In [None]:
from sklearn.preprocessing import LabelEncoder

In [None]:
encoder = LabelEncoder()
y_enc = encoder.fit_transform(y)
y_dum = pd.get_dummies(y_enc).values

In [None]:
from sklearn.preprocessing import StandardScaler

In [None]:
scaler = StandardScaler()
X_enc = scaler.fit_transform(X)

In [None]:
from sklearn.model_selection import train_test_split

In [None]:
# Modelo a entrenar ( X_enc, y_dum)
X_train, X_test, y_train, y_test = train_test_split(X_resampled,y_resampled, test_size=0.2, random_state=101)

In [None]:
X.shape

In [None]:
y.shape

Diseño arquitectura ANN
---
Input vector (4 nodos) activacion 'tanh'  
Hidden Layer 1 (10 nodos) activacion 'tanh'  
Hidden Layer 2 (8 nodos) activacion 'tanh'  
Hidden Layer 3 (6 nodos) activacion 'softmax'  
Optimizador Adam con learning rate de 0.02  

In [None]:
model=Sequential()
model.add(Input(shape=(50,)))
model.add(Dense(10,activation='tanh'))
model.add(Dense(8,activation='tanh'))
model.add(Dense(6,activation='tanh'))
model.add(Dense(8,activation='softmax'))


In [None]:
# Compilación del modelo
optimizer = Adam(learning_rate=0.02)
model.compile(optimizer=optimizer, loss='categorical_crossentropy', metrics=['accuracy'])

# Resumen del modelo
model.summary()

In [None]:
history=model.fit(X_train,y_train,batch_size=128,epochs=60,validation_data=(X_test,y_test))

## Evaluación

In [None]:
from sklearn.metrics import accuracy_score

In [None]:
y_pred=model.predict(X_test)

In [None]:
y_pred[:5]

In [None]:
y_pred_clase=np.argmax(y_pred,axis=1)
y_test_clase=np.argmax(y_test,axis=1)

In [None]:
y_pred_clase

In [None]:
y_test_clase

In [None]:
accuracy_score(y_test_clase,y_pred_clase)

In [None]:
#Evolucion del entrenamiento 
#history.history

In [None]:
plt.subplot(2,1,1)
plt.title('Train Set - Loss')
plt.plot(history.history['loss'])

plt.subplot(2,1,2)
plt.title('Train Set - Accuracy')
plt.plot(history.history['accuracy'])
plt.tight_layout()

In [None]:
plt.subplot(2,1,1)
plt.title('Validation Set - Loss')
plt.plot(history.history['val_loss'])

plt.subplot(2,1,2)
plt.title('Validation Set - Accuracy')
plt.plot(history.history['val_accuracy'])
plt.tight_layout()

## Diseño 3 - Fully connected



1.   Input vector con 50 nodos.
2.   Hidden layer 1, 512 nodos, función de activación **ReLu**.
3.   Capa de regularización, **dropout 0.2**.
4.   Hidden layer 2, 512 nodos, función de activación **ReLu**.
5.   Hidden layer 3, 8 nodos, función de activación **softmax**.

con un optimizador **adam** y learning rate de 0.001.


In [None]:
model = Sequential()
model.add(Input(shape=(50,)))
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(512, activation='relu'))
model.add(Dense(8, activation='softmax'))

In [None]:
model.compile(optimizer=Adam(learning_rate=0.001), loss='categorical_crossentropy', metrics=['accuracy'] )
model.summary()

In [None]:
history = model.fit(X_train, y_train, epochs=50, batch_size=128, verbose=2, validation_data=(X_test, y_test))

## Evaluación

In [None]:
from sklearn.metrics import accuracy_score

In [None]:
y_pred=model.predict(X_test)

In [None]:
y_pred[:5]

In [None]:
y_pred_clase=np.argmax(y_pred,axis=1)
y_test_clase=np.argmax(y_test,axis=1)

In [None]:
y_pred_clase

In [None]:
y_test_clase

In [None]:
accuracy_score(y_test_clase,y_pred_clase)

In [None]:
#Evolucion del entrenamiento 
#history.history

In [None]:
plt.subplot(2,1,1)
plt.title('Train Set - Loss')
plt.plot(history.history['loss'])

plt.subplot(2,1,2)
plt.title('Train Set - Accuracy')
plt.plot(history.history['accuracy'])
plt.tight_layout()

In [None]:
plt.subplot(2,1,1)
plt.title('Validation Set - Loss')
plt.plot(history.history['val_loss'])

plt.subplot(2,1,2)
plt.title('Validation Set - Accuracy')
plt.plot(history.history['val_accuracy'])
plt.tight_layout()

En el grafico de Validación del Set indica que para evitar un sobreajuste la cantidad de epoch deberia ser menor

## Diseño Arquitectura 4 Fully Connected Optimizador RMSPROP

1.   Input vector con 50 nodos.
2.   Hidden layer 1, 512 nodos, función de activación **ReLu**.
3.   Capa de regularización, **dropout 0.3**.
4.   Hidden layer 2, 512 nodos, función de activación **ReLu**.
5.   Capa de regularización, **dropout 0.2**
6.   Hidden layer 3, 512 nodos, función de activación **ReLu**.
7.   Hidden layer 4, 8 nodos, función de activación **softmax**.

con un optimizador **RMSprop**.

In [None]:
from tensorflow.keras.optimizers import RMSprop

In [None]:
model = Sequential()
model.add(Input(shape=(50,)))
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.3))
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(512, activation='relu'))
model.add(Dense(8, activation='softmax'))

In [None]:
model.compile(optimizer=RMSprop(), loss='categorical_crossentropy', metrics=['accuracy'] )
model.summary()

In [None]:
history = model.fit(X_train, y_train, epochs=40, batch_size=128, verbose=2, validation_data=(X_test, y_test))

## Evaluación

In [None]:
from sklearn.metrics import accuracy_score

In [None]:
y_pred=model.predict(X_test)

In [None]:
y_pred[:5]

In [None]:
y_pred_clase=np.argmax(y_pred,axis=1)
y_test_clase=np.argmax(y_test,axis=1)

In [None]:
y_pred_clase

In [None]:
y_test_clase

In [None]:
accuracy_score(y_test_clase,y_pred_clase)

In [None]:
#Evolucion del entrenamiento 
#history.history

In [None]:
plt.subplot(2,1,1)
plt.title('Train Set - Loss')
plt.plot(history.history['loss'])

plt.subplot(2,1,2)
plt.title('Train Set - Accuracy')
plt.plot(history.history['accuracy'])
plt.tight_layout()

In [None]:
plt.subplot(2,1,1)
plt.title('Validation Set - Loss')
plt.plot(history.history['val_loss'])

plt.subplot(2,1,2)
plt.title('Validation Set - Accuracy')
plt.plot(history.history['val_accuracy'])
plt.tight_layout()

#### Diseño Arquitectura 5: CNN

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv1D, MaxPooling1D, Flatten, Dense

In [None]:
model = Sequential()
model.add(Conv1D(32, 3, activation='relu', input_shape=(50,1))) #1
model.add(MaxPooling1D(2))#2
model.add(Conv1D(64, 3, activation='relu'))#3
model.add(MaxPooling1D(2))#4
model.add(Flatten())#5
model.add(Dense(64, activation='relu'))#6
model.add(Dense(8, activation='softmax'))#7

In [None]:
model.compile(optimizer=Adam(learning_rate=0.001), loss='categorical_crossentropy', metrics=['accuracy'] )
model.summary()

In [None]:
history = model.fit(X_train, y_train, epochs=60, batch_size=128, verbose=2, validation_data=(X_test, y_test))

## Evaluación

In [None]:
from sklearn.metrics import accuracy_score

In [None]:
y_pred=model.predict(X_test)

In [None]:
y_pred[:5]

In [None]:
y_pred_clase=np.argmax(y_pred,axis=1)
y_test_clase=np.argmax(y_test,axis=1)

In [None]:
y_pred_clase

In [None]:
y_test_clase

In [None]:
accuracy_score(y_test_clase,y_pred_clase)

In [None]:
#Evolucion del entrenamiento 
#history.history

In [None]:
plt.subplot(2,1,1)
plt.title('Train Set - Loss')
plt.plot(history.history['loss'])

plt.subplot(2,1,2)
plt.title('Train Set - Accuracy')
plt.plot(history.history['accuracy'])
plt.tight_layout()

In [None]:
plt.subplot(2,1,1)
plt.title('Validation Set - Loss')
plt.plot(history.history['val_loss'])

plt.subplot(2,1,2)
plt.title('Validation Set - Accuracy')
plt.plot(history.history['val_accuracy'])
plt.tight_layout()

# Conclusiones

En este proyecto, se llevó a cabo el desarrollo de diversos modelos de aprendizaje automático (ML) utilizando redes neuronales recurrentes (RRNN) con el objetivo de predecir el rendimiento académico de los estudiantes. Se aplicaron técnicas de preprocesamiento y análisis exploratorio de datos, y se crearon seis modelos distintos con variaciones en sus parámetros. A continuación, se presentan los resultados obtenidos: 



Modelo 1:  

Parámetros: 1,318   
Exactitud (Accuracy): 0.3010752688172043    
Tipo: Red Neuronal Artificial (ANN)    

Modelo 2:  

Parámetros: 708   
Exactitud (Accuracy): 0.75   
Tipo: Red Neuronal Artificial (ANN)    

Modelo 3:  
  
Parámetros: 292,872    
Exactitud (Accuracy): 0.7321428571428571  
Tipo: Red Neuronal Artificial (ANN) - Fully Connected   

Modelo 4:  


Parámetros: 555.528    
Exactitud (Accuracy): 0.7321428571428571   
Tipo: Red Neuronal Artificial (ANN) - Fully Connected    

Modelo 5:    


Parámetros: 51.976    
Exactitud (Accuracy): 0.6607142857142857   
Tipo: Red Neuronal Convolucional (CNN)    


A partir de los resultados obtenidos, se puede concluir que los modelos completamente conectados (Fully Connected) son los más adecuados para abordar este problema junto al segundo modelo el cuál presenta la mayor precisión a traves de los modelos entrenados. Sin embargo, no es posible determinar con certeza cuál de los tres primeros modelos es el mejor en términos de exactitud. El primer modelo tiene una precisión menor que los demás, pero al igual que el segundo diseño cuenta con una cantidad considerablemente menor de parámetros que los modelo Fully Connected. En cuanto a los modelos tercero y cuarto, a pesar de algunas diferencias en sus configuraciones, presentan un rendimiento similar.
