# Modelo para diagnóstico de mujeres autistas

In [1]:
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import pandas as pd
import matplotlib.pyplot as plt

In [2]:
coef_dict = {}

In [3]:
# Cargar el conjunto de datos
df = pd.read_excel("respuestas_mapeadas.xlsx")

## Entrenamiento

Separamos datos de entrenamiento y testeo

In [4]:
X = df.drop("Diagnostico_autismo", axis=1)
y = df["Diagnostico_autismo"]

In [5]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, stratify=y)

In [6]:
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

## Regresion Logística

In [7]:
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, classification_report

Inicializar el modelo de Regresión Logística

In [8]:
logistic_model = LogisticRegression()

Entrenar el modelo

In [9]:
logistic_model.fit(X_train_scaled, y_train)

Realizar predicciones en el conjunto de prueba

In [10]:
y_pred_logistic = logistic_model.predict(X_test_scaled)

## Evaluación de desempeño del modelo

In [11]:
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report

In [12]:
accuracy_logistic = accuracy_score(y_test, y_pred_logistic)
print(f"Accuracy - Regresión Logística: {accuracy_logistic}")

Accuracy - Regresión Logística: 1.0


In [13]:
conf_matrix_logistic = confusion_matrix(y_test, y_pred_logistic)
print("Confusion Matrix:")
print(conf_matrix_logistic)

Confusion Matrix:
[[5 0]
 [0 9]]


In [14]:
print("Classification Report:")
print(classification_report(y_test, y_pred_logistic))

Classification Report:
              precision    recall  f1-score   support

           0       1.00      1.00      1.00         5
           1       1.00      1.00      1.00         9

    accuracy                           1.00        14
   macro avg       1.00      1.00      1.00        14
weighted avg       1.00      1.00      1.00        14



Obtener los coeficientes del modelo

In [15]:
logistic_coefs = logistic_model.coef_
logistic_intercept = logistic_model.intercept_

Agregar coeficientes al diccionario

In [16]:
for idx, col in enumerate(X.columns):
    coef_dict[col] = [round(logistic_coefs[0][idx],4)]

Ordenar y obtener los primeros y últimos 18

In [17]:
from itertools import islice
sorted_data = dict(sorted(coef_dict.items(), key=lambda x: x[1][0], reverse=True))

In [18]:
primeros_18 = dict(islice(sorted_data.items(), 18))
ultimos_18 = dict(islice(sorted_data.items(), len(sorted_data) - 18, None))
preguntas_encuesta_reducida = list(primeros_18.keys()) + list(ultimos_18.keys())

In [19]:
primeros_18

{'A veces me gustaría no ser autista.': [0.5865],
 'Imito los gestos y comportamientos de los demás para encajar.': [0.4854],
 'Me puedo interesar intensamente por temas puntuales y adquirir cierta expertiz desde lo teórico/práctico.': [0.4575],
 'Tengo movimientos o comportamientos repetitivos, como mover las manos o pies.': [0.3256],
 'Mi honestidad y autenticidad me permiten expresar mis pensamientos y emociones de manera directa y sincera.': [0.3167],
 'Me he relacionado de manera romántica.': [0.3076],
 'Suelo balancearme o mover las piernas.': [0.2996],
 'Evito actividades que me gustan para evitar ser juzgado/a.': [0.2844],
 'No entiendo las normas sociales en diferentes situaciones.': [0.2731],
 'Tengo dificultades para filtrar o ignorar los estímulos sensoriales.': [0.2583],
 'Los ruidos fuertes o inesperados me afectan más de lo que parecen afectar a los demás.': [0.2531],
 'Me siento abrumado/a cuando tengo muchas tareas pendientes.': [0.2327],
 'Me preocupa que los demás no

In [20]:
ultimos_18

{'Me resulta complicado mantener la concentración en una tarea por largos períodos de tiempo.': [-0.1031],
 'Siento que soy capaz de resolver problemas de la vida cotidiana de manera autónoma.': [-0.1049],
 'Aprendo constantemente sobre cómo mejorar mi capacidad para realizar actividades de forma independiente.': [-0.105],
 'Puedo lograr identificar en detalle ciertos sonidos.': [-0.1084],
 'Me siento tranquilo/a y relajado/a en la mayoría de los momentos del día.': [-0.1184],
 'Puedo lograr identificar en detalle ciertos olores.': [-0.1225],
 'Estoy satisfecho/a con la calidad de mi sueño y mi descanso.': [-0.123],
 'Siento variaciones en mi equilibrio durante mi período.': [-0.1301],
 'Me esfuerzo por hablar en un tono de voz "normal" o “adecuado” en situaciones sociales.': [-0.1419],
 'Me siento satisfecho/a con mis relaciones personales y sociales.': [-0.1423],
 'La manera en la que experimento el mundo me permite conectar de manera profunda con mis emociones.': [-0.144],
 'Algunos

## Encuesta reducida

In [21]:
preguntas_encuesta_reducida

['A veces me gustaría no ser autista.',
 'Imito los gestos y comportamientos de los demás para encajar.',
 'Me puedo interesar intensamente por temas puntuales y adquirir cierta expertiz desde lo teórico/práctico.',
 'Tengo movimientos o comportamientos repetitivos, como mover las manos o pies.',
 'Mi honestidad y autenticidad me permiten expresar mis pensamientos y emociones de manera directa y sincera.',
 'Me he relacionado de manera romántica.',
 'Suelo balancearme o mover las piernas.',
 'Evito actividades que me gustan para evitar ser juzgado/a.',
 'No entiendo las normas sociales en diferentes situaciones.',
 'Tengo dificultades para filtrar o ignorar los estímulos sensoriales.',
 'Los ruidos fuertes o inesperados me afectan más de lo que parecen afectar a los demás.',
 'Me siento abrumado/a cuando tengo muchas tareas pendientes.',
 'Me preocupa que los demás noten mis dificultades sociales o comportamientos inusuales.',
 'Siento que estoy progresando hacia mis metas y objetivos 

In [22]:
df_encuesta_reducida = df[['Diagnostico_autismo'] + preguntas_encuesta_reducida]

In [23]:
df_encuesta_reducida

Unnamed: 0,Diagnostico_autismo,A veces me gustaría no ser autista.,Imito los gestos y comportamientos de los demás para encajar.,Me puedo interesar intensamente por temas puntuales y adquirir cierta expertiz desde lo teórico/práctico.,"Tengo movimientos o comportamientos repetitivos, como mover las manos o pies.",Mi honestidad y autenticidad me permiten expresar mis pensamientos y emociones de manera directa y sincera.,Me he relacionado de manera romántica.,Suelo balancearme o mover las piernas.,Evito actividades que me gustan para evitar ser juzgado/a.,No entiendo las normas sociales en diferentes situaciones.,...,"Me esfuerzo por hablar en un tono de voz ""normal"" o “adecuado” en situaciones sociales.",Me siento satisfecho/a con mis relaciones personales y sociales.,La manera en la que experimento el mundo me permite conectar de manera profunda con mis emociones.,Algunos olores me resultan fascinantes o interesantes.,Creo que me ayudaría tener información sobre educación sexual integral.,Puedo lograr identificar en detalle ciertos sabores.,Tengo dificultades para controlar mis impulsos o frenar mis respuestas automáticas.,Estoy satisfecho/a con mi nivel actual de energía y vitalidad.,Percibo algunos cambios en la forma de percibir estímulos sensoriales vinculados a los sabores.,Soy capaz de planificar y preparar comidas por mí mismo/a.
0,1,1,2,5,5,4,4,1,4,4,...,1,2,5,5,1,5,1,4,1,4
1,1,4,5,5,5,5,5,5,2,5,...,5,4,5,5,4,4,4,2,3,5
2,1,3,5,5,5,5,5,5,5,4,...,2,4,5,5,5,4,5,2,5,3
3,1,5,4,4,4,4,4,4,4,4,...,4,2,3,3,1,3,5,2,2,5
4,1,5,4,4,2,4,4,4,2,2,...,2,2,2,2,4,2,1,2,2,4
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
61,1,4,4,5,5,3,4,4,4,4,...,5,2,4,4,3,4,4,2,3,4
62,1,1,4,5,5,5,5,5,5,5,...,5,5,5,5,3,5,5,5,2,5
63,0,3,2,5,4,2,4,4,1,2,...,4,2,4,5,4,2,4,5,1,5
64,0,1,2,4,4,4,2,4,2,2,...,4,2,3,4,4,4,4,3,4,4


## Nuevo modelo 

In [24]:
X_nuevo = df_encuesta_reducida.drop("Diagnostico_autismo", axis=1)
y_nuevo = df_encuesta_reducida["Diagnostico_autismo"]

In [25]:
X_train_n, X_test_n, y_train_n, y_test_n = train_test_split(X_nuevo, y_nuevo, test_size=0.2, stratify=y_nuevo)

In [26]:
scaler = StandardScaler()
X_train_scaled_n = scaler.fit_transform(X_train_n)
X_test_scaled_n = scaler.transform(X_test_n)

In [27]:
new_logistic_model = LogisticRegression()

In [28]:
new_logistic_model.fit(X_train_scaled_n, y_train_n)

In [29]:
y_pred_logistic_new = new_logistic_model.predict(X_test_scaled_n) 

## Evaluación nuevo modelo

In [30]:
new_accuracy_logistic = accuracy_score(y_test_n, y_pred_logistic_new)
print(f"Accuracy - Regresión Logística: {new_accuracy_logistic}")

Accuracy - Regresión Logística: 0.9285714285714286


In [31]:
new_conf_matrix_logistic = confusion_matrix(y_test_n, y_pred_logistic_new)
print("Confusion Matrix:")
print(new_conf_matrix_logistic)

Confusion Matrix:
[[4 1]
 [0 9]]


In [32]:
print("Classification Report:")
print(classification_report(y_test_n, y_pred_logistic_new))

Classification Report:
              precision    recall  f1-score   support

           0       1.00      0.80      0.89         5
           1       0.90      1.00      0.95         9

    accuracy                           0.93        14
   macro avg       0.95      0.90      0.92        14
weighted avg       0.94      0.93      0.93        14



## Probabilidad de pertenencia a clase

In [33]:
probabilidad_clase = new_logistic_model.predict_proba(X_test_scaled_n)

In [34]:
print("Probabilidades de pertenencia a cada clase para el conjunto de datos")
print(probabilidad_clase.round(2))

Probabilidades de pertenencia a cada clase para el conjunto de datos
[[0.91 0.09]
 [0.01 0.99]
 [0.02 0.98]
 [0.   1.  ]
 [0.01 0.99]
 [0.75 0.25]
 [0.97 0.03]
 [0.01 0.99]
 [0.18 0.82]
 [0.02 0.98]
 [0.41 0.59]
 [0.   1.  ]
 [0.81 0.19]
 [0.01 0.99]]


## Coeficientes

In [35]:
new_logistic_coefs = new_logistic_model.coef_
new_logistic_intercept = new_logistic_model.intercept_

In [36]:
new_logistic_coefs

array([[ 0.70483627,  0.50968943,  0.56621982,  0.19440074,  0.48082744,
        -0.02404202,  0.43022361,  0.2771966 ,  0.66652148,  0.38515222,
         0.32965379,  0.47159418,  0.36940407,  0.25586263,  0.26998875,
         0.2389779 ,  0.26843033,  0.26364305, -0.04331072, -0.22825222,
         0.01729386,  0.16522595, -0.27680774,  0.03608511,  0.27226074,
        -0.12156344, -0.07466233, -0.41668204, -0.25467244,  0.02579423,
        -0.15792114, -0.07515414,  0.16898241, -0.34327692, -0.17502601,
        -0.42169571]])

In [37]:
new_coef_dict = {}

In [38]:
for idx, col in enumerate(X_nuevo.columns):
    new_coef_dict[col] = [round(new_logistic_coefs[0][idx],4)]

In [39]:
new_coef_dict

{'A veces me gustaría no ser autista.': [0.7048],
 'Imito los gestos y comportamientos de los demás para encajar.': [0.5097],
 'Me puedo interesar intensamente por temas puntuales y adquirir cierta expertiz desde lo teórico/práctico.': [0.5662],
 'Tengo movimientos o comportamientos repetitivos, como mover las manos o pies.': [0.1944],
 'Mi honestidad y autenticidad me permiten expresar mis pensamientos y emociones de manera directa y sincera.': [0.4808],
 'Me he relacionado de manera romántica.': [-0.024],
 'Suelo balancearme o mover las piernas.': [0.4302],
 'Evito actividades que me gustan para evitar ser juzgado/a.': [0.2772],
 'No entiendo las normas sociales en diferentes situaciones.': [0.6665],
 'Tengo dificultades para filtrar o ignorar los estímulos sensoriales.': [0.3852],
 'Los ruidos fuertes o inesperados me afectan más de lo que parecen afectar a los demás.': [0.3297],
 'Me siento abrumado/a cuando tengo muchas tareas pendientes.': [0.4716],
 'Me preocupa que los demás no

In [40]:
new_sorted_data = dict(sorted(new_coef_dict.items(), key=lambda x: x[1][0], reverse=True))

In [41]:
new_sorted_data

{'A veces me gustaría no ser autista.': [0.7048],
 'No entiendo las normas sociales en diferentes situaciones.': [0.6665],
 'Me puedo interesar intensamente por temas puntuales y adquirir cierta expertiz desde lo teórico/práctico.': [0.5662],
 'Imito los gestos y comportamientos de los demás para encajar.': [0.5097],
 'Mi honestidad y autenticidad me permiten expresar mis pensamientos y emociones de manera directa y sincera.': [0.4808],
 'Me siento abrumado/a cuando tengo muchas tareas pendientes.': [0.4716],
 'Suelo balancearme o mover las piernas.': [0.4302],
 'Tengo dificultades para filtrar o ignorar los estímulos sensoriales.': [0.3852],
 'Me preocupa que los demás noten mis dificultades sociales o comportamientos inusuales.': [0.3694],
 'Los ruidos fuertes o inesperados me afectan más de lo que parecen afectar a los demás.': [0.3297],
 'Evito actividades que me gustan para evitar ser juzgado/a.': [0.2772],
 'Estoy satisfecho/a con la calidad de mi sueño y mi descanso.': [0.2723],

In [42]:
new_logistic_model.intercept_

array([1.05822702])

## Evaluación nuevo modelo en casos de sospecha de autismo

In [43]:
df_sos = pd.read_excel("respuestas_mapeadas_sos.xlsx")

In [44]:
df_sos.insert(0, 'Diagnostico_autismo', 1)

In [45]:
df_encuesta_reducida_sos = df_sos[['Diagnostico_autismo'] + preguntas_encuesta_reducida]

In [46]:
X_sos = df_encuesta_reducida_sos.drop("Diagnostico_autismo", axis=1)
scaler.fit(X_sos)
X_sos_scaled = scaler.transform(X_sos)
y_pred_sos = new_logistic_model.predict(X_sos_scaled)

In [47]:
accuracy_sos = accuracy_score(df_sos["Diagnostico_autismo"], y_pred_sos)
print(f"Accuracy en el conjunto de datos de sospecha de autismo: {accuracy_sos}")

Accuracy en el conjunto de datos de sospecha de autismo: 0.5555555555555556


In [48]:
conf_matrix_sos = confusion_matrix(df_sos["Diagnostico_autismo"], y_pred_sos)
print("Confusion Matrix en el conjunto de datos de sospecha de autismo:")
print(conf_matrix_sos)

Confusion Matrix en el conjunto de datos de sospecha de autismo:
[[0 0]
 [4 5]]


In [49]:
print("Classification Report en el conjunto de datos de sospecha de autismo:")
print(classification_report(df_sos["Diagnostico_autismo"], y_pred_sos))

Classification Report en el conjunto de datos de sospecha de autismo:
              precision    recall  f1-score   support

           0       0.00      0.00      0.00         0
           1       1.00      0.56      0.71         9

    accuracy                           0.56         9
   macro avg       0.50      0.28      0.36         9
weighted avg       1.00      0.56      0.71         9



  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))


In [50]:
proba_sos = new_logistic_model.predict_proba(X_sos_scaled)

In [51]:
print("Probabilidades de pertenencia a cada clase para el conjunto de datos de sospecha de autismo:")
print(proba_sos.round(2))

Probabilidades de pertenencia a cada clase para el conjunto de datos de sospecha de autismo:
[[0.12 0.88]
 [0.   1.  ]
 [0.82 0.18]
 [0.7  0.3 ]
 [0.03 0.97]
 [0.96 0.04]
 [0.16 0.84]
 [0.03 0.97]
 [0.71 0.29]]


In [52]:
df

Unnamed: 0,Diagnostico_autismo,Percibo algunos cambios en la forma de percibir estímulos sensoriales vinculados a los olores.,Percibo algunos cambios en la forma de percibir estímulos sensoriales vinculados a los sabores.,Percibo algunos cambios en la forma de percibir estímulos sensoriales vinculados a los ruidos.,Percibo algunos cambios en la forma de percibir estímulos sensoriales vinculados a las texturas.,Percibo algunos cambios en el ciclo del sueño.,Los cambios en mi procesamiento sensorial afectan mi capacidad para concentrarme en ciertas tareas.,Siento variaciones en mi equilibrio durante mi período.,Experimento variaciones en mi capacidad para realizar movimientos precisos y coordinados durante la menstruación.,Encuentro difícil interpretar las expresiones faciales de las personas.,...,Siento que establecer relaciones sexoafectivas es un desafío.,Creo que me ayudaría tener información sobre educación sexual integral.,Me siento cómodo/a con mi situación sexoafectiva actualmente.,La manera en la que experimento el mundo me permite conectar de manera profunda con mis emociones.,Mi enfoque en los detalles pequeños me permite encontrar soluciones creativas y originales a problemas complejos.,Puedo enfocarme en una tarea durante largos períodos de tiempo.,Hago lo que me gusta con mucha pasión y dedicación.,Siento que percibo la música de manera única y especial.,Tiendo a compartir una gran cantidad de información sobre mis intereses o temas que me apasionan.,Mi honestidad y autenticidad me permiten expresar mis pensamientos y emociones de manera directa y sincera.
0,1,1,1,5,5,3,4,2,2,2,...,5,1,1,5,5,5,5,2,2,4
1,1,3,3,4,4,4,4,3,3,4,...,2,4,2,5,5,5,5,5,5,5
2,1,5,5,5,5,5,5,3,4,2,...,5,5,2,5,5,5,5,5,5,5
3,1,2,2,4,4,5,4,4,3,4,...,2,1,3,3,3,5,4,3,4,4
4,1,2,2,4,4,4,4,2,2,2,...,4,4,4,2,2,2,4,4,2,4
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
61,1,5,3,5,4,4,4,4,4,4,...,3,3,2,4,4,4,4,3,4,3
62,1,2,2,2,2,2,4,2,2,5,...,5,3,5,5,5,5,5,5,5,5
63,0,1,1,1,1,4,1,4,5,2,...,5,4,2,4,5,2,4,3,2,2
64,0,4,4,4,4,4,3,2,2,2,...,4,4,2,3,4,4,4,4,4,4
