<a href="https://colab.research.google.com/github/jdlg-42/TFG/blob/main/attention_data_analysis.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Análisis de datos de atención tras analizar con ESM-2

Tras realizar el análisis usando ESM-2 se generan dos archivos CSV, uno para cada receptor, con los que se obtienen datos de interés:

- Número de residuos que superan el percentil 85
- Valor máximo y mínimo
- Valor promedio
- Desviación estándar

## Receptor A2A de adenosina

In [63]:
# Importación del dataset

import pandas as pd

df_a2a = pd.read_csv('attention_to_allosteric_sites_a2a.csv')

res_p85_a2a = df_a2a[df_a2a["Top 15%?"] == "YES"]
res_p85_a2a

Unnamed: 0,From (Query Position),Residue,Accumulated Avg Attention,Top 15%?
156,157,Q,0.036142,YES
157,158,G,0.025201,YES
158,159,C,0.042847,YES
159,160,G,0.035881,YES
160,161,E,0.087495,YES
...,...,...,...,...
338,339,N,0.028250,YES
348,349,G,0.023967,YES
367,368,G,0.025072,YES
380,381,P,0.023920,YES


In [61]:
# Nº de residuos que superan el percentil 85

print(f"El número de residuos que superan el percentil 85 es de {len(res_p85_a2a)} residuos.")

El número de residuos que superan el percentil 85 es de 62 residuos.


In [67]:
# Ordenar los residuos por valor de atención promedio acumulada

res_p85_a2a.sort_values(by=['Accumulated Avg Attention'], ascending=False)

# Calcular máximo y mínimo

## Obtener las columnas de los valores máximo y mínimo respectivamente
max_row_a2a = res_p85_a2a.loc[res_p85_a2a['Accumulated Avg Attention'].idxmax()]
min_row_a2a = res_p85_a2a.loc[res_p85_a2a['Accumulated Avg Attention'].idxmin()]

## Obtener los valores máximo y mínimo
max_a2a_value = max_row_a2a['Accumulated Avg Attention']
max_residue_a2a = max_row_a2a['From (Query Position)']

min_a2a_value = min_row_a2a['Accumulated Avg Attention']
min_residue_a2a = min_row_a2a['From (Query Position)']

print(f"El valor máximo de atención acumulada es de {round(max_a2a_value,6)} para el residuo {max_residue_a2a} y el valor mínimo es de {round(min_a2a_value,6)} para el residuo {min_residue_a2a}.")

El valor máximo de atención acumulada es de 0.562796 para el residuo 280 y el valor mínimo es de 0.022404 para el residuo 177.


In [65]:
df_a2a.sort_values(by=['Accumulated Avg Attention'], ascending=False)

Unnamed: 0,From (Query Position),Residue,Accumulated Avg Attention,Top 15%?
279,280,N,0.562796,YES
278,279,T,0.557509,YES
273,274,I,0.476728,YES
276,277,S,0.383604,YES
292,293,R,0.373636,YES
...,...,...,...,...
19,20,A,0.000018,NO
15,16,I,0.000016,NO
50,51,A,0.000015,NO
92,93,F,0.000014,NO


In [68]:
# Promedio y desviación estandar de atención promedio acumulada

avg_a2a = round(res_p85_a2a['Accumulated Avg Attention'].mean(),6)

print(f"El valor promedio de la atención promedio acumulada es de {avg_a2a}.")

std_a2a = round(res_p85_a2a['Accumulated Avg Attention'].std(),6)

print(f"La desviación estándar de la atención promedio acumulada es de {std_a2a}.")

El valor promedio de la atención promedio acumulada es de 0.101288.
La desviación estándar de la atención promedio acumulada es de 0.135443.


## Receptor beta-2 adrenérgico

In [69]:
import pandas as pd

df_adrb2 = pd.read_csv('attention_to_allosteric_sites_adrb2.csv')

res_p85_adrb2 = df_adrb2[df_adrb2["Top 15%?"] == "YES"]
res_p85_adrb2

Unnamed: 0,From (Query Position),Residue,Accumulated Avg Attention,Top 15%?
124,125,C,0.047884,YES
174,175,R,0.077341,YES
175,176,A,0.113683,YES
176,177,T,0.097625,YES
177,178,H,0.064632,YES
...,...,...,...,...
315,316,Y,0.079657,YES
316,317,V,0.082889,YES
317,318,N,0.081427,YES
328,329,S,0.047858,YES


In [56]:
# Nº de residuos que superan el percentil 85

print(f"El número de residuos que superan el percentil 85 es de {len(res_p85_adrb2)} residuos.")

El número de residuos que superan el percentil 85 es de 62 residuos.


In [70]:
# Ordenar los residuos por valor de atención promedio acumulada

df_adrb2.sort_values(by=['Accumulated Avg Attention'], ascending=False)

# Calcular máximo y mínimo

## Obtener las columnas de los valores máximo y mínimo respectivamente
max_row_adrb2 = res_p85_adrb2.loc[res_p85_adrb2['Accumulated Avg Attention'].idxmax()]
min_row_adrb2 = res_p85_adrb2.loc[res_p85_adrb2['Accumulated Avg Attention'].idxmin()]

## Obtener los valores máximo y mínimo
max_adrb2_value = max_row_adrb2['Accumulated Avg Attention']
max_residue_adrb2 = max_row_adrb2['From (Query Position)']

min_adrb2_value = min_row_adrb2['Accumulated Avg Attention']
min_residue_adrb2 = min_row_adrb2['From (Query Position)']

print(f"El valor máximo de atención acumulada es de {round(max_adrb2_value,6)} para el residuo {max_residue_adrb2} y el valor mínimo es de {round(min_adrb2_value,6)} para el residuo {min_residue_adrb2}.")

El valor máximo de atención acumulada es de 0.245237 para el residuo 207 y el valor mínimo es de 0.045865 para el residuo 187.


In [71]:
# Promedio y desviación estandar de atención promedio acumulada

avg_adrb2 = round(res_p85_adrb2['Accumulated Avg Attention'].mean(),6)

print(f"El valor promedio de la atención promedio acumulada es de {avg_adrb2}.")

std_adrb2 = round(res_p85_adrb2['Accumulated Avg Attention'].std(),6)

print(f"La desviación estándar de la atención promedio acumulada es de {std_adrb2}.")

El valor promedio de la atención promedio acumulada es de 0.108189.
La desviación estándar de la atención promedio acumulada es de 0.056484.
