## KEGG_2021_Human

In [2]:
import pandas as pd

# Cargar el archivo CSV con los datos filtrados y con Fold Change
file_path_fc = 'deSeqRes_filtrado_bacillus_subtilis_CW14_with_FC.csv'
data_with_fc = pd.read_csv(file_path_fc)

# Renombrar las columnas
data_with_fc = data_with_fc.rename(columns={
    'GeneSymbol': 'Genes',
    'DirectionalFoldChange': 'FoldChange'
})

# Crear una nueva columna 'Regulation' basada en el signo de 'FoldChange'
data_with_fc['Regulation'] = data_with_fc['FoldChange'].apply(lambda x: 'UpRegulated' if x > 0 else 'DownRegulated')

# Tomar el valor absoluto de 'FoldChange'
data_with_fc['FoldChange'] = data_with_fc['FoldChange'].abs()

# Cargar el archivo CSV con los términos GO
file_path_go = r'C:/Users/3060/OneDrive/Documentos/Tesis de Grado/Protocolo/4_Análisis de Enriquecimiento Funcional/Bacillus subtilis CW14 - Caco 2/Enrichr/Pathways/KEGG_2021_Human_table.txt'
df = pd.read_csv(file_path_go, sep='\t')

# Eliminar las columnas especificadas
columns_to_drop = ["Overlap", "P-value", "Old P-value", "Old Adjusted P-value", "Odds Ratio", "Combined Score"]
df = df.drop(columns=columns_to_drop)

# Filtrar los registros con "Adjusted P-value" <= 0.05
df_filtered = df[df["Adjusted P-value"] <= 0.05]

# Expandir la columna "Genes" para que cada gen tenga su propia fila
df_expanded = df_filtered.assign(Genes=df_filtered['Genes'].str.split(';')).explode('Genes')

# Agrupar los términos asociados a cada gen en una lista
df_grouped = df_expanded.groupby('Genes').agg({
    'Term': lambda x: list(x),
    'Adjusted P-value': lambda x: list(x)  # Mantener todos los valores de "Adjusted P-value" para cada gen
}).reset_index()

# Combinar df_grouped con data_with_fc
df_combined = pd.merge(df_grouped, data_with_fc, on='Genes', how='left')

# Ordenar los registros por el valor de "FoldChange" del más alto al más bajo
df_combined_sorted = df_combined.sort_values(by='FoldChange', ascending=False)

# Convertir las columnas 'Term' y 'Adjusted P-value' a strings con los elementos de la lista separados por comas
df_combined_sorted['Term'] = df_combined_sorted['Term'].apply(lambda x: ', '.join(x))
df_combined_sorted['Adjusted P-value'] = df_combined_sorted['Adjusted P-value'].apply(lambda x: ', '.join(map(str, x)))

# Mostrar las primeras filas del dataframe combinado y ordenado
print(df_combined_sorted.head())

# Guardar el DataFrame combinado y ordenado en un nuevo archivo CSV
df_combined_sorted.to_csv('deSeqRes_combined_with_KEGG_2021_Human_terms_sorted.csv', index=False)

# Guardar el DataFrame combinado y ordenado en un archivo Excel
df_combined_sorted.to_excel('deSeqRes_combined_with_KEGG_2021_Human_terms_sorted.xlsx', index=False)

     Genes                                               Term  \
6     CCL4  Cytokine-cytokine receptor interaction, Viral ...   
10    CSF2  TNF signaling pathway, Rheumatoid arthritis, C...   
11    CSF3  Cytokine-cytokine receptor interaction, IL-17 ...   
19   CXCL8  Rheumatoid arthritis, Cytokine-cytokine recept...   
14  CXCL10  TNF signaling pathway, Cytokine-cytokine recep...   

                                     Adjusted P-value  Log2FoldChange  \
6   1.860485947890529e-17, 3.083583547860433e-16, ...        5.236074   
10  7.381870203598573e-21, 5.0193100412991314e-18,...        5.025177   
11  1.860485947890529e-17, 2.8667185795181054e-15,...        4.950078   
19  5.0193100412991314e-18, 1.860485947890529e-17,...        4.646226   
14  7.381870203598573e-21, 1.860485947890529e-17, ...        4.340264   

    FoldChange   Regulation  
6    37.689059  UpRegulated  
10   32.563351  UpRegulated  
11   30.911623  UpRegulated  
19   25.041102  UpRegulated  
14   20.255812  UpRe

## Metabolomics_Workbench_Metabolites_2022

In [1]:
import pandas as pd

# Cargar el archivo CSV con los datos filtrados y con Fold Change
file_path_fc = 'deSeqRes_filtrado_bacillus_subtilis_CW14_with_FC.csv'
data_with_fc = pd.read_csv(file_path_fc)

# Renombrar las columnas
data_with_fc = data_with_fc.rename(columns={
    'GeneSymbol': 'Genes',
    'DirectionalFoldChange': 'FoldChange'
})

# Crear una nueva columna 'Regulation' basada en el signo de 'FoldChange'
data_with_fc['Regulation'] = data_with_fc['FoldChange'].apply(lambda x: 'UpRegulated' if x > 0 else 'DownRegulated')

# Tomar el valor absoluto de 'FoldChange'
data_with_fc['FoldChange'] = data_with_fc['FoldChange'].abs()

# Cargar el archivo CSV con los términos GO
file_path_go = r'C:/Users/3060/OneDrive/Documentos/Tesis de Grado/Protocolo/4_Análisis de Enriquecimiento Funcional/Bacillus subtilis CW14 - Caco 2/Enrichr/Pathways/Metabolomics_Workbench_Metabolites_2022_table.txt'
df = pd.read_csv(file_path_go, sep='\t')

# Eliminar las columnas especificadas
columns_to_drop = ["Overlap", "P-value", "Old P-value", "Old Adjusted P-value", "Odds Ratio", "Combined Score"]
df = df.drop(columns=columns_to_drop)

# Filtrar los registros con "Adjusted P-value" <= 0.05
df_filtered = df[df["Adjusted P-value"] <= 0.05]

# Expandir la columna "Genes" para que cada gen tenga su propia fila
df_expanded = df_filtered.assign(Genes=df_filtered['Genes'].str.split(';')).explode('Genes')

# Agrupar los términos asociados a cada gen en una lista
df_grouped = df_expanded.groupby('Genes').agg({
    'Term': lambda x: list(x),
    'Adjusted P-value': lambda x: list(x)  # Mantener todos los valores de "Adjusted P-value" para cada gen
}).reset_index()

# Combinar df_grouped con data_with_fc
df_combined = pd.merge(df_grouped, data_with_fc, on='Genes', how='left')

# Ordenar los registros por el valor de "FoldChange" del más alto al más bajo
df_combined_sorted = df_combined.sort_values(by='FoldChange', ascending=False)

# Convertir las columnas 'Term' y 'Adjusted P-value' a strings con los elementos de la lista separados por comas
df_combined_sorted['Term'] = df_combined_sorted['Term'].apply(lambda x: ', '.join(x))
df_combined_sorted['Adjusted P-value'] = df_combined_sorted['Adjusted P-value'].apply(lambda x: ', '.join(map(str, x)))

# Mostrar las primeras filas del dataframe combinado y ordenado
print(df_combined_sorted.head())

# Guardar el DataFrame combinado y ordenado en un nuevo archivo CSV
df_combined_sorted.to_csv('deSeqRes_combined_with_Metabolomics_Workbench_Metabolites_2022_terms_sorted.csv', index=False)

# Guardar el DataFrame combinado y ordenado en un archivo Excel
df_combined_sorted.to_excel('deSeqRes_combined_with_Metabolomics_Workbench_Metabolites_2022_terms_sorted.xlsx', index=False)

    Genes       Term   Adjusted P-value  Log2FoldChange  FoldChange  \
1  CYP1B1  Melatonin  0.004595524823877        2.606486    6.090184   
0  CYP1A1  Melatonin  0.004595524823877        1.363543    2.573164   

    Regulation  
1  UpRegulated  
0  UpRegulated  


## Reactome Pathways 2024

In [2]:
import pandas as pd

# Cargar el archivo CSV con los datos filtrados y con Fold Change
file_path_fc = 'deSeqRes_filtrado_bacillus_subtilis_CW14_with_FC.csv'
data_with_fc = pd.read_csv(file_path_fc)

# Renombrar las columnas
data_with_fc = data_with_fc.rename(columns={
    'GeneSymbol': 'Genes',
    'DirectionalFoldChange': 'FoldChange'
})

# Crear una nueva columna 'Regulation' basada en el signo de 'FoldChange'
data_with_fc['Regulation'] = data_with_fc['FoldChange'].apply(lambda x: 'UpRegulated' if x > 0 else 'DownRegulated')

# Tomar el valor absoluto de 'FoldChange'
data_with_fc['FoldChange'] = data_with_fc['FoldChange'].abs()

# Cargar el archivo CSV con los términos GO
file_path_go = r'C:/Users/3060/OneDrive/Documentos/Tesis de Grado/Protocolo/4_Análisis de Enriquecimiento Funcional/Bacillus subtilis CW14 - Caco 2/Enrichr/Pathways/Reactome_2022_table.txt'
df = pd.read_csv(file_path_go, sep='\t')

# Eliminar las columnas especificadas
columns_to_drop = ["Overlap", "P-value", "Old P-value", "Old Adjusted P-value", "Odds Ratio", "Combined Score"]
df = df.drop(columns=columns_to_drop)

# Filtrar los registros con "Adjusted P-value" <= 0.05
df_filtered = df[df["Adjusted P-value"] <= 0.05]

# Expandir la columna "Genes" para que cada gen tenga su propia fila
df_expanded = df_filtered.assign(Genes=df_filtered['Genes'].str.split(';')).explode('Genes')

# Agrupar los términos asociados a cada gen en una lista
df_grouped = df_expanded.groupby('Genes').agg({
    'Term': lambda x: list(x),
    'Adjusted P-value': lambda x: list(x)  # Mantener todos los valores de "Adjusted P-value" para cada gen
}).reset_index()

# Combinar df_grouped con data_with_fc
df_combined = pd.merge(df_grouped, data_with_fc, on='Genes', how='left')

# Ordenar los registros por el valor de "FoldChange" del más alto al más bajo
df_combined_sorted = df_combined.sort_values(by='FoldChange', ascending=False)

# Convertir las columnas 'Term' y 'Adjusted P-value' a strings con los elementos de la lista separados por comas
df_combined_sorted['Term'] = df_combined_sorted['Term'].apply(lambda x: ', '.join(x))
df_combined_sorted['Adjusted P-value'] = df_combined_sorted['Adjusted P-value'].apply(lambda x: ', '.join(map(str, x)))

# Mostrar las primeras filas del dataframe combinado y ordenado
print(df_combined_sorted.head())

# Guardar el DataFrame combinado y ordenado en un nuevo archivo CSV
df_combined_sorted.to_csv('deSeqRes_combined_with_Metabolomics_Reactome_2022_terms_sorted.csv', index=False)

# Guardar el DataFrame combinado y ordenado en un archivo Excel
df_combined_sorted.to_excel('deSeqRes_combined_with_Metabolomics_Reactome_2022_terms_sorted.xlsx', index=False)

     Genes                                               Term  \
6     CCL4  Interleukin-10 Signaling R-HSA-6783783, Chemok...   
12    CSF2  Interleukin-10 Signaling R-HSA-6783783, Signal...   
13    CSF3  Interleukin-10 Signaling R-HSA-6783783, Signal...   
21   CXCL8  Interleukin-10 Signaling R-HSA-6783783, Chemok...   
16  CXCL10  Interleukin-10 Signaling R-HSA-6783783, Chemok...   

                                     Adjusted P-value  Log2FoldChange  \
6   1.813945571151312e-25, 1.072468051402429e-14, ...        5.236074   
12  1.813945571151312e-25, 6.431408209755029e-11, ...        5.025177   
13  1.813945571151312e-25, 6.431408209755029e-11, ...        4.950078   
21  1.813945571151312e-25, 1.072468051402429e-14, ...        4.646226   
16  1.813945571151312e-25, 1.072468051402429e-14, ...        4.340264   

    FoldChange   Regulation  
6    37.689059  UpRegulated  
12   32.563351  UpRegulated  
13   30.911623  UpRegulated  
21   25.041102  UpRegulated  
16   20.255812  UpRe

## Elsevier_Pathway_Collection

In [1]:
import pandas as pd

# Cargar el archivo CSV con los datos filtrados y con Fold Change
file_path_fc = 'deSeqRes_filtrado_bacillus_subtilis_CW14_with_FC.csv'
data_with_fc = pd.read_csv(file_path_fc)

# Renombrar las columnas
data_with_fc = data_with_fc.rename(columns={
    'GeneSymbol': 'Genes',
    'DirectionalFoldChange': 'FoldChange'
})

# Crear una nueva columna 'Regulation' basada en el signo de 'FoldChange'
data_with_fc['Regulation'] = data_with_fc['FoldChange'].apply(lambda x: 'UpRegulated' if x > 0 else 'DownRegulated')

# Tomar el valor absoluto de 'FoldChange'
data_with_fc['FoldChange'] = data_with_fc['FoldChange'].abs()

# Cargar el archivo CSV con los términos GO
file_path_go = r'C:/Users/3060/OneDrive/Documentos/Tesis de Grado/Protocolo/4_Análisis de Enriquecimiento Funcional/Bacillus subtilis CW14 - Caco 2/Enrichr/Pathways/Elsevier_Pathway_Collection_table.txt'
df = pd.read_csv(file_path_go, sep='\t')

# Eliminar las columnas especificadas
columns_to_drop = ["Overlap", "P-value", "Old P-value", "Old Adjusted P-value", "Odds Ratio", "Combined Score"]
df = df.drop(columns=columns_to_drop)

# Filtrar los registros con "Adjusted P-value" <= 0.05
df_filtered = df[df["Adjusted P-value"] <= 0.05]

# Expandir la columna "Genes" para que cada gen tenga su propia fila
df_expanded = df_filtered.assign(Genes=df_filtered['Genes'].str.split(';')).explode('Genes')

# Agrupar los términos asociados a cada gen en una lista
df_grouped = df_expanded.groupby('Genes').agg({
    'Term': lambda x: list(x),
    'Adjusted P-value': lambda x: list(x)  # Mantener todos los valores de "Adjusted P-value" para cada gen
}).reset_index()

# Combinar df_grouped con data_with_fc
df_combined = pd.merge(df_grouped, data_with_fc, on='Genes', how='left')

# Ordenar los registros por el valor de "FoldChange" del más alto al más bajo
df_combined_sorted = df_combined.sort_values(by='FoldChange', ascending=False)

# Convertir las columnas 'Term' y 'Adjusted P-value' a strings con los elementos de la lista separados por comas
df_combined_sorted['Term'] = df_combined_sorted['Term'].apply(lambda x: ', '.join(x))
df_combined_sorted['Adjusted P-value'] = df_combined_sorted['Adjusted P-value'].apply(lambda x: ', '.join(map(str, x)))

# Mostrar las primeras filas del dataframe combinado y ordenado
print(df_combined_sorted.head())

# Guardar el DataFrame combinado y ordenado en un nuevo archivo CSV
df_combined_sorted.to_csv('deSeqRes_combined_with_Elsevier_Pathway_Collection_terms_sorted.csv', index=False)

# Guardar el DataFrame combinado y ordenado en un archivo Excel
df_combined_sorted.to_excel('deSeqRes_combined_with_Elsevier_Pathway_Collection_terms_sorted.xlsx', index=False)

     Genes                                               Term  \
6     CCL4  Proteins Involved in Atherosclerosis, Proteins...   
11    CSF2  Proteins Involved in Atherosclerosis, Proteins...   
12    CSF3  Proteins Involved in Atherosclerosis, Proteins...   
20   CXCL8  Proteins Involved in Atherosclerosis, TLR2 Ind...   
15  CXCL10  Proteins Involved in Atherosclerosis, TLR2 Ind...   

                                     Adjusted P-value  Log2FoldChange  \
6   3.1475913889543994e-16, 9.179792583595518e-12,...        5.236074   
11  3.1475913889543994e-16, 9.179792583595518e-12,...        5.025177   
12  3.1475913889543994e-16, 1.422280374405408e-11,...        4.950078   
20  3.1475913889543994e-16, 1.6292969315956525e-13...        4.646226   
15  3.1475913889543994e-16, 1.6292969315956525e-13...        4.340264   

    FoldChange   Regulation  
6    37.689059  UpRegulated  
11   32.563351  UpRegulated  
12   30.911623  UpRegulated  
20   25.041102  UpRegulated  
15   20.255812  UpRe