In [None]:
import scanpy as sc
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from scipy.stats import ttest_ind # importando uma biblioteca estatistica do scipy
from multiprocessing import Pool
import warnings
warnings.filterwarnings("ignore")
sc.settings.verbosity = 3             
sc.logging.print_header()

In [None]:
df = pd.read_csv('DEGS_masculino_WHO_6-8_vs_ctrl_WHO_0.csv', sep= ',', index_col = 1)
df

In [None]:
del df['Unnamed: 0']

In [None]:
df

# criando variaveis com genes up e gens down, importar para .csv para uso posterior

In [None]:
#criando tabela de genes UP regulados significativos
DEGs_up = (df[(df['logfoldchanges'] > 1.5) & (df['pvals_adj'] < 0.05)]).index.tolist()

In [None]:
# convertendo lista de genes em um dataframe com up e doen
genes_up = pd.DataFrame(list(zip(DEGs_up)), columns = ['Up_regulated'])
genes_up

In [None]:
# criando tabela de genes DOWN regulados siginificativos
DEGs_down = (df[(df['logfoldchanges'] < -1.5) & (df['pvals_adj'] < 0.05)]).index.tolist()

In [None]:
genes_down = pd.DataFrame(list(zip(DEGs_down)), columns = ['Down_regulated'])
genes_down

# Exportanto tabelas de genes UP e DOWN regulados significativos

In [None]:
#exoportando os genes up para .csv
#genes_up.to_csv("GENES_UP_6-8_vs_ctrl.csv", sep=",")
#genes_up.to_excel("GENES_UP_6-8_vs_ctrl.xlsx")

In [None]:
#Exportando os genes down para .csv
#genes_down.to_csv("GENES_DOWN_6-8_vs_ctrl.csv", sep=",")
#genes_down.to_excel("GENES_DOWN_6-8_vs_ctrl.xlsx")

# criando um heatmap com os gens up e down

In [None]:
#lendo o H5AD que contem as estatisticas de DEGS
adata = sc.read_h5ad('masculino_normalizado_e_DEGs.h5ad') #inserir os dados com os nomes corretos para leitura
adata

In [None]:
# juntando as duas listas de genes up e down regulados em uma só lista
gene_names = (DEGs_up + DEGs_down)

In [None]:
print(gene_names)

In [None]:
# heat map com os genes diferencialmente expressos masi significativos
sc.pl.matrixplot(adata, gene_names, 
              groupby = 'Cohort_Disease_WHO_Score',
              log = True,
              cmap='RdBu_r',
              standard_scale= 'var',
              #show_gene_labels=True,
              title ='Heatmap de genes diferencialmente expressos em pacientes do gênero masculino \n para todos grupos de classificação da OMS)',
              colorbar_title= 'EXPRESSÃO MÉDIA',
              swap_axes = False,
              figsize= (15,5),
              save = 'HEAT_DEGS_masculino_WHO_6-8_vs_ctrl.png')

# matrix plot com todos os genes up e down

In [None]:
DEGs_up2 = (df[(df['logfoldchanges'] >= 1.5) & (df['pvals_adj'] < 0.05)]).index.tolist()

In [None]:
genes_up2 = pd.DataFrame(list(zip(DEGs_up2)), columns = ['Up_regulated'])
genes_up2

In [None]:
genes_up2.to_excel("GENES_UP_6-8_vs_ctrl_masculino.xlsx")

In [None]:
DEGs_down2 = (df[(df['logfoldchanges'] <= -1.5) & (df['pvals_adj'] < 0.05)]).index.tolist()

In [None]:
genes_down2 = pd.DataFrame(list(zip(DEGs_down2)), columns = ['Down_regulated'])
genes_down2

In [None]:
genes_down2= to_excel("GENES_DOWN_6-8_vs_ctrl_masculino.xlsx")

In [None]:
gene_names2 = (DEGs_up2 + DEGs_down2)

In [None]:
gene_names2

In [None]:
# heat map com os genes diferencialmente expressos masi significativos
sc.pl.heatmap(adata, gene_names2, 
              groupby = 'Cohort_Disease_WHO_Score',
              log = True,
              cmap='viridis',
              standard_scale= 'obs',
              swap_axes = False,
              figsize= (15,8),
              save = 'HEAT2_DEGS_masculino_WHO_6-8_vs_ctrl_WHO_0.png')

# Violino plot para os generos en todos os grupos OMS

In [None]:
markers =['TMPRSS2', 'ACE2', 'AR']

In [None]:
sc.pl.stacked_violin(adata, markers,
                     groupby='Cohort_Disease_WHO_Score',
                     log=False,
                     row_palette = 'hls',
                     standard_scale= 'var',
                     stripplot= True,
                     jitter= True,
                     size= 1,
                     scale='width',
                     title= "Expressão dos genes $\it{TMPRSS2}$, $\it{ACE2}$ e $\it{AR}$ em pacientes do gênero masculino \n para todos grupos de classificação da OMS",
                     figsize= (10.2,10.2),
                     save= 'violino_masculino_todos grupos.png')