# clusterizando celulas por genero os dados de Ziegler et al

In [None]:
#importando a biblioteca scanpy e lendo os dados processados no caderno anterior.
import scanpy as sc
import numpy as np
import pandas as pd
from sklearn.cluster import KMeans
from sklearn.metrics import adjusted_rand_score
%matplotlib inline
import collections
import matplotlib
import matplotlib.pyplot as plt
from matplotlib import pyplot as plt
import h5py
import scipy.sparse as sp_sparse

# definindo os parametros globais de qualidade do SCANPY
sc.settings.verbosity = 2  # verbosity: erro (0) perigo (1), info (2), dicas (3)
sc.settings.set_figure_params(dpi=600, dpi_save=600, format ='svg',) #qualidade das imagens para 700 DPI (alta resolução)
sc.settings.n_jobs = 8 #numero de nucleos utilizado no processamento paralelo (+ core, mais rapido os calculos serão realizados)

In [None]:
adata = sc.read_h5ad('feminino_normalizado_e_DEGs.h5ad')

In [None]:
adata

In [None]:
#tSNE é um algoritmo estocástico, o que significa que executar o método várias vezes

sc.tl.tsne(adata, perplexity=30,
           learning_rate=1000, 
           metric= 'euclidean', 
           early_exaggeration= 12,
           n_jobs = 8,
           random_state=0) 


#help(sc.tl.tsne)
#help(sc.pl.tsne)

In [None]:
#plotando o TSNE
sc.pl.tsne(adata, color='Annotation',
          title= 'Agrupamento tSNE de células de \n tecido nasofaríngeo feminino',
          save ='tSNE_feminino_ziegler.svg') # para anotações de células

In [None]:
#plotando o TSNE
#plotando o TSNE
sc.pl.tsne(adata, color='Detailed_Cell_Annotations',
          title= 'Agrupamento tSNE detalhado de células do \n tecido nasofaríngeo feminino',
           legend_loc= 'right margin',
          save ='tSNE_detalhado_feminino_ziegler.svg') # para anotações de células

# criando o UMAP

In [None]:
# rodando o calculo de visinhos
sc.pp.neighbors(adata) # O umap é baseado em um modelo de vizinhos, por isso usamos essa função.

In [None]:
# rodando o UMAP
sc.tl.umap(adata, min_dist=0.5, spread=1.0, random_state=0, n_components=2)

In [None]:
#plotando o grafico UMAP
sc.pl.umap(adata, color=['Annotation'],
          title= 'Agrupamento UMAP de células do tecido \n nasofaríngeo feminino',
          save ='umap_feminino_ziegler.svg')

In [None]:
sc.pl.umap(adata, color=['Detailed_Cell_Annotations'],
          title= 'Agrupamento UMAP detalhado de células do \n tecido nasofaríngeo feminino',
          save ='umap_detalhado_feminino_ziegler.svg')

In [None]:
#plotando o grafico UMAP para TMPRSS2
sc.pl.umap(adata, color=['TMPRSS2'],
           s=20,
          title =' Nivel de expressão de $\it{TMPRSS2}$ \n sobre cada agrupamento',
          save ='umap_TMPRSS2_feminino_ziegler.svg')

In [None]:
#plotando o grafico UMAP para ACE2
sc.pl.umap(adata, color=['ACE2'],
           s=20,
           title =' Nivel de expressão de $\it{ACE2}$ \n sobre cada agrupamento',
           save ='umap_ace2_feminino_ziegler.svg')

In [None]:
#plotando o grafico UMAP para ACE2
sc.pl.umap(adata, color=['AR'],
           s=20,
           title =' Nivel de expressão de $\it{AR}$ \n sobre cada agrupamento',
           save ='umap_AR_feminino_ziegler.svg')

In [None]:
#plotando o grafico UMAP para sexo
sc.pl.umap(adata, color=['sex'],
           s=7,
           title =' Agrupamento UMAP das células \n do genero masculino',
           save ='umap_sexo_feminino_ziegler.svg')

# exportando a quantidade de células no agrupamento masculino

In [None]:
#Verificando o tipo e o numero de células
ncell_1=adata.obs[['Annotation']].value_counts()
ncell_1.to_excel("annotation_feminino.xlsx")
ncell_1

In [None]:
#observado subgrupos de células
ncell_2=adata.obs[['Detailed_Cell_Annotations']].value_counts()
ncell_2.to_excel("celulas_feminino_detalhadas.xlsx")
ncell_2

In [None]:
#atualizando o H5ad
adata.write('feminino_normalizado_cluster_e_DEGs.h5ad')
