In [1]:
def blast_remoto(arquivo_entrada = '/Users/carla/Downloads/HLA_DQB1.fasta', formato = 'fasta', banco_dados = 'nr', tipo_blast = 'blastp'):

    '''
    Função para a realização do Blast Remoto

    Parâmetros:
    arquivo_entrada : str
        Caminho para o arquivo de entrada contendo a sequência que será usada como consulta

    formato : str
        Formato do arquivo de entrada
    
    banco_dados : str
        Banco de dados usado para a busca BLAST ('nr' para banco de dados não redundante do NCBI)
    
    tipo_blast : str
        Tipo de busca BLAST ('blastp' para proteínas)
    
    
    Retorna:
    resultado : handle
        Objeto que contém os resultados do BLAST
    '''
    
    from Bio.Blast import NCBIWWW 
    from Bio import SeqIO

    # Lê a sequência do arquivo
    record = SeqIO.read(open(arquivo_entrada), format = formato)

    # Executa o Blast Remoto
    resultado = NCBIWWW.qblast(tipo_blast, banco_dados, record.format(formato))

    return resultado


# Guardar Blast
def save_blast(resultado, nome_arquivo = 'blast.xml'):
    

    '''
    Função para salvar os resultados do BLAST num arquivo XML

    Parâmetros:
    resultado : handle
        Objeto que contém os resultados do BLAST
    
    nome_arquivo : str
        Nome do arquivo onde os resultados vão ser guardados 
    
    O 'with' fecha automaticamente o arquivo 
    '''
    

    with open(nome_arquivo,'w') as save_file:
        save_file.write(resultado.read())



In [4]:
import time
handle_nr    = blast_remoto('NP_064440.fasta')
time.sleep(5)
handle_swiss = blast_remoto('NP_064440.fasta',banco_dados='swissprot')

save_blast(handle_nr   ,'DQA2-NR-BLAST.xml')
save_blast(handle_swiss,'DQA2-NR-SWISS.xml')

In [6]:
def resultado_blast(nome_arquivo='blast.xml'):
    '''
    Função para ler e processar os resultados do BLAST armazenados num arquivo XML

    Parâmetros:
    nome_arquivo : str
        Nome do arquivo XML que contêm os resultados do BLAST 

    Retorna:
    blast_record
        Objeto que representa os resultados do BLAST
    
    Raises:
    FileNotFoundError:
        Se o arquivo especificado pelo 'nome_arquivo' não for encontrado

    IOError:
        Se ocorrer um erro durante a leitura do arquivo.
    '''

    from Bio.Blast import NCBIXML 
    
    try:
        # Abre o arquivo XML com os resultados do BLAST
        with open(nome_arquivo) as resultado:
            # Lê o conteúdo do arquivo e retorna o Blast record
            blast_record = NCBIXML.read(resultado)
    except FileNotFoundError as e:
        # Captura e relança a exceção para fornecer uma mensagem de erro mais informativa
        raise FileNotFoundError(f'O arquivo {nome_arquivo} não foi encontrado.') from e
    except IOError as e:
        # Captura e relança a exceção para fornecer uma mensagem de erro mais informativa
        raise IOError(f'Erro ao ler ou processar o arquivo {nome_arquivo}.') from e
    
    return blast_record

def parametros(blast_record):
    
    '''
    Imprime os parâmetros do BLAST

    Parâmetros:
    blast_record 
        Objeto que representa os resultados do BLAST

    Prints:
    Database - str
        Nome do banco de dados utilizado no BLAST
    
    Matrix - str
        Nome da matriz de substituição utilizada
    
    Gap penalties - tuple
        Tuple contendo os gap penalties
    
    '''
    print('PARAMETROS:')
    print('Database - ', blast_record.database)
    print('Matrix - ', blast_record.matrix)
    print('Gap penalties - ', blast_record.gap_penalties)

# Chamar as funções


## HLA-DQA2

> **Nome do gene:** Homo sapiens isolate PSCDA0402 MHC class II antigen (HLA-DQA2)

> **Cromossoma:** Chromosome 6 NC_000006.12

> **Gene ID**: 3118

> **Proteína associada**: HLA class II histocompatibility antigen, DQ alpha 2 chain

> **Protein ID**: P01906

### Pesquisa bibliográfica

### Introdução

O gene HLA-DQA2, juntamente com outros genes da mesma família, pode desempenhar um papel na patogénese de doenças neurodegenerativas e no cancro. No entanto, para este trabalho destaca-se sobretudo no seu papel na alergia alimentar e na sua interação com os genes HLA-DQA1 e HLA-DQB1.

### Interação com outros genes

O gene HLA-DQA2, juntamente com os genes HLA-DQA1 e HLA-DQB1, parece estar envolvido na patogénese de doenças complexas do sistema nervoso, como a esclerose múltipla, o Alzheimer, o Parkinson e o síndrome de Sjögren.<sup>[[1] , [2] , [3] , [4]]</sup>. Existem também estudos que apontam no sentido da associação da família deste gene, nomeadamente HLA-DQA2 e HLA-DRB1, à síndrome de Rasmussen.<sup>[[5]]</sup> Além disso, existem evidências do seu papel em doenças respiratórias como o asma (juntamente com o gene HLA-DQA1)<sup>[[6]]</sup>, COVID-19<sup>[[7]]</sup> e complicações associadas a transplantes de rim, nomeadamente nefropatia.<sup>[[8]]</sup>

### Papel em doenças autoimunes

O gene HLA-DQA2 parece desempenhar um papel em várias doenças autoimunes como a colangite esclerosante primária, artrite reumatoide (juntamente com o gene HLA-DQB1), artrite idiopática juvenil, e lupus.<sup>[[9],[10], [11], [12]]</sup>

### Papel no cancro

O gene HLA-DQA2 parece, também, ser um biomarcador para cancro de pulmão, estando a sua proteína, conjuntamente com outras como SFTPB, MICB, NRP1 e GMFG associadas a risco diminuído de cancro de pulmão, contrasstando com as proteínas C2, MICA, AIF1 e CTSH. Este gene e a proteína que codifica podem fazer parte de um conjunto interessante para novas terapêuticas para cancro do pulmão.<sup>[[13],[14]]</sup>

### Papel na alergia alimentar

No que diz respeito à alergia alimentar, o gene HLA-DQA2 parece desempenhar um papel preponderante na alergia ao camarão e à amendoim.<sup>[[15],[16]]</sup>

### Outras curiosidades

Um estudo curioso identificou o gene HLA-DQA2, juntamente com os genes HLA-DRB1 e HLA-DQB1, como potenciais biomarcadores para hábitos de fumo.<sup>[[17]]</sup>

### Referências bibliográficas

[1]:https://doi.org/10.1016/j.neulet.2023.137513
1. Guo, F., Kang, J., Xu, J., Wei, S., Tao, J., Dong, Y., Ma, Y., Tian, H., Guo, X., Bi, S., Zhang, C., Lv, H., Shang, Z., Jiang, Y., & Zhang, M. (2023). Genome-wide identification of m6A-associated single nucleotide polymorphisms in complex diseases of nervous system. Neuroscience letters, 817, 137513. https://doi.org/10.1016/j.neulet.2023.137513

[2]:https://doi.org/10.3389/fimmu.2022.857014
2. Hong, X., Wang, X., Rang, X., Yin, X., Zhang, X., Wang, R., Wang, D., Zhao, T., & Fu, J. (2022). The Shared Mechanism and Candidate Drugs of Multiple Sclerosis and Sjögren's Syndrome Analyzed by Bioinformatics Based on GWAS and Transcriptome Data. Frontiers in immunology, 13, 857014. https://doi.org/10.3389/fimmu.2022.857014

[3]:https://doi.org/10.1371/journal.pone.0248429
3. Chi, C., Taylor, K. E., Quach, H., Quach, D., Criswell, L. A., & Barcellos, L. F. (2021). Hypomethylation mediates genetic association with the major histocompatibility complex genes in Sjögren's syndrome. PloS one, 16(4), e0248429. https://doi.org/10.1371/journal.pone.0248429

[4]:https://doi.org/10.1371/journal.pone.0010142
4. Handel, A. E., Handunnetthi, L., Berlanga, A. J., Watson, C. T., Morahan, J. M., & Ramagopalan, S. V. (2010). The effect of single nucleotide polymorphisms from genome wide association studies in multiple sclerosis on gene expression. PloS one, 5(4), e10142. https://doi.org/10.1371/journal.pone.0010142

[5]:https://doi.org/10.1111/epi.17457
5. Leitner, D. F., Lin, Z., Sawaged, Z., Kanshin, E., Friedman, D., Devore, S., Ueberheide, B., Chang, J. W., Mathern, G. W., Anink, J. J., Aronica, E., Wisniewski, T., & Devinsky, O. (2023). Brain molecular mechanisms in Rasmussen encephalitis. Epilepsia, 64(1), 218–230. https://doi.org/10.1111/epi.17457

[6]:https://doi.org/10.1111/cea.12000
6. Lasky-Su, J., Himes, B. E., Raby, B. A., Klanderman, B. J., Sylvia, J. S., Lange, C., Melen, E., Martinez, F. D., Israel, E., Gauderman, J., Gilliland, F., Sleiman, P., Hakonarson, H., Celedón, J. C., Soto-Quiros, M., Avila, L., Lima, J. J., Irvin, C. G., Peters, S. P., Boushey, H., … SHARP investigators (2012). HLA-DQ strikes again: genome-wide association study further confirms HLA-DQ in the diagnosis of asthma among adults. Clinical and experimental allergy : journal of the British Society for Allergy and Clinical Immunology, 42(12), 1724–1733. https://doi.org/10.1111/cea.12000

[7]:https://doi.org/10.1111/jcmm.16714
7. Ma, D., Liu, S., Hu, L., He, Q., Shi, W., Yan, D., Cao, Y., Zhang, G., Wang, Z., Wu, J., & Jiang, C. (2021). Single-cell RNA sequencing identify SDCBP in ACE2-positive bronchial epithelial cells negatively correlates with COVID-19 severity. Journal of cellular and molecular medicine, 25(14), 7001–7012. https://doi.org/10.1111/jcmm.16714

[8]:https://doi.org/10.1016/j.kint.2020.08.007
8. Berchtold, L., Letouzé, E., Alexander, M. P., Canaud, G., Logt, A. V., Hamilton, P., Mousson, C., Vuiblet, V., Moyer, A. M., Guibert, S., Mrázová, P., Levi, C., Dubois, V., Cruzado, J. M., Torres, A., Gandhi, M. J., Yousfi, N., Tesar, V., OndrejViklický, Hourmant, M., … Ronco, P. (2021). HLA-D and PLA2R1 risk alleles associate with recurrent primary membranous nephropathy in kidney transplant recipients. Kidney international, 99(3), 671–685. https://doi.org/10.1016/j.kint.2020.08.007

[9]:https://doi.org/10.1007/s12072-023-10608-8
9. Chen, L., Zhao, Y., Li, M., & Lv, G. (2023). Proteome-wide Mendelian randomization highlights AIF1 and HLA-DQA2 as targets for primary sclerosing cholangitis. Hepatology international, 10.1007/s12072-023-10608-8. Advance online publication. https://doi.org/10.1007/s12072-023-10608-8

[10]:https://doi.org/10.1186/s12864-023-09227-2
10. Wang, M., Wu, J., Lei, S., & Mo, X. (2023). Genome-wide identification of RNA modification-related single nucleotide polymorphisms associated with rheumatoid arthritis. BMC genomics, 24(1), 153. https://doi.org/10.1186/s12864-023-09227-2

[11]:https://doi.org/10.1186/s12969-023-00787-x
11. Imbach, K. J., Treadway, N. J., Prahalad, V., Kosters, A., Arafat, D., Duan, M., Gergely, T., Ponder, L. A., Chandrakasan, S., Ghosn, E. E. B., Prahalad, S., & Gibson, G. (2023). Profiling the peripheral immune response to ex vivo TNF stimulation in untreated juvenile idiopathic arthritis using single cell RNA sequencing. Pediatric rheumatology online journal, 21(1), 17. https://doi.org/10.1186/s12969-023-00787-x

[12]:https://doi.org/10.1177/0961203312470183
12. Chai, H. C., Phipps, M. E., Othman, I., Tan, L. P., & Chua, K. H. (2013). HLA variants rs9271366 and rs9275328 are associated with systemic lupus erythematosus susceptibility in Malays and Chinese. Lupus, 22(2), 198–204. https://doi.org/10.1177/0961203312470183

[13]:https://doi.org/10.1038/s41416-023-02419-3
13. Yang, Y., Xu, S., Jia, G., Yuan, F., Ping, J., Guo, X., Tao, R., Shu, X. O., Zheng, W., Long, J., & Cai, Q. (2023). Integrating genomics and proteomics data to identify candidate plasma biomarkers for lung cancer risk among European descendants. British journal of cancer, 129(9), 1510–1515. https://doi.org/10.1038/s41416-023-02419-3

[14]:https://doi.org/10.3389/fonc.2023.1150098
14. Liu, J., Ji, Y., Weng, X., Shao, W., Zhao, J., Chen, H., Shen, L., Wang, F., Meng, Q., Wu, X., Wang, X., Ou, Q., & Ke, H. (2023). Immune microenvironment analysis and novel biomarkers of early-stage lung adenocarcinoma evolution. Frontiers in oncology, 13, 1150098. https://doi.org/10.3389/fonc.2023.1150098

[15]:https://doi.org/10.1038/s41598-017-18241-w
15. Khor, S. S., Morino, R., Nakazono, K., Kamitsuji, S., Akita, M., Kawajiri, M., Yamasaki, T., Kami, A., Hoshi, Y., Tada, A., Ishikawa, K., Hine, M., Kobayashi, M., Kurume, N., Kamatani, N., Tokunaga, K., & Johnson, T. A. (2018). Genome-wide association study of self-reported food reactions in Japanese identifies shrimp and peach specific loci in the HLA-DR/DQ gene region. Scientific reports, 8(1), 1069. https://doi.org/10.1038/s41598-017-18241-w

[16]:https://doi.org/10.1038/ncomms7304
16. Hong, X., Hao, K., Ladd-Acosta, C., Hansen, K. D., Tsai, H. J., Liu, X., Xu, X., Thornton, T. A., Caruso, D., Keet, C. A., Sun, Y., Wang, G., Luo, W., Kumar, R., Fuleihan, R., Singh, A. M., Kim, J. S., Story, R. E., Gupta, R. S., Gao, P., … Wang, X. (2015). Genome-wide association study identifies peanut allergy-specific loci and evidence of epigenetic mediation in US children. Nature communications, 6, 6304. https://doi.org/10.1038/ncomms7304

[17]:https://doi.org/10.16288/j.yczz.22-293
17. Zhang, J., Liu, K. H., Zhang, Y., Hao, J. P., Zhang, G. F., Xu, X. Y., Chang, J., Liu, X. P., Yang, X. Y., & Ye, J. (2023). Application of transcriptome in time analysis and donor characterization in blood samples. Yi chuan = Hereditas, 45(1), 52–66. https://doi.org/10.16288/j.yczz.22-293






In [9]:
def numero_de_hits(blast_record):
    
    '''
    Imprime o número de hits no resultado do BLAST

    Parâmetros:
    blast_record 
        Objeto que representa os resultados do Blast

    Prints:
    Número de Hits - int
        Número total de alinhamentos encontrados durante a busca BLAST.
    '''

    print('Número de Hits: ', len(blast_record.alignments))



def primeiro_alinhamento(blast_record):
    
    '''
    Imprime informações sobre o primeiro alinhamento do resultado do BLAST.

    Parâmetros:
    blast_record 
        Objeto que representa os resultados do BLAST

    Prints:
    Primeiro Alinhamento:
    
    Acession - str
        Número de acesso associado
    
    Hit Id - str
        Identificador único associado 
    
    Definição - str
        Definição 
    
    Length - int
        Comprimento 
    
    HSPs - int
        Número de High Scoring Pairs (HSPs)
    
    E-value - float
        Valor de E associado ao primeiro HSP
    
    Score - float
        Pontuação do primeiro HSP
    
    Length - int
        Comprimento do alinhamento do primeiro HSP
    '''
    
    
    # Obtém o primeiro alinhamento do BLAST
    first_alignment = blast_record.alignments[0]

    # Imprime informações sobre o primeiro alinhamento
    print('Primeiro Alinhamento:')
    print('Acession: ', first_alignment.accession)
    print('Hit Id: ', first_alignment.hit_id)
    print('Definição: ', first_alignment.hit_def)
    print('Length: ', first_alignment.length)
    print('HSPs: ', len(first_alignment.hsps))

    # Obtém o primeiro HSP (High Scoring Pair) do primeiro alinhamento
    first_hsp = first_alignment.hsps[0]

    # Imprime informações sobre o primeiro HSP
    print('E-value: ', first_hsp.expect)
    print('Score: ', first_hsp.score)
    print('Length: ', first_hsp.align_length)

# Chamar as funções
br_nr = resultado_blast('DQA2-NR-BLAST.xml')
br_sw = resultado_blast('DQA2-NR-SWISS.xml')

num_alinhamentos

Número de Hits:  50


In [10]:
def alinhamentos(blast_record, num_alinhamentos=5):
    '''
    Imprime informações sobre os alinhamentos no resultado da busca BLAST.

    Parâmetros:
    blast_record 
        Objeto que representa os resultados do BLAST

    num_alinhamentos : int
        Número máximo de alinhamentos

    Prints:
    Informações sobre os alinhamentos:
            Sequence: str
                Título
            Accession: str
                Número de acesso
            Definition: str
                Definição
            E-Value: float
                Valor de E associado 
    '''
    for i in range(min(num_alinhamentos, len(blast_record.alignments))):
        alignment = blast_record.alignments[i]
        print(f'Alinhamento {i + 1}:')
        print('Sequence: ', alignment.title)
        print('Accession: ', alignment.accession)
        print('Definition: ', alignment.hit_def)
        for hsp in alignment.hsps:
            print('E-Value: ', hsp.expect)
            print (hsp.query[0:75])
            print( hsp.match[0:75])
            print( hsp.sbjct[0:75])
        print('\n')

# Chama as funções
alinhamentos(br_nr, num_alinhamentos=5)

Alinhamento 1:
Sequence:  ref|NP_064440.1| HLA class II histocompatibility antigen, DQ alpha 2 chain precursor [Homo sapiens] >sp|P01906.2| RecName: Full=HLA class II histocompatibility antigen, DQ alpha 2 chain; AltName: Full=DX alpha chain; AltName: Full=HLA class II histocompatibility antigen, DQ(6) alpha chain; AltName: Full=HLA-DQA1; AltName: Full=MHC class II DQA2; Flags: Precursor [Homo sapiens] >gb|AAA59605.1| MHC HLA-DX alpha precursor, partial [Homo sapiens] >gb|AQY76845.1| HLADQA2 [Homo sapiens] >gb|AQY76847.1| HLADQA2 [Homo sapiens] >gb|AQY76849.1| HLADQA2 [Homo sapiens] >gb|AQY76850.1| HLADQA2 [Homo sapiens]
Accession:  NP_064440
Definition:  HLA class II histocompatibility antigen, DQ alpha 2 chain precursor [Homo sapiens] >sp|P01906.2| RecName: Full=HLA class II histocompatibility antigen, DQ alpha 2 chain; AltName: Full=DX alpha chain; AltName: Full=HLA class II histocompatibility antigen, DQ(6) alpha chain; AltName: Full=HLA-DQA1; AltName: Full=MHC class II DQA2; Flags