Esta é uma script em jupyter para fazer pequenas funções e depois passar para a script em python.

In [3]:
#Dar import a packages
from Bio import SeqIO, SeqFeature
from Bio.Seq import Seq
from Bio.SeqRecord import SeqRecord
from Bio.Blast import NCBIXML, NCBIWWW 

Função para fazer um NCBI blast apartir de um file (pode-se escolher o tipo de blast, database e outros parâmetros)

In [20]:
def blast(file_name, file_format = "fasta", program = "blastn", database = "nt", e_value = 0.05, hitlist_size = 50):
    """
    Realiza o BLAST de uma sequência contida em um arquivo.
    
    Parameters:
        file_name (str): Nome do arquivo contendo a sequência.
        file_format (str): Formato do arquivo (padrão: 'fasta').
        program (str): Programa BLAST a ser usado (padrão: 'blastn').
        database (str): Banco de dados para busca (padrão: 'nt').
        e_value (float): Limite de valor E para busca (padrão: 0.05).
        hitlist_size (int): Número de hits a serem retornados (padrão: 50).
    
    Returns:
        Um handle com os resultados do BLAST, ou None em caso de erro.
    """
    
    try:
        #lê o arquivo
        record = SeqIO.read(open(file_name), format = file_format)

        #Começa o blast remoto
        print("BLASTing...")
        result_handle = NCBIWWW.qblast(program, database, record.format("fasta"), expect = e_value, hitlist_size = 50)

        #returns result handle
        print("BLAST concluído com sucesso.")
        return result_handle
    
    except Exception as e:
        print(f"Erro ao executar o BLAST: {e}")
        return None

Função que utiliza função blast, mas guardar o output num file.

In [19]:
def get_blast(file_name, output_name = "blast_result", file_format = "fasta", program = "blastn", database = "nt", e_value = 0.05, hitlist_size = 50):
    """
    Realiza o BLAST usando a função `blast` e salva os resultados em um arquivo.
    
    Parameters:
        file_name (str): Nome do arquivo contendo a sequência.
        output_name (str): Nome do arquivo para salvar os resultados.
        Outros parâmetros são os mesmos da função `blast`.
    """

    result_handle = blast(file_name, file_format, program, database, e_value, hitlist_size)

    if result_handle is not None:
        try:
            # Salva os resultados em um arquivo XML
            with open(f"{output_name}.xml", "w") as save_file:
                save_file.write(result_handle.read())
                print(f"Resultados salvos em {output_name}.xml.")

        except Exception as e:
            print(f"Erro ao salvar os resultados: {e}")

        finally:
            result_handle.close()
    

Teste da função *get_blast* e *blast*

In [None]:
get_blast("genes_fasta/comS.fasta", output_name ="comS")

BLASTing...
BLAST concluído com sucesso.
Resultados salvos em comS.xml.
