In [4]:
from Bio import Entrez
from Bio import SeqIO
Entrez.email = 'A.N.Other@example.com'

def download_gene(id_gene: str, name_gene: str, start=None, end=None):
    
    if start and end:
        handle = Entrez.efetch(db="nucleotide", rettype="gb", retmode="text", id=id_gene, seq_start=start, seq_stop=end)
    else:
        handle = Entrez.efetch(db="nucleotide", rettype="gb", retmode="text", id=id_gene)
    
    for seq_record in SeqIO.parse(handle, "gb"):
        SeqIO.write(seq_record, "{}.gb".format(name_gene), "gb")
        print(f"Download do GENBANK do gene {name_gene} completo.")


download_gene("NZ_DS483503", "ptsP", start=23763, end=25406, complement=True)

TypeError: download_gene() got an unexpected keyword argument 'complement'

In [5]:
from Bio import Entrez
from Bio import SeqIO
from Bio.Seq import Seq
Entrez.email = 'A.N.Other@example.com'

def download_gene(id_gene: str, name_gene: str, start=None, end=None, complement=False):
    """
    Faz o download de uma sequência GenBank do NCBI, com opção de especificar uma região e calcular o complemento.
    
    Args:
    - id_gene (str): O ID de acesso no banco de dados NCBI.
    - name_gene (str): Nome para salvar o arquivo de saída.
    - start (int, opcional): Posição inicial da região de interesse.
    - end (int, opcional): Posição final da região de interesse.
    - complement (bool, opcional): Se True, calcula o complemento reverso da sequência.
    """
    try:
        # Decide se baixa a sequência completa ou uma subsequência
        if start and end:
            handle = Entrez.efetch(db="nucleotide", rettype="gb", retmode="text", id=id_gene, seq_start=start, seq_stop=end )
        else:
            handle = Entrez.efetch(db="nucleotide", rettype="gb", retmode="text", id=id_gene  )
        
        # Processa e salva a sequência
        seq_record = SeqIO.read(handle, "gb")  # Assume que retorna apenas um registro
        
        # Calcula o complemento reverso, se necessário
        if complement:
            seq_record.seq = seq_record.seq.reverse_complement()
        
        # Salva o arquivo GenBank
        SeqIO.write(seq_record, f"{name_gene}.gb", "gb")
        print(f"Download do GENBANK do gene '{name_gene}' completo.")
    
    except Exception as e:
        print(f"Erro ao fazer o download do gene {id_gene}: {e}")


download_gene("NZ_DS483503", "butyrylCoA", start=313586, end=314932, complement= False)
download_gene("NZ_DS483503", "ptsP", start=23763, end=25406, complement=True)


Download do GENBANK do gene 'butyrylCoA' completo.
Download do GENBANK do gene 'ptsP' completo.


In [10]:
#Função para fazer download do ficheiro FASTA com as sequências dos genes
from Bio import Entrez
from Bio import SeqIO
Entrez.email = 'A.N.Other@example.com'
def download_fasta(gene_id, filename):
    try:
        handle = Entrez.efetch(db="protein", id=gene_id, rettype="fasta", retmode="text")
        with open(filename, "w") as out_file:
            out_file.write(handle.read())
        handle.close()
        print(f"Download do FASTA do gene {gene_id} completado.")
    except Exception as e:
        print(f"Erro: {e}")

download_fasta('WP_044960620','butyrylCoA.fasta')
download_fasta('WP_005925321', 'pstP.fasta')

Download do FASTA do gene WP_044960620 completado.
Download do FASTA do gene WP_005925321 completado.
