## **Gene configuration**
The code uses the Biopython Bio.Entrez and Bio.SeqIO libraries to interact with the NCBI and process the genetic sequences under study, focusing on nucleotide sequences in GenBank format.

In [1]:
from Bio import Entrez
from Bio import SeqIO
from Bio.Seq import Seq
import os

# Setting up email for use in NCBI Entrez
Entrez.email = 'A.N.Other@example.com'

def download_gene(id_gene: str, name_gene: str, start=None, end=None, complement=False):
    """
    Downloads a GenBank sequence from NCBI, with the option of specifying a region and calculating the reverse complement.

    Args:
    - id_gene (str): The access ID in the NCBI database.
    - name_gene (str): Name of the file to store the sequence.
    - start (int, optional): Starting position of the region of interest.
    - end (int, optional): End position of the region of interest.
    - complement (bool, optional): If True, calculates the reverse complement of the sequence.
    """
    try:
        # Criar a pasta 'genes' se ela não existir
        if not os.path.exists("genes"):
            os.makedirs("genes")
        
        # Procura os dados da sequência no NCBI
        if start and end:
            handle = Entrez.efetch(db="nucleotide", rettype="gb", retmode="text", id=id_gene, seq_start=start, seq_stop=end)
        else:
            handle = Entrez.efetch(db="nucleotide", rettype="gb", retmode="text", id=id_gene)
        
        # Processar o registro GenBank
        seq_record = SeqIO.read(handle, "gb")
        handle.close()
        
        # Calcular o complemento reverso, se necessário
        if complement:
            seq_record.seq = seq_record.seq.reverse_complement()
        
        # Guardar a sequência na pasta 'genes_information'
        output_path = os.path.join("genes", f"{name_gene}.gb")
        SeqIO.write(seq_record, output_path, "gb")
        
        print(f"Download do arquivo GenBank do gene '{name_gene}' concluído com sucesso.")
    
    except Exception as e:
        print(f"Erro ao fazer o download do gene {id_gene}: {e}")

# Fazer o download dos genes com os parâmetros especificados
download_gene("NZ_DS483503", "butyrylCoA", start=313586, end=314932, complement=False)
download_gene("NZ_DS483503", "ptsP", start=23763, end=25406, complement=True)


Download do arquivo GenBank do gene 'butyrylCoA' concluído com sucesso.
Download do arquivo GenBank do gene 'ptsP' concluído com sucesso.


O código utiliza a biblioteca Biopython Bio.Entrez e Bio.SeqIO para interagir com o NCBI e fazer download das sequências dos genes, focando-se em sequências em formato FASTA.

In [None]:
import os
from Bio import Entrez
from Bio import SeqIO

Entrez.email = 'A.N.Other@example.com'

def download_fasta(gene_id, filename):
    """
    Faz o download do arquivo FASTA com as sequências dos genes e guarda na pasta 'genes'.

    Args:
    - gene_id (str): O ID do gene no banco de dados NCBI.
    - filename (str): Nome do arquivo para guardar a sequência FASTA.
    """
    try:
        # Criar a pasta 'genes' se ela não existir
        if not os.path.exists("genes"):
            os.makedirs("genes")
        
        # Caminho completo para guardar o arquivo
        file_path = os.path.join("genes", filename)
        
        # Procurar e guardar a sequência FASTA
        handle = Entrez.efetch(db="protein", id=gene_id, rettype="fasta", retmode="text")
        with open(file_path, "w") as out_file:
            out_file.write(handle.read())
        handle.close()
        
        print(f"Download do FASTA do gene {gene_id} completado e salvo em {file_path}.")
    except Exception as e:
        print(f"Erro ao fazer o download do gene {gene_id}: {e}")

# Fazer o download dos genes FASTA com os parâmetros especificados
download_fasta('WP_044960620', 'butyrylCoA.fasta')
download_fasta('WP_005925321', 'ptsP.fasta')


Download do FASTA do gene WP_044960620 completado e salvo em genes\butyrylCoA.fasta.
Download do FASTA do gene WP_005925321 completado e salvo em genes\ptsP.fasta.
