## **Análise de genes**
Este código define uma função *analyze_gene* que realiza uma análise detalhada de um arquivo GenBank. 

In [1]:
from Bio import SeqIO
from Bio.Seq import Seq
from Bio.SeqRecord import SeqRecord

def analyze_gene(file_path, gene_name):
    """
    Reads and analyzes a GenBank file to extract gene-related information.

    Inputs:
        file_path (str): Path to the GenBank file containing the gene data.
        gene_name (str): Name of the gene being analyzed.

    Outputs:
        - Prints detailed information about the gene, including:
            - Sequence length
            - ID, description, and name
            - Taxonomy details (organism and lineage)
            - Number and details of genomic features
    """
    
    gene = SeqIO.read(file_path, "genbank")
    
    print(f"## Análise do gene {gene_name}")
    print(f"Comprimento: {len(gene.seq)} pb")
    print(f"ID: {gene.id}")
    print(f"Descrição: {gene.description}")
    print(f"Nome: {gene.name}")
    
    print("\n### Taxonomia:")
    print(f"Organismo: {gene.annotations['source']}")
    print(f"Linhagem: {' > '.join(gene.annotations['taxonomy'])}")
    
    print(f"\n### Número total de Features: {len(gene.features)}")
    
    gene_features = sum(1 for feature in gene.features if feature.type == "gene")
    print(f"Número de Features do tipo 'gene': {gene_features}")
    
    print("\n### Features:")
    for i, feature in enumerate(gene.features):
        print(f"\nFeature {i}:")
        print(f"Tipo: {feature.type}")
        print(f"Localização: {feature.location}")
        print("Qualifiers:")
        for key, value in feature.qualifiers.items():
            print(f"  {key}: {value}")
    print("\n")

#### **1: Gene ptsP**

In [2]:
# Analisar o gene ptsP
analyze_gene("genes/ptsP.gb", "ptsP")

## Análise do gene ptsP
Comprimento: 1644 pb
ID: NZ_DS483503.1
Descrição: Faecalibacterium prausnitzii M21/2 Scfld_02_24, whole genome shotgun sequence
Nome: NZ_DS483503

### Taxonomia:
Organismo: Faecalibacterium prausnitzii M21/2
Linhagem: Bacteria > Bacillati > Bacillota > Clostridia > Eubacteriales > Oscillospiraceae > Faecalibacterium

### Número total de Features: 3
Número de Features do tipo 'gene': 1

### Features:

Feature 0:
Tipo: source
Localização: [0:1644](+)
Qualifiers:
  organism: ['Faecalibacterium prausnitzii M21/2']
  mol_type: ['genomic DNA']
  strain: ['M21/2']
  isolation_source: ['biological product [ENVO:02000043]']
  host: ['Homo sapiens']
  db_xref: ['taxon:411485']

Feature 1:
Tipo: gene
Localização: [0:1644](-)
Qualifiers:
  gene: ['ptsP']
  locus_tag: ['FAEPRAM212_RS10210']
  old_locus_tag: ['FAEPRAM212_02497']
  db_xref: ['GeneID:75068783']

Feature 2:
Tipo: CDS
Localização: [0:1644](-)
Qualifiers:
  gene: ['ptsP']
  locus_tag: ['FAEPRAM212_RS10210']
  old_

### **2. Gene ButyrylCoA**

In [3]:
# Analisar o gene ButyrylCoA
analyze_gene("genes/ButyrylCoA.gb", "ButyrylCoA")

## Análise do gene ButyrylCoA
Comprimento: 1347 pb
ID: NZ_DS483503.1
Descrição: Faecalibacterium prausnitzii M21/2 Scfld_02_24, whole genome shotgun sequence
Nome: NZ_DS483503

### Taxonomia:
Organismo: Faecalibacterium prausnitzii M21/2
Linhagem: Bacteria > Bacillati > Bacillota > Clostridia > Eubacteriales > Oscillospiraceae > Faecalibacterium

### Número total de Features: 3
Número de Features do tipo 'gene': 1

### Features:

Feature 0:
Tipo: source
Localização: [0:1347](+)
Qualifiers:
  organism: ['Faecalibacterium prausnitzii M21/2']
  mol_type: ['genomic DNA']
  strain: ['M21/2']
  isolation_source: ['biological product [ENVO:02000043]']
  host: ['Homo sapiens']
  db_xref: ['taxon:411485']

Feature 1:
Tipo: gene
Localização: [0:1347](+)
Qualifiers:
  locus_tag: ['FAEPRAM212_RS11550']
  old_locus_tag: ['FAEPRAM212_02812']
  db_xref: ['GeneID:75069048']

Feature 2:
Tipo: CDS
Localização: [0:1347](+)
Qualifiers:
  locus_tag: ['FAEPRAM212_RS11550']
  old_locus_tag: ['FAEPRAM212_0281

### **3. Gene MutS Domain I**

In [4]:
analyze_gene("genes/MutS.gb", "MutS")

## Análise do gene MutS
Comprimento: 8106 pb
ID: NZ_DS483503.1
Descrição: Faecalibacterium prausnitzii M21/2 Scfld_02_24, whole genome shotgun sequence
Nome: NZ_DS483503

### Taxonomia:
Organismo: Faecalibacterium prausnitzii M21/2
Linhagem: Bacteria > Bacillati > Bacillota > Clostridia > Eubacteriales > Oscillospiraceae > Faecalibacterium

### Número total de Features: 5
Número de Features do tipo 'gene': 2

### Features:

Feature 0:
Tipo: source
Localização: [0:8106](+)
Qualifiers:
  organism: ['Faecalibacterium prausnitzii M21/2']
  mol_type: ['genomic DNA']
  strain: ['M21/2']
  isolation_source: ['biological product [ENVO:02000043]']
  host: ['Homo sapiens']
  db_xref: ['taxon:411485']

Feature 1:
Tipo: gene
Localização: [1050:>1296](+)
Qualifiers:
  locus_tag: ['FAEPRAM212_RS16180']
  pseudo: ['']
  db_xref: ['GeneID:89458251']

Feature 2:
Tipo: CDS
Localização: [1050:>1296](+)
Qualifiers:
  locus_tag: ['FAEPRAM212_RS16180']
  inference: ['COORDINATES: protein motif:HMM:NF013765.