In [None]:
from Bio import Entrez, SeqIO

# Splicing Alternativo

Para comprobar la existencia de diferentes transcritos del gen FGFR2 en humanos, se ha utilizado la librería Biopython para conectarse a bases de datos biológicas como Entrez (NCBI) y extraer información genética de forma automatizada.

En este caso, se realiza una búsqueda del gen FGFR2 en la base de datos de nucleótidos, recuperando algunas de las secuencias anotadas y mostrando información relevante sobre cada una, como su identificador, descripción, longitud y productos codificados.

Con este proceso se visualizará cómo un mismo gen puede presentar múltiples variantes de ARNm, conocidas como isoformas, que se originan por splicing alternativo y dan lugar a proteínas con pequeñas diferencias estructurales y funcionales.

In [3]:
Entrez.email = "correo_ejemplo@ulpgc.es"

handle = Entrez.esearch(db="nucleotide", term="FGFR2[Gene] AND Homo sapiens[Organism]")
record = Entrez.read(handle)
ids = record["IdList"]

for seq_id in ids[:3]:  
    handle = Entrez.efetch(db="nucleotide", id=seq_id, rettype="gb", retmode="text")
    seq_record = SeqIO.read(handle, "genbank")
    print("ID:", seq_record.id)
    print("Descripción:", seq_record.description)
    print("Longitud:", len(seq_record.seq))
    print("Features:")
    for feature in seq_record.features:
        if feature.type == "CDS":
            print(" - Producto:", feature.qualifiers.get("product", ["N/A"])[0])
    print("-" * 50)


ID: NC_060934.1
Descripción: Homo sapiens isolate CHM13 chromosome 10, alternate assembly T2T-CHM13v2.0
Longitud: 134758134
Features:
--------------------------------------------------
ID: NC_000010.11
Descripción: Homo sapiens chromosome 10, GRCh38.p14 Primary Assembly
Longitud: 133797422
Features:
--------------------------------------------------
ID: XM_054365172.1
Descripción: PREDICTED: Homo sapiens fibroblast growth factor receptor 2 (FGFR2), transcript variant X9, mRNA
Longitud: 4298
Features:
 - Producto: fibroblast growth factor receptor 2 isoform X9
--------------------------------------------------


En la salida obtenida, las primeras dos entradas corresponden al cromosoma 10 humano, donde se localiza el gen FGFR2.
Sin embargo, la tercera entrada (XM_054365172.1) muestra un transcrito específico anotado como “fibroblast growth factor receptor 2, transcript variant X9, mRNA”.
La designación “variant X9” indica que existen múltiples versiones del ARNm para este gen (por ejemplo, X1, X2, X3…), lo que confirma que FGFR2 presenta diversas isoformas generadas por splicing alternativo.

Estas variantes dan lugar a proteínas ligeramente diferentes, coincidiendo con lo descrito para las isoformas FGFR2-IIIb y FGFR2-IIIc en la base de datos Ensembl.