# Ejercicio 1

Escribe un programa que tome un fichero FASTA con varias secuencias
de ADN y calcule el contenido de GC en porcentaje de cada una y lo
muestre por pantalla.
A continuación produzca las cadenas de aminoácidos asociadas a cada
secuencia de ADN.
Por último escriba estas secuencias de aminoácidos en un archivo
FASTA utilizando como identificadores y descripciones las originales
del archivo.


In [2]:
from Bio import SeqIO
from Bio.SeqRecord import SeqRecord
import warnings
warnings.filterwarnings("ignore")

in_fasta = "dna_seqs.fasta"
out_fasta = "proteins.fasta"

protein_records = []

registros = SeqIO.parse(in_fasta, "fasta")

try:
    while True:
        registro_secuencia = next(registros)
        print(f"\nID: {registro_secuencia.id}")

        seq = registro_secuencia.seq.upper()
        total = len(seq)
        count_GC = seq.count("G") + seq.count("C")
        porcentaje_GC = (count_GC / total) * 100 if total > 0 else 0

        protein_seq = registro_secuencia.seq.translate(table=1, to_stop=True)

        print(f"Cadena de aminoácidos: {protein_seq}")
        print(f"Longitud: {total}")
        print(f"GC count: {count_GC}")
        print(f"GC%: {porcentaje_GC:.2f}")

        prot_record = SeqRecord(
            protein_seq,
            id=registro_secuencia.id,
            description=registro_secuencia.description
        )
        protein_records.append(prot_record)

except StopIteration:
    print("\nNo hay más secuencias en el fichero")

SeqIO.write(protein_records, out_fasta, "fasta")
print(f"\nSe escribieron {len(protein_records)} secuencias de proteínas en {out_fasta}")



ID: seq1_human
Cadena de aminoácidos: MRT
Longitud: 50
GC count: 25
GC%: 50.00

ID: seq2_mouse
Cadena de aminoácidos: MAS
Longitud: 50
GC count: 25
GC%: 50.00

ID: seq3_bacteria
Cadena de aminoácidos: MRS
Longitud: 51
GC count: 25
GC%: 49.02

No hay más secuencias en el fichero

Se escribieron 3 secuencias de proteínas en proteins.fasta


# Ejercicio 2

In [None]:
from Bio import SeqIO
from pathlib import Path

protein_dir = Path("proteins")

proteins = {
    "Oxitocina": protein_dir / "oxytocin.fasta",
    "Colágeno": protein_dir / "collagen.fasta",
    "Queratina": protein_dir / "keratin.fasta"
}

print("Se han tomado como proteínas las siguientes:")
print("- Oxitocina: hormona relacionada con el afecto, el parto y la lactancia.")
print("- Colágeno: proteína estructural que da soporte y resistencia a tejidos.")
print("- Queratina: proteína fibrosa que forma parte del cabello, uñas y piel.\n")

for name, filepath in proteins.items():
    record = SeqIO.read(filepath, "fasta")
    print(f"> {name}")
    print(record.seq)
    print()

## Se han tomado como proteínas las siguientes:


- **Oxitocina**: hormona relacionada con el afecto, el parto y la lactancia.
- **Colágeno**: proteína estructural que da soporte y resistencia a tejidos.
- **Queratina**: proteína fibrosa que forma parte del cabello, las uñas y la piel.