 # Ejercicio 1: Síntesis de proteínas (Biopython)

Javier Orlando García Suárez

A continuación, se realiza la sintesís de proteínas a partir de una librería llamada Biopython, la cual tiene una gran utilidad en tares relacionadas con la bioinformática, enlace al manual de dicha librería: http://biopython.org/DIST/docs/tutorial/Tutorial.html


Librerías utilizadas (instalar Biopython)

In [8]:

from Bio import SeqIO
from Bio import Entrez
from Bio.Seq import Seq


Usamos una clase Seq() proveniente de Biopython, la cual simula mejor el comportamiento del ADN ya que, al contario de una simple cadena de texto, es inmutable (aunque es posible generar mutaciones con funciones de la librería) y además, permite realizar todas las acciones que tienen que ver con el ADN tales como replicación, transcripción y traducción

In [9]:
dna = Seq("ATGGCCATTGTAATGGGCCGCTGAAAGGGTGCCCGATAG")
template_dna = dna.reverse_complement() # Replicación
arn = dna.transcribe() # Transcripción
aminoacids = dna.translate() # Traducción
print("La cadena de ADN es:",dna)
print("La hebra complementaria de ADN es:",template_dna)
print("La cadena de ARN es:",arn)
print("La secuencia de aminoacidos es:",aminoacids)

La cadena de ADN es: ATGGCCATTGTAATGGGCCGCTGAAAGGGTGCCCGATAG
La hebra complementaria de ADN es: CTATCGGGCACCCTTTCAGCGGCCCATTACAATGGCCAT
La cadena de ARN es: AUGGCCAUUGUAAUGGGCCGCUGAAAGGGUGCCCGAUAG
La secuencia de aminoacidos es: MAIVMGR*KGAR*


Además, puedes conectarte a diversas bases de datos de proteínas para obtener información de alguna de ellas, en este caso, se accede mediante un identificador y te permite obtener una breve descripción, número de características, secuencia de ADN de la que proviene y secuencia de aminoacidos que la codifica, entre otras muchas cosas.

In [10]:

Entrez.email = 'A.N.Other@example.com'
handle = Entrez.efetch(db="nucleotide", id="EU490707", rettype="gb", retmode="text")
record = SeqIO.read(handle, "genbank")
handle.close()
print("Descripción:",record.description)
print("La cadena de ADN que corresponde a la proteína es:",record.reverse_complement())
print("La secuencia de aminoacidos es:",record.seq.translate())


Descripción: Selenipedium aequinoctiale maturase K (matK) gene, partial cds; chloroplast
La cadena de ADN que corresponde a la proteína es: ID: <unknown id>
Name: <unknown name>
Description: <unknown description>
Number of features: 3
Seq('TTCTTCTTCCATAAAGAATTCTTCTAATAATCCCGAACCTAATCTTCGCATAAA...AAT')
La secuencia de aminoacidos es: IFYEPVEIFGYDNKSSLVLVKRLITRMYQQNFLISSVNDSNQKGFWGHKHFFSSHFSSQMVSEGFGVILEIPFSSQLVSSLEEKKIPKYQNLRSIHSIFPFLEDKFLHLNYVSDLLIPHPIHLEILVQILQCRIKDVPSLHLLRLLFHEYHNLNSLITSKKFIYAFSKRKKRFLWLLYNSYVYECEYLFQFLRKQSSYLRSTSSGVFLERTHLYVKIEHLLVVCCNSFQRILCFLKDPFMHYVRYQGKAILASKGTLILMKKWKFHLVNFWQSYFHFWSQPYRIHIKQLSNYSFSFLGYFSSVLENHLVVRNQMLENSFIINLLTKKFDTIAPVISLIGSLSKAQFCTVLGHPISKPIWTDFSDSDILDRFCRICRNLCRYHSGSSKKQVLYRIKYILRLSCARTLARKHKSTVRTFMRRLGSGLLEEFFMEEE


Considero que esta librería tiene mucho potencial en el área de la bioinformática y continuaré investigando sobre la misma en las siguientes prácticas