# Tarea Secuencias y Formatos
Creen una función llamada resumen que a partir del path de un archivo genbank y una lista de genes imprima:

* Organismo
* Versión de la secuencia
* Fuente del aislado
* País

Para cada gen en la lista:
* Nombre del gen
* Los primeros 15 nucleótidos de ADN
* Los primeros 15 nucleótidos de ARN
* Los primeros 15 aminoácidos de proteína


Ejemplo:

```
> resumen("files/clase_2/archivo.gb", genes=['X','Y'])
# Organismo: Hepatitis B virus
# Fecha: 15-MAY-2012
# País: India
# Aislado: 11851
# Gen_1: X
# ADN: ATGGCTGCTAGGTTG
# ARN: AUGGCUGCUAGGUUG
# Proteína: MAARL
# Gen_2: Y
# ADN: ATGGTGCGCGCGGC
# ARN: ...
# Proteína: ...

```

In [120]:
# Resumen es una función que recibe como parámetros un "path" a un archivo determiado y una lista de genes
def Resumen(path, genes):

    #Parseamos el archivo 
    for gb_record in SeqIO.parse(path, "genbank"):

        #Se imprime el organismo, fecha, país y aislado
        print('Organismo: ', gb_record.annotations['organism'],'\n')
        print('Fecha: ', gb_record.annotations['date'],'\n')
        print('Pais: ', gb_record.features[0].qualifiers['country'],'\n')
        #El archivo 'virus.gb' no contiene numero de aislado (ni en annotations ni en features)
        #Por ello se remplazó por la fuente del aislado 
        print('Aislado: ', gb_record.features[0].qualifiers['isolation_source'],'\n')

        #Con un for recorremos los features (desde la posición 1 y saltando los CDS)
        for i in range(1, len(gb_record.features),2):
          
          #Recorremos la lista de genes a buscar
          for gene in genes:

            #Si el gen de la lista y el gen del archivo coinciden, la afirmación es verdadera y se imprime
            if gb_record.features[i].qualifiers['gene'][0] == gene:

              print('Gen: ', gb_record.features[i].qualifiers['gene'])
              # se crean la variable a y b para indicar los (primeros) 15 nucleótidos requeridos
              a = gb_record.features[i].location.nofuzzy_start
              b = a + 15
              #Se imprime la secuencia de DNA
              print('ADN: ', gb_record.seq[a:b])
              #Se imprime la secuencia de RNA
              print('ARN: ', gb_record.seq[a:b].transcribe())
              #Se imprime la proteína
              print('Proteína: ', gb_record.seq[a:b].translate(), '\n')
              

In [121]:
path = "/content/virus.gb"
genes = ['P', 'G', 'L']
Resumen(path, genes)

Organismo:  Isfahan virus 

Fecha:  13-AUG-2018 

Pais:  ['Iran:Isfahan province'] 

Aislado:  ['Phlebotomus papatasi'] 

Gen:  ['P']
ADN:  ATGTCTCGACTCAAC
ARN:  AUGUCUCGACUCAAC
Proteína:  MSRLN 

Gen:  ['G']
ADN:  ATGACTTCAGTCTTA
ARN:  AUGACUUCAGUCUUA
Proteína:  MTSVL 

Gen:  ['L']
ADN:  ATGGATGAGTACTCT
ARN:  AUGGAUGAGUACUCU
Proteína:  MDEYS 

