## SeqIO

**Bio.SeqIO** es una interfaz común entre los archivos de entrada y salida. Las secuencias recuperadas con esta interfaz son pasados a tu programa como objetos de SeqRecord. Bio.SeqIO puede también leer archivos de alineamientos y regresar cada registro como un objeto SeqRecord. Para recuperar un alineamiento como un objeto Alignment, puedes usar el módulo Bio.AlignIO. 

El método usado para leer secuencias es **parse(file_handle, format)**. Donde format puede ser "fasta", "genbank" u otro de los que aparecen aquí (https://biopython.org/wiki/SeqIO). Los elementos regresados por este generador son de tipo **SeqRecord**.

In [1]:
from Bio import SeqIO

In [2]:
f_in = open('samples/a19.gp')

In [3]:
seq = SeqIO.parse(f_in, 'genbank')
next(seq)

SeqRecord(seq=Seq('MGHHHHHHHHHHSSGHIDDDDKHMLEMDSTNVRSGMKSRKKKPKTTVIDDDDDC...FAS'), id='AAX78491.1', name='AAX78491', description='unknown [synthetic construct]', dbxrefs=[])

A continuación se muestra como se puede leer un archivo con varias secuencias FASTA y mostrar el título y longitud de cada entrada.

In [7]:
FILE_IN = 'samples/3seqs.fas'

with open(FILE_IN) as fh:
    for record in SeqIO.parse(fh, 'fasta'):
        id_ = record.id
        seq = record.seq
        print('Name: {0}, size: {1}'.format(id_, len(seq)))

Name: Protein-X, size: 38
Name: Protein-Y, size: 62
Name: Protein-Z, size: 60


SeqIO tiene un método para escribir secuencias: **write(iterable, file_handle, format)**. El primer parámetro que esta función toma es un objeto iterable con los objetos SeqRecords (e.g., una lista de objetos SeqRecord). El segundo parámetro es el archivo que será usado para escribir las secuencias. El argumento format trabaja como en **parse**.

In [5]:
from Bio.Seq import Seq
from Bio.SeqRecord import SeqRecord

In [6]:
with open('samples/NC2033.txt') as fh:
    with open('output/NC2033.fasta', 'w') as f_out:
        rawseq = fh.read().replace('\n','')
        record = (SeqRecord(Seq(rawseq), 'NC2033.txt','',''),)
        SeqIO.write(record, f_out, 'fasta')