# Biopython - Python tools for Computational Molecular Biology

More information: http://biopython.org/wiki/SeqIO

## SeqIO  - Sequence Input/Output

More information: http://biopython.org/wiki/SeqIO

### SeqIO için temel kullanım

In [None]:
from Bio import SeqIO

# SeqIO.read fonksiyonu sadece tek dizili dosyalar için kullanılabilir
record = SeqIO.read('one_seq_prot.fasta', 'fasta')

In [None]:
type(record)

In [None]:
# Fonksiyonun tüm metod ve niteliklerini yazdırmak için(method-attributes)
dir(record)

In [None]:
print(record)

In [None]:
record.id

In [None]:
record.seq

In [None]:
print(record.seq)

In [None]:
record.description

In [None]:
record = SeqIO.read('one_seq_nucl.fasta', 'fasta')

In [None]:
print(record.seq)

In [None]:
# Reverse complement zinciri bulmak için teknik
print(str(record.reverse_complement()))

In [None]:
# SeqIO.parse eğer dosyamız da birden fazla dizi var ise bu fonksiyonu kullanırız.
records = SeqIO.parse('rab20.fasta', 'fasta')

In [None]:
# Tüm nesneleri yazdırmak için
for record in records:
    print(record)

In [None]:
# Tüm IDs'leri yazdırmak için kullanırız ama çalışmadı neden?
for record in records:
    print(record.id)

# Verimizi tekrar yüklememiz gerekiyor! Nesne kaydetme operatörleri generator olarak görev görür!!    

In [None]:
records = SeqIO.parse('rab20.fasta', 'fasta')
for record in records:
    print(record.id)

In [None]:
# Eğer sadece tek bir dizi ile çalışıyorsak next fonksiyonunu kullanabiliriz.
record = next(records)

In [None]:
record.description

In [None]:
records = SeqIO.parse('rab20.fasta', 'fasta')
record = list(records)[0]

In [None]:
# SeqIO.to_dict, fasta uzantılı dosyamızı sözlük biçiminde almak için kullanırız format şekli ID:dizi şeklindedir.
from Bio import SeqIO
record_dict = SeqIO.to_dict(SeqIO.parse('rab20.fasta', 'fasta'))

In [None]:
# SeqIO.to_dict kullanmadan fasta uzantılı dosyadan sözlük yapısı oluşturma.
record_dict = {}
for record in SeqIO.parse('rab20.fasta', 'fasta'):
    record_dict[record.id] = record.seq

In [None]:
record_dict['NP_001086022.1']

In [None]:
record_dict['NP_001086022.1'].seq

In [5]:
with open('test_out.fasta', 'w') as res:
    for record in SeqIO.parse("rab20.fasta", 'fasta'):
        res.write(f'>{record.id}\n{record.seq}\n')

In [2]:
# SeqIO.write fonksiyonunu dosyaya yazmak için kullanabiliriz ama çıktıyı manipule etme imkanımız azalır.
from Bio import SeqIO
sequences = SeqIO.parse('rab20.fasta', 'fasta')

with open("test_out.fasta", 'w') as res:
    SeqIO.write(sequences, res, 'fasta')

In [None]:
# 230 aa'dan uzun olan dizileri bulmamızı sağlayan kod bloğu
sequences = SeqIO.parse('rab20_ncbi.fasta', 'fasta')

with open("longer_than_230.fasta", 'w') as res:
    for record in sequences:
        if len(record.seq) > 230:
            res.write('>{} longer than 230 \n{}\n'.format(record.name, record.seq))            

In [None]:
# SeqIO fonksiyonunu format dönüşüm  işlemlerinde kullanabiliriz.
from Bio import SeqIO
SeqIO.convert("cor6_6.gb", "genbank", "cor6_6.fasta", "fasta")