## Blast.NCBIWWW

NCBIWWW modülü NCBI sunucularında blast işlemi yapmamızı sağlar.

Daha fazlası için: http://biopython.org/DIST/docs/tutorial/Tutorial.html

In [None]:
from Bio.Blast import NCBIWWW
from Bio import Entrez
Entrez.email = "zihaladavid@gmail.com"  # NCBI için kim olduğunuzu belirtin

# Blast edilecek dizi
seq = 'MKKPDLKVVLLGDMNVGKTSLLHRYMERRFQDTVSTVGGAFYLKQWGPYNISI\
WDTAGREQFHGLGSMYCRAASAVILTYDVSNMQSLLELEDRFLGLTDTASDDCIFAVVGNK\
IDLTEDYNSDSDIEGERPRTSSKIRRQVNLEDAFALYKRIMKYKMLDENVVPAAEKMCFET\
SAKTGYNVDVLFEGVFNMVIPLIVKKKASGLDETVNLAQSKPNKSKSRCCK'

# Blast araması için veri tabanı tipinin belirtilmesi gereklidir.
handle = NCBIWWW.qblast("blastp", "nr", sequence=seq)

# res = open("my_blast.xml", "w")
# res.write(handle.read())
# res.close()

with open("my_blast.xml", "w") as res:
    res.write(handle.read())

In [None]:
# Yukarıdakiyle benzer örnek.
from Bio import SeqIO
from Bio import Entrez
from Bio.Blast import NCBIWWW
Entrez.email = "zihaladavid@gmail.com"  # Always tell NCBI who you are

infile = "xenopus_tropicalis_rab20.fasta"
record = SeqIO.read(infile, format="fasta")

handle = NCBIWWW.qblast("blastp", "refseq_protein", record.seq)
with open(infile.split('.')[0]+ ".xml", "w") as res:
    res.write(handle.read())

In [None]:
"xenopus_tropicalis_rab20.fasta".split('.')[0] + '.new_suffix'

In [None]:
# Dosyalardan blast yapmanın kolay yolu
from Bio import SeqIO
from Bio.Blast import NCBIWWW

def ncbi_blast(seq_record):
    net_handle = NCBIWWW.qblast("blastp", "nr", sequence=seq_record.seq)
    with open (seq_record.name + '_NCBI.xml', 'w') as res:
        res.write(net_handle.read())
        
for record in SeqIO.parse('rab20.fasta', 'fasta'):
    ncbi_blast(record)

## Blast.NCBIXML

One of the most importan modules in Biopython. Thanks to NCBIXML we can easily manipulate with blast results for one or more sequences (thousand, million..)

In [None]:
# NCBIXML.read sadece tek dizili dosyalar için kullanılır, çok dizililer için: NCBIXML.parse
from Bio.Blast import NCBIXML

# Parsing işleminden önce dosyamızı açmamız gerekir.
blastout = open('my_blast.xml')
blast_record = NCBIXML.read(blastout)

In [None]:
help(blast_record)

In [None]:
blast_record.

In [None]:
# number of hits
len(blast_record.alignments)

In [None]:
type(blast_record.alignments)

In [None]:
# Kullanılabilir metodlar ve özellikler
dir(blast_record.alignments[0])

In [None]:
# hit_id
for hit in blast_record.alignments:
    print(hit.accession)

In [None]:
# hit_description
blast_record.alignments[0].hit_def

In [None]:
# full hit name
blast_record.alignments[0].title

In [None]:
# Hizalama uzunluğu
blast_record.alignments[0].length

In [None]:
# first hsp
blast_record.alignments[0].hsps[0]

In [None]:
# Kullanılabilir özellikler ve metodlar => hsp
dir(blast_record.alignments[0].hsps[0])

In [None]:
# ilk hsp için evalue değeri
blast_record.alignments[0].hsps[0].expect

In [None]:
# ilk hsp için frame
blast_record.alignments[0].hsps[0].frame

In [None]:
# query start
blast_record.alignments[0].hsps[0].query_start

In [None]:
# hit start
blast_record.alignments[0].hsps[0].sbjct_start

In [None]:
# query end
blast_record.alignments[0].hsps[0].query_end

In [None]:
# hit end
blast_record.alignments[0].hsps[0].sbjct_end

In [None]:
# Tüm blast sonuçları için erişimi yazdır.
from Bio.Blast import NCBIXML

blastout = open('multiple.xml')
blast_records = NCBIXML.parse(blastout)

for record in blast_records:
    for aln in record.alignments:
        for hsp in aln.hsps:
            print(f'id: {aln.accession}\nevalue:{hsp.expect}\n')

In [None]:
type(blast_records)

In [None]:
# Tüm erişimler ve evalue değerlerini bu formatta yazdırınız,format: id': id; 'evalue': evalue:
from Bio.Blast import NCBIXML

blastout = open('my_blast.xml')
blast_record = NCBIXML.read(blastout)

for aln in blast_record.alignments:
    for hsp in aln.hsps:
        print(f'id: {aln.accession}\nevalue:{hsp.expect}\n')