# memeを使ってmotifの検出
**各生物種のTTNイントロン領域からMotif配列の検出を試みる**<br>
<br>
<検出ツール><br>
https://meme-suite.org/meme/<br>
MEME(Multiple Em for Motif Elicitation)を使って配列中のモチーフを検出する

<マニュアル><br>
https://meme-suite.org/meme/doc/meme.html<br>

<解析結果><br>
result/memeにhtmlファイルとして出力

In [None]:
# オリジナルモジュールのインポート
from lib.gbkparse import Seq_count
import subprocess

## ヒトTTNのイントロン配列からモチーフを検出する

In [None]:
# ヒトTTN情報の取得
gbk = Seq_count()
gbk.get_gbk('7273')

# 各イントロンに配列をfasta形式で保存
file_path = '../data/fasta/ttn_intron_human.fasta'
with open(file_path,'w') as f:
    for i in range(gbk.intron_num()):
        seq = str(gbk.intron_seq(i+1))
        f.write(f'>intron_{i+1}'+'\n')
        f.write(seq+'\n')    

# パラメータ設定 
mtf_n = 4
min_w = 8
max_w = 20
mode = "zoops"

# memeの実行
dir = "../result/meme/human/ttn"
cmd1 = f"rm -rf {dir}"
cmd2= f"meme {file_path} -dna -o {dir} -maxsize 200000 -nmotifs {mtf_n} -minw {min_w} -maxw {max_w} -mod {mode}"
subprocess.run(cmd1.split())
subprocess.run(cmd2.split())

## マウスTTNのイントロン配列からモチーフを検出する

In [None]:
# マウスTTN情報の取得
gbk = Seq_count()
gbk.get_gbk('22138')

# 各イントロンに配列をfasta形式で保存
file_path = '../data/fasta/ttn_intron_mouse.fasta'
with open(file_path,'w') as f:
    for i in range(gbk.intron_num()):
        seq = str(gbk.intron_seq(i+1))
        f.write(f'>intron_{i+1}'+'\n')
        f.write(seq+'\n')    

# パラメータ設定 
mtf_n = 4
min_w = 8
max_w = 20
mode = "zoops"

# memeの実行
dir = "../result/meme/mouse/ttn"
cmd1 = f"rm -rf {dir}"
cmd2= f"meme {file_path} -dna -o {dir} -maxsize 200000 -nmotifs {mtf_n} -minw {min_w} -maxw {max_w} -mod {mode}"
subprocess.run(cmd1.split())
subprocess.run(cmd2.split())

## チンパンジーTTNのイントロン配列からモチーフを検出する

In [None]:
# チンパンジーTTN情報の取得
gbk = Seq_count()
gbk.get_gbk('459784')


# 各イントロンに配列をfasta形式で保存
file_path = '../data/fasta/ttn_intron_chimp.fasta'
with open(file_path,'w') as f:
    for i in range(gbk.intron_num()):
        seq = str(gbk.intron_seq(i+1))
        f.write(f'>intron_{i+1}'+'\n')
        f.write(seq+'\n')    

# パラメータ設定 
mtf_n = 4
min_w = 8
max_w = 20
mode = "zoops"

# memeの実行
dir = "../result/meme/chimp/ttn"
cmd1 = f"rm -rf {dir}"
cmd2= f"meme {file_path} -dna -o {dir} -maxsize 200000 -nmotifs {mtf_n} -minw {min_w} -maxw {max_w} -mod {mode}"
subprocess.run(cmd1.split())
subprocess.run(cmd2.split())

## ラットTTNのイントロン配列からモチーフを検出する

In [None]:
# ラットTTN情報の取得
gbk = Seq_count()
gbk.get_gbk('84015')

# 各イントロンに配列をfasta形式で保存
file_path = '../data/fasta/ttn_intron_rat.fasta'
with open(file_path,'w') as f:
    for i in range(gbk.intron_num()):
        seq = str(gbk.intron_seq(i+1))
        f.write(f'>intron_{i+1}'+'\n')
        f.write(seq+'\n')    

# パラメータ設定 
mtf_n = 4
min_w = 8
max_w = 20
mode = "zoops"

# memeの実行
dir = "../result/meme/rat/ttn"
cmd1 = f"rm -rf {dir}"
cmd2= f"meme {file_path} -dna -o {dir} -maxsize 200000 -nmotifs {mtf_n} -minw {min_w} -maxw {max_w} -mod {mode}"
subprocess.run(cmd1.split())
subprocess.run(cmd2.split())

## チキンTTNのイントロン配列からモチーフを検出する

In [None]:
# チキンTTN情報の取得
gbk = Seq_count()
gbk.get_gbk('424126')

# 各イントロンに配列をfasta形式で保存
file_path = '../data/fasta/ttn_intron_chiken.fasta'
with open(file_path,'w') as f:
    for i in range(gbk.intron_num()):
        seq = str(gbk.intron_seq(i+1))
        f.write(f'>intron_{i+1}'+'\n')
        f.write(seq+'\n')    

# パラメータ設定 
mtf_n = 4
min_w = 8
max_w = 20
mode = "zoops"

# memeの実行
dir = "../result/meme/chicken/ttn"
cmd1 = f"rm -rf {dir}"
cmd2= f"meme {file_path} -dna -o {dir} -maxsize 200000 -nmotifs {mtf_n} -minw {min_w} -maxw {max_w} -mod {mode}"
subprocess.run(cmd1.split())
subprocess.run(cmd2.split())

## アカゲザルTTNのイントロン配列からモチーフを検出する

In [None]:
# アカゲザルTTN情報の取得
gbk = Seq_count()
gbk.get_gbk('424126')

# 各イントロンに配列をfasta形式で保存
file_path = '../data/fasta/ttn_intron_macaca.fasta'
with open(file_path,'w') as f:
    for i in range(gbk.intron_num()):
        seq = str(gbk.intron_seq(i+1))
        f.write(f'>intron_{i+1}'+'\n')
        f.write(seq+'\n')    

# パラメータ設定 
mtf_n = 4
min_w = 8
max_w = 20
mode = "zoops"

# memeの実行
dir = "../result/meme/macaca/ttn"
cmd1 = f"rm -rf {dir}"
cmd2= f"meme {file_path} -dna -o {dir} -maxsize 200000 -nmotifs {mtf_n} -minw {min_w} -maxw {max_w} -mod {mode}"
subprocess.run(cmd1.split())
subprocess.run(cmd2.split())

## ウシTTNのイントロン配列からモチーフを検出する

In [None]:
# アカゲザルTTN情報の取得
gbk = Seq_count()
gbk.get_gbk('540561')

# 各イントロンに配列をfasta形式で保存
file_path = '../data/fasta/ttn_intron_cattle.fasta'
with open(file_path,'w') as f:
    for i in range(gbk.intron_num()):
        seq = str(gbk.intron_seq(i+1))
        f.write(f'>intron_{i+1}'+'\n')
        f.write(seq+'\n')    

# パラメータ設定 
mtf_n = 4
min_w = 8
max_w = 20
mode = "zoops"

# memeの実行
dir = "../result/meme/cattle/ttn"
cmd1 = f"rm -rf {dir}"
cmd2= f"meme {file_path} -dna -o {dir} -maxsize 200000 -nmotifs {mtf_n} -minw {min_w} -maxw {max_w} -mod {mode}"
subprocess.run(cmd1.split())
subprocess.run(cmd2.split())