## Mouse Ttn遺伝子内のTCTT配列の分布の可視化

In [None]:
# オリジナルモジュールのインポート
from introngap import PileUp
from gbkparse import Seq_count

# モジュールのインポート
import glob

### 可視化の準備

In [None]:
# クラスのインスタンス化
gbk = Seq_count()

# gbkファイルの読み込み
gbk.read_gbk('data/gbk/human_ttn.gb')

# tutorialの表示
gbk.tutorial()

In [None]:
# バリアントの表示
gbk.get_mrna_ids()

In [None]:
# トランスクリプトバリアントの設定
gbk.set_mrna_id('NM_001267550.2')

In [None]:
# 着目する配列の設定
gbk.set_interest_seq('TCTT')

### Ttn遺伝子内のTCTT配列の分布

In [None]:
# TCTT配列の分布の可視化
gbk.heatmap_hist()

# figureの保存
gbk.save_fig()

### 各エクソン・イントロン内のTCTT配列の個数の分布

#### 各イントロン内のTCTT配列の棒グラフ

In [None]:
# 各イントロン内のTCTT配列の棒グラフ
gbk.intron_bar()

#### 各イントロン内の100塩基あたりのTCTT配列の棒グラフ

In [None]:
# 各イントロン内の100塩基あたりのTCTT配列の棒グラフ
gbk.intron_bar_base()

#### 各イントロンの両端の５０塩基に存在するTCTT配列の棒グラフ

In [None]:
# 各イントロンの両端の５０塩基に存在するTCTT配列の棒グラフ
gbk.interest_seq_count_edge()

#### 各エクソン内のTCTT配列の棒グラフ

In [None]:
# 各エクソン内のTCTT配列の棒グラフ
gbk.exon_bar()

#### 各エクソン内の100塩基あたりのTCTT配列の棒グラフ

In [None]:
# 各エクソン内の100塩基あたりのTCTT配列の棒グラフ
gbk.exon_bar_base()

## その他の哺乳類のTtn遺伝子のイントロンのスプライシングパターン

### げっ歯類のTtn遺伝子のスプライスパターン
**mouse Ttn:**<br>
https://www.ncbi.nlm.nih.gov/nuccore/NC_000068.8?report=graph&from=76492536&to=76854687&strand=true&app_context=Gene&assm_context=GCF_000001635.27<br>
**rat Ttn:**<br>
https://www.ncbi.nlm.nih.gov/nuccore/NC_051338.1?report=graph&from=61611559&to=61965783&strand=true&app_context=Gene&assm_context=GCF_015227675.2<br>
**rabbit Ttn:**<br>
https://www.ncbi.nlm.nih.gov/nuccore/NC_067380.1?report=graph&from=55045025&to=55398485&app_context=Gene&assm_context=GCF_009806435.1

In [None]:
for i in ['mouse','rat','rabbit']:
    pile = PileUp()
    pile.set_csv(f"data/intron/{i}_ttn_intron.tsv")
    pile.set_title(f"{i} Ttn intron gap distribution")
    pile.show(height=300)

### 霊長類のTtn遺伝子のスプライスパターン
**human TTN:**<br>
https://www.ncbi.nlm.nih.gov/nuccore/NC_000002.12?report=graph&from=178483773&to=178849637&strand=true&app_context=Gene&assm_context=GCF_000001405.40<br>
**chimp TTN:**<br>
https://www.ncbi.nlm.nih.gov/nuccore/NC_072400.1?report=graph&from=80513939&to=80881842&strand=true&app_context=Gene&assm_context=GCF_028858775.1<br>
**gorilla TTN:**<br>
https://www.ncbi.nlm.nih.gov/nuccore/NC_073226.1?report=graph&from=69432214&to=69798206&strand=true&app_context=Gene&assm_context=GCF_029281585.1

In [None]:
for i in ['human','chimp','gori']:
    pile = PileUp()
    pile.set_csv(f"data/intron/{i}_ttn_intron.tsv")
    pile.set_title(f"{i} Ttn intron gap distribution")
    pile.show(height=300)

## 種間の保存性の可視化
**UCSC genome browser**<br>
https://genome.ucsc.edu/cgi-bin/hgTracks?db=hg38&lastVirtModeType=default&lastVirtModeExtraState=&virtModeType=default&virtMode=0&nonVirtPosition=&position=chr2%3A178525989%2D178807423&hgsid=1735195872_llHo1dKi3SVLwkPP3OCN3pMDqYzb

## エクソン数の多い遺伝子のイントロンのスプライスパターンを可視化

In [None]:
for i in ['obscn','neb','ryr1','ryr2','ryr3','dst','syne1','syne2','col7a1']:
    pile = PileUp()
    pile.set_csv(f"data/intron/mouse_other_genes/mouse_{i}_intron.tsv")
    pile.set_title(f"Mouse {i} intron gap distribution")
    pile.show(height=300)

## Guide to the Human Genome
http://www.cshlp.org/ghg5_all/section/gene.shtml

## 仮説
TTN遺伝子のオーソログでは、種間でイントロンのスプライスパターンが異なる<br>
哺乳類のなかでも、霊長類とげっ歯類では、それぞれ特徴的な類似したスプライスパターンを持つ<br>
TTN遺伝子の塩基配列の保存性は、哺乳類の中でも霊長類（human,chimp,gorilla）とそれ以外の２群に大きく分かれる<br>
エクソン数の多い遺伝子の中でも、イントロンのスプライスパターンのホットスポットを持つものと、そうでないものが存在する<br>
筋に関連する遺伝子はスプライスパターンのホットスポットを持つ<br>