# プログラミングで何ができるか？
- データ解析（グラフ化、統計処理）  
    * グラフ作成 [matplotlibギャラリー](https://matplotlib.org/gallery/index.html)
    * 統計処理
    * [機械学習/ディープラーニング](https://www.amazon.co.jp/s/ref=nb_sb_noss/358-9795876-6852603?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&url=search-alias%3Dstripbooks&field-keywords=%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92&rh=n%3A465392%2Ck%3A%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92)
    * モデリング
    * シミュレーション
    * ルーチンワークの自動化 => 大規模なデータ処理


- 各種開発
    * [アプリケーション開発](https://www.amazon.co.jp/s/ref=nb_sb_ss_ime_i_4_8/358-9795876-6852603?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&url=search-alias%3Dstripbooks&field-keywords=%E3%82%A2%E3%83%97%E3%83%AA%E3%82%B1%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0&sprefix=%E3%82%A2%E3%83%97%E3%83%AA%E3%82%B1%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%2Cundefined%2C256&crid=1RLVDT5PKY1EQ&rh=n%3A465392%2Ck%3A%E3%82%A2%E3%83%97%E3%83%AA%E3%82%B1%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0)
    * [Web開発](https://www.amazon.co.jp/s/ref=nb_sb_noss_2?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&url=search-alias%3Daps&field-keywords=Web%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0&rh=i%3Aaps%2Ck%3AWeb%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0)
    * [ゲーム開発](https://www.amazon.co.jp/%E3%82%B2%E3%83%BC%E3%83%A0%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0-Python-%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0/s?ie=UTF8&page=1&rh=n%3A3229700051%2Cp_n_feature_seven_browse-bin%3A3232405051)
    * [機械の制御プログラム開発](https://www.amazon.co.jp/s/ref=nb_sb_noss/358-9795876-6852603?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&url=search-alias%3Dstripbooks&field-keywords=%E5%88%B6%E5%BE%A1%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0&rh=n%3A465392%2Ck%3A%E5%88%B6%E5%BE%A1%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0)


# プログラミング言語と主な用途
- Python: 小規模〜大規模データ解析、機械学習/ディープラーニング
- R: データ解析
- C言語系：制御プログラム開発、機械学習/ディープラーニング
- Swift: Apple系のアプリケーション開発
- Ruby: Webアプリケーション開発
- PHP: Webアプリケーション開発
- JavaScript: Web開発
- Perl: 文字列操作
- Shell Script: 解析等の自動化

# プログラミングと生物学
- データ解析（グラフ作成、統計処理、シミュレーションなど）
- 解析の自動化  
　生データ => ソフトA => ソフトB => ソフトC => 最終結果

生物学データ（DNA配列や遺伝子発現データなど）を解析する分野 => __バイオインフォマティクス__ 


# [例] 測定データのグラフ化

4種のアヤメ(Iris)について、花弁の長さ・幅、萼片の長さ・幅を測定したデータをグラフ化する。


In [None]:
%matplotlib inline
import pandas as pd
import seaborn as sns
sns.set(style="whitegrid", palette="muted")

# Load the example iris dataset
iris = sns.load_dataset("iris")

# "Melt" the dataset to "long-form" or "tidy" representation
iris = pd.melt(iris, "species", var_name="measurement")

# Draw a categorical scatterplot to show each observation
sns.swarmplot(x="measurement", y="value", hue="species", data=iris)

# [例] サンプル間遺伝子発現比較

2サンプル間（種Aと種B）の遺伝子発現量を比較する。  
（遺伝子発現量データとして、ランダムに発生させた数値データを用いています）

t検定（平均値の差の検定）

In [None]:
### データファイル読み込み

import pandas as pd

df = pd.read_csv("data/gene_expression.txt", sep="\t", header=0, index_col=0)
df

In [None]:
### 統計処理

import scipy.stats as stats

P = []
for index, row in df.iterrows():
    t, p = stats.ttest_ind(row[0:3], row[3:6], equal_var=False)
    P.append(p)

df['Probability'] = P
df

In [None]:
### データの抽出

df[df['Probability'] < 0.05]

# [例] ゲノム地図の作成

コムギ(Triticum aestivum)葉緑体ゲノム上の遺伝子および制限酵素EcoRI切断部位をプロットする。


In [None]:
### パッケージのインポート
from reportlab.lib import colors
from reportlab.lib.units import cm
from Bio.Graphics import GenomeDiagram
from Bio import SeqIO
from Bio.SeqFeature import SeqFeature, FeatureLocation
from IPython.display import Image, display_png

### ファイルの読み込み
record = SeqIO.read("data/Triticum_aestivum_chloroplast.gb", "genbank")

gd_diagram = GenomeDiagram.Diagram(record.id)
gd_track_for_features = gd_diagram.new_track(1, name="Annotated Features")
gd_feature_set = gd_track_for_features.new_set()

### 遺伝子の位置情報を取得
for feature in record.features:
    if feature.type != "gene":
        #Exclude this feature
        continue
    if len(gd_feature_set) % 2 == 0:
        color = colors.blue
    else:
        color = colors.lightblue
    gd_feature_set.add_feature(feature, sigil="ARROW",
                               color=color, label=True,
                               label_size = 14, label_angle=0)

### 任意配列の位置情報を取得
for site, name, color in [("GAATTC","EcoRI",colors.green),]:
    index = 0
    while True:
        index  = record.seq.find(site, start=index)
        if index == -1 : break
        feature = SeqFeature(FeatureLocation(index, index+len(site)))
        gd_feature_set.add_feature(feature, color=color, name=name,
                                   label=True, label_size = 10,
                                   label_color=color)
        index += len(site)


### 描画＆ファイルに出力
png_file = "Triticum_aestivum_chloroplast_map.png"
gd_diagram.draw(format="circular", circular=True, pagesize=(36*cm,36*cm),
                start=0, end=len(record), circle_core = 0.8)
gd_diagram.write(png_file, "PNG")

### 表示
display_png(Image(png_file))