## 第 12 回　遺伝子データ解析

### 参考文献：先進ゲノム解析研究推進プラットフォーム (編集)、独習 Python バイオ情報解析、羊土社
---
---
### 目的：ヒト胚性幹細胞を胚様体とした分化過程のシングルセル RNA-Seq 解析データから論文用の図を作成する。

K.R. Moon et al., Visualizing structure and transitions in high-dimensional biological data, Nature Biotechnology, Vol. 37, 1482-1492, 2019.

---
---
## シングルセル解析 2
### 次元削減
---

### 解析に必要なライブラリのインポート

In [None]:
import matplotlib.pyplot as plt

---
### S 字の生成と可視化

#### sklearn を使って S 字データを生成して、matplotlib を使って 3 次元空間で可視化

In [None]:
from sklearn.datasets import make_s_curve
from mpl_toolkits.mplot3d import Axes3D

# S 字データの生成
X, t = make_s_curve(1000, random_state=0)

# 3Dプロットの作成
fig = plt.figure(figsize=(12, 7))  # プロットのサイズ設定
ax = fig.add_subplot(111, projection='3d')

# データポイントのプロット（色はtに基づく、rainbowカラーマップを使用）
sc = ax.scatter(X[:, 0], X[:, 1], X[:, 2], c=t, cmap="Spectral")

# 軸のアスペクト比を設定（Z軸を長くする）
ax.set_box_aspect((1, 1, 2))  # X, Y, Z軸の比率

# ラベルの設定
ax.set_xlabel('X Label')
ax.set_ylabel('Y Label')
ax.set_zlabel('Z Label')
ax.set_title('3D S-Curve with Extended Z-Axis')

# プロットの表示
plt.show()

---
### 主成分分析（principal component analysis; PCA）

**課題 1：** 主成分分析についてまとめて下さい。

#### sklearn を用いて主成分分析

**課題 2：** S 字データに対して PCA を実行した結果をグラフで可視化して下さい。

解答例

<img src="figs/pca.jpg" width="400px">

---
### 多次元尺度構成法（multidimensional scaling; MDS）

**課題 3：** 多次元尺度構成法（multidimensional scaling; MDS）についてまとめて下さい。

#### sklearn を用いて多次元尺度構成法

**課題 4：** S 字データに対して MDS を実行した結果をグラフで可視化して下さい。

解答例

<img src="figs/mds.jpg" width="400px">

---
### 確率的近傍埋め込み（stochastic neighbor embedding; SNE）

**課題 5：** 確率的近傍埋め込み（stochastic neighbor embedding; SNE）についてまとめて下さい。

---
### t-SNE（t-distributed stochastic neighbor embedding：t 分布型確率的近傍埋め込み）

**課題 6：** t 分布型確率的近傍埋め込み(t-distributed stochastic neighbor embedding; t-SNE)についてまとめて下さい。

#### sklearn を用いて t-SNE

**課題 7：** S 字データに対して t-SNE を実行した結果をグラフで可視化して下さい。

解答例

<img src="figs/tsne.jpg" width="400px">

---
### UMAP
**課題 8：** 一様多様体近似と射影（Uniform Manifold Approximation and Projection; UMAP）についてまとめて下さい。

#### sklearn を用いて UMAP

**課題 9：** S 字データに対して UMAP を実行した結果をグラフで可視化して下さい。

解答例

<img src="figs/umap.jpg" width="400px">

---
**課題 10：** 次元削減をする方法として他にどのようなものがあるか調べてまとめて下さい。また、グラフで可視化して下さい。

解答例

<img src="figs/seven.jpg" width="1000px">