# Scube tutorial: 3D expression modeling with gaussian process regression
# 使用高斯过程回归进行 3D 表达建模

Dataset: 3D STARmap of mouse brain ([here](https://zenodo.org/record/8167488)).

注意：如果要在 Scube 中运行 3D 表达 GPR 模型，需要先安装 [Open3D](http://www.open3d.org/docs/release/) python 库。

In [2]:
from SPACEL.setting import set_environ_seed
set_environ_seed()
from SPACEL import Scube
from SPACEL.Scube.utils_3d import create_mesh, smooth_mesh, sample_in_mesh, get_surface_colors, save_view_parameters, load_view_parameters
import scanpy as sc
import numpy as np
import pandas as pd
np.random.seed(42)

Setting environment seed: 42
Jupyter environment detected. Enabling Open3D WebVisualizer.
[Open3D INFO] WebRTC GUI backend enabled.
[Open3D INFO] WebRTCWindowSystem: HTTP handshake server disabled.


## Load data

3D 表达模型的输入数据类型是归一化表达和每个 spot/cell 的 3D 坐标。

In [3]:
st_ad = sc.read_h5ad('data/starmap_3d_mouse_brain/starmap_3d_mouse_brain.h5ad')
sc.pp.normalize_total(st_ad,target_sum=1e4)
sc.pp.log1p(st_ad)

# Normalized expression data (rows as spots/cells, columns as genes)
norm_expr = st_ad.to_df()

# 3D location (rows as spots/cells, columns as x,y,z axis coordinate)
loc = st_ad.obsm['spatial'].copy()

## Generate 3D surface

在此步骤中，我们使用 alpha 形状方法从 spots/cells 的 3D 位置坐标创建三角形网格。默认情况下，参数 α 是自动估计的，它会影响网格中三角形的数量。

In [5]:
mesh = create_mesh(loc.values,alpha=80,show=False)

RuntimeError: Unable to cast Python instance to C++ type (compile in debug mode for details)

为了获得平滑的网格，我们可以对网格使用 Taubin 滤波器和网格细分。通过增加 `taubin_iter` 和 `subdivide_iter` 将生成更平滑的网格。

In [None]:
mesh = smooth_mesh(mesh,taubin_iter=10,subdivide_iter=3,show=False)

从网格内部采样 500000 个位置坐标并获取网格表面的顶点。

In [None]:
loc_sampled,loc_surface = sample_in_mesh(mesh,loc.values)

## Gaussian process regression

为了使 GPR 模型具有更好的性能，我们建议将位置坐标值调整为 0 到 10 左右。

In [None]:
loc = loc/1000
loc_sampled = loc_sampled/1000

然后，我们构建 GPR 模型并对其进行训练直至收敛。如果 GPU 设备可用，请将 `use_gpu` 设置为 `True`

In [None]:
gpr_model = Scube.GPRmodel(norm_expr,loc.values,loc_sampled,used_genes=norm_expr.columns,use_gpu=False)

In [None]:
gpr_model.train(lr=.02,training_iter=50,save_model=True,cal_bf=True,optim_l=True,optimize_method='Adam')

通过计算贝叶斯因子，我们可以统计识别 3D 表达模型中空间变化的基因。对于基因来说，贝叶斯因子值越大表示空间变异越大。

## Visualization

任何基因的 GRP 模型结果的可视化。

In [None]:
g = 'Cux2'

# Expression of sampled location from the 3D mesh
sampled_expr = gpr_model.plot_gpr_expr(g,s=.1,training_iter=50,lr=.02,save=False,show=True,elev=45,azim=45,cmap='Spectral_r',zlim=(-0.3,0.4))

# Expression of surface location from the 3D mesh
surface_expr = gpr_model.plot_gpr_expr(g,data=loc_surface/1000,s=.1,training_iter=50,lr=.02,save=False,show=True,elev=45,azim=45,cmap='Spectral_r',zlim=(-0.3,0.4))

# Expression of measurement location from the observation
Scube.plot_3d(loc=loc.values,val=norm_expr[g],s=.1,show=True,elev=45,azim=45,zlim=(-0.3,0.4))

此步骤用 GPR 表达对网格表面进行着色。它可用于通过 `Open3D` 库对 GRP 模型结果进行可视化。

In [None]:
get_surface_colors(mesh,surface_expr)

将相机视图参数保存在 json 文件中，然后在下一次可视化时加载它。

In [None]:
save_view_parameters(mesh, 'view_parameters.json')

In [None]:
g = 'Mbp'
# Expression of surface location from the 3D mesh
surface_expr = gpr_model.plot_gpr_expr(g,data=loc_surface/1000,s=.1,training_iter=50,lr=.02,save=False,show=False,elev=45,azim=45,cmap='Spectral_r',zlim=(-0.3,0.4))
get_surface_colors(mesh,surface_expr)
load_view_parameters(mesh, 'view_parameters.json')