# 実験ワークフロー機能トップページ

実験中に生じる研究者のタスクを実行支援します。  
「実験の流れとワークフロー機能の概要」を確認後、セルを実行してワークフロー図を作成してください。  
また、個々のタスクの実行支援は、Jupyter Notebook形式で機械的に実行可能な手順書として記述されているため、柔軟に手順を修正いただけます。 

## 実験の流れとワークフロー機能の概要

以下のような実験の流れに沿って、ワークフロー機能をご利用いただけます。

### 0. 実験ワークフロー実行準備

この実験で実験ワークフロー機能を使うのが初めての場合は、必ず実行する必要があります。  
2回目以降は、このトップページに研究リポジトリのREADME.mdのリンクから遷移した場合は実行する必要がありませんが、実験実行環境を再構築した場合は実行してください。

### 1. 実験準備

「実験メタデータを入力する」で、実験日時や実験者などの情報を実験メタデータとして登録できます。  
※一度の実行で十分ですが、実験メタデータの内容を更新したい場合は再度実行してください。

### 2. 実験

作成された実験パッケージにはDMPのデータセット構造(dataseetStructure)に従い、以下のような実験に必要なフォルダが用意されます。<br>
各フォルダの使用について各データセット構造で共通する条件と特有の条件があります。<br>
以下の条件を満たすように、実験入力データの準備と実験実行コードの作成をしてください。<br>

- 共通条件
  - 実験の入力データは`input_data`フォルダに配置してください。
  - ソースコードはPythonで記述してください。
  - 実験結果は output_dataフォルダに出力されるようにソースコードを記述してください。
<p> </p><br>
<p> </p>

- RCOS_with_codeを選択した場合
  ```
  experiments
  └─────<実験パッケージ名>
              │─────input_data
              │─────source
              └─────output_data
  ```
- RCOS_with_codeの特有条件
  - ソースコードは`source`フォルダに配置してください。
<p> </p><br>
<p> </p>

- RCOS_only_dataを選択した場合
  ```
  experiments
  └─────<実験パッケージ名>
              │─────input_data
              └─────output_data
  ```
- RCOS_only_dataの特有条件
  - 特になし。共通条件に従ってください。
<p> </p><br>
<p> </p>

- RCOS_for_parametersを選択した場合
  ```
  experiments
  └─────<実験パッケージ名>
              │─────input_data
              │─────source
              │─────<パラメータ実験名-1>
              │        │─────param
              │        └─────output_data
              │
              └─────<パラメータ実験名-2>
                       │─────param
                       └─────output_data
  ```
- RCOS_only_dataの特有条件
  - 各パラメータ実験の固有のパラメータファイルは、それぞれのparamフォルダに配置してください。
  - パラメータファイルはユーザ任意のファイルの種類が使用できます(.txt, .yaml など)。
  - 各実験結果はそれぞれの各パラメータ実験毎のoutput_dataフォルダに配置してください。
<p> </p><br>
<p> </p>

求める実験結果が得られるまで、入力データや実験実行コードの修正を繰り返してください。  
ワークフロー機能では以下の処理を支援可能です。
- 「他リポジトリから実験の入力データを用意する」<br>
データガバナンス機能の他リポジトリのデータを入力データとして利用したい場合に活用できます。  
また、必要なファイルのみ実体を`input_data`フォルダへダウンロードすることもできます。
- 「実験を途中保存する」  
実験を途中保存してログを残すこともできます。

### 3. 実験データなどの整理
他人が閲覧することを考慮した上で、実験の入出力データやソースコードの記述の見直しやファイルの整理を行ってください。

### 4. 実験を再現するためのSnakefileを記述

実験パッケージの再現性を確保するために、実験内の処理の依存関係などの実験の実行方法をSnakefileに記述する必要があります。  
[こちらのマニュアル](https://github.com/NII-DG/dg-manual/blob/main/HowToSnakemake.md)を参照しながらSnakefileを記述してください。

### 5. 実験終了

この実験環境でデータが維持されるのは最後に利用した日から30日間です。実験データの整理後は必ず「実験を終了する」を実行してGIN-forkに実験データを反映させてください。

## ワークフロー図を作成する

以下のセルを実行してワークフロー図を作成できます。  
すでに実行したワークフローを確認したい場合は再度実行してください。

In [None]:
from IPython.display import SVG
import os

nb_utils_path   = os.path.join(os.environ['HOME'], 'WORKFLOWS/EX-WORKFLOWS/util/scripts/nb_utils.py')
basic_path      = os.path.join(os.environ['HOME'], 'WORKFLOWS/EX-WORKFLOWS/images')
basic_path_svg  = os.path.join(basic_path, 'notebooks.svg')
basic_path_diag = os.path.join(basic_path, 'notebooks.diag')
os.chdir(os.environ['HOME'])
!python3 $nb_utils_path $basic_path_diag

SVG(filename=basic_path_svg)

ワークフロー図の左のノードはワークフローのフェーズとその流れを表しており、フェーズの右側にあるノードは個々の支援するタスクを表しています。  
各タスクを実行するには、実行したいタスクのノードのリンクをクリックしてください。

## GIN-forkへ戻る

以下のセルを実行し、表示されるURLをクリックするとGIN-forkへアクセスできます。

In [None]:
!git config --get remote.origin.url