# GIN-forkに公開されているリポジトリからデータを用意する
GIN-forkで公開されている自分のリポジトリや他の研究者のリポジトリのデータをこの実験の入力データもしくはソースコードとして用意します。<br>
このタスクを実行するには、`用意したいデータを持っているGIN-forkリポジトリのURL`が必要です。<br>
**<p style="color:red;">※ 自分のリポジトリ、他の研究者のリポジトリ共に公開されているリポジトリのみ利用することができます。</p>**<br>
指定したリポジトリにある実験のデータ（入力データ、ソースコード、出力データ）を、今回の実験で使えるように実験パッケージの`input_data`もしくは`source`配下にダウンロードします。<br>

Jupyter Notebookの操作方法については、[こちら](https://support.rdm.nii.ac.jp/usermanual/60/#jp_operation)をご参照ください。<br>
共通メニューについては、[こちら](https://support.rdm.nii.ac.jp/usermanual/60/#jp_menu)をご参照ください。<br>
いずれも新規タブで開きます。

## 共通メニュー

In [None]:
import sys
sys.path.append("../..")
from nb_libs.utils.form import menu
menu.dg_menu(type='experiment')

## 1. 取込対象のリポジトリ指定
データを取得するための事前準備を行います。<br>
今回の実験で用いたいデータを持つ公開研究リポジトリのHTTPSのURLを入力します。<br>
入力後、`入力完了`ボタンを押下してください。

※ 入力に誤りがある場合は、次の処理に進む前に、再度このセルを実行してください。

In [None]:
# 取得データ情報の整理
import sys
sys.path.append('../..')
from nb_libs.experiment import prepare_from_repository
prepare_from_repository.input_repository()

## 2. 実験名を選択
リポジトリの実験群から必要なデータを持つ実験名を選択します。<br>
選択後、`選択完了`ボタンを押下してください。<br>
パラメータ実験の場合は、パラメータ実験名も選択してください。<br>
同一リポジトリの複数の実験からファイルを用意したい場合は、各実験毎に手順2.～6.を繰り返し実行してください。

In [None]:
# 取得データ情報の整理
import sys
sys.path.append('../..')
from nb_libs.experiment import prepare_from_repository
prepare_from_repository.choose_get_pkg()

## 3. 必要なデータを選択
選択した実験にあるデータが表示されます。<br>
表示されたデータからこの実験に必要なデータをクリックして選択してください。<br>
「複数のデータを選択する場合」や「選択を解除する場合」は、CtrlキーもしくはCommandキーを押しながらクリックしてください。<br>
選択後、`選択完了`ボタンを押下してください。

In [None]:
# 取得データ情報の整理
import sys
sys.path.append('../..')
from nb_libs.experiment import prepare_from_repository
prepare_from_repository.choose_get_data()

## 4. 格納先を指定
データの格納先を指定します。<br>
格納先のファイルパスには、実験パッケージ直下の既存フォルダである`input_data/`, `source/`を含めて入力してください。<br>
`input_data/`, `source/`以下に新たにフォルダを作成したい場合はここで指定することで作成可能です。(以下に記載される入力例を参照)<br>

以下の点に注意して入力してください。

<p style="color:red;">格納先のファイルパスは、<code>input_data/</code>, <code>source/</code>で始まる必要があります。<br>格納先のファイルパスの拡張子は、元のデータの拡張子と一致させる必要があります。</p>

入力後、`入力完了`ボタンを押下してください。<br>
※ 入力に誤りがある場合は、次の処理に進む前に、再度このセルを実行してください。<br>

#### 入力例
- 格納先のファイルパス
  - パターン１(input_data/の場合)：`input_data`/added_folder/sample_input.txt
  - パターン２(source/の場合)：`source`/added_folder/sample_src.txt

上記の入力例において、`added_folder/`は新規追加フォルダを表します。

In [None]:
import sys
sys.path.append('../..')
from nb_libs.experiment import prepare_from_repository
prepare_from_repository.input_path()

## 5. データの取り込み
上記で入力したデータを取得します。

### 5-1. リポジトリへの追加準備
リポジトリに取得データの情報を登録する準備を行います。

In [None]:
# 取得データ情報の整理
import sys
sys.path.append('../..')
from nb_libs.experiment import prepare_from_repository
prepare_from_repository.prepare_addurls_data()

In [None]:
# リポジトリへの取得データ情報の登録
import sys
sys.path.append('../..')
from nb_libs.experiment import prepare_from_repository
prepare_from_repository.add_url()

### 5-2. データ取得履歴を記録
データを取得した履歴の記録を行います。

In [None]:
import sys
sys.path.append('../..')
from nb_libs.experiment import prepare_from_repository
prepare_from_repository.save_annex()

### 5-3. 取得データの実データをダウンロード
リポジトリから実データを取得し、格納します。

In [None]:
import sys
sys.path.append('../..')
from nb_libs.experiment import prepare_from_repository
prepare_from_repository.get_data()

### 5-4. 不要なデータを削除
一時的に使用したデータを削除します。

In [None]:
import sys
sys.path.append('../..')
from nb_libs.experiment import prepare_from_repository
prepare_from_repository.remove_unused()

### 5-5. 実行結果の保存の準備
タスクNotebookを保存し、同期の準備を行います。

In [None]:
import sys
sys.path.append('../..')
from nb_libs.experiment import prepare_from_repository
sync_repo_args = prepare_from_repository.prepare_sync()

## 6. GIN-forkに実行結果を同期
タスクの実行結果をGIN-forkに同期します。

`リポジトリ側の変更と競合しました。競合を解決してください。`と表示された場合は、[GIN-forkへの同期の失敗を解消する](../common/conflict_helper.ipynb)を参照して、競合を解消してください。

In [None]:
import sys
sys.path.append('../..')
from nb_libs.utils.gin import sync
from nb_libs.utils import message
from nb_libs.utils.except_class import DidNotFinishError
if not 'sync_repo_args' in locals():
    message.display.display_err(message.message.get('from_repo_s3', 'did_not_finish'))
    raise DidNotFinishError()
else:
    sync.syncs_with_repo(**sync_repo_args)

## 7. 実験フロートップページへ
実験フロートップページへ遷移するボタンを表示します。

In [None]:
import sys
sys.path.append('../..')
from nb_libs.utils.path import display
display.exp_top_link()