# workerノードの追加

---

CoursewareHub環境を構成しているworkerノードに新たなノードを追加します。

## パラメータの指定

workerノードを追加するのに必要となるパラメータを入力します。

### VCCアクセストークンの入力

VCノードを追加するためにVC Controller(VCC)のアクセストークンが必要となります。
次のセルを実行すると表示される入力枠にVCCのアクセストークンを入力してください。

> アクセストークン入力後に Enter キーを押すことで入力が完了します。

In [None]:
from getpass import getpass

vcc_access_token = getpass()

入力されたアクセストークンが正しいことを、実際にVCCにアクセスして確認します。

In [None]:
from common import logsetting
from vcpsdk.vcpsdk import VcpSDK

vcp = VcpSDK(vcc_access_token)

上のセルの実行結果がエラーとなり以下のようなメッセージが表示されている場合は、入力されたアクセストークンに誤りがあります。

```
config vc failed: http_status(403)
2021/XX/XX XX:XX:XX UTC: VCPAuthException: xxxxxxx:token lookup is failed: permission denied
```

エラーになった場合はこの節のセルを全て `unfreeze` してから、もう一度アクセストークンの入力を行ってください。

### UnitGroup名

操作対象となるVCPのUnitGroup名を指定します。

VCノードを作成時に指定したUnitGroup名を確認するために `group_vars` ファイル名の一覧を表示します。

In [None]:
!ls -1 group_vars/

UnitGroup名を指定してください。

In [None]:
# (例)
# ugroup_name = 'CoursewareHub'

ugroup_name = 

#### チェック

対象となるVCノードがAnsibleによって操作できることを確認します。

Ansibleの設定ファイルの場所を環境変数に設定しておきます。

In [None]:
from pathlib import Path
import os

cfg_ansible = Path("ansible.cfg")
if cfg_ansible.exists():
    os.environ["ANSIBLE_CONFIG"] = str(cfg_ansible.resolve())

構築対象となる各VCノードにアクセスできることを確認します。

In [None]:
target_hub = f"{ugroup_name}_manager"

!ansible {target_hub} -m ping

In [None]:
target_nodes = f"{ugroup_name}_worker"

!ansible {target_nodes} -m ping

UnitGroup名に対応する group_varsファイルが存在していることを確認します。

In [None]:
!test -f group_vars/{ugroup_name}

UnitGroupの変数をgroup_varsファイルから読み込みます。

In [None]:
%run scripts/group.py
gvars = load_group_vars(ugroup_name)

### 追加するノードの指定

workerノードから追加するノードを指定します。

追加するノードの指定は二通りの方法で行うことができます。

* 追加するworkerノード数を指定する
* 追加するノードのIPアドレスを指定する

ノードの追加を行う前に、現在のworkerノードの状態を確認します。

In [None]:
ugroup = vcp.get_ugroup(ugroup_name)
unit_worker = ugroup.get_unit("worker")
unit_worker.df_nodes()

#### 追加するworkerノード数を指定する

> 追加するノードをIPアドレスで指定する場合はこの節をスキップしてください。

追加するノード数を指定してください。

In [None]:
# (例)
# add_nodes = 2

add_nodes = 

#### 追加するノードのIPアドレスを指定する

> 追加するノード数を指定した場合はこの節をスキップしてください。ノード数とIPアドレスの両方を指定した場合はIPアドレスの指定が優先されます。

追加するノードのIPアドレスのリストを指定してください。

In [None]:
# (例)
# add_ipaddresses = [
#     '172.30.2.101',
#     '172.30.2.102',
#     '172.30.2.103',
# ]

add_ipaddresses = [
    
]

#### チェック

指定されたパラメータをチェックします。

In [None]:
worker_addrs = unit_worker.find_ip_addresses()
if "add_ipaddresses" in vars() and len(add_ipaddresses) > 0:
    if len(set(add_ipaddresses) & set(worker_addrs)) > 0:
        raise RuntimeError("既存のIPアドレスと重複した値が指定されています")
elif "add_nodes" in vars():
    if add_nodes <= 0:
        raise RuntimeError("追加するノード数には正の値を指定してください")

## ノードの追加

### /etc/exportsの設定を一時変更する

追加するノードからNFSサーバにアクセスできるようにするためにサブネット全体を許可するように`/etc/exports`の設定を変更します。ノードを追加後にworkerノードのIPアドレスが確定した後に、workerノードからのみアクセス可能となるように`/etc/exports`を設定しなおします。

一時的にNFSサーバへのアクセスを許可するサブネットの値を確認します。

In [None]:
print(vcp.get_vpn_catalog(gvars["vc_provider"]).get("private_network_ipmask"))

`/etc/exports`の記述を変更します。

In [None]:
from tempfile import TemporaryDirectory
from pathlib import Path

exports_opts = 'rw,fsid=0,no_root_squash,no_subtree_check,sync,crossmnt'
subnet = vcp.get_vpn_catalog(gvars["vc_provider"]).get('private_network_ipmask')
with TemporaryDirectory() as workdir:
        exports = Path(workdir) / f'{ugroup_name}.exports'
        with exports.open(mode='w') as f:
               f.write(f'/exported/{ugroup_name} {subnet}({exports_opts})\n')
        !cat {exports}
        !ansible {ugroup_name}_manager -b -D -m copy -a \
                'src={exports} dest=/etc/exports.d/ backup=yes'

設定ファイルを読み込ませてエクスポート設定を更新します。

In [None]:
!ansible {ugroup_name}_manager -b -a 'exportfs -r -v'

### VCノードの追加

VCノードを追加します。

In [None]:
params = {}
if "add_ipaddresses" in vars() and len(add_ipaddresses) > 0:
    params["ip_addresses"] = add_ipaddresses
elif "add_nodes" in vars():
    params["num_add_nodes"] = add_nodes
unit_worker.add_nodes(**params)

追加後のworkerノードの状態を確認します。

In [None]:
unit_worker.df_nodes()

### Ansibleの設定を更新する

Ansibleのインベントリにノードの情報を追加します。

In [None]:
from pathlib import Path
import yaml

inventory_path = Path("inventory.yml")
with inventory_path.open() as f:
    inventory = yaml.safe_load(f)
inventory["all"]["children"][ugroup_name]["children"][
    f"{ugroup_name}_{unit_worker.name}"
]["hosts"] = dict([(x, {}) for x in unit_worker.find_ip_addresses()])
bak_inventory_path = Path(inventory_path.parent, inventory_path.name + ".bak")
inventory_path.rename(bak_inventory_path)
with inventory_path.open(mode="w") as f:
    yaml.safe_dump(inventory, f)

変更差分を確認します。

In [None]:
! ! diff -u {bak_inventory_path} {inventory_path}

追加したVCノードにSSHでログインできるようにするために `~/.ssh/known_hosts` の更新を行います。

In [None]:
from time import sleep


def check_update_known_hosts(ipaddr):
    # VCノード起動直後だと sshd サービスが開始されておらずに known_hosts が更新されない場合がある
    # ssh-keyscan が値を取得できるまで何度かリトライする
    for x in range(10):
        out = ! echo $(ssh-keyscan {ipaddr} 2> /dev/null | wc -l)
        update_lines = int(out[0])
        if update_lines > 0:
            break
        sleep(1)
    else:
        raise RuntimeError("ERROR: timeout!")


!mkdir -p -m 0700 ~/.ssh
!touch ~/.ssh/known_hosts
for addr in unit_worker.find_ip_addresses():
    !ssh-keygen -R {addr}
    check_update_known_hosts(addr)
    !ssh-keyscan -H {addr} >> ~/.ssh/known_hosts

 Ansible でアクセスできることを確認します。

In [None]:
!ansible {ugroup_name}_{unit_worker.name} -m ping

group_varsに記録されているworkerノードのIPアドレスとノード数を更新します。

In [None]:
%run scripts/group.py
worker_ipaddresses = unit_worker.find_ip_addresses()
update_group_vars(
    ugroup_name,
    worker_nodes=len(worker_ipaddresses),
    worker_ipaddresses=worker_ipaddresses,
)

### /etc/exportsを更新する

NFSサーバの`/etc/exports`に追加したノードに対応する設定を追加します。

`/etc/exports`の記述を更新します。

In [None]:
from tempfile import TemporaryDirectory
from pathlib import Path

exports_opts = 'rw,fsid=0,no_root_squash,no_subtree_check,sync,crossmnt'
with TemporaryDirectory() as workdir:
        exports = Path(workdir) / f'{ugroup_name}.exports'
        with exports.open(mode='w') as f:
                for addr in unit_worker.find_ip_addresses():
                    f.write(f'/exported/{ugroup_name} {addr}({exports_opts})\n')
        !cat {exports}
        !ansible {ugroup_name}_manager -b -m copy -a \
                'src={exports} dest=/etc/exports.d/ backup=yes'

設定ファイルを読み込ませてエクスポート設定を更新します。

In [None]:
!ansible {ugroup_name}_manager -b -a 'exportfs -r -v'

NFSサーバ側に作成したファイルをNFSクライアント側で参照できることを確認します。

In [None]:
!ansible {ugroup_name}_manager -m file -a 'path=/jupyter/xxx state=touch'
!ansible {ugroup_name}_manager -m file -a 'path=/exchange/xxx state=touch'
!ansible {ugroup_name}_{unit_worker.name} -a 'test -f /jupyter/xxx'
!ansible {ugroup_name}_{unit_worker.name} -a 'test -f /exchange/xxx'
!ansible {ugroup_name} -m file -a 'path=/jupyter/xxx state=absent'
!ansible {ugroup_name} -m file -a 'path=/exchange/xxx state=absent'

### コンテナイメージの取得

workerノードでsingle-user serverのコンテナイメージを取得します。

In [None]:
!ansible {ugroup_name}_{unit_worker.name} -a 'docker pull {{{{singleuser_image}}}}'

JupyterHubからコンテナとして起動する際に指定するタグ名をコンテナイメージに設定します。

In [None]:
!ansible {ugroup_name}_{unit_worker.name} -a \
      'docker tag {{{{singleuser_image}}}} niicloudoperation/jupyterhub-singleuser'

各workerノードでコンテナイメージの一覧を確認します。

In [None]:
!ansible {ugroup_name}_{unit_worker.name} -m shell -a \
        'docker images | grep -e "niicloudoperation/jupyterhub-singleuser"'

### Docker Swarmを更新する

追加したノードをDocker Swarmに追加します。

更新前のworkerノードの一覧を確認します。

In [None]:
!ansible {ugroup_name}_manager -a 'docker node ls -f role=worker'

workerノードを追加するためのトークンをmanagerノードで取得します。

In [None]:
out = !ansible {ugroup_name}_manager -a 'docker swarm join-token -q worker'
if out[0].find("CHANGED") >= 0 or out[0].find("SUCCESS") >= 0:
    swarm_token = out[1]
    print(swarm_token)
else:
    raise

追加したVCノードをworkerノードとしてDocker Swarmに追加します。

In [None]:
out = !ansible {ugroup_name}_manager -a \
    'docker node ls -f role=worker --format "{{% raw %}}{{{{.Hostname}}}}{{% endraw %}}"'
exist_nodes = out[1:]
manager_ip = gvars['vc_ipaddress']
for addr in unit_worker.find_ip_addresses():
    out = !ansible {addr} -a 'hostname'
    if out[1] not in exist_nodes:
        !ansible {addr} -a \
            'docker swarm join --token {swarm_token} {manager_ip}:2377'

更新後のworkerノードの一覧を確認します。

In [None]:
!ansible {ugroup_name}_manager -a 'docker node ls -f role=worker'

## 管理者ユーザの設定

構築環境のJupyterHubでは講師権限を持つ管理ユーザが操作を行うためのインベントリファイルが配置されています。このインベントリを更新します。

### パラメータの指定

設定対象とする管理者ユーザのメールアドレスを次のセルで指定してください。

In [None]:
# （例)
# teacher_emails = [
#    'teacher-01@example.com',
# ]


teacher_emails = [

]

### インベントリの更新

JupyterHubのインベントリを更新します。

実際に変更する前にチェックモードでplaybookを実行します。

In [None]:
%run scripts/cwh.py
for email in teacher_emails:
    name = get_username_from_mail_address(email)
    !ansible-playbook -CDv -l {ugroup.name}_manager \
        -e teacher_id={name} \
        -e teacher_homedir=/jupyter/users/{name} \
        -e target_hub={ugroup_name}_manager \
        -e target_nodes={ugroup_name}_{unit_worker.name} \
         playbooks/deploy-inventory.yml \
   || true

実際に更新を行います。

In [None]:
for email in teacher_emails:
    name = get_username_from_mail_address(email)
    !ansible-playbook -Dv -l {ugroup.name}_manager \
        -e teacher_id={name} \
        -e teacher_homedir=/jupyter/users/{name} \
        -e target_hub={ugroup_name}_manager \
        -e target_nodes={ugroup_name}_{unit_worker.name} \
        playbooks/deploy-inventory.yml