# Cephノード運用：Cephクラスタ OSDサービスUpdate
Cephクラスタを構成するサービスであるOSDのイメージ更新を行う。



# パラメータ定義

## パラメータファイル設定

Cephクラスタの定義ファイルを指定するため、<br>
パラメータ定義格納ディレクトリを表示する。

In [None]:
!ls -p ~/notebooks/share/ | grep "/$"

In [None]:
!ls -p ~/notebooks/share/configuration

In [None]:
!ls -p ~/notebooks/share/configuration/ceph

In [None]:
import sys, os.path, importlib, json, yaml

config_file_name = "ceph_admin_vm.yml"
config_file_path = os.path.expanduser("~/notebooks/share/configuration/ceph/{}".format(config_file_name))
with open(config_file_path) as f:
    admin_params = yaml.safe_load(f)
admin_params

In [None]:
target_vm_name = 'xxx-ceph-admin1'
admin_patam = admin_params[target_vm_name]
admin_patam

In [None]:
ceph_admin_ip = admin_patam['network']['provisioning']['ip']

In [None]:
import sys, os.path, importlib, json, yaml

config_file_name = "xxx-openstack-parameter.yml"
config_file_path = os.path.expanduser("~/notebooks/share/configuration/{}".format(config_file_name))
with open(config_file_path) as f:
    params = yaml.safe_load(f)
params

In [None]:
repo_server = params['repository']['addresses']['service_operation']
repo_server

In [None]:
provisioning_vip = params['openstack']['provisioning_vip']
provisioning_vip

## CephノードとストレージセグメントIPアドレス対応表の読み込み

In [None]:
import os
import csv
import pandas as pd

instance_ip_csv_path =  os.environ['HOME'] + "/notebooks/share/configuration/ceph/ceph_instance_ip.csv"
instance_ip_list = []
instance_ip_map = {}

with open(instance_ip_csv_path, 'r') as path_csv:
    reader = csv.DictReader(path_csv)
    
    for record in reader:
        instance_ip_list.append(record)
        instance_ip_map[record['instance_name']] = record

pd.DataFrame(instance_ip_list)

## 作業用ディレクトリを作成する

In [None]:
import os,tempfile
temp_dir = tempfile.mkdtemp()
print (temp_dir)

## AnsibleのInventoryファイルを作業用ディレクトリへ作成する

In [None]:
import os

with open( os.path.join(temp_dir, "hosts"), 'w') as f:
    f.write('''[openstack_ctl]
{openstack_cmn}
'''.format(openstack_cmn = provisioning_vip))

hosts = temp_dir + "/hosts"
!cat $hosts

In [None]:
%env ANSIBLE_INVENTORY={hosts}

疎通確認

In [None]:
!ansible -m ping openstack_ctl

In [None]:
!ansible -a 'hostname' openstack_ctl

## OpenStack用OpenRCファイル設定

`xxxxxxx`プロジェクト用のOpenRCファイルを事前にダウンロードしておくこと。  

In [None]:
import os

user_creds = os.path.expanduser('~/.keys/xxxxxxx-openrc.sh')

assert os.path.exists(user_creds), '{} is not exist'.format(user_creds)

In [None]:
%env USER_CREDS={user_creds}

In [None]:
!ls -l {user_creds}

## openstackコマンド用ユーティリティ関数

In [None]:
def build_cmdline(param):
    cmdline = ''
    
    for param_name, param_value in param.items():
        if isinstance(param_value, dict):
            for key, value in param_value.items():
                cmdline += ' --{} {}={}'.format(param_name, key, value)
        elif isinstance(param_value, list):
            for item in param_value:
                cmdline += ' --{} {}'.format(param_name, item)
        elif isinstance(param_value, bool):
            if param_value:
                cmdline += ' --{}'.format(param_name)
        else:
            cmdline += ' --{} {}'.format(param_name, param_value)

    return cmdline

In [None]:
import json

def run_openstack(cmd):
    print('EXEC: {}'.format(cmd))
    out = !source {user_creds} && {cmd}
    print('OUTPUT: {}'.format('\n'.join(out)))
    return json.loads('\n'.join(out))

テスト

In [None]:
run_openstack('openstack flavor list -f json' + build_cmdline({'all': True}))

## デプロイされたCephノード情報の取得

ストレージノードを特定するにあたり、ノード名称が　ceph-nodexxx （xxxの部分は、右寄せ0埋めの数字3桁）というルールに従っていることを前提としている。<br>
 例：ceph-node001<br>
 このノード名称ルールは、構築するCephクラスタ毎に変えるため、以下で定義する。

In [None]:
# 初期化対象のインスタンス名称を設定する
raise Exception('この先手作業が必要です')

In [None]:
import pandas as pd
import re

# 対象インスタンス名称マッチングルール
name_match_rule = r'ceph-xxx-node-[0-9]+'

## OpenStack Ironicからノード情報の取得

In [None]:
cmd = "openstack baremetal node list -f json --long"
nodes = run_openstack(cmd)

In [None]:
import pandas as pd
import re

for node in nodes:
    instance_uuid = node.get("Instance UUID", None)
    if instance_uuid is None:
        continue
        
    node["instance_name"] = node["Instance Info"]["display_name"]

pd.set_option('display.max_rows', None)
pd.DataFrame(nodes, columns=['Instance UUID', 'instance_name', 'UUID', 'Maintenance', 'Provisioning State', 'Power State', 'Name'])


In [None]:
cmd = "openstack server list -f json --long"
nova_server_map = run_openstack(cmd)

In [None]:
node_list = []
for server in nova_server_map:
    node_id = server['ID']
    if re.match(name_match_rule, server['Name']) is None:
        continue
    for node in nodes:
        if node['Instance UUID'] == node_id:
            node_info = {}
            node_list.append(node_info)
            node_info['name'] = server['Name']
            node_info['node_name'] = node['Name']
            instance_ip_info = instance_ip_map.get(server['Name'], None)
            if instance_ip_info is not None:
                node_info['instance_ip'] = instance_ip_info.get('ipv4', None)
            else:
                node_info['instance_ip'] = None
            address = server['Networks']
            prov_net = address['provisioning-net']
            for addr in prov_net:
                node_info['prov_ip'] = addr

pd.DataFrame(node_list)

## 初期化対象Cephノード情報の取得

初期化対象のインスタンス名称を設定する

In [None]:
# 初期化対象のインスタンス名称を設定する
raise Exception('この先手作業が必要です')

In [None]:
# メンテナンス対応先ノード
instance_name = 'ceph-xxx-node-002'

In [None]:
bootstrap_node_name = 'ceph-xxx-node-001'

In [None]:
target = None
for elem in node_list:
    if elem['name'] == instance_name:
        target = elem
        break

assert (target is not None), "指定されたターゲットノードが存在しません。"
print (target)

In [None]:
bootstrap_node = None
for elem in node_list:
    if elem['name'] == bootstrap_node_name:
        bootstrap_node = elem
        break

assert (bootstrap_node is not None), "指定されたターゲットノードが存在しません。"
print (bootstrap_node)

## 一時Inventoryファイルの生成
以下を実行し、作業用ディレクトリ配下に一時Inventoryファイルを生成する。

Inventoryファイルを生成する。

In [None]:
node_user='xxxxx'
proxy_user='xxxxx'
proxy_key='~/.ssh/id_ras'

sudoでパスワードが必要な場合は、パスワード入力を設定してansible.cfgに設定すること。

In [None]:
import os

with open( os.path.join(temp_dir, "hosts"), 'w') as f:
     f.write('''[ceph_admin]
{ceph_admin_ip}   ansible_user={proxy_user} ansible_ssh_private_key_file={proxy_key} ansible_python_interpreter=/usr/bin/python3
[ceph_node]
{node_ip}  ansible_user={node_user} ansible_ssh_common_args='-o ControlMaster=auto -o StrictHostKeyChecking=no -o ControlPersist=30m -o ProxyCommand="ssh -W %h:%p -i {proxy_key} -q {proxy_user}@{ceph_admin_ip}"' ansible_python_interpreter=/usr/bin/python3
'''.format(ceph_admin_ip=ceph_admin_ip, node_ip=target["prov_ip"],
           node_user=node_user, proxy_user=proxy_user, proxy_key=proxy_key))
     f.write('''[bootstrap]
{node_ip}  ansible_user={node_user} ansible_ssh_common_args='-o ControlMaster=auto -o StrictHostKeyChecking=no -o ControlPersist=30m -o ProxyCommand="ssh -W %h:%p -i {proxy_key} -q {proxy_user}@{ceph_admin_ip}"' ansible_python_interpreter=/usr/bin/python3
'''.format(ceph_admin_ip=ceph_admin_ip, node_ip=bootstrap_node["prov_ip"],
           node_user=node_user, proxy_user=proxy_user, proxy_key=proxy_key))

hosts = temp_dir + "/hosts"

!cat $hosts

In [None]:
%env ANSIBLE_INVENTORY={hosts}

# 疎通確認
以下コマンドを実行し、OpeHubからCephAdmin経由で、Cephノードに疎通することを確認する。

In [None]:
!ansible -b -m shell -a 'hostname' ceph_admin

以下コマンドを実行し、OpeHubからCephAdminに疎通することを確認する。

In [None]:
!ansible -b -m shell -a 'hostname' bootstrap

In [None]:
!ansible -b -m shell -a 'hostname' ceph_node

# OSDイメージ更新

## OSDデーモン noout設定
更新対象ホスト上のOSDにnooutフラグを設定する。

In [None]:
ret = !ansible -b -m shell -a "cephadm shell -- ceph osd ls-tree $instance_name 2> /dev/null" bootstrap
ret

In [None]:
ret.pop(0)
ret

In [None]:
osd_num=0
for osd_id in ret:
    if osd_id.isdecimal() == True:
        !ansible -b -m shell -a "cephadm shell -- ceph osd add-noout osd.$osd_id 2> /dev/null" bootstrap
        osd_num += 1

In [None]:
print(osd_num)
assert (osd_num > 0), "対象ホストにOSDは存在していません。以降の更新作業を中断してください。"

In [None]:
!ansible -b -m shell -a "cephadm shell -- ceph -s 2> /dev/null" bootstrap

## OSD Update

In [None]:
# 更新対象Cephリポジトリ指定
ceph_image = 'repository:5000/ceph/ceph:v17'

In [None]:
!ansible -b -m shell -a "cephadm shell -- ceph orch upgrade start --image $ceph_image --daemon-types osd --hosts $instance_name" bootstrap

## Update完了確認

In [None]:
import time

is_done = False
while is_done == False:
    ret = !ansible -b -m shell -a "cephadm shell -- ceph orch upgrade status --format=json 2> /dev/null" bootstrap
    del ret[0:2]
    stat_text = ''.join(ret)
    stat = json.loads(stat_text)
    if stat['in_progress'] == False:
        print("Progress Done")
        is_done = True
    else:
        print("in_progress=true")
        time.sleep(5)

## OSDデーモン noout設定解除
停止対象ホスト上のOSDにnooutフラグを解除する。

In [None]:
ret = !ansible -b -m shell -a "cephadm shell -- ceph osd ls-tree $instance_name 2> /dev/null" bootstrap
ret

In [None]:
ret.pop(0)
ret

In [None]:
for osd_id in ret:
    if osd_id.isdecimal() == True:
        !ansible -b -m shell -a "cephadm shell -- ceph osd rm-noout osd.$osd_id 2> /dev/null" bootstrap

In [None]:
!ansible -b -m shell -a "cephadm shell -- ceph -s 2> /dev/null" bootstrap

# 後始末

一時ディレクトリを削除する。

In [None]:
!rm -fr $temp_dir