# SnapShot and SnapRestore with NetApp DataOps Toolkit for Kuberenetes

本デモではNetApp DataOps Toolkitを使用して、永続ボリューム（K8s PersistentVolume）内のデータを高速にバックアップ・リストアできることを確認します。  
NetApp DataOps Toolkitはオープンソースソフトウェアであり、利用方法も含めて下記GitHub上で公開されています。  
https://github.com/NetApp/netapp-dataops-toolkit/tree/main

In [None]:
# ! python3 -m pip install netapp-dataops-k8s

## ライブラリのインポート
本デモで使用するNetApp DataOps Toolkitと汎用ライブラリをインポートします。

In [14]:
# 汎用ライブラリのインポート
import datetime
import os
import sys

In [15]:
# (Option)ライブラリのimport先を指定
sys.path.append("/home/jovyan/netapp-dataops-toolkit")
from netapp_dataops.k8s import list_volumes, create_volume_snapshot, list_volume_snapshots, clone_volume

## デモ環境の事前確認
NetApp DataOps Toolkitでバックアップを取得する前に、現在の永続ボリュームの状態を確認します。なお本ワークショップではマルチテナント化されたKubeflowの環境を想定しています。  
以下にお使いのKubeflowのテナント名（=k8s namespace）名を入力します。

In [16]:
# 利用中のテナント名（=k8s namespace）を入力
YOUR_NAMESPACE = 'yshimizu'

次にNetApp DataOps Toolkitを使用して、お使いのテナント内に払い出された永続ボリュームの一覧を確認します

In [17]:
# FSxN上に作成されたボリューム一覧の確認
volumes = list_volumes(namespace=YOUR_NAMESPACE, print_output=True)

PersistentVolumeClaim (PVC) Name    Status    Size      StorageClass    Clone    Source PVC    Source VolumeSnapshot
----------------------------------  --------  --------  --------------  -------  ------------  -----------------------
100tb-volume                        Bound     100000Gi  nfs             No
ai-coe-sync-demo                    Bound     100Gi     nfs             No
ai-platform-demo-datavol-1          Bound     1000Gi    nfs-large       No
ai-platform-demo-volume             Bound     10Gi      nfs             No
dataset-cats                        Bound     100Gi     nfs             No
demo-workspace1-volume              Bound     100Gi     nfs             No
large-vol                           Bound     1Ti       nfs             No
netapp-dataops-demo-workspace       Bound     5Gi       nfs             No
netapp-dataops-toolkit              Bound     10Gi      nfs             No
test-note-volume                    Bound     10Gi      nfs             No
workspace-demo

上記出力結果からバックアップ対象のボリュームを選定し、以下の変数に代入します

In [18]:
# 上記で表示されたボリュームからバックアップ対象ボリューム（PVC）の名称を指定
PVC_NAME = 'large-vol'

## NetApp DataOps Toolkitを使用したボリュームの高速バックアップ

In [19]:
# 取得するSnapshotの名称を生成
t_delta = datetime.timedelta(hours=9)
JST = datetime.timezone(t_delta, 'JST')
now = datetime.datetime.now(JST)
timestamp = now.strftime('%Y%m%d%H%M%S')
SNAPSHOT_NAME = "snapshot-" + timestamp

上記で確認したボリュームのバックアップを取得します。  
下記のコードによりNetApp DataOps ToolkitはCSI-Snapshotterを介して、volumeSnapshotの取得を行います。  
TridentのバックエンドストレージがNetApp ONTAPの場合、ボリューム内の実データではなく、データへのポインタ情報のみをバックアップするため大規模なボリュームであっても、バックアップ自体の容量は極めて小さく、バックアップ処理も瞬時に完了します。

In [21]:
# NetApp DataOps Toolkitを使用して、ボリュームのSnapshotを取得
create_volume_snapshot(namespace=YOUR_NAMESPACE, pvc_name=PVC_NAME, snapshot_name=SNAPSHOT_NAME, print_output=True)

Creating VolumeSnapshot 'snapshot-20240527155736' for PersistentVolumeClaim (PVC) 'large-vol' in namespace 'yshimizu'.
VolumeSnapshot 'snapshot-20240527155736' created. Waiting for Trident to create snapshot on backing storage.
Snapshot successfully created.


In [22]:
# 取得したSnapshotの一覧を確認
snap = list_volume_snapshots(namespace=YOUR_NAMESPACE, pvc_name=PVC_NAME, print_output=True)

VolumeSnapshot Name      Ready to Use    Creation Time         Source PersistentVolumeClaim (PVC)    Source JupyterLab workspace    VolumeSnapshotClass
-----------------------  --------------  --------------------  ------------------------------------  -----------------------------  ---------------------
snapshot-20230913130807  True            2023-09-13T04:08:14Z  large-vol                                                            csi-snapclass
snapshot-20230913133129  True            2023-09-13T04:53:10Z  large-vol                                                            csi-snapclass
snapshot-20240527155736  True            2024-05-27T07:20:20Z  large-vol                                                            csi-snapclass
