# Pythonクライアントを用いた動作確認

## このノートブックについて

このノートブックは、Delta Sharingの動作確認用である。
詳しくは、[Getting Started of Delta Sharingのブログ](https://dobachi.github.io/memo-blog/2021/09/10/Getting-Started-of-Delta-Sharing/) を参照。

## クライアントのインスタンス化

In [10]:
import delta_sharing

今回は、ローカルファイルシステムに置かれたプロファイルを利用する。

In [11]:
profile_file = "deltasharing.json"

クライアント生成

In [12]:
# ファイルから読み込む場合
# client = delta_sharing.SharingClient(profile_file)

In [13]:
# JSONのテキストを渡す場合 
profile_json_txt = '{\
  "shareCredentialsVersion": 1,\
  "endpoint": "http://localhost:80/delta-sharing/",\
  "bearerToken": ""\
}'
delta_sharing_prof = delta_sharing.protocol.DeltaSharingProfile.from_json(profile_json_txt)

In [14]:
client = delta_sharing.SharingClient(delta_sharing_prof)

クライアントについてはファイルで読み込む方法、JSONのテキストをそのまま渡す方法などある。

## 共有されているテーブルのリストを取得する

クライアントを利用し、共有されているテーブルを確認

In [15]:
client.list_all_tables()

[Table(name='table1', share='share1', schema='schema1')]

なお、ほかにもスキーマを指定してテーブル一覧を取得する `delta_sharing.delta_sharing.SharingClient.list_tables` メソッド、スキーマ一覧を取得する `delta_sharing.delta_sharing.SharingClient.list_schemas` メソッド、そもそもシェアを確認する `delta_sharing.delta_sharing.SharingClient.list_shares` メソッドなどがクライアントにて提供されている。

## Pandasで取得する

テーブルにアクセスする

In [16]:
table_url = profile_file + "#share1.schema1.table1"

In [19]:
pdf = delta_sharing.load_as_pandas(table_url)

なお、2021/9/10現在、`delta_sharing.delta_sharing.load_as_pandas` メソッドの引数はプロフィールのJSONそのものではなく、ファイルを示すURLでないとならない。

In [20]:
pdf

Unnamed: 0,id
0,0
1,1
2,2
3,3
4,4
5,5
6,6
7,7
8,8
9,9


## Sparkで取得する

In [23]:
sdf = spark.read.format('deltaSharing').load(table_url)

In [26]:
sdf.show()

+---+
| id|
+---+
|  2|
|  3|
|  4|
|  7|
|  8|
|  9|
|  0|
|  1|
|  5|
|  6|
+---+

