# S3に置かれたプロファイルを読めるかどうかの確認

## このノートブックについて

このノートブックは、Delta Sharingの動作確認用である。
詳しくは、[Getting Started of Delta Sharingのブログ](https://dobachi.github.io/memo-blog/2021/09/10/Getting-Started-of-Delta-Sharing/) を参照。

なお、たまたま気になった挙動として、S3上に置かれたプロファイルを読みるかどうか、というのがあった。
ここではそれを動作確認する。

## クライアントのインスタンス化

In [1]:
import delta_sharing

あらかじめ起動時に渡しておいた環境変数を利用し、S3上のベースとなるURLを取得する。

In [2]:
import os

In [3]:
s3_base = os.environ['S3_TEST_URL']

In [6]:
profile_file = s3_base + "deltasharing.json"

クライアント生成

In [11]:
# ファイルから読み込む場合
client = delta_sharing.SharingClient(profile_file)

なお、この処理はあらかじめpipでs3fsをインストールしていないと動作しない。

## 共有されているテーブルのリストを取得する

クライアントを利用し、共有されているテーブルを確認

In [12]:
client.list_all_tables()

[Table(name='table1', share='share1', schema='schema1')]

このように、S3に置かれたプロファイルを読み込み、クライアントが動作した。

## Pandasで取得する

テーブルにアクセスする

In [13]:
table_url = profile_file + "#share1.schema1.table1"

In [14]:
pdf = delta_sharing.load_as_pandas(table_url)

なお、2021/9/10現在、`delta_sharing.delta_sharing.load_as_pandas` メソッドの引数はプロフィールのJSONそのものではなく、ファイルを示すURLでないとならない。

In [15]:
pdf

Unnamed: 0,id
0,0
1,1
2,2
3,3
4,4
5,5
6,6
7,7
8,8
9,9


## Sparkで取得する

In [16]:
sdf = spark.read.format('deltaSharing').load(table_url)

In [17]:
sdf.show()

+---+
| id|
+---+
|  2|
|  3|
|  4|
|  7|
|  8|
|  9|
|  0|
|  1|
|  5|
|  6|
+---+

