## **SpDB Manual之系列3：Entry进阶——Open_Entry**

SpDB中引入Entry来灵活处理Python中的原生数据类型。

日常的科研环境中，数据科学的类似是多样的，通常被分类为：
- 结构化数据
- 半结构化数据
- 非结构化数据

这些数据类型以不同的形式表现出来，如结构化的数据通常以表格的形式出现，
半结构化的数据通常以XML或者JSON的形式出现，非结构化的数据通常以二进制的形式出现，如磁约束聚变中常用的GDSKfile。

SpDB通过对底层Entry功能封装，提供统一的Open_Entry标准API来访问、处理这些数据。Open_Entry中支持标准的URL语法来访问不同的数据。用户无需关心后台的数据格式及来源。



标准的URI表述,它是标准RFC3986的扩展：
```
<protocol>+<backend>[<schema>]://< authority >/<path>/?<query>#<fragment>
```
- \<protocol\>指定了资源的协议，如远程的MDSplus或者本地的数据文件格式
- \<backend\>[\<schema\>]： SpDB 添加到标准 URI 中的扩展关键字，<Backend> 指定了访问资源的 "格式；而 \<schema\> 则指定了访问资源的 "语义"。
- \<authority\> 组件指定了管理资源的权限，通常包括主机 通常包括主机名和端口号。
- \<path\>组件指定资源的分层路径，可包括多个层级，每个层级之间用 资源的分层路径，可包括多个层级，以斜线（/）分隔。
- \<query\> 组件指定随资源请求发送到服务器的查询字符串
- \<fragment\> 组件指定指向特定资源的 片段标识符

标准的URI表述,它是标准RFC3986的扩展：
```
<device>+<protocol>://<netloc>/<path>?<query>#<fragment>

```
- device: specifies  device description;
- \<protocol\>://\<netloc\>/\<path\>: specifies the address of the data source
- \<query\> query command, e.g. specify shot or  run number
- \<fragment\>specifies   path to subnodes


####处理文件的URL表达式

In [26]:
## 加载基本环境
from spdm.data.Entry import open_entry,Entry
from spdm.utils.logger import logger
from pathlib import Path

import os
os.environ["SP_DATA_MAPPING_PATH"] = "//scratch/jupytertest/workspace_fytok/fytok_data/mapping"

In [52]:
## 通过open_entry函数,将原始换的gdskfile，转成entry对象，B02_SpDB_entry中对entry的操作均有效
file_entry = open_entry("file+geqdsk:///scratch/jupytertest/workspace_fytok/output/g070754.05000#equilibrium")

In [18]:
[*file_entry.keys()]

['time', 'vacuum_toroidal_field', 'time_slice']

In [24]:
file_entry.get("vacuum_toroidal_field")

{'r0': 1.85000002, 'b0': [1.79915598]}

In [23]:
file_entry.child("vacuum_toroidal_field").fetch()

{'r0': 1.85000002, 'b0': [1.79915598]}

In [56]:
## 通过open_entry函数,将原始换的gdskfile，转成entry对象，B02_SpDB_entry中对entry的操作均有效
hdf5_entry = open_entry("file+hdf5:///scratch/jupytertest/workspace_fytok/fytok_tutorial/tutorial/data/test-eq.hdf5")

[0;37m2023-11-15 10:16:10,204 [    spdm]    DEBUG: /gpfs/fuyun/projects/fuyun/spdm/python/spdm/plugins/data/plugin_hdf5.py:197:open: Open HDF5 File /scratch/jupytertest/workspace_fytok/fytok_tutorial/tutorial/data/test-eq.hdf5 mode=Mode.read[0m


In [57]:
hdf5_entry.get()

KeyError: 'Unable to synchronously open object (invalid identifier type to function)'

In [48]:
[*hdf5_entry.keys()]

ValueError: Invalid group (or file) id (invalid group (or file) ID)

In [None]:
entry = open_entry("east+mdsplus://202.127.204.12?enable=efit_east&shot={shot_num}")

In [None]:
file_entry= open_entry(f"file:///{current_path}/g063982.04800", format="gdskfile" ,mode="r")

In [None]:
file_entry = open_entry(f'file://current_path+'"/g070754.05000")

In [None]:
current_path = "/scratch/jupytertest/workspace_fytok/fytok_tutorial/tutorial"
### For NameList File
DATA_INPUT = current_path+"/data/"
with File(DATA_INPUT+"/g070754.05000", mode="r", format="GEQdsk") as fid:
    doc = fid.read()
    eq_test = doc.dump()

####处理MDSplus的URL表达式

In [27]:
### 访问远程EAST MDS数据库中70754炮的数据，
shot_num = 70754
time_slice = 10
entry = open_entry("east+mdsplus://202.127.204.12?enable=efit_east&shot={shot_num}")

FileNotFoundError: Can not find mapping files for ['east', 'imas/3', 'mdsplus'] MAPPING_PATH=[] !