## **SpDM Manual之系列3：Entry进阶——Open_Entry**

在磁约束聚变研究中，科学数据是重要的处理对象。按照普遍的数据科学中分类，大体上被分为
- 结构化数据：如大型的MDSplus数据库
- 半结构化数据：如NameList,JSON,netCDF,HDF5，XML,YAML等
- 非结构化数据：如GDSKfile,InPut文件

每种数据都有其特定的读取、处理方式，SpDM通过对底层Entry功能封装，提供统一的Open_Entry标准API来访问、处理这些数据，使得用户可以通过同一种访问入口读取不同类型的数据。

Open_Entry中支持标准的URL语法来访问不同的数据。用户无需关心后台的数据格式及来源。


### **标准的URI表述,它是标准RFC3986的扩展：**
```
<schema>+<protocol>+<backend>://< authority >/<path>/?<query>#<fragment>
```
- \<schema\> 则指定了访问资源的 "语义"。
- \<protocol\>指定了资源的协议，如远程的MDSplus或者本地的数据文件格式
- \<backend\>：指定了访问资源的 "格式；
- \<authority\> 组件指定了管理资源的权限，通常包括主机 通常包括主机名和端口号。
- \<path\>组件指定资源的分层路径，可包括多个层级，每个层级之间用 资源的分层路径，可包括多个层级，以斜线（/）分隔。
- \<query\> 组件指定随资源请求发送到服务器的查询字符串
- \<fragment\> 组件指定指向特定资源的 片段标识符

标准的URI表述,它是标准RFC3986的扩展：
```
<device>+<protocol>://<netloc>/<path>?<query>#<fragment>

```
- device: specifies  device description;
- \<protocol\>://\<netloc\>/\<path\>: specifies the address of the data source
- \<query\> query command, e.g. specify shot or  run number
- \<fragment\>specifies  path to subnodes


### **Open_Entry对文件的处理**

####针对文件的URL表达式：
```
file_entry = open_entry(f"file+format://{file_path}}")
```
- open_entry() :API入口
- file：处理对象是文件
- format：指定文件格式
- file_path：文件路径

#### 处理gdskfile文件

In [115]:
### 初始化环境，import open_entry
from spdm.data.Entry import open_entry

### 指定输入文件的目录workdir
workdir = "/scratch/jupytertest/workspace_fytok/fytok_tutorial/tutorial/"

### 使用open_entry打开一个gdskfile文件
file_entry = open_entry(f"file+geqdsk://{workdir}/data/g070754.05000/")


### 指定子节点的标识符
# file_entry = open_entry(f"file+geqdsk://{workdir}//data/g900003.00230_ITER_15MA_eqdsk16HR.txt/#equilibrium")


In [117]:
## file_entry是一个Entry对象,B02节介绍的针对entry的对象的操作均可使用
## 获得该entry树的所有节点的标识符
[*file_entry.keys()]

['wall', 'equilibrium']

In [119]:
## 指标移到wall节点，获得数据
file_entry.child("wall").fetch()

{'description_2d': [{'limiter': {'unit': [{'outline': {'r': array([1.35838, 1.35838, 1.35838, 1.36314, 1.4371 , 1.43721, 1.44164,
              1.4297 , 1.39169, 1.39151, 1.37929, 1.399  , 1.43623, 1.45919,
              1.47791, 1.54494, 1.61204, 1.63506, 1.66054, 1.66519, 1.6955 ,
              1.70668, 1.71388, 1.714  , 1.73649, 1.76324, 1.80199, 1.80237,
              1.93972, 1.97063, 2.07495, 2.1771 , 2.27925, 2.35   , 2.35   ,
              2.35   , 2.27925, 2.1771 , 2.07495, 1.9728 , 1.97063, 1.92059,
              1.87055, 1.82051, 1.79281, 1.76511, 1.75421, 1.67782, 1.60143,
              1.48426, 1.36709, 1.33132, 1.37874, 1.42615, 1.40528, 1.3844 ,
              1.36353, 1.35838, 1.35838, 1.35838, 1.35838]),
       'z': array([ 0.      ,  0.227   ,  0.454   ,  0.455735,  0.798332,  0.798821,
               0.838195,  0.908908,  1.01426 ,  1.01473 ,  1.04859 ,  1.03946 ,
               1.0256  ,  1.02095 ,  1.02514 ,  1.05454 ,  1.08394 ,  1.09586 ,
               1.114   , 

In [120]:
### 指定子节点的标识符
file_entry_eq = open_entry(f"file+geqdsk://{workdir}//data/g900003.00230_ITER_15MA_eqdsk16HR.txt/#equilibrium")

In [121]:
## equilibrium节点的子节点
[*file_entry_eq.keys()]

['time', 'vacuum_toroidal_field', 'time_slice']

#### 处理hdf5文件

In [122]:

hdf5_entry = open_entry(f"file+hdf5://{workdir}/data/test_eq.h5")

[0;37m2023-11-16 21:05:44,677 [    spdm]    DEBUG: /gpfs/fuyun/projects/fuyun/spdm/python/spdm/plugins/data/plugin_hdf5.py:196:open: Open HDF5 File /scratch/jupytertest/workspace_fytok/fytok_tutorial/tutorial//data/test_eq.h5 mode=Mode.read[0m


In [123]:
[*hdf5_entry.keys()]

['equilibrium', 'wall']

In [126]:
hdf5_entry.child("equilibrium/time_slice/0/boundary").fetch()

{'geometric_axis': {'r': 1.85000002, 'z': 0.0},
 'outline': {'r': array([1.41273642, 1.41389295, 1.41822664, 1.425     , 1.43209863,
         1.43980543, 1.45      , 1.4625    , 1.475     , 1.4875    ,
         1.5       , 1.5125    , 1.525     , 1.54090029, 1.55857183,
         1.575     , 1.5875    , 1.60822115, 1.625     , 1.64220094,
         1.675     , 1.7       , 1.72689129, 1.7625    , 1.7875    ,
         1.8125    , 1.8375    , 1.86378618, 1.893304  , 1.92133389,
         1.94791747, 1.9731425 , 1.99710604, 2.01989722, 2.0415908 ,
         2.0625    , 2.0875    , 2.1125    , 2.13503267, 2.15095696,
         2.175     , 2.19360357, 2.2125    , 2.22883407, 2.24833148,
         2.2625    , 2.275     , 2.2875    , 2.29561793, 2.3       ,
         2.30052821, 2.29718556, 2.2875    , 2.275     , 2.2625    ,
         2.25      , 2.23203494, 2.2125    , 2.19533868, 2.175     ,
         2.15      , 2.13201545, 2.1125    , 2.0875    , 2.0625    ,
         2.0375    , 2.0125    , 1.9875

In [129]:
## 或者使用.来表示字符串
hdf5_entry.child("equilibrium.time_slice[0].boundary.geometric_axis").fetch()

{'r': 1.85000002, 'z': 0.0}

### 处理netCDF文件


In [139]:
nc_entry = open_entry(f"file+hdf5://{workdir}/data/test.nc")

[0;37m2023-11-16 21:10:30,889 [    spdm]    DEBUG: /gpfs/fuyun/projects/fuyun/spdm/python/spdm/plugins/data/plugin_hdf5.py:196:open: Open HDF5 File /scratch/jupytertest/workspace_fytok/fytok_tutorial/tutorial//data/test.nc mode=Mode.read[0m


In [144]:
[*nc_entry.keys()]

['coherent_wave']

In [153]:
nc_entry.child("coherent_wave").fetch()

{'0': {'profiles_1d': {'0': {'power_density': array([0.        , 0.        , 0.        , 0.        , 0.99999802,
           0.99999918, 0.99999994, 1.00000037, 1.00000072, 1.00000098,
           1.0000012 , 1.00000132, 1.00000145, 1.00000163, 1.00000158,
           1.00000156, 1.00000155, 1.00000155, 1.00000154, 1.00000155,
           1.00000153, 1.00000149, 1.00000145, 1.00000139, 1.00000134,
           1.00000129, 1.00000124, 1.00000125, 1.00000131, 1.00000145,
           1.00000149, 1.0000015 , 1.00000144, 1.00000136, 1.00000122,
           1.0000011 , 1.00000096, 1.00000085, 1.00000083, 1.00000088,
           1.00000105, 1.00000128, 1.0000014 , 1.00000142, 1.00000148,
           1.0000015 , 1.0000015 , 1.00000145, 1.0000012 , 1.00000149]),
    'current_parallel_density': array([-0.00000000e+00, -0.00000000e+00, -0.00000000e+00, -0.00000000e+00,
            1.99364358e-13,  2.14821878e-08,  3.93642769e-05,  2.86688349e-03,
            9.60013670e-02,  1.23434308e+00,  1.03052517e+01

In [103]:
[*file_entry.keys()]

['wall', 'equilibrium']

In [None]:
### 访问远程EAST MDS数据库中70754炮的数据，
shot_num = 70754
time_slice = 10
entry = open_entry("east+mdsplus://202.127.204.12?enable=efit_east&shot={shot_num}")

In [76]:
[*file_entry.keys()]

['time', 'vacuum_toroidal_field', 'time_slice']

In [77]:
file_entry.get("vacuum_toroidal_field")

{'r0': 6.2, 'b0': [-5.3]}

In [78]:
file_entry.child("vacuum_toroidal_field").fetch()

{'r0': 6.2, 'b0': [-5.3]}