## 8.3 NetCDF

在本节，我们将读取一个NetCDF文件，并写入相同的格式。我们正在使用的这个文件,`rhum.2003.nc`可以从`http://www.unidata.ucar.edu/software/netcdf/examples/files.html`下载。我们将从`Scientific.IO`库中使用`NetCDF`库来读取和写入NetCDF数据，所以让我们先导入它(译者注:限于linux系统，可找替代的如从scipy.io导入netcdf等)。

In [6]:
import numpy as np
#from Scientific.IO import NetCDF as nc
from scipy.io import netcdf as nc

首先，我们打开这个文件。

In [7]:
file = nc.netcdf_file('datas/rhum.2003.nc','r')
#file = nc.NetCDFFile('datas/rhum.2003.nc','r')

我们通过使用`dir`来查看它的属性。

In [8]:
dir(file)

['Conventions',
 '__class__',
 '__del__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__enter__',
 '__eq__',
 '__exit__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 '_attributes',
 '_dims',
 '_mm',
 '_mm_buf',
 '_pack_begin',
 '_pack_int',
 '_pack_int32',
 '_pack_int64',
 '_pack_string',
 '_read',
 '_read_att_array',
 '_read_dim_array',
 '_read_gatt_array',
 '_read_numrecs',
 '_read_values',
 '_read_var',
 '_read_var_array',
 '_recs',
 '_recsize',
 '_unpack_int',
 '_unpack_int32',
 '_unpack_int64',
 '_unpack_string',
 '_write',
 '_write_att_array',
 '_write_dim_array',
 '_write_gatt_array',
 '_write_numrecs',
 '_write_values',
 '_write_var_array',
 '_write_var_data',
 '_write_var_metadata',
 'base_date',
 'close',
 'createDimension',
 'createVariable'

`title`告诉数据集的标题，`discription`提供了文件内容的描述。

In [9]:
file.title

b'mean daily NMC reanalysis (2003)'

In [10]:
file.description

b'Data is from NMC initialized reanalysis\n(4x/day).  It consists of most variables interpolated to\npressure surfaces from model (sigma) surfaces.'

我么你可以查看数据的维度。

In [11]:
file.dimensions

OrderedDict([('lon', 144), ('lat', 73), ('level', 8), ('time', None)])

我们看到，这个数据由四维:lat，time，lon,和level。每个维度的大小也已给出。现在，我们可以查看数据的变量。

In [12]:
file.variables

OrderedDict([('level', <scipy.io.netcdf.netcdf_variable at 0x18be7a86080>),
             ('lat', <scipy.io.netcdf.netcdf_variable at 0x18be7a86048>),
             ('lon', <scipy.io.netcdf.netcdf_variable at 0x18be7a86128>),
             ('time', <scipy.io.netcdf.netcdf_variable at 0x18be7a86358>),
             ('rhum', <scipy.io.netcdf.netcdf_variable at 0x18be7a862b0>)])

这提供了，变量名和相对于数据的变量的引用。这意味着这并未将数据加载进入内存，事实上只是在文中提供一个引用，而我们可以检索只检索我们想要的变量。我们应该得到`rhum`变量的值。首先我们引用一些变量名。然后我们可以看到单元、数据类型，并得到它的值。

In [13]:
foo = file.variables['level']
foo.units

b'millibar'

In [14]:
foo.typecode

<bound method netcdf_variable.typecode of <scipy.io.netcdf.netcdf_variable object at 0x0000018BE7A86080>>

In [15]:
rhum = foo.getValue

现在，我们可以查看变量`rhum`的形状。

In [20]:
rhum.shape

AttributeError: 'function' object has no attribute 'shape'

第一维表示时间，第二维表示不同压力水平，第三维代表经度，最后一个代表维度。

我们可以用相同的方式写入文件。首先我们打开文件来写。

In [22]:
file = nc.netcdf_file('datas/test.nc','w')



然后我们可以定义一些类似于标题、描述等的全局属性。

In [23]:
setattr(file,'title','trial')
setattr(file,'description','File generated while testing to write in NetCDF')

现在我们可以创建一些维度。我们需要定义维度的名称和大小。

In [24]:
file.createDimension('lat',73)
file.createDimension('lon',144)
file.createDimension('level',8)
file.createDimension('time',65)

现在我们可以保存这个变量。首先，我们需要从上面创建的列表中定义维度。这个文图应该是元祖，注意在`lat`后的冒号,。在此之后，我们可以使用`createVariable`创建变量，我们需要指定变量的名称、格式和维度。我们看到已经创建了一个名称为`lat`的变量，并且指向它。

In [25]:
varDims = 'lat',
lat = file.createVariable('lat','f',varDims)
print(file.variables)

OrderedDict([('lat', <scipy.io.netcdf.netcdf_variable object at 0x0000018BE7A8E860>)])


最终，我们可以将我们的值赋给这个变量。

In [26]:
lat = np.random.rand(73)

现在，我们关闭这个文件。

In [27]:
file.close()