# 数据预处理

一、创建master栅格用于对齐数据


操作逻辑：
1、tif先无脑转换为.nc格式，尽量使用xarray的功能
2、空间范围一致：lat,lon经纬度一致
3、分辨率一致
4、坐标系一致
5、栅格对齐
6、栅格空洞

气象类数据检查（都来自于同一源）

In [None]:
import os
import xarray as xr
import glob

# 定义目录路径
climate_dir = r'D:\xarray\pre-process\Climate'

# 获取所有.nc文件
nc_files = glob.glob(os.path.join(climate_dir, '*.nc'))

# 打印找到的文件数量
print(f"找到 {len(nc_files)} 个.nc文件")

# 遍历每个文件并打印信息
for file_path in nc_files:
    print("\n" + "="*50)
    print(f"文件名: {os.path.basename(file_path)}")
    print("="*50)
    
    try:
        # 打开数据集
        ds = xr.open_dataset(file_path)
        
        # 打印基本信息
        print("\n基本信息:")
        print(f"维度: {list(ds.dims.keys())}")
        print(f"变量: {list(ds.data_vars)}")
        print(f"坐标: {list(ds.coords)}")
        
        # 打印空间范围
        if 'lat' in ds.coords or 'latitude' in ds.coords:
            lat_var = 'lat' if 'lat' in ds.coords else 'latitude'
            print(f"\n纬度范围: {ds[lat_var].values.min()} 到 {ds[lat_var].values.max()}")
        
        if 'lon' in ds.coords or 'longitude' in ds.coords:
            lon_var = 'lon' if 'lon' in ds.coords else 'longitude'
            print(f"经度范围: {ds[lon_var].values.min()} 到 {ds[lon_var].values.max()}")
        
        # 打印时间范围(如果有)
        if 'time' in ds.coords:
            print(f"\n时间范围: {ds.time.values[0]} 到 {ds.time.values[-1]}")
            print(f"时间步长: {len(ds.time)} 步")
        
        # 打印详细信息
        print("\n详细信息:")
        print(ds.info())
        
        # 关闭数据集
        ds.close()
        
    except Exception as e:
        print(f"读取文件时出错: {e}")

print("\n数据信息打印完成")
