## xrkit库函数介绍

### 导入xrkit库

In [1]:
# 推荐使用以下方式导入xrkit库
import xrkit as xrk
xrk.show_functions()

1. get_files_in_directory：获取目录下的所有文件名称及路径
2. print_file_save_time：打印文件的保存时间
3. csv_to_shp：将csv文件转换为shp文件
4. zonal_statistics：分区统计


### 一、文件管理类

##### 1. 获取目录中的文件名称或路径

```python
  get_files_in_directory(
    folder_path: str= os.getcwd(),    # 文件夹路径（默认为当前路径）
    extension: str='',                # （可选）按文件扩展名筛选，如'.tif'或'jpg'
    rootpath: bool=False              # （可选）是否返回文件的完整路径
  ) -> (list| list[str])              # 返回一个list列表
```

In [None]:
import xrkit as xrk

target_directory = r"D:\WorkSpace\Accessibility\data\NearHospitals_Province_samples"
file_list = xrk.get_files_in_directory(target_directory, "csv")
print(file_list[0:5])

The number of files:  34
['0.csv', '1.csv', '10.csv', '11.csv', '12.csv']


##### 2. 打印文件保存时间


```python
  print_file_save_time(
    filename: str='File'     # 文件名
  ) -> None                  # 无返回值
```

In [None]:
import xrkit as xrk

file_name = file_list[0]
xrk.print_file_save_time(file_name)

0.csv saved (2025-02-20 21:10:43)


### 二、数据处理类

##### 1. csv文件转shp文件

```python
  csv_to_shp(
    csv_path: str,                    # csv文件路径
    shp_path: str,                    # shp文件路径
    lon: str = 'lon',                 # （可选）csv文件经度列名，默认为'lon'
    lat: str = 'lat',                 # （可选）csv文件纬度列名，默认为'lat'
    input_crs: str = 'epsg:4326',     # （可选）经纬度坐标系，默认为'epsg:4326'
    output_crs: Any | None = None     # （可选）输出坐标系，默认为与输入坐标系相同
    encoding: str = 'auto',           # （可选）csv文件编码，默认为'auto'
  ) -> None                           # 无返回值
```

In [3]:
import xrkit as xrk

csv_name = r'D:\WorkSpace\Test\全国医院列表_R.csv'
shp_name = r'D:\WorkSpace\Test\全国医院列表_R.shp'
xrk.csv_to_shp(csv_name, shp_name, '经度', '纬度')

全国医院列表_R.shp saved (2025-02-23 18:20:00)


##### 2. 分区统计

```python
  zonal_statistics(
    value_raster: str,                # 值的栅格文件路径
    zone_file: str,                   # 分区的文件路径，支持tif或shp
    zone_field: Any | None = None,    # （可选）分区文件的字段名
    statistic_type: str = 'mean',     # （可选）统计类型，如'mean'、'sum'、'max'等，默认为'mean'
    bins: Any | None = None,          # （可选）分区的分级，依据值进行分区时使用，如[0, 10, 20, 30]
    write_raster: Any | None = None   # （可选）输出栅格文件路径，输出不同分区的统计值栅格
) -> DataFrame                        # 返回一个DataFrame，包含统计结果
```

In [1]:
import xrkit as xrk

value_raster = r'D:\WorkSpace\耕地复垦潜力\data\Factors\tif_1km\dem.tif'
zone_file = r'D:\WorkSpace\耕地复垦潜力\data\AdministrativeDivision\province.shp'

table = xrk.zonal_statistics(value_raster, zone_file, '省')
print(table.head())

          mean classes
0     4.574573     上海市
1  1881.828425     云南省
2  1014.215883  内蒙古自治区
3   365.434573     北京市
4   787.025546     台湾省
