In [6]:
import pandas as pd
import matplotlib.pyplot as plt
import os

# 定义文件路径和场站数量
base_path = 'train/train1'
num_stations = 12

# 创建一个空的DataFrame用于存储所有场站的数据
all_data = pd.DataFrame()

# 循环读取12个场站的CSV文件
for i in range(1, num_stations + 1):
    file_path = os.path.join(base_path, f'train_ID_{i}.csv')
    
    # 读取CSV文件
    data = pd.read_csv(file_path)
    
    # 将 'date_time' 列转换为 datetime 类型
    data['date_time'] = pd.to_datetime(data['date_time'])
    
    # 将 'date_time' 列设置为索引
    data.set_index('date_time', inplace=True)
    
    # 重命名风速列为场站名称
    data.rename(columns={'wind_obs': f'场站{i}'}, inplace=True)
    
    # 将当前场站的数据合并到 all_data 中
    if all_data.empty:
        all_data = data
    else:
        all_data = all_data.join(data, how='wind_obs')

# 筛选出2023年6月1日至2024年6月30日的数据
start_date = '2023-06-01'
end_date = '2024-06-30'
filtered_data = all_data.loc[start_date:end_date]

# 检查数据是否每15分钟采集一次
time_diff = filtered_data.index.to_series().diff().value_counts()
print("时间间隔统计：")
print(time_diff)

# 绘制每个场站的风速数据
plt.figure(figsize=(14, 8))

# 绘制每个场站的风速曲线
for column in filtered_data.columns:
    plt.plot(filtered_data.index, filtered_data[column], label=column)

# 设置图表标题和标签
plt.title('2023年6月1日至2024年6月30日场站风速数据', fontsize=16)
plt.xlabel('时间', fontsize=14)
plt.ylabel('风速 (m/s)', fontsize=14)
plt.legend(title='场站', bbox_to_anchor=(1.05, 1), loc='upper left')  # 将图例放在图表外侧
plt.grid(True)

# 自动调整布局
plt.tight_layout()

# 显示图表
plt.show()

ValueError: do not recognize join method wind_obs