In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import os
from matplotlib.ticker import FuncFormatter

In [None]:
start_date = '2023-12-18'
# end_date ='2021-08-28'

start_date = pd.to_datetime(start_date) 
# end_date = pd.to_datetime(end_date)
end_date = start_date + pd.Timedelta(days=35)


In [None]:
target = '../Chanae-combined_files'
# sunny rainy winter
output_dir = '../Chanae-Graph/2023/winter'

In [None]:
sixfactor_dir = ['d2m','RH','temperature','rainfall','ws','uvb','durationOfDay','sevenFactor']
for dir in sixfactor_dir:
    if not os.path.exists(os.path.join(output_dir,dir)):
        os.makedirs(os.path.join(output_dir,dir))

### D2M

In [None]:
for file in os.listdir(target):
    df = pd.read_excel(os.path.join(target, file))
    df['date'] = pd.to_datetime(df['date'], format='%Y/%m/%d')    
    filtered_data = df[(df['date'] >= start_date) & (df['date'] <= end_date)]
    
    df = filtered_data

    # print(df.head(7))    
    # แปลงข้อมูลในคอลัมน์ 'date' เป็นชนิดข้อมูล datetime
    df['date'] = pd.to_datetime(df['date'])

    # กำหนด 'date' เป็น index
    df.set_index('date', inplace=True)

    # สร้าง DataFrame ใหม่โดยรวมข้อมูลทุก 7 วัน
    df_resampled = df.resample('7D').agg({'d2m': 'mean'})

    # เลื่อน index ไป 7 วัน
    df_resampled.index = df_resampled.index + pd.DateOffset(days=6)

    # # ตัดข้อมูลเฉพาะที่ต้องการแสดง
    end_date = df.index[-1]  # วันที่สิ้นสุดของข้อมูล
    df_resampled = df_resampled[df_resampled.index <= end_date]

    # พล็อตกราฟ
    plt.figure(figsize=(10, 6))

    # # พล็อตกราฟจุดน้ำค้าง
    plt.plot(df_resampled.index, df_resampled['d2m'], label='Dew Point', marker='o')

    # ปรับตำแหน่ง x ของ marker ให้ตรงกับข้อมูลที่ถูกรวมรวมแล้ว
    plt.xticks(df_resampled.index)


    # ปรับแต่งกราฟ
    plt.title('Dew Point Over Time (7-day Interval)')
    plt.xlabel('Date')
    plt.ylabel('Dew Point (°C)')
    plt.legend()
    plt.xticks(rotation=45)
    plt.grid(True)
    # บันทึกภาพเป็นไฟล์ PNG
    output_file = os.path.join(output_dir,sixfactor_dir[0], f'D2m_{file.split(".")[0]}.png')
    plt.savefig(output_file, bbox_inches='tight')
    plt.close()
    
    print(f"Saved graph to {output_file}")



### RH

In [None]:
for file in os.listdir(target):
    df = pd.read_excel(os.path.join(target, file))
    df['date'] = pd.to_datetime(df['date'], format='%Y/%m/%d')    
    filtered_data = df[(df['date'] >= start_date) & (df['date'] <= end_date)]
    
    df = filtered_data
    
    # แปลงข้อมูลในคอลัมน์ 'date' เป็นชนิดข้อมูล datetime
    df['date'] = pd.to_datetime(df['date'])

    # กำหนด 'date' เป็น index
    df.set_index('date', inplace=True)

    # สร้าง DataFrame ใหม่โดยรวมข้อมูลทุก 7 วัน
    df_resampled = df.resample('7D').agg({'RH': 'mean'})

    # เลื่อน index ไป 7 วัน
    df_resampled.index = df_resampled.index + pd.DateOffset(days=6)

    # # ตัดข้อมูลเฉพาะที่ต้องการแสดง
    end_date = df.index[-1]  # วันที่สิ้นสุดของข้อมูล
    df_resampled = df_resampled[df_resampled.index <= end_date]

    # พล็อตกราฟ
    plt.figure(figsize=(10, 6))

    # พล็อตกราฟความชื้น
    plt.plot(df_resampled.index, df_resampled['RH']*100, label='RH', marker='o')

    # ปรับตำแหน่ง x ของ marker ให้ตรงกับข้อมูลที่ถูกรวมรวมแล้ว
    plt.xticks(df_resampled.index)

    # ปรับแต่งกราฟ
    plt.title('Relative Humidity Over Time (7-day Interval)')
    plt.xlabel('Date')
    plt.ylabel('RH (%)')
    plt.legend()
    plt.xticks(rotation=45)
    plt.grid(True)
    # บันทึกภาพเป็นไฟล์ PNG
    output_file = os.path.join(output_dir,sixfactor_dir[1], f'RH_{file.split(".")[0]}.png')
    plt.savefig(output_file, bbox_inches='tight')
    plt.close()
    
    print(f"Saved graph to {output_file}")



### temperature

In [None]:
for file in os.listdir(target):
    df = pd.read_excel(os.path.join(target, file))
    df['date'] = pd.to_datetime(df['date'], format='%Y/%m/%d')
    filtered_data = df[(df['date'] >= start_date) & (df['date'] <= end_date)]
    df = filtered_data

    # แปลงข้อมูลในคอลัมน์ 'date' เป็นชนิดข้อมูล datetime
    df['date'] = pd.to_datetime(df['date'])

    # กำหนด 'date' เป็น index
    df.set_index('date', inplace=True)

   # สร้าง DataFrame ใหม่โดยรวมข้อมูลทุก 7 วัน
    df_resampled = df.resample('7D').agg({'minTemp': 'min', 'maxTemp': 'max', 'meanTemp': 'mean'})

    # เลื่อน index ไป 7 วัน
    df_resampled.index = df_resampled.index + pd.DateOffset(days=6)

    # # ตัดข้อมูลเฉพาะที่ต้องการแสดง
    end_date = df.index[-1]  # วันที่สิ้นสุดของข้อมูล
    df_resampled = df_resampled[df_resampled.index <= end_date]

    # พล็อตกราฟ
    plt.figure(figsize=(10, 6))

    # พล็อตกราฟอุณหภูมิ
    plt.plot(df_resampled.index, df_resampled['minTemp'], label='minTemp', marker='o')
    plt.plot(df_resampled.index, df_resampled['meanTemp'], label='meanTemp', marker='o')
    plt.plot(df_resampled.index, df_resampled['maxTemp'], label='maxTemp', marker='o')

    # ปรับตำแหน่ง x ของ marker ให้ตรงกับข้อมูลที่ถูกรวมรวมแล้ว
    plt.xticks(df_resampled.index)

    # ปรับแต่งกราฟ
    plt.title('Temperature Over Time (7-day Interval)')
    plt.xlabel('Date')
    plt.ylabel('Temp (°C)')
    plt.legend()
    plt.xticks(rotation=45)
    plt.grid(True)

    # บันทึกภาพเป็นไฟล์ PNG
    output_file = os.path.join(output_dir, sixfactor_dir[2],f'Temperature_{file.split(".")[0]}.png')
    plt.savefig(output_file, bbox_inches='tight')
    plt.close()

    print(f"Saved graph to {output_file}")

### rainfall

In [None]:
for file in os.listdir(target):
    df = pd.read_excel(os.path.join(target, file))
    df['date'] = pd.to_datetime(df['date'], format='%Y/%m/%d')    
    filtered_data = df[(df['date'] >= start_date) & (df['date'] <= end_date)]
    # print(filtered_data.tail())
    df = filtered_data
    
    # แปลงข้อมูลในคอลัมน์ 'date' เป็นชนิดข้อมูล datetime
    df['date'] = pd.to_datetime(df['date'])

    # กำหนด 'date' เป็น index
    df.set_index('date', inplace=True)

    # สร้าง DataFrame ใหม่โดยรวมข้อมูลทุก 7 วัน
    df_resampled = df.resample('7D').agg({'tp':'sum'}) 

    # เลื่อน index ไป 7 วัน
    df_resampled.index = df_resampled.index + pd.DateOffset(days=6)

    # # ตัดข้อมูลเฉพาะที่ต้องการแสดง
    end_date = df.index[-1]  # วันที่สิ้นสุดของข้อมูล
    df_resampled = df_resampled[df_resampled.index <= end_date]

    # Plot the graph
    plt.figure(figsize=(10, 6))

    plt.plot(df_resampled.index, df_resampled['tp']*1000, label='Rainfall', marker='o')

    # ปรับตำแหน่ง x ของ marker ให้ตรงกับข้อมูลที่ถูกรวมรวมแล้ว
    plt.xticks(df_resampled.index)

    plt.title('Rainfall Over Time (7-day Interval)')  # Corrected title
    plt.xlabel('Date')
    plt.ylabel('Rainfall (mm)')  # Adjusted unit to millimeters
    plt.legend()
    plt.xticks(rotation=45)
    plt.grid(True)
    # บันทึกภาพเป็นไฟล์ PNG
    output_file = os.path.join(output_dir, sixfactor_dir[3],f'Rainfall_{file.split(".")[0]}.png')
    plt.savefig(output_file, bbox_inches='tight')
    plt.close()
    
    print(f"Saved graph to {output_file}")

### WS

In [None]:
for file in os.listdir(target):
    df = pd.read_excel(os.path.join(target, file))
    df['date'] = pd.to_datetime(df['date'], format='%Y/%m/%d')    
    filtered_data = df[(df['date'] >= start_date) & (df['date'] <= end_date)]
    # print(filtered_data.tail())
    df = filtered_data
    
    # แปลงข้อมูลในคอลัมน์ 'date' เป็นชนิดข้อมูล datetime
    df['date'] = pd.to_datetime(df['date'])

    # กำหนด 'date' เป็น index
    df.set_index('date', inplace=True)

    # สร้าง DataFrame ใหม่โดยรวมข้อมูลทุก 7 วัน
    df_resampled = df.resample('7D').agg({'WS': 'mean'})

    # เลื่อน index ไป 7 วัน
    df_resampled.index = df_resampled.index + pd.DateOffset(days=6)

    # # ตัดข้อมูลเฉพาะที่ต้องการแสดง
    end_date = df.index[-1]  # วันที่สิ้นสุดของข้อมูล
    df_resampled = df_resampled[df_resampled.index <= end_date]

    # พล็อตกราฟ
    plt.figure(figsize=(10, 6))

    # พล็อตกราฟลม
    plt.plot(df_resampled.index, df_resampled['WS'], label='WS', marker='o')

    # ปรับตำแหน่ง x ของ marker ให้ตรงกับข้อมูลที่ถูกรวมรวมแล้ว
    plt.xticks(df_resampled.index)

    # ปรับแต่งกราฟ
    plt.title('Wind Speed Over Time (7-day Interval)')
    plt.xlabel('Date')
    plt.ylabel('WS (m/s)')
    plt.legend()
    plt.xticks(rotation=45)
    plt.grid(True)
    # บันทึกภาพเป็นไฟล์ PNG
    output_file = os.path.join(output_dir,sixfactor_dir[4], f'Ws_{file.split(".")[0]}.png')
    plt.savefig(output_file, bbox_inches='tight')
    plt.close()
    
    print(f"Saved graph to {output_file}")
        

### uvb

In [None]:
for file in os.listdir(target):
    df = pd.read_excel(os.path.join(target, file))
    df['date'] = pd.to_datetime(df['date'], format='%Y/%m/%d')    
    filtered_data = df[(df['date'] >= start_date) & (df['date'] <= end_date)]
    # print(filtered_data.tail())
    df = filtered_data
    
    # แปลงข้อมูลในคอลัมน์ 'date' เป็นชนิดข้อมูล datetime
    df['date'] = pd.to_datetime(df['date'])

    # กำหนด 'date' เป็น index
    df.set_index('date', inplace=True)

    # Convert 'uvb' column to numeric, coerce errors to NaN
    df['uvb'] = pd.to_numeric(df['uvb'], errors='coerce')

    # สร้าง DataFrame ใหม่โดยรวมข้อมูลทุก 7 วัน
    df_resampled = df.resample('7D').agg({'uvb': 'mean'})

    # เลื่อน index ไป 7 วัน
    df_resampled.index = df_resampled.index + pd.DateOffset(days=6)

    # ตัดข้อมูลเฉพาะที่ต้องการแสดง
    end_date = df.index[-1]  # วันที่สิ้นสุดของข้อมูล
    df_resampled = df_resampled[df_resampled.index <= end_date]

    # พล็อตกราฟ
    plt.figure(figsize=(10, 6))
    plt.plot(df_resampled.index, df_resampled['uvb'], label='radiation', marker='o')
    plt.xticks(df_resampled.index)

    # แสดงตัวเลขบนแต่ละ marker
    for i, value in enumerate(df_resampled['uvb']):
        plt.text(df_resampled.index[i], value, f'{value:.2f}', ha='left', va='bottom')

    # ปรับแต่งกราฟ
    plt.title('Radiation Over Time (7-day Interval)')
    plt.xlabel('Date')
    plt.ylabel('Radiation (J/m^2)')
    plt.legend()
    plt.grid(True)
    plt.tight_layout()
    # บันทึกภาพเป็นไฟล์ PNG
    output_file = os.path.join(output_dir,sixfactor_dir[5], f'Radiation_{file.split(".")[0]}.png')
    plt.savefig(output_file, bbox_inches='tight')
    plt.close()
    
    print(f"Saved graph to {output_file}")
        

### durationOfDay

In [None]:
def convert_to_time(value):
  hours = int(value)
  minutes = round((value - hours) * 60)
  return f"{hours}h{minutes}m"

In [None]:
for file in os.listdir(target):
    df = pd.read_excel(os.path.join(target, file))
    df['date'] = pd.to_datetime(df['date'], format='%Y/%m/%d')    
    filtered_data = df[(df['date'] >= start_date) & (df['date'] <= end_date)]
    # print(filtered_data.tail())
    df = filtered_data

    # แปลงข้อมูลในคอลัมน์ 'date' เป็นชนิดข้อมูล datetime
    df['date'] = pd.to_datetime(df['date'])

    # กำหนด 'date' เป็น index
    df.set_index('date', inplace=True)

    # คำนวณระยะเวลาของแต่ละวัน
    df['duration_of_day'] = pd.to_datetime(df['sunset']) - pd.to_datetime(df['sunrise'])

    # สร้าง DataFrame ใหม่โดยรวมข้อมูลทุก 7 วัน
    df_resampled = df.resample('7D').agg({'duration_of_day': 'mean'})

    # เลื่อน index ไป 7 วัน
    df_resampled.index = df_resampled.index + pd.DateOffset(days=6)

    # แปลงระยะเวลาจากวินาทีเป็น ชั่วโมงและนาที
    df_resampled['duration_hours'] = df_resampled['duration_of_day'].dt.seconds // 3600
    df_resampled['duration_minutes'] = (df_resampled['duration_of_day'].dt.seconds % 3600) // 60

    # ตัดข้อมูลเฉพาะที่ต้องการแสดง
    end_date = df.index[-1]  # วันที่สิ้นสุดของข้อมูล
    df_resampled = df_resampled[df_resampled.index <= end_date]

    # พล็อตกราฟ
    plt.figure(figsize=(10, 6))
    plt.plot(df_resampled.index, df_resampled['duration_hours'] + df_resampled['duration_minutes'] / 60, label='duration_of_day', marker='o')
    plt.xticks(df_resampled.index)

    # แสดงตัวเลขบนแต่ละ marker
    for i, (hours, minutes) in enumerate(zip(df_resampled['duration_hours'], df_resampled['duration_minutes'])):
        time_str = f'{int(hours)}h {int(minutes)}m'
        plt.text(df_resampled.index[i], hours + minutes / 60, time_str, ha='left', va='bottom')

    # ปรับแต่งกราฟ
    plt.title('Duration of Day Over Time (7-day Interval)')
    plt.xlabel('Date')
    plt.ylabel('Duration of Day')

    # กำหนดแกน y ให้แสดงเป็นรูปแบบ "11h48m"
    plt.gca().yaxis.set_major_formatter(FuncFormatter(lambda x, _: convert_to_time(x)))

    plt.legend()
    plt.grid(True)
    plt.tight_layout()
    # บันทึกภาพเป็นไฟล์ PNG
    output_file = os.path.join(output_dir,sixfactor_dir[6], f'Duration_of_Day_{file.split(".")[0]}.png')
    plt.savefig(output_file, bbox_inches='tight')
    plt.close()
    
    print(f"Saved graph to {output_file}")

### combination all together

In [None]:
for file in os.listdir(target):
    df = pd.read_excel(os.path.join(target, file))
    df['date'] = pd.to_datetime(df['date'], format='%Y/%m/%d')    
    filtered_data = df[(df['date'] >= start_date) & (df['date'] <= end_date)]

    df = filtered_data

    # print(df.head(7))    
    # แปลงข้อมูลในคอลัมน์ 'date' เป็นชนิดข้อมูล datetime
    df['date'] = pd.to_datetime(df['date'])

    # กำหนด 'date' เป็น index
    df.set_index('date', inplace=True)

    # คำนวณระยะเวลาของแต่ละวัน
    df['duration_of_day'] = pd.to_datetime(df['sunset']) - pd.to_datetime(df['sunrise'])

    # สร้าง DataFrame ใหม่โดยรวมข้อมูลทุก 7 วัน
    df_resampled = df.resample('7D').agg({'d2m': 'mean', 
                                          'RH': 'mean', 
                                          'minTemp': 'min',
                                          'maxTemp': 'max',
                                          'meanTemp': 'mean',
                                          'tp': 'sum',
                                          'WS': 'mean',
                                          'uvb': 'mean',
                                          'duration_of_day': 'mean'
                                          })

    # เลื่อน index ไป 7 วัน
    df_resampled.index = df_resampled.index + pd.DateOffset(days=6)

    # # ตัดข้อมูลเฉพาะที่ต้องการแสดง
    end_date = df.index[-1]  # วันที่สิ้นสุดของข้อมูล
    df_resampled = df_resampled[df_resampled.index <= end_date]

    # แปลงระยะเวลาจากวินาทีเป็น ชั่วโมงและนาที
    df_resampled['duration_hours'] = df_resampled['duration_of_day'].dt.seconds // 3600
    df_resampled['duration_minutes'] = (df_resampled['duration_of_day'].dt.seconds % 3600) // 60

    # # พล็อตกราฟ
    plt.figure(figsize=(10, 6))

    # # พล็อตกราฟจุดน้ำค้าง
    plt.plot(df_resampled.index, df_resampled['d2m'], label='Dew Point (°C)', marker='o')
    plt.plot(df_resampled.index, df_resampled['RH']*100, label='RH (%)', marker='o')
    plt.plot(df_resampled.index, df_resampled['minTemp'], label='minTemp (°C)', marker='o')
    plt.plot(df_resampled.index, df_resampled['meanTemp'], label='meanTemp (°C)', marker='o')
    plt.plot(df_resampled.index, df_resampled['maxTemp'], label='maxTemp (°C)', marker='o')
    plt.plot(df_resampled.index, df_resampled['tp']*1000, label='Rainfall (mm)', marker='o')
    plt.plot(df_resampled.index, df_resampled['WS'], label='WS (m/s)', marker='o')
    # 0 -> /1000
    plt.plot(df_resampled.index, df_resampled['uvb']/1000, label='radiation (kJ/m^2) ', marker='o')
    plt.plot(df_resampled.index, df_resampled['duration_hours'] + df_resampled['duration_minutes'] / 60, label='duration_of_day (hours)', marker='o')



    # ปรับตำแหน่ง x ของ marker ให้ตรงกับข้อมูลที่ถูกรวมรวมแล้ว
    plt.xticks(df_resampled.index)


    # ปรับแต่งกราฟ
    plt.title('Seven Factor (7-day Interval)')
    plt.xlabel('Date')
    # ปรับตำแหน่ง label ให้ไม่บังกราฟ
    # plt.legend()
    plt.legend(bbox_to_anchor=(1, 1), loc='upper left')
    plt.xticks(rotation=45)
    # plt.tight_layout()
    plt.grid(True)

    # บันทึกภาพเป็นไฟล์ PNG
    output_file = os.path.join(output_dir,sixfactor_dir[7], f'SevenFactor_{file.split(".")[0]}.png')
    plt.savefig(output_file, bbox_inches='tight')
    plt.close()
    
    print(f"Saved graph to {output_file}")
