# สร้างลิสต์ชื่อไฟล์ที่จะใช้ในการโมเสคฝนรายชั่วโมงทั้งประเทศ

In [1]:
'''
2024.09.22
โค้ดนี้พัฒนาโดย รองศาสตราจารย์ ดร. นัฐพล มหาวิค ภาควิชาทรัพยากรธรรมชาติและสิ่งแวดล้อม คณะเกษตรศาสตร์ฯ มหาวิทยาลัยนเรศวร 
ในงานวิจัย เรื่อง "การวิจัยและพัฒนาผลิตภัณฑ์โมเสคฝนประมาณค่าจากเรดาร์ตรวจอากาศในพื้นที่ระดับลุ่มน้ำของประเทศไทยด้วยเทคโนโลยีภูมิสารสนเทศรหัสเปิด"
สนับสนุนทุนวิจัยโดยสํานักงานการวิจัยแห่งชาติ (วช.)  แผนงานการวิจัยและนวัตกรรมแผนงานด้านการบริหารจัดการภัยพิบัติทางธรรมชาติ 
ประจำปีงบประมาณ 2566  ตามสัญญา เลขที่ N25A660467 ผู้นำโค้ดนี้ไปใช้หรือดัดแปลงควรอ้างอิงงานวิจัยชิ้นนี้ตามหลักเกณฑ์การอ้างอิงสากล
เรียนหลักการเรดาร์และภูมิสารสนเทศ ที่ https://www.youtube.com/@Nattapon_Mahavik/playlists
หนังสือเรดาร์ตรวจอากาศทางอุตุนิยมวิทยา สำนักพิมพ์จุฬาฯ : https://www.chulabook.com/education/144567
หนังสือออนไลน์เรดาร์ตรวจอากาศทางอุตุนิยมวิทยา สำนักพิมพ์จุฬาฯ : https://www.chulabook.com/education/205129
ติดต่อ nattaponm@nu.ac.th
'''
import os
import re

def extract_timestamps(input_path):
    timestamp_pattern = re.compile(r'(\d{10})')  # Matches YYYYMMDDhh
    timestamp_set = set()
    
    print(f"Scanning directory: {input_path}")
    for station in os.listdir(input_path):
        station_path = os.path.join(input_path, station)
        if os.path.isdir(station_path):
            print(f"Scanning station directory: {station}")
            for filename in os.listdir(station_path):
                print(f"  Processing file: {filename}")
                match = timestamp_pattern.search(filename)
                if match:
                    timestamp = match.group(1)
                    print(f"    Found timestamp: {timestamp}")
                    timestamp_set.add(timestamp)
                else:
                    print(f"    No timestamp found in filename: {filename}")
    
    timestamp_list = sorted(list(timestamp_set))
    print(f"Total unique timestamps found: {len(timestamp_list)}")
    return timestamp_list

def save_timestamp_list(timestamp_list, output_file):
    os.makedirs(os.path.dirname(output_file), exist_ok=True)
    with open(output_file, 'w') as f:
        for timestamp in timestamp_list:
            f.write(f"{timestamp}\n")
    print(f"Timestamp list saved to {output_file}")

def read_timestamp_list(input_file):
    with open(input_file, 'r') as f:
        return [line.strip() for line in f]

# Set paths
input_path = '../1data/0radar/1Mosaic_hourly_1hour_sotntihn/' # เปลี่ยนตรงนี้
output_file = './0variables_cappi/cappi_hourly_times.txt' # เข้าไปดูไฟลืนี้ในโฟลเดอร์ที่ตั้งไว้

# Generate and save timestamp list
timestamps = extract_timestamps(input_path)
save_timestamp_list(timestamps, output_file)
print(f"Generated {len(timestamps)} timestamps")

# Read the list back and print for verification
mos_times = read_timestamp_list(output_file)
print(f"Read {len(mos_times)} timestamps from file")
print("First few timestamps:", mos_times[:5])
if len(mos_times) > 5:
    print("Last few timestamps:", mos_times[-5:])

Scanning directory: ../1data/0radar/1Mosaic_hourly_1hour_sotntihn/
Scanning station directory: CHN
  Processing file: CHN240@201807171400.uf.bz2
    Found timestamp: 2018071714
  Processing file: CHN240@201807171415.uf.bz2
    Found timestamp: 2018071714
  Processing file: CHN240@201807171430.uf.bz2
    Found timestamp: 2018071714
  Processing file: CHN240@201807171445.uf.bz2
    Found timestamp: 2018071714
Scanning station directory: CMP
  Processing file: CMP240@201807171400.uf.bz2
    Found timestamp: 2018071714
  Processing file: CMP240@201807171415.uf.bz2
    Found timestamp: 2018071714
  Processing file: CMP240@201807171430.uf.bz2
    Found timestamp: 2018071714
  Processing file: CMP240@201807171445.uf.bz2
    Found timestamp: 2018071714
Scanning station directory: CRI
  Processing file: CRI240@201807171400.uf.bz2
    Found timestamp: 2018071714
  Processing file: CRI240@201807171415.uf.bz2
    Found timestamp: 2018071714
  Processing file: CRI240@201807171430.uf.bz2
    Found t