## Check

In [10]:
import pandas as pd

# 気象庁のウェブページにあるテーブルを読み込む
html_table = 'https://www.data.jma.go.jp/stats/etrn/view/hourly_a1.php?prec_no=66&block_no=0669&year=2024&month=07&day=06&view=p1'
df = pd.read_html(html_table)[0]

# データフレームを表示
df

Unnamed: 0_level_0,時,降水量 (mm),気温 (℃),露点 温度 (℃),蒸気圧 (hPa),湿度 (％),風速・風向,風速・風向,日照 時間 (h),雪,雪
Unnamed: 0_level_1,時,降水量 (mm),気温 (℃),露点 温度 (℃),蒸気圧 (hPa),湿度 (％),平均風速 (m/s),風向,日照 時間 (h),降雪 (cm),積雪 (cm)
0,1,0.0,28.9,22.4,27.1,68,2.2,西,,///,///
1,2,0.0,28.2,22.4,27.2,71,1.2,西,,///,///
2,3,0.0,28.1,22.6,27.4,72,1.4,西南西,,///,///
3,4,0.0,27.0,22.8,27.8,78,0.6,西南西,,///,///
4,5,0.0,27.5,22.9,27.9,76,1.3,南南西,0.0,///,///
5,6,0.0,27.7,23.3,28.6,77,2.7,南西,0.3,///,///
6,7,0.0,29.0,23.9,29.7,74,2.3,西南西,1.0,///,///
7,8,0.0,30.2,24.1,30.1,70,3.7,西南西,1.0,///,///
8,9,0.0,30.8,24.0,29.8,67,4.7,南西,1.0,///,///
9,10,0.0,31.5,23.9,29.6,64,4.2,南西,0.5,///,///


In [4]:
df[['時','降水量 (mm)','気温 (℃)','風速・風向']].head()

Unnamed: 0_level_0,時,降水量 (mm),気温 (℃),風速・風向,風速・風向
Unnamed: 0_level_1,時,降水量 (mm),気温 (℃),平均風速 (m/s),風向
0,1,0.0,28.9,2.2,西
1,2,0.0,28.2,1.2,西
2,3,0.0,28.1,1.4,西南西
3,4,0.0,27.0,0.6,西南西
4,5,0.0,27.5,1.3,南南西


## Save HTML as csv

In [15]:
import pandas as pd
from datetime import datetime, timedelta
import time  # timeモジュールをインポート

# 開始日と終了日
start_date = datetime(2016, 1, 1)
end_date = datetime(2016, 11, 2)

# データを格納するリスト
data_frames = []

# データを取得するための関数
def fetch_data(year, month, day):
    url = f"https://www.data.jma.go.jp/stats/etrn/view/hourly_a1.php?prec_no=66&block_no=0669&year={year}&month={month:02d}&day={day:02d}&view=p1"
    try:
        # HTMLテーブルを読み込み
        df = pd.read_html(url)[0]
        # 必要な列を抽出
        df = df[['時', '降水量 (mm)', '気温 (℃)', '風速・風向']]
        
        # 24の値を翌日の0時に調整
        # df['時'] = df['時'].replace(24, 0)  # 24を0に置き換える
        # df['日時'] = pd.to_datetime(f"{year}-{month:02d}-{day:02d} " + (df['時'] + 1).astype(str) + ":00:00")  # 時に1を加えて0時からスタート
        
        # df.drop(columns=['時'], inplace=True)
        return df
    except Exception as e:
        print(f"Error fetching data for {year}-{month:02d}-{day:02d}: {e}")
        return None

# 期間内の日付でループ
current_date = start_date
while current_date <= end_date:
    year = current_date.year
    month = current_date.month
    day = current_date.day
    df = fetch_data(year, month, day)
    
    data_frames.append(df)
    
    # 次の日に進める前に0.5秒待機
    # time.sleep(0.5)  # 0.5秒待つ
    
    # 次の日に進める
    current_date += timedelta(days=1)

# すべてのデータを連結
final_df = pd.concat(data_frames)
print(final_df)


     時 降水量 (mm) 気温 (℃)      風速・風向     
     時 降水量 (mm) 気温 (℃) 平均風速 (m/s)   風向
0    1      0.0    2.0        0.3  西南西
1    2      0.0    1.7        0.6  西南西
2    3      0.0    0.9        0.3  北北西
3    4      0.0    1.0        1.0  南南西
4    5      0.0    0.2        0.2   静穏
..  ..      ...    ...        ...  ...
19  20      0.0   12.5        0.4  北北東
20  21      0.0   11.7        1.2  北北西
21  22      0.0   10.7        0.0   静穏
22  23      0.0   10.9        0.7  東南東
23  24      0.0   12.1        0.7  北北西

[7368 rows x 5 columns]


In [4]:
print(f'{month:02d}')

01


In [None]:

# CSVファイルに保存
final_df.to_csv("weather_data_2016_to_2024.csv", index=False)