## Check

In [5]:
import pandas as pd

# 気象庁のウェブページにあるテーブルを読み込む
html_table = 'https://www.data.jma.go.jp/stats/etrn/view/hourly_a1.php?prec_no=66&block_no=0669&year=2024&month=07&day=06&view=p1'
df = pd.read_html(html_table)[0]

# データフレームを表示
df.head()

Unnamed: 0_level_0,時,降水量 (mm),気温 (℃),露点 温度 (℃),蒸気圧 (hPa),湿度 (％),風速・風向,風速・風向,日照 時間 (h),雪,雪
Unnamed: 0_level_1,時,降水量 (mm),気温 (℃),露点 温度 (℃),蒸気圧 (hPa),湿度 (％),平均風速 (m/s),風向,日照 時間 (h),降雪 (cm),積雪 (cm)
0,1,0.0,28.9,22.4,27.1,68,2.2,西,,///,///
1,2,0.0,28.2,22.4,27.2,71,1.2,西,,///,///
2,3,0.0,28.1,22.6,27.4,72,1.4,西南西,,///,///
3,4,0.0,27.0,22.8,27.8,78,0.6,西南西,,///,///
4,5,0.0,27.5,22.9,27.9,76,1.3,南南西,0.0,///,///


In [4]:
df[['時','降水量 (mm)','気温 (℃)','風速・風向']].head()

Unnamed: 0_level_0,時,降水量 (mm),気温 (℃),風速・風向,風速・風向
Unnamed: 0_level_1,時,降水量 (mm),気温 (℃),平均風速 (m/s),風向
0,1,0.0,28.9,2.2,西
1,2,0.0,28.2,1.2,西
2,3,0.0,28.1,1.4,西南西
3,4,0.0,27.0,0.6,西南西
4,5,0.0,27.5,1.3,南南西


## Save HTML as csv

In [50]:
import pandas as pd
from datetime import datetime, timedelta

# 開始日と終了日
start_date = datetime(2016, 1, 1)
end_date = datetime(2016, 1, 30)

# データを格納するリスト
data_frames = []

# データを取得するための関数
def fetch_data(year, month, day):
    url = f'https://www.data.jma.go.jp/stats/etrn/view/hourly_a1.php?prec_no=66&block_no=0669&year={year}&month={month}&day={day}&view=p1'
    try:
        # HTMLテーブルを読み込み
        df = pd.read_html(url)[0]
        # 必要な列を抽出
        df = df[['時','降水量 (mm)','気温 (℃)','風速・風向']]
        # print(df)
        # 日時列を追加
        df['日時'] = pd.to_datetime(f"{year}-{month:02d}-{day:02d} " + df['時'].astype(str) + ":00:00")
        df.drop(columns=['時'], inplace=True)
        return df
    except Exception as e:
        print(f"Error fetching data for {year}-{month:02d}-{day:02d}: {e}")
        return None

# 期間内の日付でループ
current_date = start_date
while current_date <= end_date:
    year = current_date.year
    month = current_date.month
    day = current_date.day
    
    df = fetch_data(year, month, day)
    
    if df is not None:
        data_frames.append(df)
    
    # 次の日に進める
    current_date += timedelta(days=1)

# すべてのデータを連結
final_df = pd.concat(data_frames)
final_df

     時 降水量 (mm) 気温 (℃)      風速・風向     
     時 降水量 (mm) 気温 (℃) 平均風速 (m/s)   風向
0    1      0.0    2.0        0.3  西南西
1    2      0.0    1.7        0.6  西南西
2    3      0.0    0.9        0.3  北北西
3    4      0.0    1.0        1.0  南南西
4    5      0.0    0.2        0.2   静穏
5    6      0.0    0.4        0.1   静穏
6    7      0.0    0.1        0.9   南西
7    8      0.0    0.4        0.4  南南東
8    9      0.0    2.6        0.7    西
9   10      0.0    5.4        0.0   静穏
10  11      0.0    8.8        0.7    南
11  12      0.0    9.9        2.1  南南西
12  13      0.0   10.2        3.4   南西
13  14      0.0   10.4        3.2  南南西
14  15      0.0    9.8        4.3   南西
15  16      0.0   10.1        4.2   南西
16  17      0.0    9.5        2.1   南西
17  18      0.0    8.5        0.5   南西
18  19      0.0    6.5        0.3  北北西
19  20      0.0    5.4        0.1   静穏
20  21      0.0    4.2        0.2   静穏
21  22      0.0    3.4        0.4    東
22  23      0.0    2.9        0.4   北東
23  24      0.0    2.6   

ValueError: No objects to concatenate

In [None]:

# CSVファイルに保存
final_df.to_csv("weather_data_2016_to_2024.csv", index=False)