In [1]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
from datetime import datetime, timedelta

In [8]:
DIR_CSV = "Z:\\lab\\output\\logs\\seed_20000_no_40000_behavior_log.csv"

In [9]:
BEHAVIOR_TYPE_TO_ACTIVITY = {
    "SLEEP": "睡眠",
    "EATING": "食事",
    "PERSONAL_CARE": "身のまわりの用事",
    "MEDICAL_CARE": "療養・静養",
    "WORK": "仕事",
    "WORK_SOCIALIZING": "仕事のつきあい",
    "SCHOOL_ACTIVITIES": "授業・学内の活動",
    "STUDY_OUTSIDE": "学校外の学習",
    "HOUSEWORK": "炊事・掃除・洗濯",
    "SHOPPING": "買い物",
    "CHILDCARE": "子どもの世話",
    "HOUSEHOLD_TASKS": "家庭雑事",
    "COMMUTING": "通勤",
    "SCHOOL_COMMUTING": "通学",
    "SOCIAL_PARTICIPATION": "社会参加",
    "SOCIALIZING": "会話・交際",
    "SPORTS": "スポーツ",
    "RECREATION": "行楽・散策",
    "HOBBIES": "趣味・娯楽・教養",
    "MEDIA_CONSUMPTION": "マスメディア接触",
    "REST": "休息"
}
# 各アクティビティに対して色を指定
COLOR_MAP = {
    '食事': '#5DAE8B',  # 濃いめの柔らかいグリーン
    '授業・学内の活動': '#E59866',  # 濃いめの柔らかいオレンジ
    '買い物': '#F7DC6F',  # 濃いめのイエロー
    '会話・交際': '#5499C7',  # 濃いめの柔らかいブルー
    'マスメディア接触': '#AF7AC5',  # 濃いめのパープル
    '仕事': '#F4D03F',  # 濃いライトゴールド
    '療養・静養': '#EC7063',  # 濃いめのピンク
    '子どもの世話': '#5DADE2',  # 濃いライトブルー
    '行楽・散策': '#DC7633',  # 濃いめのオレンジ
    '休息': '#58D68D',  # 濃いめのグリーン
    '睡眠': '#28B463',  # 濃いめのグリーン
    '通勤': '#85C1E9',  # 濃いめのブルー
    'スポーツ': '#F1C40F',  # 濃いめのライトイエロー
    '身のまわりの用事': '#E74C3C',  # 濃いめのレッド
    '家庭雑事': '#48C9B0',  # 濃いめのアクア
    '通学': '#A569BD',  # 濃いラベンダー
    '炊事・掃除・洗濯': '#F1948A',  # 濃いめのピンクベージュ
    '趣味・娯楽・教養': '#F5B041',  # 濃いゴールド
    '仕事のつきあい': '#85929E',  # 濃いめのグレー
    '社会参加': '#F8C471',  # 濃いめのライトオレンジ
    '学校外の学習': '#76D7C4'  # 濃いめのアクア
}
ACTIVITY_ORDERING = [
            "睡眠", "食事", "身のまわりの用事", "療養・静養", "仕事", "仕事のつきあい", "授業・学内の活動",
            "学校外の学習", "炊事・掃除・洗濯", "買い物", "子どもの世話", "家庭雑事", "通勤", "通学", "社会参加",
            "会話・交際", "スポーツ", "行楽・散策", "趣味・娯楽・教養", "マスメディア接触", "休息"]

def parse_current_time_to_datetime(time_str):
    # "0/00:00:00" 形式の文字列をパース
    day_part, time_part = time_str.split('/')  # 例: "0", "00:00:00"
    hours, minutes, seconds = map(int, time_part.split(':'))  # 時、分、秒をintに変換
    days = int(day_part)  # 日数部分をintに変換

    # 基準日（例えば、今日の日付）からの timedelta を計算
    base_date = datetime(2024, 9, 1)  # 基準日を設定（任意の日付を使用）
    delta = timedelta(days=days, hours=hours, minutes=minutes, seconds=seconds)
    
    # 基準日に timedelta を加えて最終的な datetime を計算
    result_datetime = base_date + delta
    return result_datetime

In [14]:
# result = pd.read_csv(DIR_CSV).replace(BEHAVIOR_TYPE_TO_ACTIVITY)
result = pd.read_csv("C:\\Users\\tora2\\Downloads\\seed_20000_no_40000_behavior_log.csv").replace(BEHAVIOR_TYPE_TO_ACTIVITY)
weekday = result.query("CurrentDay not in ('SUNDAY','SATURDAY')").drop(columns=["CurrentDay"])
saturday = result.query("CurrentDay == 'SATURDAY'").drop(columns=["CurrentDay"])
sunday = result.query("CurrentDay == 'SUNDAY'").drop(columns=["CurrentDay"])
allday = result.drop(columns=["CurrentDay"])

In [16]:
weekday.head()

Unnamed: 0,CurrentTime,Person1,Person2,Person3,Person4,Person5,Person6,Person7,Person8,Person9,...,Person42840,Person42841,Person42842,Person42843,Person42844,Person42845,Person42846,Person42847,Person42848,Person42849
0,0/00:00:00,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,...,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,学校外の学習,睡眠
1,0/00:01:00,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,...,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,学校外の学習,睡眠
2,0/00:02:00,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,...,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,学校外の学習,睡眠
3,0/00:03:00,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,...,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,学校外の学習,睡眠
4,0/00:04:00,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,...,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,睡眠,学校外の学習,睡眠


In [34]:
df_grouped = pd.melt(weekday, id_vars=["CurrentTime"], var_name="Human", value_name="Activity").groupby(['CurrentTime', 'Activity']).size().unstack(fill_value=0)
df_percentage = df_grouped.div(df_grouped.sum(axis=1), axis=0)
result_cleaned = df_percentage.reset_index().melt(id_vars=["CurrentTime"],value_name="Rate")
result_cleaned["Time"] = result_cleaned["CurrentTime"].apply(parse_current_time_to_datetime)
result_cleaned = result_cleaned.sort_values("Time")
# result_cleaned['DayOfWeek'] = result_cleaned['Time'].dt.strftime('%a')  # 曜日 (Mon, Tue, etc.)
# # 横軸に日付と曜日を表示するようにするために、日時 + 曜日の文字列を作成
# result_cleaned['TimeWithDay'] = result_cleaned['Time'].dt.strftime('%m/%d %H:%M (%a)')

In [40]:
result_cleaned["CurrentTime"] = result_cleaned["CurrentTime"].apply(lambda x: x[-5:])
result_cleaned["Time"] = pd.to_datetime(result_cleaned["CurrentTime"]).format("HH:MM")


Could not infer format, so each element will be parsed individually, falling back to `dateutil`. To ensure parsing is consistent and as-expected, please specify a format.



DateParseError: hour must be in 0..23: 24:00, at position 24

In [45]:
# 目盛りを間引いて設定するため、例えば1日ごとに間引いて設定
# tick_step = 96  # 15分間隔でのタイムティックで96が1日分に相当（24時間 ÷ 0.25時間）
# tickvals = result_cleaned['Time'][::tick_step]  # 1日ごとに目盛りを表示
# ticktext = result_cleaned['TimeWithDay'][::tick_step]  # 1日ごとの時間と曜日



# 折れ線グラフを作成
fig = go.Figure()

# # 算出データの実線グラフ
# for activity in ACTIVITY_ORDERING:
#     filtered_df = result_cleaned[result_cleaned['Activity'] == activity]
#     fig.add_trace(go.Scatter(
#         x=filtered_df['Time'],  # 時間軸はdatetimeのTime列
#         y=filtered_df['Rate'], 
#         mode='lines', 
#         name=f'{activity} (シミュレーション値)', 
#         line=dict(dash='solid', color=COLOR_MAP.get(activity))
#     ))

# 元データの点線グラフ  
for activity in ACTIVITY_ORDERING:
    filtered_df = data_hourly_cleaned[data_hourly_cleaned['Activity'] == activity]
    fig.add_trace(go.Scatter(
        x=filtered_df['Time'],
        y=filtered_df['Rate']/100,
        mode='lines',
        name=f'{activity} (sim)',
        line=dict(dash='dash', color=COLOR_MAP.get(activity))
    ))

# グラフのレイアウトを更新
fig.update_layout(
    title=f"統計値",
    xaxis_title="時間",
    yaxis_title="割合",
    legend_title="活動",
    template="plotly",
    xaxis=dict(
        tickmode='array',  # 固定された値で目盛りを表示
        # tickvals=tickvals,  # 表示したいタイムティック
        # ticktext=ticktext,  # 曜日を含めた目盛りテキスト
    )
)

# 結果をHTMLで保存
fig.write_html(f"Z:\\lab\\SSI2024_検証\\chart\\国民生活時間調査.html")
fig

In [32]:
result_cleaned

Unnamed: 0,CurrentTime,Activity,Rate,Time,DayOfWeek,TimeWithDay
0,0/00:00:00,スポーツ,0.000000,2024-09-01 00:00:00,Sun,09/01 00:00 (Sun)
4320,0/00:00:00,仕事のつきあい,0.000000,2024-09-01 00:00:00,Sun,09/01 00:00 (Sun)
25920,0/00:00:00,通勤,0.001540,2024-09-01 00:00:00,Sun,09/01 00:00 (Sun)
8640,0/00:00:00,子どもの世話,0.004528,2024-09-01 00:00:00,Sun,09/01 00:00 (Sun)
21600,0/00:00:00,買い物,0.000000,2024-09-01 00:00:00,Sun,09/01 00:00 (Sun)
...,...,...,...,...,...,...
2879,0/23:59:00,マスメディア接触,0.002964,2024-09-01 23:59:00,Sun,09/01 23:59 (Sun)
27359,0/23:59:00,通勤,0.000677,2024-09-01 23:59:00,Sun,09/01 23:59 (Sun)
1439,0/23:59:00,スポーツ,0.000583,2024-09-01 23:59:00,Sun,09/01 23:59 (Sun)
20159,0/23:59:00,社会参加,0.001144,2024-09-01 23:59:00,Sun,09/01 23:59 (Sun)


In [41]:
from tqdm import tqdm
"""pathの定義"""

DIR_HOURLY = 'C:/Users/tora2/IdeaProjects/LifeBehavior/data/2020_jikoku_all.csv'
DIR_FULL_DAY = 'C:/Users/tora2/IdeaProjects/LifeBehavior/data/2020_4shihyo_danjonenso.csv'
DIR_GENRE = 'C:/Users/tora2/IdeaProjects/LifeBehavior/data/nhk_genre.csv'

# 独自定義のラベルを適用するためにまず辞書を作る
small = [
    "睡眠", "食事", "身のまわりの用事", "療養・静養", "仕事", "仕事のつきあい",
    "授業・学内の活動", "学校外の学習", "炊事・掃除・洗濯", "買い物",
    "子どもの世話", "家庭雑事", "通勤", "通学", "社会参加", "会話・交際",
    "スポーツ", "行楽・散策", "趣味・娯楽・教養(インターネット除く)",
    "趣味・娯楽・教養のインターネット(動画除く)", "インターネット動画",
    "テレビ", "録画番組・DVD", "ラジオ", "新聞", "雑誌・マンガ・本",
    "音楽", "休息", "その他", "不明"
]
label_master = pd.read_csv(DIR_GENRE)
label_dict = {}
for k,v in zip(label_master["小分類"],label_master["モデル用定義"]):
    label_dict[k]=v

Activity_Ordering = list(set(label_dict.values()))

In [42]:
data_hourly = pd.read_csv(DIR_HOURLY)
data_hourly = data_hourly.set_axis(["Day","Group","Activity","Time","Rate"],axis=1)
data_hourly["Time"] = pd.to_datetime(data_hourly["Time"], format="%H:%M")
data_hourly = data_hourly.query("Group == '国民全体' & Activity in @small & Day == '平日'")
data_hourly["Activity"] = data_hourly["Activity"].map(label_dict) # 独自定義のラベル適用
data_hourly_cleaned = data_hourly[["Activity","Time","Rate"]].groupby(["Time","Activity"],as_index=False).sum().copy()

In [30]:
data_hourly_cleaned

Unnamed: 0,Time,Activity,Rate
0,1900-01-01 00:00:00,スポーツ,0.0
1,1900-01-01 00:00:00,マスメディア接触,2.9
2,1900-01-01 00:00:00,仕事,1.6
3,1900-01-01 00:00:00,仕事のつきあい,0.0
4,1900-01-01 00:00:00,休息,0.5
...,...,...,...
2011,1900-01-01 23:45:00,趣味・娯楽・教養,2.8
2012,1900-01-01 23:45:00,身のまわりの用事,4.4
2013,1900-01-01 23:45:00,通勤,0.4
2014,1900-01-01 23:45:00,通学,0.0


In [13]:
import plotly.graph_objects as go
# result tableから集計
df_grouped = result.groupby(['Time', 'Activity']).size().unstack(fill_value=0)
df_percentage = df_grouped.div(df_grouped.sum(axis=1), axis=0)
result_cleaned = df_percentage.reset_index().melt(id_vars=["Time"],value_name="Rate")

# 各アクティビティに対して色を指定
color_map = {
    '食事': '#5DAE8B',  # 濃いめの柔らかいグリーン
    '授業・学内の活動': '#E59866',  # 濃いめの柔らかいオレンジ
    '買い物': '#F7DC6F',  # 濃いめのイエロー
    '会話・交際': '#5499C7',  # 濃いめの柔らかいブルー
    'マスメディア接触': '#AF7AC5',  # 濃いめのパープル
    '仕事': '#F4D03F',  # 濃いライトゴールド
    '療養・静養': '#EC7063',  # 濃いめのピンク
    '子どもの世話': '#5DADE2',  # 濃いライトブルー
    '行楽・散策': '#DC7633',  # 濃いめのオレンジ
    '休息': '#58D68D',  # 濃いめのグリーン
    '睡眠': '#28B463',  # 濃いめのグリーン
    '通勤': '#85C1E9',  # 濃いめのブルー
    'スポーツ': '#F1C40F',  # 濃いめのライトイエロー
    '身のまわりの用事': '#E74C3C',  # 濃いめのレッド
    '家庭雑事': '#48C9B0',  # 濃いめのアクア
    '通学': '#A569BD',  # 濃いラベンダー
    '炊事・掃除・洗濯': '#F1948A',  # 濃いめのピンクベージュ
    '趣味・娯楽・教養': '#F5B041',  # 濃いゴールド
    '仕事のつきあい': '#85929E',  # 濃いめのグレー
    '社会参加': '#F8C471',  # 濃いめのライトオレンジ
    '学校外の学習': '#76D7C4'  # 濃いめのアクア
}



for activity in tqdm(Activity_Ordering):
    # Plotlyで折れ線グラフを作成
    fig = go.Figure()

    # 元データの点線グラフ  
    filtered_df = data_hourly_cleaned[data_hourly_cleaned['Activity'] == activity]
    fig.add_trace(go.Scatter(
        x=filtered_df['Time'],
        y=filtered_df['Rate']/100,
        mode='lines',
        name=f'{activity} (sim)',
        line=dict(dash='dash', color=color_map.get(activity))
    ))

    # 算出データの実線グラフ
    # for activity in Activity_Ordering:
    filtered_df = result_cleaned[result_cleaned['Activity'] == activity]
    fig.add_trace(go.Scatter(
        x=filtered_df['Time'],
        y=filtered_df['Rate'],
        mode='lines',
        name=f'{activity} (統計値)',
        line=dict(dash='solid', color=color_map.get(activity))
    ))

    fig.update_layout(
        title=f"平日 石垣市 {activity} における推定遷移確率によるマイクロシミュレーションの結果と統計値の比較",
        xaxis_title="時間",
        yaxis_title="割合",
        legend_title="活動",
        template="plotly",
    )

# fig.write_html(f"C:/Users/tora2/downloads/マルコフ連鎖モデル_{activity}.html")
fig

NameError: name 'result' is not defined