In [38]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from matplotlib import rcParams

In [39]:
# 日本語のフォント設定
rcParams['font.family'] = 'DejaVu Sans'
plt.rcParams['axes.unicode_minus'] = False

In [40]:
# データの読み込み
df = pd.read_csv('../data/SSDSE-B-2025.csv', encoding='shift_jis')

In [41]:
# 基本統計を表示
def basic_statistics(df):
    # 必要な経済や生活指標を選択
    key_indicators = [
        '消費支出(二人以上の世帯)',
        '教育費(二人以上の世帯)',
        '保健医療費(二人以上の世帯)',
        '中学校卒業者のうち進学者数',
        '高等学校卒業者のうち進学者数',
        '一般病院数',
        '一般診療所数',
        '転入者数(日本人移動者)',
        '転出者数(日本人移動者)',
    ]

    # 基本統計量
    for indicator in key_indicators:
        if indicator in df.columns:
            print(f"{indicator}の基本統計量:")
            print(f"平均: {df[indicator].mean():.2f}")
            print(f"標準偏差: {df[indicator].std():.2f}")
            print(f"最大値: {df[indicator].max():.2f} (都道府県: {df[df[indicator] == df[indicator].max()]['都道府県'].iloc[0]})")
            print(f"最小値: {df[indicator].min():.2f} (都道府県: {df[df[indicator] == df[indicator].min()]['都道府県'].iloc[0]})")

In [48]:
print("基本統計量の表示")
print(f"データ形状: {df.shape}")
print(f"年度範囲: {df['年度'].min()}年 - {df['年度'].max()}年")
print(f"都道府県数: {df['都道府県'].nunique()}県")
print(df.columns.tolist())

基本統計量の表示
データ形状: (564, 112)
年度範囲: 2011年 - 2022年
都道府県数: 47県
['年度', '地域コード', '都道府県', '総人口', '総人口（男）', '総人口（女）', '日本人人口', '日本人人口（男）', '日本人人口（女）', '15歳未満人口', '15歳未満人口（男）', '15歳未満人口（女）', '15〜64歳人口', '15〜64歳人口（男）', '15〜64歳人口（女）', '65歳以上人口', '65歳以上人口（男）', '65歳以上人口（女）', '出生数', '出生数（男）', '出生数（女）', '合計特殊出生率', '死亡数', '死亡数（男）', '死亡数（女）', '転入者数（日本人移動者）', '転入者数（日本人移動者）（男）', '転入者数（日本人移動者）（女）', '転出者数（日本人移動者）', '転出者数（日本人移動者）（男）', '転出者数（日本人移動者）（女）', '婚姻件数', '離婚件数', '年平均気温', '最高気温（日最高気温の月平均の最高値）', '最低気温（日最低気温の月平均の最低値）', '降水日数（年間）', '降水量（年間）', '着工建築物数', '着工建築物床面積', '旅館営業施設数（ホテルを含む）', '旅館営業施設客室数（ホテルを含む）', '標準価格（平均価格）（住宅地）', '標準価格（平均価格）（商業地）', '幼稚園数', '幼稚園教員数', '幼稚園在園者数', '小学校数', '小学校教員数', '小学校児童数', '中学校数', '中学校教員数', '中学校生徒数', '中学校卒業者数', '中学校卒業者のうち進学者数', '高等学校数', '高等学校教員数', '高等学校生徒数', '高等学校卒業者数', '高等学校卒業者のうち進学者数', '短期大学数', '大学数', '短期大学教員数', '大学教員数', '短期大学学生数', '大学学生数', '短期大学卒業者数', '短期大学卒業者のうち進学者数', '大学卒業者数', '大学卒業者のうち進学者数', '専修学校数', '各種学校数', '専修学校生徒数', '各種学校生徒数', '新規求職申込件数（一般）', '月間有効求職者数（一般）', '月間有効求人数（一般）'

In [60]:
# 派生指標の計算
def calculate_derived_indicators(df):
    # 進学率の計算
    df['中学進学率'] = (df['中学校卒業者のうち進学者数'] / df['中学校卒業者数'] * 100).round(2)
    df['高校進学率'] = (df['高等学校卒業者のうち進学者数'] / df['高等学校卒業者数'] * 100).round(2)

    # 人口当たりの医療施設数
    df['病院密度'] = (df['一般病院数'] / df['総人口'] * 100000).round(2)
    df['診療所密度'] = (df['一般診療所数'] / df['総人口'] * 100000).round(2)

    # 人口移動のバランス
    df['人口移動バランス'] = df['転入者数（日本人移動者）'] - df['転出者数（日本人移動者）']

    # 高齢化率
    df['高齢化率'] = (df['65歳以上人口'] / df['総人口'] * 100).round(2)

    # 教育費比率(消費支出に占める教育費の割合)
    df['教育費比率'] = (df['教育費（二人以上の世帯）'] / df['消費支出（二人以上の世帯）'] * 100).round(2)
    
    return df

In [61]:
print("利用可能な列名:")
print(df.columns.tolist())

利用可能な列名:
['年度', '地域コード', '都道府県', '総人口', '総人口（男）', '総人口（女）', '日本人人口', '日本人人口（男）', '日本人人口（女）', '15歳未満人口', '15歳未満人口（男）', '15歳未満人口（女）', '15〜64歳人口', '15〜64歳人口（男）', '15〜64歳人口（女）', '65歳以上人口', '65歳以上人口（男）', '65歳以上人口（女）', '出生数', '出生数（男）', '出生数（女）', '合計特殊出生率', '死亡数', '死亡数（男）', '死亡数（女）', '転入者数（日本人移動者）', '転入者数（日本人移動者）（男）', '転入者数（日本人移動者）（女）', '転出者数（日本人移動者）', '転出者数（日本人移動者）（男）', '転出者数（日本人移動者）（女）', '婚姻件数', '離婚件数', '年平均気温', '最高気温（日最高気温の月平均の最高値）', '最低気温（日最低気温の月平均の最低値）', '降水日数（年間）', '降水量（年間）', '着工建築物数', '着工建築物床面積', '旅館営業施設数（ホテルを含む）', '旅館営業施設客室数（ホテルを含む）', '標準価格（平均価格）（住宅地）', '標準価格（平均価格）（商業地）', '幼稚園数', '幼稚園教員数', '幼稚園在園者数', '小学校数', '小学校教員数', '小学校児童数', '中学校数', '中学校教員数', '中学校生徒数', '中学校卒業者数', '中学校卒業者のうち進学者数', '高等学校数', '高等学校教員数', '高等学校生徒数', '高等学校卒業者数', '高等学校卒業者のうち進学者数', '短期大学数', '大学数', '短期大学教員数', '大学教員数', '短期大学学生数', '大学学生数', '短期大学卒業者数', '短期大学卒業者のうち進学者数', '大学卒業者数', '大学卒業者のうち進学者数', '専修学校数', '各種学校数', '専修学校生徒数', '各種学校生徒数', '新規求職申込件数（一般）', '月間有効求職者数（一般）', '月間有効求人数（一般）', '充足数（一般）', '就職件数（一般）', '一般旅券発行件数', '延べ宿泊者数', '外

In [64]:
# 派生指標の計算と表示
print("派生指標の計算")
df = calculate_derived_indicators(df)

派生指標の計算


In [43]:
# 指標別の都道府県ランキング
def regional_ranking(df, indicator, year=None):
    if year:
        df_year = df[df['年度'] == year].copy()
    else:
        df_year = df[df['年度'] == df['年度'].max()].copy()

    ranking = df_year[['都道府県', indicator]].sort_values(indicator, ascending=False)

    print(f"\n{indicator} ランキング (上位10位・下位5位)")
    print("上位10位:")
    for i, row in ranking.tail(5).iterrows():
        rank = len(ranking) - ranking.tail(5).index.get_loc(i)
        print(f"{rank:2d}位: {row['都道府県']:8s} {row[indicator]:10.2f}")

    return ranking

In [59]:
print(f"\n {df['年度'].max()}年のランキング")
regional_ranking(df, '消費支出（二人以上の世帯）')
regional_ranking(df, '高校進学率')
regional_ranking(df, '病院密度')


 2022年のランキング

消費支出（二人以上の世帯） ランキング (上位10位・下位5位)
上位10位:
47位: 大阪府       265161.00
46位: 和歌山県      263910.00
45位: 沖縄県       251735.00
44位: 青森県       249660.00
43位: 愛媛県       245054.00

高校進学率 ランキング (上位10位・下位5位)
上位10位:
47位: 秋田県           47.52
46位: 岩手県           47.52
45位: 山口県           46.88
44位: 鹿児島県          46.33
43位: 沖縄県           46.20

病院密度 ランキング (上位10位・下位5位)
上位10位:
47位: 埼玉県            4.03
46位: 静岡県            3.88
45位: 愛知県            3.75
44位: 滋賀県            3.62
43位: 神奈川県           3.15


Unnamed: 0,都道府県,病院密度
456,高知県,15.98
420,徳島県,12.93
540,鹿児島県,12.35
516,大分県,11.38
528,宮崎県,10.93
480,佐賀県,10.24
504,熊本県,9.6
492,長崎県,9.28
444,愛媛県,9.26
0,北海道,9.05
