# Japan Prefecture Example

Example adopted from

* 栗原考次, & 石岡文生. (2021). エシェロン解析: 階層化して視る時空間データ. 共立出版.

In [1]:
%load_ext autoreload
%autoreload 2
%matplotlib inline
import warnings
warnings.filterwarnings('ignore')

In [2]:
import echelon
echelon.__version__

'1.0.3'

In [3]:
from IPython.display import Markdown, display

import numpy as np
import pandas as pd

df = pd.DataFrame([
    (1, '北海道', 69, ['青森']),
    (2, '青森', 136, ['北海道', '岩手', '秋田']),
    (3, '岩手', 84, ['青森', '宮城', '秋田']),
    (4, '宮城', 321, ['岩手', '秋田', '山形', '福島']),
    (5, '秋田', 88, ['青森', '岩手', '宮城', '山形']),
    (6, '山形', 121, ['宮城', '秋田', '福島', '新潟']),
    (7, '福島', 139, ['宮城', '山形', '茨城', '栃木', '群馬', '新潟']),
    (8, '茨城', 478, ['福島', '栃木', '埼玉', '千葉']),
    (9, '栃木', 308, ['福島', '茨城', '群馬', '埼玉']),
    (10, '群馬', 310, ['福島', '栃木', '埼玉', '新潟', '長野']),
    (11, '埼玉', 1913, ['茨城', '栃木', '群馬', '千葉', '東京', '山梨', '長野']),
    (12, '千葉', 1207, ['茨城', '埼玉', '東京']),
    (13, '東京', 6169, ['埼玉', '千葉', '神奈川', '山梨']),
    (14, '神奈川', 3778, ['東京', '山梨', '静岡']),
    (15, '新潟', 183, ['山形', '福島', '群馬', '富山', '長野']),
    (16, '富山', 251, ['新潟', '石川', '長野', '岐阜']),
    (17, '石川', 276, ['富山', '福井', '岐阜']),
    (18, '福井', 188, ['石川', '岐阜', '滋賀', '京都']),
    (19, '山梨', 187, ['埼玉', '東京', '神奈川', '長野', '静岡']),
    (20, '長野', 155, ['群馬', '埼玉', '新潟', '富山', '山梨', '岐阜', '静岡', '愛知']),
    (21, '岐阜', 191, ['富山', '石川', '福井', '長野', '愛知', '三重', '滋賀']),
    (22, '静岡', 476, ['神奈川', '山梨', '長野', '愛知']),
    (23, '愛知', 1447, ['長野', '岐阜', '静岡', '三重']),
    (24, '三重', 315, ['岐阜', '愛知', '滋賀', '京都', '奈良', '和歌山']),
    (25, '滋賀', 352, ['福井', '岐阜', '三重', '京都']),
    (26, '京都', 566, ['福井', '三重', '滋賀', '大阪', '兵庫', '奈良']),
    (27, '大阪', 4640, ['京都', '兵庫', '奈良', '和歌山']),
    (28, '兵庫', 659, ['京都', '大阪', '鳥取', '岡山', '徳島']),
    (29, '奈良', 370, ['三重', '京都', '大阪', '和歌山']),
    (30, '和歌山', 204, ['三重', '大阪', '奈良']),
    (31, '鳥取', 164, ['兵庫', '島根', '岡山', '広島']),
    (32, '島根', 104, ['鳥取', '広島', '山口']),
    (33, '岡山', 270, ['兵庫', '鳥取', '広島', '香川']),
    (34, '広島', 335, ['鳥取', '島根', '岡山', '山口', '愛媛']),
    (35, '山口', 230, ['島根', '広島', '福岡']),
    (36, '徳島', 182, ['兵庫', '香川', '愛媛', '高知']),
    (37, '香川', 520, ['岡山', '徳島', '愛媛']),
    (38, '愛媛', 244, ['広島', '徳島', '香川', '高知']),
    (39, '高知', 103, ['徳島', '愛媛']),
    (40, '福岡', 1023, ['山口', '佐賀', '熊本', '大分']),
    (41, '佐賀', 341, ['福岡', '長崎']),
    (42, '長崎', 333, ['佐賀']),
    (43, '熊本', 241, ['福岡', '大分', '宮崎', '鹿児島']),
    (44, '大分', 184, ['福岡', '熊本', '宮崎']),
    (45, '宮崎', 143, ['熊本', '大分', '鹿児島']),
    (46, '鹿児島', 179, ['熊本', '宮崎', '沖縄']),
    (47, '沖縄', 628, ['鹿児島']),
], columns=['id', 'name', 'density (ppl/km2)', 'adjacent'])
df

Unnamed: 0,id,name,density (ppl/km2),adjacent
0,1,北海道,69,[青森]
1,2,青森,136,"[北海道, 岩手, 秋田]"
2,3,岩手,84,"[青森, 宮城, 秋田]"
3,4,宮城,321,"[岩手, 秋田, 山形, 福島]"
4,5,秋田,88,"[青森, 岩手, 宮城, 山形]"
5,6,山形,121,"[宮城, 秋田, 福島, 新潟]"
6,7,福島,139,"[宮城, 山形, 茨城, 栃木, 群馬, 新潟]"
7,8,茨城,478,"[福島, 栃木, 埼玉, 千葉]"
8,9,栃木,308,"[福島, 茨城, 群馬, 埼玉]"
9,10,群馬,310,"[福島, 栃木, 埼玉, 新潟, 長野]"


## Echelon construction

In [4]:
from echelon.api import DataFrameEchelonAnalysis
analyzer = DataFrameEchelonAnalysis()
result = analyzer(df, 'density (ppl/km2)', 'name', 'adjacent')
result

Result_EchelonAnalysis(peak_echelons=[['東京', '神奈川', '埼玉', '千葉', '茨城'], ['大阪', '兵庫', '京都', '奈良', '滋賀'], ['愛知'], ['福岡', '佐賀', '長崎', '熊本'], ['沖縄'], ['香川'], ['広島'], ['宮城'], ['石川', '富山'], ['青森']], foundation_echelons=[['静岡'], ['三重', '群馬', '栃木'], ['岡山', '愛媛'], ['山口', '和歌山'], ['岐阜', '福井', '山梨', '大分', '新潟', '徳島'], ['鹿児島', '鳥取', '長野', '宮崎'], ['福島', '山形', '島根', '高知'], ['秋田', '岩手', '北海道']], hierarchy_tree=Node('/17'), oracle=<echelon.oracle.DataFrameEchelonOracle object at 0x7f8d483a5198>)

In [5]:
display(Markdown('### Peak Echelons'))
display(pd.DataFrame(result.peak_echelons).fillna(''))

display(Markdown('### Foundation Echelons'))
display(pd.DataFrame(result.foundation_echelons).fillna(''))

### Peak Echelons

Unnamed: 0,0,1,2,3,4
0,東京,神奈川,埼玉,千葉,茨城
1,大阪,兵庫,京都,奈良,滋賀
2,愛知,,,,
3,福岡,佐賀,長崎,熊本,
4,沖縄,,,,
5,香川,,,,
6,広島,,,,
7,宮城,,,,
8,石川,富山,,,
9,青森,,,,


### Foundation Echelons

Unnamed: 0,0,1,2,3,4,5
0,静岡,,,,,
1,三重,群馬,栃木,,,
2,岡山,愛媛,,,,
3,山口,和歌山,,,,
4,岐阜,福井,山梨,大分,新潟,徳島
5,鹿児島,鳥取,長野,宮崎,,
6,福島,山形,島根,高知,,
7,秋田,岩手,北海道,,,


## Echelon dendrogram

In [6]:
print(analyzer.dendrogram(result))

E18(秋田): [北海道, 岩手, 秋田]
 (max: 88)

├── E17(福島): [高知, 島根, 山形, 福島]
│    (max: 139)
│   
│   ├── E16(鹿児島): [宮崎, 長野, 鳥取, 鹿児島]
│   │    (max: 179)
│   │   
│   │   ├── E15(岐阜): [徳島, 新潟, 大分, 山梨, 福井, 岐阜]
│   │   │    (max: 191)
│   │   │   
│   │   │   ├── E14(山口): [和歌山, 山口]
│   │   │   │    (max: 230)
│   │   │   │   
│   │   │   │   ├── E13(岡山): [愛媛, 岡山]
│   │   │   │   │    (max: 270)
│   │   │   │   │   
│   │   │   │   │   ├── E12(三重): [栃木, 群馬, 三重]
│   │   │   │   │   │    (max: 315)
│   │   │   │   │   │   
│   │   │   │   │   │   ├── E11(静岡): [静岡]
│   │   │   │   │   │   │    (max: 476)
│   │   │   │   │   │   │   
│   │   │   │   │   │   │   ├── E3(愛知): [愛知]
│   │   │   │   │   │   │   │    (max: 1447)
│   │   │   │   │   │   │   │   
│   │   │   │   │   │   │   └── E1(東京): [茨城, 千葉, 埼玉, 神奈川, 東京]
│   │   │   │   │   │   │        (max: 6169)
│   │   │   │   │   │   │       
│   │   │   │   │   │   └── E2(大阪): [滋賀, 奈良, 京都, 兵庫, 大阪]
│   │   │   │   │   │        (max: 4640)
│   │   │   │   

## Echelon clusters

In [7]:
_df = analyzer.cluster(result)
_df['representatives'] = _df['representatives'].map(lambda x: str(x[0]) + '圏')
pd.DataFrame(_df['indices'].to_list()).fillna('').set_index(_df['representatives'].rename('圏'))

Unnamed: 0_level_0,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14
圏,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1
東京圏,東京,神奈川,埼玉,千葉,茨城,静岡,群馬,栃木,山梨,新潟,長野,福島,山形,秋田,岩手
大阪圏,大阪,兵庫,京都,奈良,滋賀,三重,岡山,和歌山,岐阜,福井,徳島,鳥取,長野,島根,高知
愛知圏,愛知,静岡,三重,和歌山,岐阜,福井,山梨,長野,,,,,,,
福岡圏,福岡,佐賀,長崎,熊本,山口,大分,鹿児島,宮崎,島根,,,,,,
沖縄圏,沖縄,鹿児島,宮崎,,,,,,,,,,,,
香川圏,香川,岡山,愛媛,徳島,鳥取,島根,高知,,,,,,,,
広島圏,広島,岡山,愛媛,山口,徳島,鳥取,島根,高知,,,,,,,
宮城圏,宮城,福島,山形,秋田,岩手,,,,,,,,,,
石川圏,石川,富山,岐阜,福井,新潟,長野,福島,山形,秋田,岩手,,,,,
青森圏,青森,秋田,岩手,北海道,,,,,,,,,,,


## Hotspot detection

In [8]:
analyzer.hotspots(result)

Unnamed: 0,spot,score,c(Z),log_lambda
17,"[愛知, 東京, 神奈川, 埼玉, 千葉, 茨城, 静岡]",3.555613,15468,3.555613
4,"[東京, 神奈川, 埼玉, 千葉, 茨城]",3.548297,13545,3.548297
3,"[東京, 神奈川, 埼玉, 千葉]",3.543992,13067,3.543992
2,"[東京, 神奈川, 埼玉]",3.528448,11860,3.528448
1,"[東京, 神奈川]",3.488595,9947,3.488595
20,"[静岡, 愛知, 東京, 神奈川, 埼玉, 千葉, 茨城, 大阪, 兵庫, 京都, 奈良, ...",3.441145,22370,3.441145
21,"[静岡, 愛知, 東京, 神奈川, 埼玉, 千葉, 茨城, 大阪, 兵庫, 京都, 奈良, ...",3.429304,22680,3.429304
22,"[静岡, 愛知, 東京, 神奈川, 埼玉, 千葉, 茨城, 大阪, 兵庫, 京都, 奈良, ...",3.416726,22988,3.416726
25,"[三重, 群馬, 栃木, 静岡, 愛知, 東京, 神奈川, 埼玉, 千葉, 茨城, 大阪, ...",3.362919,24113,3.362919
9,"[大阪, 兵庫, 京都, 奈良, 滋賀]",3.357184,6587,3.357184
