# Tutorial 2: データ構造（とアルゴリズム）

5. [](#tut-python-basic2)
6. [](#tut-python-data-class1)
7. [](#how-to-represent-graph)

**Appendix**
- [](#tut2-appendix1)

---

In [1]:
%%html
<style>
    div.jp-CodeMirrorEditor span.ͼ11 { font-style: normal; } /* Comment (Jupyter 4.x) */
    div.jp-MarkdownCell h2 { border-bottom: solid 2px #aaf; padding-bottom: 2px; }
</style>

In [2]:
from IPython.display import display, Markdown

In [3]:
%reload_ext autoreload
%autoreload 1
%aimport ebai
    # 上記の3行は，Jupyter Lab の特殊なコマンドです．
    # - 本講義の範囲を超えるので，詳細を理解する必要はありません．
    # - 通常は，一度 import すると，再度同じファイルを import することはできません，
    #   - 正確には，実行しても，まったく効果がありません．
    #   - importを実行してから，ebai.py を編集しても，再度 import する術がありません．
    # - そこで，上記3行を書くことで，ebai.py に定義された関数は，毎回 ebai.py を
    #   再読み込みしてから実行してくださいね，という動作に切り替えることができます．
    #   （関数呼び出しのオーバーヘッドが増えるというデメリットはあります．なので，
    #     開発用途の特殊コマンド，という位置づけで，理解しておきましょう．）
    # 参考：https://ipython.org/ipython-doc/stable/config/extensions/autoreload.html

# 人工知能実験用の補助関数を定義したサブライブラリ（改変不可）
import ebai
    # 以降，ebai.pyの中に書かれた関数は，"ebai." のように名前空間を明示することで利用できます．
    # 例えば，以下の記述は，ebai.py の中に書かれた，ebai_info()という関数を呼び出しています．

ebai.ebai_info()
display(Markdown("**要確認：Revision 2025.1 以上が必要です**"))

/home/users/ecs/09B23523/exp-b/ai/ebai.py
> Revision 2025.1
> 更新日時：2025-10-03 11:18:05.715802
>
> Python     : 3.12.3 (main, Aug 14 2025, 17:47:21) [GCC 13.3.0]
> NumPy      : 2.3.2
> Matplotlib : 3.10.5
> NetworkX   : 3.5


**要確認：Revision 2025.1 以上が必要です**

(tut-python-basic2)=
## Pythonの基本(2)

人工知能実験では，Pythonにネイティブで実装された関数やデータ構造を使います．

- タプル型 (`tuple`) ... https://docs.python.org/ja/3.12/library/stdtypes.html#tuples
- リスト型 (`list`) ... https://docs.python.org/ja/3.12/library/stdtypes.html#list
- 辞書型 (`dict`) ... https://docs.python.org/ja/3.12/library/stdtypes.html#dict
- データクラス ... https://docs.python.org/ja/3.12/library/dataclasses.html

まずは簡単に使い方を理解しておきましょう．

### タプル型

- https://docs.python.org/ja/3.12/library/stdtypes.html#tuples

様々なデータ型をまとめて表現できます．ざっくりいえば「どんな型でも格納できる配列（ただし，書き換え不可）」です．

タプル型は，丸カッコ`()`内をカンマ`,`で区切って表現します [^tuple_comma]．

[^tuple_comma]: 単なるカンマ区切りでもタプルになります．初心者のうちは，なるべく丸カッコを使って明示したほうが分かりやすいでしょう．
    ややこしいことを承知で書くと，`x = 10` の結果では，`x`は`10`という1つの数字を表しますが，
    `x = 10,` の結果では，`x`は`(10,)`という1つ組(?)のタプルになります．後者では，`10`という数値を得るには`x[0]`とする必要があります．

以下の例を実行して，使い方を理解してください．[プロ演2の構造体](https://edu2024.sp.cs.okayama-u.ac.jp/eop/p2/p/practice04.html) のことも思い出してください！

In [4]:
# Example of tuple: part 1
# cf. https://edu2024.sp.cs.okayama-u.ac.jp/eop/p2/p/practice04.html

date1 = (2012, 5, 1)
date2 = (2021, 5, 2)
date3 = 2021, 5, 3
    # 注：date3 のように丸カッコ無しでも書けるが・・・ぱっと見でわかりにくいため，お勧めしません．．

print(f'{date1=}')
print(f'{date2=}')
print(f'{date3=}')
print(f'{date1[0]=}; {date1[1]=}; {date1[2]=};')

date1=(2012, 5, 1)
date2=(2021, 5, 2)
date3=(2021, 5, 3)
date1[0]=2012; date1[1]=5; date1[2]=1;


In [5]:
# Example of tuple: part 2

profile1 = (5100046,
            'The Bridge',
            (1845, 11, 2),
            '14 Seafield Road Longman Inverness',
            'SEN Unit 2.0 Open')
profile2 = (5100127,
            'Bower Primary School',
            (1908, 1, 19),
            'Bowermadden Bower Caithness',
            '01955 641225 Primary 25 2.6 Open')
    # 参考：要素が続くことが明らか（開いたかっこが閉じてない）なら，途中で改行しても構わない．

print(f'{profile1=}')
print(f'{profile2=}')
print(f'{profile1[0]=}; {profile1[1]=}; {profile1[2]=};')

profile1=(5100046, 'The Bridge', (1845, 11, 2), '14 Seafield Road Longman Inverness', 'SEN Unit 2.0 Open')
profile2=(5100127, 'Bower Primary School', (1908, 1, 19), 'Bowermadden Bower Caithness', '01955 641225 Primary 25 2.6 Open')
profile1[0]=5100046; profile1[1]='The Bridge'; profile1[2]=(1845, 11, 2);


In [None]:
# Example of tuple: part 3
# date1[0] = 2024   # --> Error
    # タプル型では要素の書き換えはできません

### リスト型

- https://docs.python.org/ja/3.12/library/stdtypes.html#list

基本的にはC言語の配列を思い出せば十分です．
ただし，C言語の配列が，一般に固定長配列であることに対して，Pythonのlistは可変長配列です [^list_malloc]．

定義は`[ ]`を使い [^listdef]，参照も`[ ]`を使います．

[^list_malloc]: プログラミング演習でも profile 構造体の要素として，固定長配列と可変長配列を使っていました．
    可変長配列ですから，listへの挿入時に要素が拡大するなら，暗黙的に realloc (free and malloc) が呼ばれていると想像できます．

[^listdef]: 定義の際には，`list()`を使うこともあります．

#### リストの基本

In [6]:
# Example of list: part 1

list1 = [1, 2, 4, 8, 16]

print(f'{list1=}')
print(f'{list1[0]=}; {list1[1]=}; {list1[2]=};')

list1=[1, 2, 4, 8, 16]
list1[0]=1; list1[1]=2; list1[2]=4;


In [7]:
# Example of list: part 2

profiles = [profile1, profile2]

print(f'{profiles=}')
print(f'{profiles[0]=}')
print(f'{profiles[1]=}')

profiles=[(5100046, 'The Bridge', (1845, 11, 2), '14 Seafield Road Longman Inverness', 'SEN Unit 2.0 Open'), (5100127, 'Bower Primary School', (1908, 1, 19), 'Bowermadden Bower Caithness', '01955 641225 Primary 25 2.6 Open')]
profiles[0]=(5100046, 'The Bridge', (1845, 11, 2), '14 Seafield Road Longman Inverness', 'SEN Unit 2.0 Open')
profiles[1]=(5100127, 'Bower Primary School', (1908, 1, 19), 'Bowermadden Bower Caithness', '01955 641225 Primary 25 2.6 Open')


配列の長さは `len()` 関数で取得できます．

In [8]:
# Example of list: part 3
print(len(list1))
print(len(profiles))

5
2


:::{exercise}
`profiles` 変数を使って，次のような出力を得るコードを記述してください．(最後のピリオドも忘れずに)

```{code-block}
The number of profiles is 2.
```
:::

In [10]:
# ANSWER SHEET
print(f'The number of profiles is {len(profiles)}')

The number of profiles is 2


#### リストの動的拡張

可変長配列ですので，追加の方法も見ておきましょう．`append()` メソッドを呼ぶことで，末尾に追加できます．

ところで，受講生の中には，もしかしたらオブジェクト指向言語の流儀に慣れていない人もいるかもしれませんね．
この書き方はよく出てきますので，しっかり理解してください．

`profiles` というリスト変数に要素を追加したいので，`profile.append(...)` という書き方をしています．
もしC言語であれば，`new_profile(&profiles, ...)` のように書いていたことでしょう．

In [11]:
# Example of list: part 4

profiles = []  # 空の配列
profiles.append(profile1)
profiles.append(profile2)

profiles.append((5100224, 'Canisbay Primary School',
                 (1928, 7, 5), 'Canisbay Wick',
                 '01955 611337 Primary 56 3.5 Open'))
    # - いうまでもなく，変数を介さず直接代入してもよい
    # - ただし，カッコに注意しよう！！
    #   - ここで代入したいのは，あくまでタプルである．
    #   - 従って，append()としてのカッコの中に，タプルとしてのカッコも必要である．

profiles.extend([profile1, profile2])
    # - extend() を使うと，複数の要素を追加できる．
    # - extend() の引数は list 型である．


# 以下はやりがちな誤った挿入例 (Ctrl + / で3行分のコメントトグルして，エラーメッセージを確認しよう)
# profiles.append(5100321, 'Castletown Primary School',
#                 (1913, 11, 4), 'Castletown Thurso',
#                 '01847 821256 01847 821256 Primary 137 8.5 Open')

print(f'{profiles=}')
print(f'{profiles[0]=}')
print(f'{profiles[1]=}')
print(f'{profiles[2]=}')
print(f'{profiles[3]=}')
print(f'{profiles[4]=}')


profiles=[(5100046, 'The Bridge', (1845, 11, 2), '14 Seafield Road Longman Inverness', 'SEN Unit 2.0 Open'), (5100127, 'Bower Primary School', (1908, 1, 19), 'Bowermadden Bower Caithness', '01955 641225 Primary 25 2.6 Open'), (5100224, 'Canisbay Primary School', (1928, 7, 5), 'Canisbay Wick', '01955 611337 Primary 56 3.5 Open'), (5100046, 'The Bridge', (1845, 11, 2), '14 Seafield Road Longman Inverness', 'SEN Unit 2.0 Open'), (5100127, 'Bower Primary School', (1908, 1, 19), 'Bowermadden Bower Caithness', '01955 641225 Primary 25 2.6 Open')]
profiles[0]=(5100046, 'The Bridge', (1845, 11, 2), '14 Seafield Road Longman Inverness', 'SEN Unit 2.0 Open')
profiles[1]=(5100127, 'Bower Primary School', (1908, 1, 19), 'Bowermadden Bower Caithness', '01955 641225 Primary 25 2.6 Open')
profiles[2]=(5100224, 'Canisbay Primary School', (1928, 7, 5), 'Canisbay Wick', '01955 611337 Primary 56 3.5 Open')
profiles[3]=(5100046, 'The Bridge', (1845, 11, 2), '14 Seafield Road Longman Inverness', 'SEN Unit 

(list-and-for)=
#### リストと制御文: for文への再訪

ところで，「list = 配列」と聞くと，やはり `for` 文と組み合わせたくなりますよね．

In [12]:
# Example of list: part 5

for item in list1:
    print(item)


1
2
4
8
16


ここで，forループの動きにもう一度注目しておきましょう．
C言語では制御変数[^loop_index]を使ったループが一般的でしたが，**Pythonのfor文では要素そのもの(への参照)が取り出され** ています．

以下の例も見て，もう一度 python の for ループに対する理解を深めてください．

[^loop_index]: インデックスとも呼ぶ; 慣習上 `i` や `j` をよく使う）
    いわゆる
    ``` C
    int i;
    for(i=0; i<2; i++) {
      printf_profile(&profiles[i]);
    }
    ```
    としていた時の `i` のこと．

In [13]:
# Example of list: part 6

print('---- LOOP type A')
for value in list1:
    print(value)

print('---- LOOP type B')
for i in range(len(list1)):  # rangeの使い方は Tutorial 1 の Pythonの基本(1) を参照
    print(i, list1[i])


---- LOOP type A
1
2
4
8
16
---- LOOP type B
0 1
1 2
2 4
3 8
4 16


In [15]:
# Example of list: part 7

print('---- LOOP type C')
for (i, value) in enumerate(list1):
    print(i, value)
    # - LOOP type B のように，要素だけでなくインデックスも必要な場合は，
    #   この例のように enumerate() をlist変数にかぶせて，タプル型の値を得るとよい．

for (i, value) in enumerate(profiles):
    print(i, value)


for (i, value) in enumerate(list1, 2):
    print(i, value)

---- LOOP type C
0 1
1 2
2 4
3 8
4 16
0 (5100046, 'The Bridge', (1845, 11, 2), '14 Seafield Road Longman Inverness', 'SEN Unit 2.0 Open')
1 (5100127, 'Bower Primary School', (1908, 1, 19), 'Bowermadden Bower Caithness', '01955 641225 Primary 25 2.6 Open')
2 (5100224, 'Canisbay Primary School', (1928, 7, 5), 'Canisbay Wick', '01955 611337 Primary 56 3.5 Open')
3 (5100046, 'The Bridge', (1845, 11, 2), '14 Seafield Road Longman Inverness', 'SEN Unit 2.0 Open')
4 (5100127, 'Bower Primary School', (1908, 1, 19), 'Bowermadden Bower Caithness', '01955 641225 Primary 25 2.6 Open')
2 1
3 2
4 4
5 8
6 16


:::{exercise}
以下のソースコードは，講義でC言語に少し触れたレベルの python 初学者が陥りがちな誤りの典型例です．  
彼/彼女に，「何が間違っていて，どう書き直すべきか」，ソースコードとコメント文にて提案してください．

ヒント1：本項（[](#list-and-for)）の説明文中の脚注  
ヒント2：様々な示唆の可能性はありそうですが，ひとまず1つぐらいは示せるようにしてください．

```{code-block} python
for i in profiles:
    print(profiles[i])
```

:::

In [16]:
# Let's tell your idea to your "student" !!
for value in profiles:
    print(value)
# pythonではリストをfor文に渡すと，要素そのものへの参照が取り出される．

(5100046, 'The Bridge', (1845, 11, 2), '14 Seafield Road Longman Inverness', 'SEN Unit 2.0 Open')
(5100127, 'Bower Primary School', (1908, 1, 19), 'Bowermadden Bower Caithness', '01955 641225 Primary 25 2.6 Open')
(5100224, 'Canisbay Primary School', (1928, 7, 5), 'Canisbay Wick', '01955 611337 Primary 56 3.5 Open')
(5100046, 'The Bridge', (1845, 11, 2), '14 Seafield Road Longman Inverness', 'SEN Unit 2.0 Open')
(5100127, 'Bower Primary School', (1908, 1, 19), 'Bowermadden Bower Caithness', '01955 641225 Primary 25 2.6 Open')


### 辞書型

- https://docs.python.org/ja/3.12/library/stdtypes.html#dict

辞書型は，いわゆる Key-Value store とも呼ばれます [^perl_hash]．

定義の際はブレス `{ }` を使い[^dictdef]，アクセスのときは tuple や list と同様 `[ ]` を使います．

ざっくり理解したいなら，**構造体に似ている** とか **アクセスするときに数字以外のインデックスが使える特殊な配列** ぐらいの理解でも，現状では構いません[^dict1]．

[^perl_hash]: perlのような言語ではハッシュと呼ばれたりもします．
    Key のハッシュに基づく探索木（例えば，二分探索木）を持つため，効率よく Key を見つけられる仕組みを備えています．

[^dictdef]: `dict()` を使うこともあります．

[^dict1]: あくまで，今は，です．時と場合を選びましょう．例えば，情報系卒としての新卒就活における技術面談で，こんな発言をした日には・・・（略  
実験Bでの様々な実装を経験し，理解を深めてください．

In [17]:
# Example of dict: part 1
# tupleの例を再掲:
#   date1 = (2012, 5, 1)
#   date2 = (2021, 5, 2)

date1_d = {'y': 2012, 'm': 5, 'd': 1}
date2_d = {'y': 2021, 'm': 5, 'd': 2}

print(f'{date1_d=}')
print(f'{date2_d=}')

print(date1_d["y"] + date2_d['y'])   # 4033 = 2012 + 2021
    # - key が文字列の場合，囲うのは "" でも '' でもどちらでもよい

print(f'{date2_d["y"]}/{date2_d["m"]}/{date2_d["d"]}')
    # - f-stringのprint文に組み込む場合などは，注意して使い分けよう

date1_d={'y': 2012, 'm': 5, 'd': 1}
date2_d={'y': 2021, 'm': 5, 'd': 2}
4033
2021/5/2


In [18]:
# Example of dict: part 2
date3_d = {}
date3_d['y'] = 2012
date3_d['m'] = 5
date3_d['d'] = 1
    # Keyを指定して代入することもできる
    # 事前に存在していれば上書き，いなければ新規追加である
    # 注：Keyに対する typo(タイプミス) には，特に注意を払おう!!!

print(f'{date3_d["y"]}/{date3_d["m"]}/{date3_d["d"]}')

2012/5/1


辞書型の Key や Value は，文字列や数字に限る必要もない．例えば，

In [19]:
# Example of dict: part 3

dataset1 = {
                        # Value として：
    '0': [1, 2, 3, 4],  #  リストを入れることもできるし，
    '1': [6, 8],        #  異なる長さのリストを入れてもよいし，
    '2': (5, 8, 10),    #  タプルを入れてもよい．
                        # Key として：
    1: (11, 12, 13),    #   文字でなく数字にしてもいいし，
    (1, 1): 16,         #   タプルにしてもいいし，
                        # 当然，Valueとして：
    'date1': {          #   別のdict型データを入れる＝辞書の入れ子もある
        'y': 2012,
        'm': 5,
        'd': 1
    }
}

print('DICT 1 -----')
print(dataset1)
print(dataset1["0"])
print(dataset1["1"])

print('DICT 2 -----')    # ここには，あまりよくない例も，あえて示している．
print(dataset1[1])       # Keyは，数字と文字列を混在させず，何らかのルールの下で
print(dataset1[1, 1])    # 一貫して利用したほうが，当然プログラムとして理解しやすい．

print('DICT 3 -----')
for l in dataset1['0']:
    print(l)
    # dataset1のKey='0'には list が格納されているので，'0'を指定すれば list 型として扱える．


DICT 1 -----
{'0': [1, 2, 3, 4], '1': [6, 8], '2': (5, 8, 10), 1: (11, 12, 13), (1, 1): 16, 'date1': {'y': 2012, 'm': 5, 'd': 1}}
[1, 2, 3, 4]
[6, 8]
DICT 2 -----
(11, 12, 13)
16
DICT 3 -----
1
2
3
4


(tut-python-data-class1)=
## Python のデータクラス

- https://docs.python.org/ja/3.12/library/dataclasses.html

C言語での構造体に類似したデータ構造として，独自のデータクラスを定義して，そのデータクラスを自由に使うことができます．

[プログラミング演習1の練習4-2](https://edu2024.sp.cs.okayama-u.ac.jp/eop/p2/p/practice04-ans1.html#struct-profile)を思い出してから，以下の利用例を確認してみてください．

In [20]:
from dataclasses import dataclass
    # 本来は，この from import は，ファイルの先頭に書いた方がいいです．

#
# データクラスの定義
#
@dataclass    # <-- class定義の前にアットマーク付きのデコレータが必要です．やや特殊．．．
class Date:
    y: int
    m: int
    d: int

@dataclass
class Profile:
    id: int
    name: str
    birthday: Date
    address: str
    comment: str

#
# データクラスに基づくデータの作成
#
profile1 = Profile(5100046,
            'The Bridge',
            Date(1845, 11, 2),
            '14 Seafield Road Longman Inverness',
            'SEN Unit 2.0 Open')
profile2 = Profile(5100127,
            'Bower Primary School',
            Date(1908, 1, 19),
            'Bowermadden Bower Caithness',
            '01955 641225 Primary 25 2.6 Open')

#
# データの参照(1)
#
print(profile1)
print(profile2)

Profile(id=5100046, name='The Bridge', birthday=Date(y=1845, m=11, d=2), address='14 Seafield Road Longman Inverness', comment='SEN Unit 2.0 Open')
Profile(id=5100127, name='Bower Primary School', birthday=Date(y=1908, m=1, d=19), address='Bowermadden Bower Caithness', comment='01955 641225 Primary 25 2.6 Open')


要素へのアクセスはC言語の構造体と同じように `.` を利用します．例えば：

In [21]:
#
# データの参照(2)
#
print(f'Id    : {profile1.id}')
print(f'Name  : {profile1.name}')

Id    : 5100046
Name  : The Bridge


```{exercise}
`for` 文を利用して，変数 `profiles = [profile1, profile2]` を次のように画面表示するような動作を実現してください．  
cf. プログラミング演習1の[名簿管理プログラムにおける%Pコマンド](https://edu2024.sp.cs.okayama-u.ac.jp/eop/p2/p/practice05-ans2.html#cmd-print-p)のうち，もっとも単純な動作．

    Id    : 5100046
    Name  : The Bridge
    Birth : 1845/11/2
    Addr. : 14 Seafield Road Longman Inverness
    Comm. : SEN Unit 2.0 Open
    
    Id    : 5100127
    Name  : Bower Primary School
    Birth : 1908/1/19
    Addr. : Bowermadden Bower Caithness
    Comm. : 01955 641225 Primary 25 2.6 Open

```

In [26]:
#
# EXERCISE answer cell
#
profiles = [profile1, profile2]

# Write your code!!
for i in profiles:
    print(f'Id    : {i.id}')
    print(f'Name  : {i.name}')
    print(f'Birth : {i.birthday}')
    print(f'Addr. : {i.address}')
    print(f'Comm. : {i.comment}')
    print()


Id    : 5100046
Name  : The Bridge
Birth : Date(y=1845, m=11, d=2)
Addr. : 14 Seafield Road Longman Inverness
Comm. : SEN Unit 2.0 Open

Id    : 5100127
Name  : Bower Primary School
Birth : Date(y=1908, m=1, d=19)
Addr. : Bowermadden Bower Caithness
Comm. : 01955 641225 Primary 25 2.6 Open



(how-to-represent-graph)=
## データ構造とアルゴリズム (1) -- グラフ構造とプログラム表現に関する一検討

list と dict の利用の練習もかねて，グラフを計算機上で表現する方法を考えてみましょう．

なお，ここでの「表現」とは，「データをどういうデータ構造で保持するか」という意味です．画面に示したり，図として描く話は，「表示」や「描画」と呼びます．

本来考えるべきことは様々にありますが，ここでは次の3点に絞って考えてみます．

1. 計算機で効率よく表現できること
2. 計算機に効率よく表現を示せること　<small>※かみ砕いていえば，プログラマにわかりやすく，ということ</small>
3. 想定するアルゴリズムにとって，効率よくアクセス可能なデータ構造であること

です．

以下では，次の [](#AI-graph1) に示すグラフ `graph1` を利用して，a)～c)の３つの表現方法を示します．
上記3つの観点から，それぞれのメリットとデメリットを考えてみてください．

```{figure} example/Example-AI-graph1.png
:align: left
:name: AI-graph1

Structure of `graph1`
```

```{tip}
以降，図を見比べながら資料を読みたくなると思います．

JupyterLabのタブ(ファイル名が表示されている場所)を右クリックして，"New View for Notebook" を選んでください．
右側に新しいパネルが開き，同じノートブックの上の方と下の方を同時に見る，みたいなことができます．

### a) (Dense) Adajacency Matrix

**隣接行列** ([Adjacency Matrix](https://en.wikipedia.org/wiki/Adjacency_matrix)) を，ソースコードでもそのまま行列のように表した例です [^dense_matrix]．  
ただし，Pythonのネイティブ型に行列型はありませんので，listの中に複数のlistがある，という構造です．  
インデックスを与えて1要素にアクセスするなら `graph1_adj[SRC][DST]` となります [^rowmajor]．

[^rowmajor]: 少し細かい話ですが，インデックスが Row-major ([wikipedia](https://en.wikipedia.org/wiki/Row-_and_column-major_order)) になっている点には注意してください．
    皆さんになじみ深そうな x-y 軸のイメージで示せば，`graph1_adj[y][x]` です．
    例えば，$a_{12}$ は `graph1_adj[0][1]` であり，その1つ下の要素 $a_{22}$ は `graph1_adj[1][1]` です．

[^dense_matrix]: 次項に出てくる **疎** という概念と対比する場合は，**密(dense)** という形容詞を使って **Dense Adjacency Matrix** と呼ぶこともあります．

In [27]:
graph1_adj = [
       #   0    1    2    3    4    5
       # ---------------------------------------
        [0.0, 1.0, 0.0, 0.0, 0.0, 0.0],  # 0 --> 1
        [0.0, 0.0, 1.0, 1.0, 0.0, 0.0],  # 1 --> 2 or 3
        [0.0, 1.0, 0.0, 0.0, 0.0, 0.0],  # 2 --> 1
        [0.0, 1.0, 0.0, 0.0, 1.0, 1.0],  # 3 --> 1, 4 or 5
        [0.0, 0.0, 0.0, 1.0, 0.0, 0.0],  # 4 --> 3
        [0.0, 0.0, 0.0, 1.0, 0.0, 0.0]   # 5 --> 3
    ]

display(graph1_adj)

[[0.0, 1.0, 0.0, 0.0, 0.0, 0.0],
 [0.0, 0.0, 1.0, 1.0, 0.0, 0.0],
 [0.0, 1.0, 0.0, 0.0, 0.0, 0.0],
 [0.0, 1.0, 0.0, 0.0, 1.0, 1.0],
 [0.0, 0.0, 0.0, 1.0, 0.0, 0.0],
 [0.0, 0.0, 0.0, 1.0, 0.0, 0.0]]

### b) Sparse Adajacency Matrix <small>_a.k.a. Edge list_</small>

本課題が対象とする迷路を解くためのグラフでは，隣接行列が **疎な行列（[Sparse Matrix](https://en.wikipedia.org/wiki/Sparse_matrix)）** になることが多いです．

そこで，値が存在する要素（非ゼロ要素）のみを保持しておけば，無駄なメモリを使わずに行列を表現できるかもしれません．

In [28]:
graph1_edgelist = [
    # 要素は，(src, dst, weight) の3つ組
    (0, 1, 1.0),
    (1, 2, 1.0), (1, 3, 1.0),
    (2, 1, 1.0),
    (3, 1, 1.0), (3, 4, 1.0), (3, 5, 1.0),
    (4, 3, 1.0),
    (5, 3, 1.0)
]

display(graph1_edgelist)

[(0, 1, 1.0),
 (1, 2, 1.0),
 (1, 3, 1.0),
 (2, 1, 1.0),
 (3, 1, 1.0),
 (3, 4, 1.0),
 (3, 5, 1.0),
 (4, 3, 1.0),
 (5, 3, 1.0)]

(tut2-adjacency_list_repr)=

### c) Adjacency List <small>_a.k.a. Dict of edge list_</small>

最後に．グラフ探索をする際には，**あるノード(SRC)から接続されている全ノード(DSTs) を参照する** という操作を頻繁に行います．  
例えば，`get_neighbors(graph1, 1)` という関数呼び出しをして，`[2, 3]` のような解を得ることを頻繁に行います（この例はノード1からノード2と3につながっているという意味です）．

そのためには，隣接行列から毎回探し出してもよいのですが，巨大なグラフになると探索回数も莫大になり，その計算コストを無視することはできなくなります [^database]．

そこで，所望の情報を参照しやすい**隣接リスト** ([Adajacency List](https://en.wikipedia.org/wiki/Adjacency_list)) 表現はどうでしょうか．
ここでは List といいながらpythonの `dict` 型を使っている点に注意してください．

[^database]: データベースの講義は取っているでしょうか？  
    データベースの考えであれば，b) の表現はテーブルデータそのものであり，c) が実現できるように 1列目を Index にすることでしょう．

In [29]:
graph1_edgedict = {
    0: [(1, 1.0)],
    1: [(2, 1.0), (3, 1.0)],
    2: [(1, 1.0)],
    3: [(1, 1.0), (4, 1.0), (5, 1.0)],
    4: [(3, 1.0)],
    5: [(3, 1.0)]
}
    # - 基本的にはdict型であるので Key-Value のペアとしてデータを保持している
    # - Value には，全隣接ノードを list として保持している
    # - 隣接ノードは，SRCはすでに確定しているので，(DST, weight) の2つ組で十分である

display(graph1_edgedict)

{0: [(1, 1.0)],
 1: [(2, 1.0), (3, 1.0)],
 2: [(1, 1.0)],
 3: [(1, 1.0), (4, 1.0), (5, 1.0)],
 4: [(3, 1.0)],
 5: [(3, 1.0)]}

### 練習課題

pythonのdict型やlist型の練習もかねて，以降の [](#impl-adj2edgelist) と [](#impl-adj2edgedict) を解いてみましょう．

(impl-adj2edgelist)=
```{exercise}
`graph1_adj` のような (Dense) Adacency Matrix から，`graph1_edgelist` に変換する関数 `adj2edgelist()` を作ってください．
```

In [30]:
# この関数は，関数実装の参考として使ってください．
def display_matrix(adj_matrix):
    """参考関数
    「a) Dense Adjacency Matrix」の全要素を走査する一例．
    display(adj_matrix)と似たような表示をする．
    """
    for _y in range(len(adj_matrix)):
        for _x in range(len(adj_matrix[_y])):
            print(adj_matrix[_y][_x], end=' ')  # endに' '(半角スペース)を指定．
        print('')                               # endのdefaultは'\n'．すなわち，ここで改行を出力．


In [31]:
# この関数は，関数実装の参考として使ってください．
# ※※ ***_STUB() 関数を修正してはいけません！！※※
def adj2edgelist_STUB(adj_matrix):
    """参考関数
    adj2edgelist関数をテストするためのスタブ関数．
    cf. スタブ - https://ja.wikipedia.org/wiki/%E3%82%B9%E3%82%BF%E3%83%96
    """
    from warnings import warn
    warn('THIS IS STUB FUNCTION!! IMPLEMENT YOUR FUNCTION!!')

    # Exampleのgraph1_adjであれば，次のような戻り値を期待する
    result = []   # 空の list を準備

    result.append((0, 1, 1.0))
        # tuple を1要素として挿入するため，カッコが二重になっているように見える点に注意
        # 外側のカッコはappend()のカッコで，内側のカッコは tuple のためのカッコである．

    result.append((1, 2, 1.0))
    result.append((1, 3, 1.0))

    result.append((2, 1, 1.0))

    result.extend([(3, 1, 1.0), (3, 4, 1.0), (3, 5, 1.0)])
        # extend を使うと list で表現された複数要素を一気に代入することもできる．

    result.append((4, 3, 1.0))
    result.append((5, 3, 1.0))

    return result

In [37]:
#
# EXERCISE answer cell
#
def adj2edgelist(adj_matrix):
    """
    Adjacency Matrixを Edge List (Sparse Matrix) に変換する関数

    Parameters
    ----------
    adj_matrix : list[list[int]]
        変換元の Adjacency Matrix

    Returns
    -------
    edges_list : list[tuple(int, int, float)]
        Edge list. 
        - list の要素として edge に関する情報が格納されている．
        - tuple(int, int. float) は，(src_id, dst_id, weight) の3つ組である．
    """
    edg_list = []
    for i in range(len(adj_matrix)):
        for j in range(len(adj_matrix[i])):
            if adj_matrix[i][j] != 0.0:
                edg_list.append((i, j, adj_matrix[i][j]))

    return edg_list   # この行は消して，適切な戻り値を作ろう！

my_graph1_edgelist = adj2edgelist(graph1_adj)

print('---- DEBUG: display_matrix')
display_matrix(graph1_adj)

print('---- DEBUG: my_graph1_edgelist')
display(my_graph1_edgelist)

print('---- DEBUG: graph1_edgelist')
display(graph1_edgelist)

---- DEBUG: display_matrix
0.0 1.0 0.0 0.0 0.0 0.0 
0.0 0.0 1.0 1.0 0.0 0.0 
0.0 1.0 0.0 0.0 0.0 0.0 
0.0 1.0 0.0 0.0 1.0 1.0 
0.0 0.0 0.0 1.0 0.0 0.0 
0.0 0.0 0.0 1.0 0.0 0.0 
---- DEBUG: my_graph1_edgelist


[(0, 1, 1.0),
 (1, 2, 1.0),
 (1, 3, 1.0),
 (2, 1, 1.0),
 (3, 1, 1.0),
 (3, 4, 1.0),
 (3, 5, 1.0),
 (4, 3, 1.0),
 (5, 3, 1.0)]

---- DEBUG: graph1_edgelist


[(0, 1, 1.0),
 (1, 2, 1.0),
 (1, 3, 1.0),
 (2, 1, 1.0),
 (3, 1, 1.0),
 (3, 4, 1.0),
 (3, 5, 1.0),
 (4, 3, 1.0),
 (5, 3, 1.0)]

(impl-adj2edgedict)=
```{exercise}
`graph1_adj` のような (Dense) Adacency Matrix から，`graph1_edgedict` に変換する関数 `adj2edgedict()` を作ってください．
```

In [38]:
# この関数は，関数実装の参考として使ってください．
# ※※ ***_STUB() 関数を修正してはいけません！！※※
def adj2edgedict_STUB(adj_matrix):
    """参考関数
    adj2edgedict関数をテストするためのスタブ関数
    cf. スタブ - https://ja.wikipedia.org/wiki/%E3%82%B9%E3%82%BF%E3%83%96
    """
    from warnings import warn
    warn('THIS IS STUB FUNCTION!! IMPLEMENT YOUR FUNCTION!!')

    # Exampleのadj_GraphAであれば，次のような戻り値を期待する
    result = {}   # 空の dict を準備

    result[0] = [(1, 1.0)]
        # - Keyに対するValueは常に list とする．
        # - そのため，tupleを1つのみ持つ list を与えているのである．

    result[1] = [(2, 1.0), (3, 1.0)]

    result[2] = [(1, 1.0)]

    result[3] = []
    result[3].append((1, 1.0))
    result[3].append((4, 1.0))
    result[3].append((5, 1.0))
        # 空配列で初期化してから append で一つずつ挿入する方策も考えられよう

    result[4] = [(3, 1.0)]

    result[5] = [(3, 1.0)]

    return result

In [46]:
#
# EXERCISE answer cell
#
def adj2edgedict(adj_matrix):
    """
    Adjacency Matrixを Edge List (Sparse Matrix) に変換する関数

    Parameters
    ----------
    adj_matrix : list[list[int]]
        変換元の Adjacency Matrix

    Returns
    -------
    edges_dict : dict[int, list[tuple(int, float)]]
        Edge dict.
        - 最も外の dict は：
            - インデックス => src node id (int型)
            - 要素        => dst node に関する情報が複数 (すなわちlist型)
          格納されている．
        - dictの要素たるlist型の中身は，tuple(int. float) であり，
          (dst_id, weight) の2つ組となっている．

    Note
    ----
    - 辞書の Key は，文字列str型ではなく，数値int型である
    """

    edg_dict = {}
    for i in range(len(adj_matrix)):
        # appendはリストが存在していないときに追加できない
        edg_dict[i] = []
        for j in range(len(adj_matrix[i])):
            if adj_matrix[i][j] != 0.0:
                edg_dict[i].append((j, adj_matrix[i][j]))

    return edg_dict   # この行は消して，適切な戻り値を作ろう！

my_graph1_edgedict = adj2edgedict(graph1_adj)

print('---- DEBUG: display_matrix')
display_matrix(graph1_adj)

print('---- DEBUG: my_graph1_edgedict')
display(my_graph1_edgedict)

print('---- DEBUG: graph1_edgedict')
display(graph1_edgedict)

---- DEBUG: display_matrix
0.0 1.0 0.0 0.0 0.0 0.0 
0.0 0.0 1.0 1.0 0.0 0.0 
0.0 1.0 0.0 0.0 0.0 0.0 
0.0 1.0 0.0 0.0 1.0 1.0 
0.0 0.0 0.0 1.0 0.0 0.0 
0.0 0.0 0.0 1.0 0.0 0.0 
---- DEBUG: my_graph1_edgedict


{0: [(1, 1.0)],
 1: [(2, 1.0), (3, 1.0)],
 2: [(1, 1.0)],
 3: [(1, 1.0), (4, 1.0), (5, 1.0)],
 4: [(3, 1.0)],
 5: [(3, 1.0)]}

---- DEBUG: graph1_edgedict


{0: [(1, 1.0)],
 1: [(2, 1.0), (3, 1.0)],
 2: [(1, 1.0)],
 3: [(1, 1.0), (4, 1.0), (5, 1.0)],
 4: [(3, 1.0)],
 5: [(3, 1.0)]}

### 練習課題の結果の確認

In [None]:
graph1_pos = {
    0: [0, 0],
    1: [1, 1],
    2: [1, 2],
    3: [2, 1],
    4: [2, 2],
    5: [3, 1]
}

# 確認
import matplotlib.pyplot as plt

# 正しければ，同じ構造のグラフが3つ表示される．
# 今は，ここの処理の詳細を考えないで構いません．のちの Practice シートで理解を深めてください．
fig, (ax1, ax2, ax3) = plt.subplots(1, 3, figsize=(16, 4))
try:
    ax1.set_title('(a) graph1_adj')
    ebai.draw_graph_structure(graph1_adj, graph1_pos, ax=ax1, show_weight=True)
except IndexError as e:
    print('ERROR on (a): ', e)

try:
    ax2.set_title('(b) adj2edgelist(graph1_adj)')
    ebai.draw_graph_structure(adj2edgelist(graph1_adj), graph1_pos, ax=ax2, show_weight=True)
except IndexError as e:
    print('ERROR on (b):', e)

try:
    ax3.set_title('(c) adj2edgedict(graph1_adj)')
    ebai.draw_graph_structure(adj2edgedict(graph1_adj), graph1_pos, ax=ax3, show_weight=True)
except IndexError as e:
    print('ERROR on (c):', e)

plt.show()


## まとめ

この資料における必須の内容は以上です．

(tut2-appendix)=

## Appendix

ここから下はおまけです．
一通り課題を終えた後に，時間があれば確認してください．より深い考察ができるようになるかもしれません．

なお，ここに書かれた内容や数値をそのまま書きうつしてもレポートにはなりません．

(tut2-appendix1)=

### Appendix 1: グラフの構造と典型的なデータ参照方法

使いそうな参照方式として3種類を見てみましょう．

- [](#access-pattern-1): src, dst を指定して，1つの重み (weight) を得る
- [](#access-pattern-2): src を指定して，特定のノードから移動可能な全ノードを (dst, weight) のリストとして得る
- [](#access-pattern-3): dst を指定して，特定のノードに到達可能な全ノードを (src, dst, weight) のリストとして得る

:::{hint}
ここの記述は初学者には難しいと思います．書き方そのものは，[コードスニペット](https://ja.wikipedia.org/wiki/%E3%82%B9%E3%83%8B%E3%83%9A%E3%83%83%E3%83%88)として使うようにしてください．  
典型例をほぼ載せていますので，ググるよりは早いはずです．
:::

(access-pattern-1)=
#### パターン 1

一番簡単そうな，1要素へのアクセスを見てみましょう．いずれも1行で書けます．

例えば，src = 1 番から dst = 3 番に遷移する際の重み(weight)を知りたい，というケースです．

In [None]:
# Access Pattern 1

SRC_ID, DST_ID = 1, 3

# -----------------------------------------------------------------
# a) Dense adjacency matrix
print(graph1_adj[SRC_ID][DST_ID])

# -----------------------------------------------------------------
# b) Sparce adjacency matrix
print([w for (s, d, w) in graph1_edgelist if s == SRC_ID and d == DST_ID][0])
    # 最後の[0]は見つかった結果の配列から0番目を取り出すために入れてます．
    # It is equivalant to:
    # tmp = []
    # for (s, d, w) in graph1_edgelist:
    #   if s == SRC_ID and d == dst_id:
    #     tmp.append(w)
    # result = tmp[0]

# -----------------------------------------------------------------
# c) Adjacency List
print([w for (d, w) in graph1_edgedict[SRC_ID] if d == DST_ID][0])
    # It is equivalant to:
    # tmp = []
    # for (d, w) in graph1_edgedict[SRC_ID]:
    #   if d == DST_ID:
    #     tmp.append(w)
    # result = tmp[0]

# セルの後始末
del SRC_ID, DST_ID

皆さんにとって，どれが簡単（あるいは，直感的？）な記述に見えるでしょうか？

あるいは，参照にかかる処理速度の観点からはどうなっているでしょうか．  
Jupyter Lab では特定の1行を繰り返し実行して計算速度を図る機能 `%timeit` があります．やってみましょう [^unit]．

[^unit]: 1 ns (nano second) = $10^{-9}$ sec  
    1 µs (micro second) = $10^{-6}$ sec  
    1 ms (milli second) = $10^{-3}$ sec


In [None]:
# Access Pattern 1
SRC_ID, DST_ID = 1, 3

%timeit graph1_adj[SRC_ID][DST_ID]
%timeit [d for (s, d, w) in graph1_edgelist if s == SRC_ID and d == DST_ID][0]
%timeit [d for (d, w) in graph1_edgedict[SRC_ID] if d == DST_ID][0]

del SRC_ID, DST_ID  # 後始末

(access-pattern-2)=
#### パターン 2

次は，例えば，`1` 番ノードから `2`, `3` 番ノードに向けて，いずれも重み `1.0` で接続されている，という情報を得てみます．  
つまり，何らかのシステムに対して `1` を入力したとき，`[(2, 1.0), (3, 1.0)]` という出力を得るにはどうすればいいか，という話です．

In [None]:
# Access Pattern 2

SRC_ID, DST_ID = 1, None

# -----------------------------------------------------------------
# a) Dense adjacency matrix
display([(d, w) for d, w in enumerate(graph1_adj[SRC_ID]) if w > 0])
    # It is equivalant to:
    # result = []
    # for d, w in enumerate(graph1_adj[SRC_ID]):
    #   if w > 0:  # w == graph1_adj[SRC_ID][d]
    #     result.append((d, w))

# -----------------------------------------------------------------
# b) Sparce adjacency matrix
display([(d, w) for (s, d, w) in graph1_edgelist if s == SRC_ID])
    # It is equivalant to:
    # result = []
    # for s, d, w in graph1_edgelist:
    #   if s == SRC_ID:
    #     result.append((d, w))

# -----------------------------------------------------------------
# c) Adjacency List
display(graph1_edgedict[SRC_ID])


# セルの後始末
del SRC_ID, DST_ID

計算速度はどうでしょうか．

In [None]:
# Access Pattern 2

SRC_ID, DST_ID = 1, None

%timeit [(d, ws[SRC_ID]) for d, ws in enumerate(graph1_adj) if ws[SRC_ID] > 0]
%timeit [(d, w) for (s, d, w) in graph1_edgelist if s == SRC_ID]
%timeit graph1_edgedict[SRC_ID]

del SRC_ID, DST_ID  # 後始末

(access-pattern-3)=
#### パターン 3

最後に，逆探索を考えてみましょう．DSTが決まっているときに，そのDSTにたどり着けるSRCおよびその際の重みをリストとして得たい，とします．  
なお，graph1の例であれば，dst=1にたどり着けるのは，src=0, 2, 3 です．

（0と1の間は一方通行になっていることに注意してください．デバッグのため，すべて (src, dst, weight) の3つ組 tuple を要素とするリストを得ることにします．）

In [None]:
# Access Pattern 3

SRC_ID, DST_ID = None, 1

# -----------------------------------------------------------------
# a) Dense adjacency matrix
display([(s, DST_ID, wd[DST_ID]) for s, wd in enumerate(graph1_adj) if wd[DST_ID] > 0])
    # It is equivalant to:
    # result = []
    # for s, wd in enumerate(graph1_adj):
    #   if wd[DST_ID] > 0:  # wd[DST_ID] == graph1_adj[SRC_ID][DST_ID]
    #     result.append((s, DST_ID, wd[DST_ID]))

# -----------------------------------------------------------------
# b) Sparce adjacency matrix
display([(s, d, w) for (s, d, w) in graph1_edgelist if d == DST_ID])
    # It is equivalant to:
    # result = []
    # for (s, d, w) in graph1_edgelist:
    #   if s == src_id and d == DST_ID:
    #     result.append((s, d, w))

# -----------------------------------------------------------------
# c) Adjacency List
display([(s, d, w) for (s, dw) in graph1_edgedict.items() for d, w in dw if d == DST_ID])
    # It is equivalant to:
    # result = []
    # for s, dw in graph1_edgedict.items():
    #     for d, w in dw:
    #         if d == DST_ID:
    #             result.append((s, d, w))
    # print(result)

# 後始末
del SRC_ID, DST_ID

計算速度はどうでしょうか．

In [None]:
# Access Pattern 3

SRC_ID, DST_ID = None, 1

%timeit [(s, DST_ID, wd[DST_ID]) for s, wd in enumerate(graph1_adj) if wd[DST_ID] > 0]
%timeit [(s, d, w) for (s, d, w) in graph1_edgelist if d == DST_ID]
%timeit [(s, d, w) for (s, dw) in graph1_edgedict.items() for d, w in dw if d == DST_ID]

del SRC_ID, DST_ID  # 後始末

:::{exercise}
※これは Appendix 内の exercise です．

グラフを表現するために，ここで示した3種のどの表現を利用すべきでしょうか？  
今後の役に立つかもしれません．客観的な情報も含めて，改めて整理しておくとよいでしょう．
:::

以下は，表でまとめるためのテンプレートです．ダブルクリックして直接編集してください．**何を記録するかは，各自にお任せします．**

:::{table} Summary of data structure for Graph
:label: table-graph-datastructure-summary
:align: center
| Access Pattern | a) Dense Adj. Matrix | b) Sparse Adj. Matrix | c) Adj. List   | Note   |
|:--------------:|---------------------:|----------------------:|---------------:|:------:|
| *1*:           |                      |                       |                | src,dst --> weight |
| *2*:           |                      |                       |                | src --> dst,weight |
| *3*:           |                      |                       |                | dst --> src,weight |
:::