# Pythonプログラミング入門 第4回


木構造のデータ形式について説明します

# ▲木構造のデータ形式

みなさん、Windowsではエクスプローラ、MacではFinderを使ってファイルを階層的に保存していますよね。<br>
下の例では、Windowsで「ドキュメント（Documents)」という名前のフォルダの中に「Python入門」というフォルダを作り、
その下にこの教材を置いた時の、エクスプローラの様子を表しています。

![エクスプローラ](fig/4-4-Explore.png)


これはJupyter Notebookでは以下のように見えます。

![Jupyter Notebook](fig/4-4-jupyterTree.png)

このようなデータ形式は以下のようにグラフであらわすこともできます。
まるで木を逆さにしたような形に見えますね。<br>
ですからこのようなデータの形式を「木構造」と呼びます。<br>
また、一番根っこにあたるデータを「ルート（根）」、先端にあたるデータを「リーフ（葉）」、その間にあるデータを「ノード（節）」と呼びます。   

![Jupyter Notebook tree](fig/4-4-jupyterTreeIllust.png)

データの保存においては、ファイルはリーフ（葉）に相当し、フォルダはノード（節）に相当します。   
ルートはハードディスクやUSBメモリなど記録媒体自体に対応することが多いです。  
ハードディスクに入っているファイルと、USBメモリに入っているファイルは、それぞれ違う木に属するデータということです。

## カレントディレクトリ

4-1で`small.csv`という名前のファイルをオープンするときに、以下のように書きました。   

``f = open('small.csv', 'r')``

このとき、この`small.csv`というファイルはどこにあるのでしょうか？

実は、プログラムを実行するときは、その実行環境はどこかのディレクトリを**カレントディレクトリ**としています。   
Jupyter Notebookでは、そのnotebookが置かれでいるディレクトリをカレントディレクトリとします。  
もし`sample.csv`がそのnotebookと同じフォルダではなく、そこに置かれた`tmp`という名前のフォルダの中に
置かれているとすると、notebookとは同じ場所に`small.csv`が置かれていないので、   


といったエラーが出て、ファイルのオープンに失敗するはずです。

ではどうやったら「カレントディレクトリの下の`tmp`の下」にある「`small.csv`」を開けるのでしょうか？<br>
これは次のように行います。<br>

``f = open('tmp/small.csv', 'r')``

このようにすることによって、ターミナルに「カレントディレクトリの下の`tmp`の下にある`small.csv`を開いてください」と指示することができます。  
これは、カレントディレクトリから「`small.csv`」までの経路（行き方）を表したものなので**パス**とも呼びます。

## 相対パスと絶対パス
`tmp/small.csv`という表現では、カレントディレクトリから「`small.csv`」までのパスを表しています。<br>
ここで、Jupyter Notebookでは、カレントディレクトリはnotebookの場所になるので、どの場所のnotebookを開いているかによってカレントディレクトリが変わり、それに応じて、同じファイルでもパスが変わります。<br>
このようなパスの表現を**相対パス**と呼びます。<br>

一方、`C:\Users\hagiya\Douments\Python入門\small.csv`のように、ルートからパスを記した場合、
カレントディレクトリの場所に関わらず、常に同じファイルを指すことができます。<br>
このようなパスの表現を**絶対パス**と呼びます。

ところで、カレントディレクトリより下にあるファイルは、そこまでに通るディレクトリ名をパスに書けばいいですが、
その下にないファイルを指すにはどうしたらいいでしょうか？<br>
たとえば下の図のようにカレントディレクトリが`C:\Users\hagiya\Douments\Python入門`のとき、
`C:\Users\hagiya\Douments\メディアプログラミング入門\imagelist.csv`を開きたい場合はどうしたらいいでしょう？

![Jupyter Notebook tree](fig/4-4-jupyterTreeIllust2.png)

実は、一つ上のディレクトリを`..（コンマ２つ）`で表現することができます。<br>
上の例だと、<br>

`f = open('..\メディアプログラミング入門\imagelist.csv', 'r')`  

とすれば、`C:\Users\hagiya\Douments\メディアプログラミング入門\imagelist.csv`を開くことができます。<br>
`..`によって、「Python入門」から一段上の「Documents」に戻り、そこから「メディアプログラミング入門の下のimagelist.csv」と辿っているわけです。

## 木構造によるデータ表現

木構造はファイルやディレクトリの保存形式だけでなく、データの表現として幅広く利用されます。<br>
たとえば家系図も木構造による表現です。「家系図」は英語で"Family tree"ですよね。

![Family tree](fig/4-4-FamilyTree.png)

このような構造を持つデータでは、まるで家系図のように、上位下位関係にあるデータ同士を「親子（parent/child)」と呼んだり、同位関係にあるものを「兄妹（siblings)」と呼んだりします。「祖先（ancestor)」や「子孫（desendant)」という表現も使われます。<br>
データのグラフ構造におけるこのような表現は、実際に親子関係にあるかは関係ありません。<br>
たとえば下の図は四肢動物の系統樹です。

![tree](fig/4-4-PhylogeneticTree.png)

データ構造的には、「有羊膜類」と「哺乳類」は親子関係にあるというわけです。

## テキストによる木構造のデータ表現

上のイラストのように毎回絵を描いて木構造を表せばわかりやすいですが面倒ですよね。<br>
テキストでは以下のように表現することがあります。<br>
今度は一番左にあるのがルートで、右に行くにしたがって分岐しています。

## 木構造のjson表現

json形式のメリットの一つは、木構造のような入れ子（何かの中に何かが入っているという構造）を表現できることです。<br>
上の例をjsonで表すと以下のようになります。