# 4-2. コンピュータにおけるファイルやディレクトリの配置
木構造のデータ形式について説明します。  
この内容はPython言語に限らず、WindowsやMac、Linuxなどの一般的なOSにおいて共通する概念です。

みなさん、Windowsではエクスプローラ、MacではFinderを使ってファイルを階層的に保存していますよね。<br>
下の例では、Windowsで「ドキュメント（Documents)」という名前のフォルダの中に「Python入門」というフォルダを作り、
その下にこの教材を置いた時の、エクスプローラの様子を表しています。

![エクスプローラ](fig/4-4-Explore.png)


これはJupyter Notebookでは以下のように見えます。

![Jupyter Notebook](fig/4-4-jupyterTree.png)

このようなデータ形式は以下のようなグラフであらわすこともできます。
まるで木を逆さにしたような形に見えますね。<br>
ですからこのようなデータの形式を「木構造」と呼びます。<br>
また、一番根っこにあたるデータを「ルート（根）」、先端にあたるデータを「リーフ（葉）」、その間にあるデータを「ノード（節）」と呼びます。   

![Jupyter Notebook tree](fig/4-4-jupyterTreeIllust.png)  


データの保存においては、ファイルはリーフ（葉）に相当し、フォルダはノード（節）に相当します。   
ルートはハードディスクやUSBメモリなど記録媒体自体に対応することが多いです。  
ハードディスクに入っているファイルと、USBメモリに入っているファイルは、それぞれ違う木に属するデータということです。

## カレントディレクトリ

4-1で`sample.txt`という名前のファイルをオープンするときに、以下のように書きました。   

---

```python
f = open('sample.txt', 'r')
```

---

このとき、この`sample.txt`というファイルはどこにあるのでしょうか？

実は、プログラムを実行するときは、どこかのディレクトリを**カレントディレクトリ**としています。   
Jupyter Notebookでは、そのnotebookが置かれているディレクトリをカレントディレクトリとします。  
`sample.txt`が、このノートブックと同じディレクトリの中に置かれているならば（実際、置かれています）、上のようにして`sample.txt`を開くことができました。

一方、`novel.txt`はこのnotebookと同じフォルダではなく、そこに置かれた`text`という名前のフォルダの中に
置かれているファイルです。   
ですから、そのままファイル名だけを指定して開こうとすると以下のようにエラーが出て、ファイルのオープンに失敗します。

---

```python
f = open('novel.txt', 'r', encoding='utf-8')
```

---

<pre><span class="ansi-red-fg">---------------------------------------------------------------------------</span>
<span class="ansi-red-fg">FileNotFoundError</span>                         Traceback (most recent call last)
<span class="ansi-green-fg">&lt;ipython-input-1-cc9526482c59&gt;</span> in <span class="ansi-cyan-fg">&lt;module&gt;</span>
<span class="ansi-green-fg">----&gt; 1</span><span class="ansi-red-fg"> </span>f <span class="ansi-blue-fg">=</span> open<span class="ansi-blue-fg">(</span><span class="ansi-blue-fg">"novel.txt"</span><span class="ansi-blue-fg">,</span> <span class="ansi-blue-fg">"r"</span><span class="ansi-blue-fg">,</span> encoding<span class="ansi-blue-fg">=</span><span class="ansi-blue-fg">"utf-8"</span><span class="ansi-blue-fg">)</span>

<span class="ansi-red-fg">FileNotFoundError</span>: [Errno 2] No such file or directory: 'novel.txt'

</pre>

ではどうやったら「カレントディレクトリの下の`text`の下」にある「`novel.txt`」を開けるのでしょうか？<br>
これは次のように行います。<br>

---

```python
f = open('text/novel.txt', 'r', encoding='utf-8')
```

---

このようにすることによって、「カレントディレクトリの下の`text`の下にある`novel.txt`を開いてください」と指示することができます。  
これは、カレントディレクトリから「`novel.txt`」までの経路（行き方）を表したものなので**パス**とも呼びます。

In [None]:
f = open('text/novel.txt', 'r', encoding='utf-8')
print(f.read())
f.close()

## 相対パスと絶対パス
`text/novel.txt`という表現では、カレントディレクトリから「`novel.txt`」までのパスを表しています。  
ここで、Jupyter Notebookでは、カレントディレクトリはnotebookの場所になるので、どの場所に置かれたnotebookを開いているかによってカレントディレクトリが変わり、それに応じて、同じファイルでもパスが変わります。  
このようなパスの表現を**相対パス**と呼びます。

一方、Windowsの場合`C:\Users\hagiya\Douments\Python入門\novel1.txt`、
MacOSの場合`/Users/hagiya/Documents/Python入門/novel1.txt`のように、ルートからのパスを記した場合、
カレントディレクトリの場所に関わらず、常に同じファイルを指すことができます。  
このようなパスの表現を**絶対パス**と呼びます。

ところで、カレントディレクトリより下にあるファイルは、そこまでに入るディレクトリ名を`/`で区切って書けばいいですが、
その下にないファイルを指すにはどうしたらいいでしょうか？  
たとえば下の図のようにカレントディレクトリが`C:\Users\hagiya\Douments\Python入門`（MacOSなら`/Users/hagiya/Documents/Python入門`）のとき、
`C:\Users\hagiya\Douments\メディアプログラミング入門\imagelist.csv`（MacOSなら`/Users/hagiya/Douments/メディアプログラミング入門/imagelist.csv`)を開きたい場合はどうしたらいいでしょう？

![Jupyter Notebook tree](fig/4-4-jupyterTreeIllust2.png)

実は、一つ上のディレクトリを`..`（コンマ２つ）で表現することができます。  
上の例だと、  

---

```python
f = open('../メディアプログラミング入門/imagelist.csv', 'r')
```

---

とすれば、`C:\Users\hagiya\Douments\メディアプログラミング入門\imagelist.csv`（MacOSなら`/Users/hagiya/Douments/メディアプログラミング入門/imagelist.csv`)を開くことができます。  
`..`によって、「Python入門」から一段上の「Documents」に戻り、そこから「メディアプログラミング入門の下のimagelist.csv」と辿っているわけです。

## 木構造によるデータ表現

木構造はファイルやディレクトリの保存形式だけでなく、データの表現として幅広く利用されます。<br>
たとえば家系図も木構造による表現です。「家系図」は英語で"Family tree"ですよね。

![Family tree](fig/4-4-FamilyTree.png)

このような構造を持つデータでは、まるで家系図のように、上位下位関係にあるデータ同士を「親子（parent/child)」と呼んだり、同位関係にあるものを「兄妹（siblings)」と呼んだりします。「祖先（ancestor)」や「子孫（desendant)」という表現も使われます。<br>
データのグラフ構造におけるこのような表現は、実際に親子関係にあるかは関係ありません。<br>
たとえば下の図は四肢動物の系統樹です。

![tree](fig/4-4-PhylogeneticTree.png)

データ構造的には、「有羊膜類」と「哺乳類」は親子関係にあるというわけです。<br>
