# Pythonでファイルパスを扱う時にはpathlibを使う

## はじめに
- Pythonでファイルパスを扱う時、ファイルを読み書きする時ありますよね
- 検索すると大体以下のようなコードが出てきます
  - 場合によっては `with` がなかったり、encodingがなかったりと突っ込みが色々あったりしますが。。。


In [2]:
p1 = "./python_pathlib/data.txt"
with open(p1, encoding="UTF-8") as f:
    print(f.read())


abcd



## pathlibを使って欲しい
- 間違っている訳ではないですが、今コードを書くのであればpathlibを使用しましょう
- ドキュメント
  - https://docs.python.org/ja/3/library/pathlib.html

## strで扱うことのデメリット
- エラーの発生しやすさ
  - パスの結合時にプラットフォームごとの違いを考慮する必要がある
  - スラッシュやバックスラッシュの違いとか
- 非効率性
  - コードが冗長になりがち
  - パスの存在確認や属性取得などを行う際に追加の関数が必要
- 可読性の低下
  - 文字列操作が多用される
  - コードの意図が読み取りにくくなる

In [3]:
# エラーの発生しやすさ
# Windowsの場合区切り文字はバックスラッシュ「\」
base_path = "C:\\path\\to\\folder"
filename = "file.txt"

# 区切り文字を「/」としてパスを結合
full_path = base_path + "/another_folder/" + filename
print(full_path)

C:\path\to\folder/another_folder/file.txt


In [4]:
# 非効率性（pathlibを使用しない場合）
import os

# パスの結合
base_path = "/path/to/folder"
filename = "file.txt"
full_path = os.path.join(base_path, filename)

# パスの存在確認
if os.path.exists(full_path):
    print(f"The file {filename} exists.")
else:
    print(f"The file {filename} does not exist.")

# ファイルのサイズを取得
if os.path.exists(full_path):
    file_size = os.path.getsize(full_path)
    print(f"The size of the file is {file_size} bytes.")


The file file.txt does not exist.


In [5]:
# 非効率性（pathlibを使用する場合）
from pathlib import Path

# パスの結合
base_path = Path("/path/to/folder")
filename = "file.txt"
full_path = base_path / filename

# パスの存在確認
if full_path.exists():
    print(f"The file {filename} exists.")
else:
    print(f"The file {filename} does not exist.")

# ファイルのサイズを取得
if full_path.exists():
    file_size = full_path.stat().st_size
    print(f"The size of the file is {file_size} bytes.")

The file file.txt does not exist.


In [6]:
# 可読性の低下（pathlibを使用しない場合）
# 複雑なパスの操作
base_path = "/path/to/somewhere"
project_folder = "project"
config_file = "settings.conf"

# パスの手動での操作
config_path = base_path + "/" + project_folder + "/" + config_file
print(config_path)


/path/to/somewhere/project/settings.conf


In [7]:
# 可読性の低下（pathlibを使用する場合）
from pathlib import Path

# 複雑なパスの操作
base_path = Path("/path/to/somewhere")
project_folder = "project"
config_file = "settings.conf"

# パスの操作
config_path = base_path / project_folder / config_file
print(config_path)


/path/to/somewhere/project/settings.conf


In [11]:
## Pathの結合については個人的に一番良いと思っている

base_path = "/path/to/somewhere" # 末尾のスラッシュがある場合
config_file = "settings.conf"

# パスの手動での操作
config_path = base_path + "/" + config_file
print(config_path)  # スラッシュが重複している

# パスの操作
config_path = Path(base_path) / project_folder / config_file
print(config_path) # スラッシュが重複していない

/path/to/somewhere/settings.conf
/path/to/somewhere/project/settings.conf


## pathlibを使うと拡張子やファイル名なども取得しやすい

In [None]:
from pathlib import Path

file_path = Path("/path/to/somefile.txt")

filename = file_path.name
print("ファイル名:", filename)  # "somefile.txt"

extension = file_path.suffix
print("拡張子:", extension)  # ".txt"

stem = file_path.stem
print("ファイル基本名（拡張子なし）:", stem)  # "somefile"

## 相対PATHを絶対PATHに変換

In [12]:
from pathlib import Path

relative_path1 = Path("some/relative/path")
absolute_path1 = relative_path1.resolve()
print("絶対PATH:", absolute_path1)

relative_path2 = Path("../home/user1/some/relative/path")
absolute_path2 = relative_path2.resolve()
print("絶対PATH:", absolute_path2)


絶対PATH: /project/some/relative/path
絶対PATH: /home/user1/some/relative/path


## 相対PATHと言えば、親ディレクトリとかも簡単に取得できる

In [13]:
from pathlib import Path

file_path = Path("/path/to/some/file.txt")

# 直接の親ディレクトリ
parent_dir = file_path.parent
print("親Directory:", parent_dir)  # "/path/to/some"

# さらに上の親ディレクトリにアクセス
grandparent_dir = file_path.parent.parent
print("親の親Directory:", grandparent_dir)

# ファイルパスの階層を上に遡る
# file_path.parents[2] とすることで2つ上の親ディレクトリにアクセスできる
for parent in file_path.parents:
    print(parent)

親Directory: /path/to/some
親の親Directory: /path/to
/path/to/some
/path/to
/path
/


## とは言っても、Pathを文字列で渡す必要あるのでは？

In [14]:
# 標準ライブラリはPathが大体そのまま使える
p1 = "./python_pathlib/data.txt"
with open(p1, encoding="UTF-8") as f:
    print(f.read())

with open(Path(p1), encoding="UTF-8") as f:
    print(f.read())


abcd

abcd



## コードがちょっと出てこないけど、
## Django等の著名なライブラリであれば基本pathlibをそのまま使える

## Pathlibの公式ドキュメント
## https://docs.python.org/ja/3/library/pathlib.html