## ファイルとディレクトリアクセス


### ファイルパス操作を直感的に行う - pathlib

- [pathlib --- オブジェクト指向のファイルシステムパス](https://docs.python.org/ja/3.13/library/pathlib.html)


In [1]:
from pathlib import Path

Path()

PosixPath('.')

- PurePath は純粋パスを表すクラス


In [2]:
from pathlib import PurePath, Path

PurePath("spam.txt")

PurePosixPath('spam.txt')

In [3]:
PurePath("spam", "ham", "egg.txt")

PurePosixPath('spam/ham/egg.txt')

In [4]:
PurePath("spam/ham", "egg.txt")

PurePosixPath('spam/ham/egg.txt')

In [5]:
PurePath(Path("spam"), Path("ham"), "egg.txt")

PurePosixPath('spam/ham/egg.txt')

In [6]:
PurePath()

PurePosixPath('.')

In [7]:
p = Path("/usr")
p

PosixPath('/usr')

In [8]:
p / "bin" / "python3"

PosixPath('/usr/bin/python3')

In [9]:
q = Path("hosts")
"usr" / q

PosixPath('usr/hosts')

In [10]:
# パスの要素をタプルで返す
p = PurePath("spam", "ham", "egg.txt")
p.parts

('spam', 'ham', 'egg.txt')

In [11]:
cur_path = PurePath("/Users", "xxxxx", "python-snippets-hub")
# Linux系の場合は空文字列になる, Windowsなどはc:などが取得できるかと
cur_path.drive

''

In [12]:
# ルードを表す文字列を返す
cur_path.root

'/'

In [13]:
# ドライブとルートを結合した文字列を返す
cur_path.anchor

'/'

In [14]:
# 上位パスにアクセ腕きるシーケンスを返す
cur_path.parents[:]

(PurePosixPath('/Users/xxxxx'), PurePosixPath('/Users'), PurePosixPath('/'))

In [15]:
# パスの直接の上位パスを返す
cur_path.parent

PurePosixPath('/Users/xxxxx')

In [16]:
# パス要素の末尾を表す文字列を消す
cur_path.name

'python-snippets-hub'

In [17]:
# 末尾の拡張子を返す
p.suffix
# 拡張子が複数連なっている場合
# p.suffixes

'.txt'

In [18]:
# 末尾の拡張子を除いたものを返す
p.stem

'egg'

In [19]:
# パスが絶対パスである場合にTrue
cur_path.is_absolute()

True

In [20]:
# 指定したパスに対して相対であればTrue
print(cur_path.is_relative_to("/Users"))
print(cur_path.is_relative_to("/xxxxx"))

True
False


- glob とはワイルドカードとファイル名/ディレクトリ名をセットで指定するパターンのこと


In [21]:
# glob形式の引数patternと一致する場合True
p.match("*.txt")

True

In [22]:
# パスのname部分を引数で指定したものに変更したパスを返す
cur_path.with_name("examples")

PurePosixPath('/Users/xxxxx/examples')

In [23]:
# パスのstem部分を引数で指定したものにして返す
p.with_stem("tests")

PurePosixPath('spam/ham/tests.txt')

In [24]:
# パスの拡張子を引数で変更したものを返す
p.with_suffix(".md")

PurePosixPath('spam/ham/egg.md')

In [25]:
# 現在のディレクトリを表すパスオブジェクト
Path.cwd()

PosixPath('/Users/akagikouzanh/dev/backend/python-snippets-hub/snippets')

In [26]:
# ユーザのホームディレクトリを表すパスオブジェクト
Path.home()

PosixPath('/Users/akagikouzanh')

In [27]:
# ファイルの各種情報を返す
p = Path(str(Path.cwd()) + "/logs/helloworld.txt")
p.exists()
p.stat()

os.stat_result(st_mode=33188, st_ino=30378279, st_dev=16777233, st_nlink=1, st_uid=501, st_gid=20, st_size=0, st_atime=1746809694, st_mtime=1746809694, st_ctime=1746809694)

In [28]:
# 権限の変更
p.chmod(0o600)
p.stat().st_mode

33152

In [29]:
# パスがファイルである場合True
p.is_file()

True

In [30]:
with p.open(encoding="utf-8") as f:
    print(f.read())

# ファイルの内容を書き込む、書き込んだ文字数を返す
p.write_text("ハムハムハムハム", encoding="utf-8")




8

In [31]:
# ファイルの内容を文字列で返す
p.read_text(encoding="utf-8")

'ハムハムハムハム'

In [32]:
# ファイルの削除
p.unlink()

In [33]:
p.exists()

False

In [34]:
# ファイルの作成
p.touch()

In [35]:
# 絶対パスにし、シンボリックリンクを解決(絶対パスの取得)
p.resolve()

PosixPath('/Users/akagikouzanh/dev/backend/python-snippets-hub/snippets/logs/helloworld.txt')

In [36]:
p = Path()
p.iterdir()

<map at 0x108b964a0>

In [37]:
sorted(p.iterdir())

[PosixPath('logs'),
 PosixPath('snippets_class_special_methods.ipynb'),
 PosixPath('snippets_classes.ipynb'),
 PosixPath('snippets_coding_conventions.ipynb'),
 PosixPath('snippets_collections.ipynb'),
 PosixPath('snippets_data_type_and_algorithms.ipynb'),
 PosixPath('snippets_datetime.ipynb'),
 PosixPath('snippets_file_dirs.ipynb'),
 PosixPath('snippets_io.ipynb'),
 PosixPath('snippets_os_runtime.ipynb'),
 PosixPath('snippets_python_environments.ipynb'),
 PosixPath('snippets_python_specifications.ipynb'),
 PosixPath('snippets_secrets.ipynb'),
 PosixPath('snippets_text_process.ipynb'),
 PosixPath('snippets_timeit.ipynb'),
 PosixPath('snippets_tmplate.ipynb'),
 PosixPath('snippets_type_hint.ipynb'),
 PosixPath('snippets_unicodedata.ipynb')]

In [38]:
sorted(p.glob("*.ipynb"))

[PosixPath('snippets_class_special_methods.ipynb'),
 PosixPath('snippets_classes.ipynb'),
 PosixPath('snippets_coding_conventions.ipynb'),
 PosixPath('snippets_collections.ipynb'),
 PosixPath('snippets_data_type_and_algorithms.ipynb'),
 PosixPath('snippets_datetime.ipynb'),
 PosixPath('snippets_file_dirs.ipynb'),
 PosixPath('snippets_io.ipynb'),
 PosixPath('snippets_os_runtime.ipynb'),
 PosixPath('snippets_python_environments.ipynb'),
 PosixPath('snippets_python_specifications.ipynb'),
 PosixPath('snippets_secrets.ipynb'),
 PosixPath('snippets_text_process.ipynb'),
 PosixPath('snippets_timeit.ipynb'),
 PosixPath('snippets_tmplate.ipynb'),
 PosixPath('snippets_type_hint.ipynb'),
 PosixPath('snippets_unicodedata.ipynb')]

### 一時的なファイルやディレクトリを生成する - tempfile

- [tempfile --- 一時ファイルやディレクトリの作成](https://docs.python.org/ja/3.13/library/tempfile.html)


In [39]:
# 一時ファイルを作成する
import tempfile

with tempfile.TemporaryFile() as tmpf:
    print(tmpf.write(b"test test test\n"))
    print(tmpf.seek(0))
    print(tmpf.read())

15
0
b'test test test\n'


In [40]:
tmpf = tempfile.TemporaryFile()
print(tmpf.write(b"Hello tempfile\n"))
print(tmpf.seek(0))
print(tmpf.read())
tmpf.close()

15
0
b'Hello tempfile\n'


In [42]:
# 一時ファイルは名前を持ったファイルとして作成される保証はないため、ファイル名が必要な場合は以下を使用する(ファイルを削除したくなければdelete=Falseにする)
tmpf = tempfile.NamedTemporaryFile()
print(tmpf.name)
p = Path(tmpf.name)
print(p.exists())
tmpf.close()
print(p.exists())

/var/folders/8f/5bctm_kd3qg_4dv_z9xc0lch0000gn/T/tmpvtdqtl0a
True
False


In [43]:
# 一時ディレクトリを作成する
with tempfile.TemporaryDirectory() as tmpd:
    print(tmpd)
    p = Path(tmpd)
    print(p.exists())
    p2 = p / "hoge.txt"
    p2.touch()
    print(p2.exists())

/var/folders/8f/5bctm_kd3qg_4dv_z9xc0lch0000gn/T/tmp9_9uqu07
True
True


In [44]:
p.exists()

False

In [45]:
p2.exists()

False

In [50]:
# コンテキストマネージャを使用せず、明示的にディレクトリを削除したい場合は、cleanup()を呼び出す
tmpdir = tempfile.TemporaryDirectory()
print(tmpdir.name)
p = Path(tmpdir.name)
print(p.exists())
tmpdir.cleanup()
print(p.exists())

/var/folders/8f/5bctm_kd3qg_4dv_z9xc0lch0000gn/T/tmpubf77j84
True
False


### 高レベルなファイル操作を行う - shutil

- [shutil --- 高水準のファイル操作](https://docs.python.org/ja/3.13/library/shutil.html)


In [None]:
import shutil

# ファイルのデータのみをコピーする(dstにディレクトリは指定できない)
shutil.copyfile("logs/helloworld.txt", "logs/helloworld2.txt")

'logs/helloworld2.txt'

In [54]:
# 　ファイルのコピーとパーミッションも含めてコピーする
shutil.copy("logs/helloworld.txt", "logs/helloworld3.txt")

'logs/helloworld3.txt'

In [55]:
# copyの機能に加え全てのメタデータを含みコピーする
shutil.copy2("logs/helloworld.txt", "logs/helloworld4.txt")

# パーミッションをコピーする
# shutil.copymode("logs/helloworld.txt", "logs/helloworldX.txt")

# パーミッション、最終アクセス/最終変更時間、その他のファイル情報をコピーする
# shutil.copystat("logs/helloworld.txt", "logs/helloworldX.txt")

'logs/helloworld4.txt'

In [58]:
ls -la logs/

total 0
drwxr-xr-x@  6 akagikouzanh  staff  192 May 10 02:34 [34m.[m[m/
drwxr-xr-x@ 20 akagikouzanh  staff  640 May 10 01:11 [34m..[m[m/
-rw-r--r--@  1 akagikouzanh  staff    0 May 10 02:18 helloworld.txt
-rw-r--r--@  1 akagikouzanh  staff    0 May 10 02:29 helloworld2.txt
-rw-r--r--@  1 akagikouzanh  staff    0 May 10 02:30 helloworld3.txt
-rw-r--r--@  1 akagikouzanh  staff    0 May 10 02:18 helloworld4.txt


In [59]:
# 事前準備
p = Path("logs2")
p.mkdir()

In [64]:
# 事前準備２
p2 = Path("logs/helloworld.txt")
p2.rename("logs/hello.md")

PosixPath('logs/hello.md')

In [65]:
# 事前準備3
p3 = Path("logs/helloworld3.txt")
p3.rename("logs/world.py")

PosixPath('logs/world.py')

In [67]:
ignore = shutil.ignore_patterns("*.txt", "*.py")
print(ignore)
shutil.copytree("./logs", "./logs3", ignore=ignore)

<function ignore_patterns.<locals>._ignore_patterns at 0x10f7cc040>


'./logs3'

In [68]:
ls logs

hello.md         helloworld2.txt  helloworld4.txt  world.py


In [69]:
ls logs3

hello.md


In [None]:
# パスで指定したディレクトリ以下を全て削除する
# shutil.rmtree(path, ignore=xxxx)

# src -> distへ再帰的に移動させる, copy時の関数を指定できる
# shutil.move(src, dist, copy_function=shutil.copy)

In [74]:
p = Path("example.txt")
p2 = Path("example.md")
p
p2

PosixPath('example.md')

In [75]:
p.touch()
p2.touch()

In [78]:
ignore = shutil.ignore_patterns("*.txt", "*.ipynb", "*logs*")
shutil.copytree("./", "./backup", ignore=ignore)

'./backup'

In [88]:
def ignorefiles(path, names):
    print(path, names)
    # return [f for f in names if f.endswith((".py", ".md"))]
    return [f for f in names if Path(f).suffix in [".py", ".md"]]


shutil.copytree("./src", "./archive", ignore=ignorefiles)

./src ['helloworld2.txt', 'helloworld4.txt', 'hello.md']


'./archive'

### まとめ

| 目的                                   | 使用モジュール   | 主な API                | フィルタ手法                         | 備考                          |
| -------------------------------------- | ---------------- | ----------------------- | ------------------------------------ | ----------------------------- |
| ディレクトリ全体をコピー（全ファイル） | shutil           | `copytree()`            | なし                                 | 最も基本的なコピー            |
| `.txt` 以外を除外してコピー            | shutil           | `copytree()` + `ignore` | 自作関数（`not f.endswith('.txt')`） | ignore 関数でホワイトリスト化 |
| `.py` と `.md` だけコピー              | shutil           | `copytree()` + `ignore` | `Path(f).suffix in ['.py', '.md']`   | 任意拡張子リストで制御        |
| 任意のファイルのみを個別にコピー       | pathlib + shutil | `glob()` + `copy()`     | `Path.glob()`                        | 明示的な選択に最適            |
| 全 `.txt` を構造維持せず 1 箇所に集約  | pathlib + shutil | `rglob()` + `copy()`    | `**/*.txt`                           | flatten コピー用              |

### コピー系 まとめ

| 関数名                      | 説明                                                                           |
| --------------------------- | ------------------------------------------------------------------------------ |
| `shutil.copyfile(src, dst)` | ファイルの**内容のみ**をコピー。メタデータは含まれない                         |
| `shutil.copy(src, dst)`     | ファイルの**内容＋パーミッション**をコピー（`copymode()` を内部的に呼ぶ）      |
| `shutil.copy2(src, dst)`    | `copy()` に加えて、**最終アクセス時刻や更新時刻など全メタデータを保持**        |
| `shutil.copymode(src, dst)` | **パーミッションだけ**を `src` から `dst` にコピー                             |
| `shutil.copystat(src, dst)` | パーミッション＋**最終アクセス時刻・更新時刻など**をコピー（`copy2()` に近い） |
