# ライブラリインポート
pathlib：ファイル読み取り＆ファイル操作  
フォルダの中にあるファイルのpath一覧を取得するために主に使います。  
pathが取得できれば、DataFrameに中身を取り込めます。  
まずはpathlibライブラリのインポートから。読み取るのはpathlibモジュールのPathクラスだけです。  

参考：[pathlibとかいう優秀すぎる標準ライブラリ(python)](https://may46onez.hatenablog.com/entry/2018/09/18/233606)  
　　[Python, pathlibでファイル一覧を取得（glob, iterdir）](https://note.nkmk.me/python-pathlib-iterdir-glob/)  

■ライブラリインポート
```python
from pathlib import Path
```

In [None]:
# from pathlib import Path


# フォルダ指定
フォルダやファイルを指定しておくと、その後pathlibの機能が使えます。  

■フォルダの指定  
**※Windowsから取ってくる人は、文字列のクオテーションの前に小文字のrを付けておく（思考停止でつけておくように）**
```python
folder = Path(r"フォルダパス")
```
■フォルダの中のファイル一覧を読み取り  
※globの中の「\*」はパターンマッチングの表現が可能で、名前のフィルタをかける事が可能です  
　https://www.javadrive.jp/python/file/index15.html  
```python
files = list(folder.glob("*"))
```
※`list()`をつけなくても使えます。その場合filesはgenerator型となります  
　generator型がわからない方は`list()`をつけて使ってください

■ファイルを1つずつ取り出して処理
```python
for file in files:
    処理内容
```
■ファイルの直接指定  
```python
file = Path(r"ファイル名（パス込み）")
```
■ファイルパスの結合
```python
# WindowsPath型の変数に、パスを続けて書ける
folder/"4.txt"
```

In [None]:
# folder = Path(r"./file/pathlib/a")
# # type(folder)

# files = list(folder.glob("*.csv"))
# files


In [None]:
# folder = Path(r"./file/pathlib/a")
# files = list(folder.glob("*.csv"))
# print(files)

# # # import pandas as pd  # 本当は、importするライブラリはまとめて最初に書く方が良い（こんな風に途中のセルでimportしないように）

# for file in files:
#     print(file)
#     df = pd.read_csv(file)
#     display(df)


In [None]:
# """「pathlib」フォルダ以下のすべてのファイルを引っ張る（再帰処理）　→glob引数の文字列に"**/"をつける"""
# folder = Path(r"./file/pathlib")
# files = list(folder.glob("**/*"))
# files

In [None]:
# """「pathlib」フォルダ以下のすべてのcsvファイルを引っ張る"""
# folder = Path(r"./file/pathlib")
# files = list(folder.glob("**/*.csv"))
# files


In [None]:
# """なお、アスタリスク（*）を一つにすると、その階層にあるファイルだけ読む"""
# files_hide = list(folder.glob("*/*"))
# files_hide

# # そこにあるファイルと、「ipynb-checkpoints」というフォルダを読み込むと思います

In [None]:
# """「pathlib」フォルダの一つ下のすべての階層にあるcsvファイル"""
# folder = Path(r"./file/pathlib")
# files = list(folder.glob("*/*.csv"))
# files


\**、\*の使い分けについてはこのあたりを参照  
[【Python3】フォルダの中のフォルダの中のファイルをごそっと取得](https://note.com/yucco72/n/n7a5dbf5bb68b)

In [None]:
# # 1階層上位フォルダ以下のすべてのcsvファイル（ピリオドを増やすとそれだけ上の階層に行きます）
# folder1 = Path("../")
# files = list(folder1.glob("*/*.csv"))
# files


親ディレクトリその他はこの辺を参照（他にもあるので知りたい人は調べてください）  
[Python, pathlibの使い方（パスをオブジェクトとして操作・処理）](https://note.nkmk.me/python-pathlib-usage/)

In [None]:
# # WindowsPath型の変数に、パスを文字列で続けて書ける（osモジュールではこのような書き方はできないので便利！）
# folder = Path(r"./file/pathlib")
# file = folder/"a/t1.txt"
# file

# ファイルの情報読み取り
## ファイル名、フォルダ名読み取り

※以下、「file」はファイルパスが格納されている、Windowspath型の変数です。  
　```file = Path("ファイル名（パス込み）") ``` 

■ファイル名読み取り（拡張子なし）**★よく使う**
```python
file.stem
```
■ファイル名読み取り（拡張子有り）
```python
file.name
```
■親フォルダ名読み取り
```python
file.parent
```
■絶対パス読み取り
```python
file.resolve()
```  
■親フォルダに含まれるフォルダ名を取得  
```python
file.parts[-i]
# file.partsでpathを\で分け、タプルを生成。リスト形式で-i番目を指定することで、必要なフォルダ名を取得
```

In [None]:
# file = Path(r"./file/pathlib/a/data_t1.txt")

# print(file.stem) # ファイル名（拡張子なし） 
# print(file.name) # ファイル名（拡張子あり）

In [None]:
# print(file.parent) # 親フォルダ
# print(file.resolve()) # ファイルの絶対パス

In [None]:
# print(file.parts) # 親フォルダをtupleで出力
# print(file.parts[-2]) # ファイルがいるフォルダ名

## その他情報読み取り

■ファイル更新時間読み取り（エポック秒）
```python
file.stat().st_mtime
```

■ファイル更新時間読み取り（文字列変換）  
  （`time.strftime`関数の第一引数は、好きな書式を設定）  
```python
import time
time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(file.stat().st_mtime))
```

■ファイルかどうか確認
```python
file.is_file()
```
■パスのファイル、またはディレクトリが存在しているかどうかを判定  
```python
file.exists()
```

In [None]:
# file = Path(r"./file/pathlib/a/result_1.csv")
# print(file.stat().st_mtime)

# import time
# print(time.strftime("%Y/%m/%d %H:%M:%S", time.localtime(file.stat().st_mtime)))


In [None]:
# folder = Path(r"./file/pathlib/a")
# files = list(folder.glob("*"))

# for file in files:
#     if file.is_file():
#         print(f"ファイル【〇】：{file.stem}")
#     else:
#         print(f"フォルダ【×】：{file.stem}")


In [None]:
# file_a = Path(r"./file/pathlib/a/result_1.csv")
# print(file_a.exists())

# file_b = Path(r"./file/pathlib/a/result_5.csv")
# print(file_b.exists())

# ファイルコピー、移動、削除

■ファイルコピー  
※別途shutilライブラリのインポート必要  
```python
import shutil
shutil.copy(file, "移動後のパス")
```
■ファイル移動  
※別途shutilライブラリのインポート必要  
```python
import shutil
shutil.move(file, "移動後のパス")
```
■ファイル削除
```python
file.unlink()
```

In [None]:
# import shutil
# file = Path(r"./file/pathlib/move/before/1.txt")
# shutil.copy(file, r"./file/pathlib/move/after")


In [None]:
# file = Path(r"./file/pathlib/move/after/1.txt")
# file.unlink()


# ソート
pathlibの機能というより、listの機能になります  
pathlibで受け取ったfilesを並べ替える

- 更新時間順でソート  
※ osモジュールをインポートする
```python
import os
files.sort(key=os.path.getmtime)
```  

【参考】  
・gettimeの種類  
https://docs.python.org/ja/3/library/os.path.html  
※長いので、「getmtime」などで検索をかけてください。真ん中のあたりにあります  


- ファイル名でソート  
```python
files = sorted(files, key=lambda x: x.stem)
```  


- リストの最初 or 最後のファイルを変数fileに格納  

```python
# 並べ替えたファイルの一番最初のファイルを取る
file = files[0]

# 並べ替えたファイルの一番最後のファイルを取る
file = files[-1]
```
  
■表示形式  
os.path.gettimeの情報はエポック秒で表示されてしまうため、datetimeオブジェクトに変換するにはdatetimeモジュールのdatetime.fromtimestamp()関数を使う。  

```python  
import datetime
print(datetime.datetime.fromtimestamp([ファイルパス].stat().st_mtime).strftime('%Y-%m-%d %H:%M:%S'))  
```  
`[ファイルパス].stat().st_mtime)`はエポック秒で取れるので、`datetime.datetime.fromtimestamp`で文字列に直す  
※`.strftime('%Y-%m-%d %H:%M:%S')`はフォーマット指定のために入れています

In [None]:
# from pathlib import Path
# import os
# folder = Path(r"./file/pathlib/a")
# files = list(folder.glob("*"))

# files.sort(key=os.path.getmtime)
# print(files)

# # for file in files:
# #     print(file.stem, ':', file.stat().st_mtime)

# # # print(" -----------------getmtimeの表示形式変更------------------- ")
# # # import datetime
# # # for file in files:
# # #     print(file.stem, ':', datetime.datetime.fromtimestamp(file.stat().st_mtime).strftime('%Y-%m-%d %H:%M:%S'))


# Pathlib未対応のライブラリでの処理

ライブラリによっては、Pathlibが未対応のものがあります。  
その場合は、PathlibのWindowspath型 → str型へ変換してから使ってください。  

```python
path_pl = Path(r"ファイルパス or フォルダパス")
path_str = str(path_pl)
```

In [None]:
# path_pl = Path(r"./") # 「今いるフォルダ（カレントディレクトリ）」を相対パスで取得
# print(type(path_pl)) # path_plはWindowspath型

# path_pl = path_pl.resolve() # 「今いるフォルダ」の絶対パスを取得している
# path_str = str(path_pl)

# print(path_str)
# print(type(path_str)) # ファイルパスが文字列型に変更されている

**おまけ**  
相対パス`r"./"`などが使えない時に「今いるフォルダ」を取得したい場合は、osモジュールのgetcwdを使う（Jupyterの`%pwd`と同じ。`%pwd`はpyファイルでは使えないので注意）  

```python
import os
cur_path = os.getcwd()
print(cur_path)

# cur_pathが取得できたら、その後は同じような操作が可能
folder = Path(cur_path)
```  