# ライブラリインポート
pathlib：ファイル読み取り＆ファイル操作  
フォルダの中にあるファイルのpath一覧を取得するために主に使います。  
pathが取得できれば、DataFrameに中身を取り込めます。  
まずはpathlibライブラリのインポートから。読み取るのはpathlibモジュールのPathクラスだけです。  

参考：[pathlibとかいう優秀すぎる標準ライブラリ(python)](https://may46onez.hatenablog.com/entry/2018/09/18/233606)

■ライブラリインポート
```python
from pathlib import Path
```

In [1]:
from pathlib import Path


# フォルダ指定
フォルダやファイルを指定しておくと、その後pathlibの機能が使えます。  

■フォルダの指定
```python
folder = Path("フォルダパス")
```
■フォルダの中のファイル一覧を読み取り  
※globの中の「\*」はパターンマッチングの表現が可能で、名前のフィルタをかける事が可能です  
　https://www.javadrive.jp/python/file/index15.html  
```python
files = list(folder.glob("*"))
```
※`list()`をつけなくても使えます。その場合filesはgenerator型となります  
　generator型がわからない方は`list()`をつけて使ってください

■ファイルを1つずつ取り出して処理
```python
for file in files:
    処理内容
```
■ファイルの直接指定
```python
file = Path("ファイル名（パス込み）")
```
■ファイルパスの結合
```python
# WindowsPath型の変数に、パスを続けて書ける
folder/"4.txt"
```

In [4]:
folder = Path("./file/pathlib/a")
type(folder)

files = list(folder.glob("*.csv"))
files


[WindowsPath('file/pathlib/a/result_1.csv'),
 WindowsPath('file/pathlib/a/result_2.csv')]

In [6]:
folder = Path("./file/pathlib/a")
files = list(folder.glob("*.csv"))
print(files)

import pandas as pd  #importはまとめて最初に書く方が良い（こんな風に途中のセルでimportしないように）

for file in files:
    print(file)
    df = pd.read_csv(file)
    display(df)


[WindowsPath('file/pathlib/a/result_1.csv'), WindowsPath('file/pathlib/a/result_2.csv')]
file\pathlib\a\result_1.csv


Unnamed: 0,ナンバー1
0,0
1,1
2,2
3,3
4,4
5,5


file\pathlib\a\result_2.csv


Unnamed: 0,ナンバー2
0,6
1,7
2,8
3,9
4,10


In [8]:
# 「pathlib」フォルダ以下のすべてのファイル
folder = Path("./file/pathlib")
files = list(folder.glob("**/*"))
files


[WindowsPath('file/pathlib/a'),
 WindowsPath('file/pathlib/b'),
 WindowsPath('file/pathlib/c'),
 WindowsPath('file/pathlib/move'),
 WindowsPath('file/pathlib/a/.ipynb_checkpoints'),
 WindowsPath('file/pathlib/a/data_t1.txt'),
 WindowsPath('file/pathlib/a/result_1.csv'),
 WindowsPath('file/pathlib/a/result_2.csv'),
 WindowsPath('file/pathlib/a/.ipynb_checkpoints/data_t1-checkpoint.txt'),
 WindowsPath('file/pathlib/a/.ipynb_checkpoints/result_1-checkpoint.csv'),
 WindowsPath('file/pathlib/a/.ipynb_checkpoints/result_2-checkpoint.csv'),
 WindowsPath('file/pathlib/b/3.csv'),
 WindowsPath('file/pathlib/b/t2.txt'),
 WindowsPath('file/pathlib/c/3.txt'),
 WindowsPath('file/pathlib/c/4.csv'),
 WindowsPath('file/pathlib/move/before'),
 WindowsPath('file/pathlib/move/before/1.txt')]

In [None]:
# # 「pathlib」フォルダ以下のすべてのcsvファイル
# folder = Path("./file/pathlib")
# files = list(folder.glob("**/*.csv"))
# files


In [None]:
# # 1階層上位フォルダ以下のすべてのcsvファイル（ピリオドを増やすとそれだけ上の階層に行きます）
# folder1 = Path("../")
# files = list(folder1.glob("**/*.csv"))
# files


In [None]:
# # WindowsPath型の変数に、パスを文字列で続けて書ける
# folder = Path("./file/pathlib")
# file = folder/"a/t1.txt"
# file

# ファイルの情報読み取り
## ファイル名、フォルダ名読み取り

※以下、「file」はファイルパスが格納されている、Windowspath型の変数です。  
　```file = Path("ファイル名（パス込み）") ``` 

■ファイル名読み取り（拡張子なし）
```python
file.stem
```
■ファイル名読み取り（拡張子有り）
```python
file.name
```
■親フォルダ名読み取り
```python
file.parent
```
■絶対パス読み取り
```python
file.resolve()
```  
■フルパスに含まれるフォルダ名を取得  
```python
file.parts[-i]
# file.partsでpathを\で分け、タプルを生成。リスト形式で-i番目を指定することで、必要なフォルダ名を取得
```

In [11]:
file = Path("./file/pathlib/a/data_t1.txt")

print(file.stem)
print(file.name)
print(file.parent)
print(file.resolve())
print(file.parts[-3])

data_t1
data_t1.txt
file\pathlib\a
C:\Users\00220401626\AppData\Local\Programs\Python\Python39\Scripts\(1)Pythonマニュアル_v15\file\pathlib\a\data_t1.txt
pathlib


## その他情報読み取り

■ファイル更新時間読み取り（エポック秒）
```python
file.stat().st_mtime
```

■ファイル更新時間読み取り（文字列変換）  
  （`time.strftime`関数の第一引数は、好きな書式を設定）  
```python
import time
time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(file.stat().st_mtime))
```

■ファイルかどうか確認
```python
file.is_file()
```
■パスのファイル、またはディレクトリが存在しているかどうかを判定  
```python
file.exists()
```

In [None]:
# file = Path("./file/pathlib/a/result_1.csv")
# print(file.stat().st_mtime)

# import time
# print(time.strftime("%Y/%m/%d %H:%M:%S", time.localtime(file.stat().st_mtime)))


In [None]:
# folder = Path("./file/pathlib/a")
# files = list(folder.glob("*"))

# for file in files:
#     if file.is_file():
#         print(f"ファイル【〇】：{file.stem}")
#     else:
#         print(f"フォルダ【×】：{file.stem}")


In [None]:
# file_a = Path("./file/pathlib/a/result_1.csv")
# print(file_a.exists())

# file_b = Path("./file/pathlib/a/result_5.csv")
# print(file_b.exists())

# ファイルコピー、移動、削除

■ファイルコピー  
※別途shutilライブラリのインポート必要  
```python
import shutil
shutil.copy(file,"移動後のパス")
```
■ファイル移動  
※別途shutilライブラリのインポート必要  
```python
import shutil
shutil.move(file,"移動後のパス")
```
■ファイル削除
```python
file.unlink()
```

In [None]:
# import shutil
# file = Path(r"./file/pathlib/move/before/1.txt")
# shutil.copy(file,r"./file/pathlib/move/after")


In [None]:
# file = Path(r"./file/pathlib/move/after/1.txt")
# file.unlink()


# ソート
pathlibの機能というより、listの機能になります  
pathlibで受け取ったfilesを更新時間で並べ替える

■osモジュールをインポートしてソート
```python
import os
files.sort(key=os.path.getmtime)
```  

【参考】  
・gettimeの種類  
https://docs.python.org/ja/3/library/os.path.html  
※長いので、「getmtime」などで検索をかけてください。真ん中のあたりにあります  

■表示形式  
os.path.gettimeの情報はエポック秒で表示されてしまうため、datetimeオブジェクトに変換するにはdatetimeモジュールのdatetime.fromtimestamp()関数を使う。  
```python  
import datetime
print(datetime.datetime.fromtimestamp([ファイルパス].stat().st_mtime))  
```  
`[ファイルパス].stat().st_mtime)`はエポック秒で取れるので、`datetime.datetime.fromtimestamp`で文字列に直す  
※`.strftime('%Y-%m-%d %H:%M:%S')`はフォーマット指定のために入れています

In [None]:
# from pathlib import Path
# import os
# folder = Path("./file/pathlib/a")
# files = list(folder.glob("*"))

# files.sort(key=os.path.getmtime)
# print(files)

# # for file in files:
# #     print(file.stem, ':', file.stat().st_mtime)

# # # print(" -----------------getmtimeの表示形式変更------------------- ")
# # # import datetime
# # # for file in files:
# # #     print(file.stem, ':', datetime.datetime.fromtimestamp(file.stat().st_mtime).strftime('%Y-%m-%d %H:%M:%S'))
