In [1]:
import glob

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline

### globe

*:

ワイルドカード（０文字以上の任意の文字列）

引数のパターンにマッチするファイルパスのリストを取得

→すべての文字列に合致するので、ワーキングディレクトリ直下にあるすべてのファイルのパスが取得される

**取得して来たデータセットにどのようなファイルがあるかを調べる時に使用する**

In [2]:
glob.glob('*')

['Glob.ipynb', 'public-covid-data', 'その他.html', 'その他.ipynb']

In [3]:
cd public-covid-data

/work/Glob/public-covid-data


In [4]:
pwd

'/work/Glob/public-covid-data'

In [5]:
ls -a

[0m[01;34m.[0m/  [01;34m..[0m/  .DS_Store  [01;34mrp_im[0m/  [01;34mrp_msk[0m/


In [6]:
glob.glob('rp_*')

['rp_im', 'rp_msk']

In [7]:
# */*で２階層下まで潜って見ることもできる
glob.glob('rp_*/*')

['rp_im/1.nii.gz',
 'rp_im/2.nii.gz',
 'rp_im/3.nii.gz',
 'rp_im/4.nii.gz',
 'rp_im/5.nii.gz',
 'rp_im/6.nii.gz',
 'rp_im/7.nii.gz',
 'rp_im/8.nii.gz',
 'rp_im/9.nii.gz',
 'rp_msk/1.nii.gz',
 'rp_msk/2.nii.gz',
 'rp_msk/3.nii.gz',
 'rp_msk/4.nii.gz',
 'rp_msk/5.nii.gz',
 'rp_msk/6.nii.gz',
 'rp_msk/7.nii.gz',
 'rp_msk/8.nii.gz',
 'rp_msk/9.nii.gz']

### osとpathlib

In [8]:
cd ..

/work/Glob


In [9]:
import os
from pathlib import Path

In [10]:
p = Path('public-covid-data/')

In [11]:
p

PosixPath('public-covid-data')

In [12]:
# イテレーターを作成

p_i = p.iterdir()

In [13]:
next(p_i)

PosixPath('public-covid-data/.DS_Store')

In [14]:
# 同じ階層にある次のディレクトリのパスを表示

p_i_ =next(p_i)

In [15]:
p_i_

PosixPath('public-covid-data/rp_im')

In [16]:
# 更にイテレーターを作成

p_i_i = p_i_.iterdir()
p_i_i

<generator object Path.iterdir at 0x7fc361708d50>

In [18]:
# 更に下の階層にあるファイルのパスを取得

next(p_i_i)

PosixPath('public-covid-data/rp_im/1.nii.gz')

In [19]:
p = Path('public-covid-data/')

In [26]:
# public-covid-dataディレクトリの中のファイルパスをリスト形式で見る

list(p.iterdir())

[PosixPath('public-covid-data/.DS_Store'),
 PosixPath('public-covid-data/rp_im'),
 PosixPath('public-covid-data/rp_msk')]

In [27]:
sub_p = list(p.iterdir())[1]
sub_p

PosixPath('public-covid-data/rp_im')

In [28]:
# 一階層下のパスを取得
list(sub_p.iterdir())

[PosixPath('public-covid-data/rp_im/.DS_Store'),
 PosixPath('public-covid-data/rp_im/1.nii.gz'),
 PosixPath('public-covid-data/rp_im/2.nii.gz'),
 PosixPath('public-covid-data/rp_im/3.nii.gz'),
 PosixPath('public-covid-data/rp_im/4.nii.gz'),
 PosixPath('public-covid-data/rp_im/5.nii.gz'),
 PosixPath('public-covid-data/rp_im/6.nii.gz'),
 PosixPath('public-covid-data/rp_im/7.nii.gz'),
 PosixPath('public-covid-data/rp_im/8.nii.gz'),
 PosixPath('public-covid-data/rp_im/9.nii.gz')]

In [33]:
# globで条件に合ったもののパスを取得

list(sub_p.glob('*[6-9]*'))

[PosixPath('public-covid-data/rp_im/6.nii.gz'),
 PosixPath('public-covid-data/rp_im/7.nii.gz'),
 PosixPath('public-covid-data/rp_im/8.nii.gz'),
 PosixPath('public-covid-data/rp_im/9.nii.gz')]

In [34]:
target_file = list(sub_p.glob('*[6-9]*'))[0]

In [35]:
target_file

PosixPath('public-covid-data/rp_im/6.nii.gz')

### os.path.split()

head(フォルダパス)とtail(ファイル名)にsplitする

In [36]:
os.path.split(target_file)

('public-covid-data/rp_im', '6.nii.gz')

In [37]:
folder_p, file_name = os.path.split(target_file)

In [38]:
# head(フォルダパス)

folder_p

'public-covid-data/rp_im'

In [39]:
# tail(ファイル名)

file_name

'6.nii.gz'

### os.path.join()

フォルダパスとファイル名を連結

In [40]:
os.path.join(folder_p, file_name)

'public-covid-data/rp_im/6.nii.gz'

### フォルダの作成（応用）

**良く使う手技**

In [41]:
# public-covid-data/new_folderを作成

p = Path('public-covid-data/')
new_folder_name = 'new_folder'

In [42]:
# new_folderのパスを作成

new_folder_path = os.path.join(p, new_folder_name)
new_folder_path

'public-covid-data/new_folder'

In [43]:
# ファイルまたはディレクトリ（フォルダ）の存在を確認

os.path.exists(new_folder_path)

False

In [45]:
# 上記のコードでファイルまたはディレクトリ（フォルダ）の存在が確認出来ないことを確認したら作成

# exit:True, not exist:False 
# ファイルまたはディレクトリ（フォルダ）の存在が確認出来なかったら
if not os.path.exists(new_folder_path):
    os.makedirs(new_folder_path)