<a href="https://colab.research.google.com/github/hongo-daisuke/study-python/blob/master/python_file.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ファイル操作とシステム

## ファイルの作成

In [None]:
# ファイルの作成
f = open('text.txt', 'w')
f.write('Test')
f.close()

In [None]:
# ファイルへ追記
f = open('text.txt', 'a')
f.write('Test')
f.close()

In [None]:
# print()でのファイルへの書き込み
f = open('text.txt', 'w')
f.write('Test\n')
print('I am print', file=f)
print('My',  'name', 'is', 'Mike', sep='&', end='!!', file=f)
f.close()

### withステートメントでファイル操作を行う
*   withのインデント終わりに自動的にcloseを行ってくれる


```
with open(ファイル名, ファイルを開くモード) as f:
    書き込み処理

```



In [None]:
s = """\
aaa
bbb
ccc
ddd
eee
"""
with open('text.txt', 'w') as f:
    f.write(s)

## ファイルの読み込み

In [None]:
with open('text.txt', 'r') as f:
    print(f.read())

aaa
bbb
ccc
ddd
eee



In [None]:
# 1行ずつ読み込み
with open('text.txt', 'r') as f:
    while True:
        line = f.readline()
        print(line, end="")
        if not line:
            break

aaa
bbb
ccc
ddd
eee


In [None]:
# 指定した文字数ずつ読み込む
with open('text.txt', 'r') as f:
    while True:
        chunk = 2 # 2文字ずつ読み込む
        line = f.read(chunk)
        print(line)
        if not line:
            break

aa
a

bb
b

cc
c

dd
d

ee
e




### seekを使用して移動




In [None]:
with open('text.txt', 'r') as f:
    print(f.tell()) # 0の位置
    print(f.read(1)) # １文字読み込む

    f.seek(5) # 5文字移動
    print(f.read(1)) # １文字読み込む

    f.seek(14) # 14文字移動
    print(f.read(1)) # １文字読み込む

    f.seek(15) # 15文字移動
    print(f.read(1)) # １文字読み込む

    f.seek(16) # 16文字移動
    print(f.read(2)) # 2文字読み込む

    f.seek(5) # 5文字移動
    print(f.read(1)) # １文字読み込む

0
a
b
d


ee
b


## ファイルを開くモードについて

*   書き込みと読み込みを行う場合

```
with open(ファイル名, 'w+') as f:
    f.write(s)
    f.seek(0) # seek(0)で先頭に移動する必要がある
    print(f.read())

または

with open('text.txt', 'r+') as f:
    f.read()
    f.seek(0) # seek(0)で先頭に移動する必要がある
    f.read()
```



In [None]:
s = """\
Aaa
bBb
ccD
dDd
Eee
"""
with open('text.txt', 'w+') as f:
    f.write(s)
    f.seek(0)
    print(f.read())

Aaa
bBb
ccD
dDd
Eee



In [None]:
s = """\
aaA
bBb
Ccc
dDd
eeE
"""
# 読み込んでから書き込みを行うため、事前にファイルが存在しないとエラーになる
with open('text.txt', 'r+') as f:
    print(f.read())
    f.seek(0)
    f.write(s)

Aaa
bBb
ccD
dDd
Eee



## テンプレート



In [None]:
import string
s = """\

Hi $name.

$contents

Have a good day
"""

t = string.Template(s)
contents = t.substitute(name='Mike', contents='How are your?')
print(contents)


Hi Mike.

How are your?

Have a good day



In [None]:
import string
# 外部ファイルからテキストを読み込みテンプレートとして扱うことが出来る
with open('text2.txt') as f: # text2.txtは上の変数sと同じ
    t = string.Template(f.read())
contents = t.substitute(name='Mike', contents='How are your?')
print(contents)

Hi Mike.

How are your?

Have a good day


## CSVファイルへの書き込みと読み込み

In [None]:
from os import write
import csv
with open('test.csv', 'w') as csv_file:
    fieldnames = ['Name', 'Count']
    writer = csv.DictWriter(csv_file, fieldnames=fieldnames)
    writer.writeheader()
    writer.writerow({'Name': 'A', 'Count': 1})
    writer.writerow({'Name': 'B', 'Count': 2})

In [None]:
with open('test.csv', 'r') as csv_file:
    reader = csv.DictReader(csv_file)
    for row in reader:
        print(row['Name'], row['Count'])

A 1
B 2


## ファイルの操作

*   os
*   pathlib
*   glob
*   shutil

In [None]:
import os
print(os.path.exists('text.txt')) # 引数のファイルが存在するか判定
print(os.path.isfile('text.txt')) # ファイルか判定
print(os.path.isdir('sample_data')) # ディレクトリか判定

if os.path.exists('text.txt') == True:
    os.rename('text.txt', 'renamed.txt') #ファイル名の変更
    if os.path.exists('symlink.txt') == False:
        os.symlink('renamed.txt', 'symlink.txt') # symlink.txtを変更するとrenamed.txtにも反映される

# ディレクトリの作成と削除
if os.path.exists('test_dir') == False:
    os.mkdir('test_dir') # ディレクトリの作成
else:
    os.rmdir('test_dir') # ディレクトリの削除

False
False
True


In [None]:
# 空ファイルの作成と削除
import os
import pathlib

if os.path.exists('empty.txt') == False:
    pathlib.Path('empty.txt').touch() # 空ファイルの作成
else:
    os.remove('empty.txt') # ファイルの削除

In [None]:
# ディレクトリの中身を確認1（ファイル名のみ）
import os

os.mkdir('test_dir') # ディレクトリの作成
os.mkdir('test_dir/test_dir2') # ディレクトリの作成
pathlib.Path('test_dir/test_dir.txt').touch() # 空ファイルの作成
print(os.listdir('test_dir')) # ディレクトリの中身を返す

['test_dir2', 'test_dir.txt']


In [None]:
# ディレクトリの中身を確認2
import glob
import pathlib
pathlib.Path('test_dir/test_dir2/test_dir2_1.txt').touch() # 空ファイルの作成
pathlib.Path('test_dir/test_dir2/test_dir2_2.txt').touch() # 空ファイルの作成
print(glob.glob('test_dir/test_dir2/*')) # test_dir2配下にあるファイルを全て取得

['test_dir/test_dir2', 'test_dir/test_dir.txt']


In [None]:
# ファイルのコピー
import shutil
import glob
shutil.copy('test_dir/test_dir1_1.txt',
            'test_dir/test_dir1_2.txt') # ファイルのコピー
print(glob.glob('test_dir/*')) # test_dir配下にあるファイルを全て取得

['test_dir/test_dir2', 'test_dir/test_dir1_2.txt', 'test_dir/test_dir1_1.txt']


In [None]:
import shutil
# ディレクトリの削除
# os.rmdirはからの場合のみ削除可能
shutil.rmtree('test_dir') # ディレクトリとその中身を全て削除

In [None]:
import os
# 現在のファイルが実行されたパスを取得
print(os.getcwd())

/content


## tarfileの圧縮展開

In [None]:
import tarfile

# tarfile_testをtest.tar.gzとして圧縮する
with tarfile.open('test.tar.gz', 'w:gz') as tr:
    tr.add('tarfile_test')

# Macの場合は右記の様なコマンドで展開出来る「tar zxvf test.tar.gz -C /tmp」

In [None]:
with tarfile.open('test.tar.gz', 'r:gz') as tr:
    # test_tarという名前で展開
    tr.extractall(path='test_tar')

In [None]:
# 展開せずに中身だけ確認
with tarfile.open('test.tar.gz', 'r:gz') as tr:
    with tr.extractfile('tarfile_test/tarfile_test.txt') as f:
        print(f.read())

b'test'


## zipファイルの圧縮展開

In [None]:
import zipfile

# test_dir
with zipfile.ZipFile('test.zip', 'w') as z:
    # 以下のやり方だと自分でzip化したいファイルを全て指定する必要があるのでglobでファイル名を取得するのが良い
    # z.write('test_dir')
    # z.write('test_dir/test.txt')
    for file in glob.glob('test_dir/**', recursive=True): # *二つとrecursive=Trueで下の階層も全て取得する
        print(file)
        z.write(file)

# Macの場合は右記の様なコマンドで展開出来る「unzip test.zip -d zzz」

test_dir/
test_dir/test.txt
test_dir/sub_dir
test_dir/sub_dir/sub_text.txt


In [None]:
#zipファイルの展開
with zipfile.ZipFile('test.zip', 'r') as z:
    z.extractall('zzz2')

In [None]:
# tar同様に展開前に一つのファイルだけ中身を確認することが出来る
with zipfile.ZipFile('test.zip', 'r') as z:
    with z.open('test_dir/test.txt') as f:
        print(f.read())

b''


## tempfile

*   pythonがioバッファの上でファイルを作成するので使用後は削除してくれる



In [None]:
import tempfile

with tempfile.TemporaryFile(mode='w+') as t:
    t.write('hello')
    t.seek(0)
    print(t.read())

hello


### tempfileを保存する

In [None]:
import tempfile

with tempfile.NamedTemporaryFile(delete=False) as t:
    print(t.name)
    with open(t.name, 'w+') as f: 
        f.write('test')
        f.seek(0)
        print(f.read())

/tmp/tmplxww05kn
test


### ディレクトリの対応

In [None]:
with tempfile.TemporaryDirectory() as td:
    print(td)

/tmp/tmpnwymh31k


## subprocess

*   Linuxコマンドをpythonで使用する
*   以前はos.systemだったが現在は非推奨
*   returncodeに結果が入っている 0:成功 0以外:エラー


```
subprocess.run(['実行コマンド', '引数'])

# shellを使用するとパイプなど使用可能
# シェルインジェクションなどセキュリティ的によろしくないため推奨されていない
subprocess.run('実行コマンド', shell=True) 
```






In [None]:
import subprocess
# こちらのやり方で存在しないコマンドを実行するとエラーになる
subprocess.run(['ls', '-al'])

# パイプを使用する場合
p1 = subprocess.Popen(['ls', '-al'], stdout=subprocess.PIPE)
p2 = subprocess.Popen(['grep', 'test.txt'], stdin=p1.stdout, stdout=subprocess.PIPE)
p1.stdout.close()
output = p2.communicate()[0]
print(output)

b'-rw-r--r-- 1 root root    0 Aug 29 15:04 test.txt\n'


In [None]:
import subprocess

# 左のコマンドをそのままシェルに渡しシェルが実行する
subprocess.run('ls -al | grep *.py', shell=True) 

# returncodeによるレスポンス
r1 = subprocess.run('ls -al', shell=True)
print(r1.returncode)

r2 = subprocess.run('lsf -al', shell=True)
print(r2.returncode)

0
127


## 時間について

In [None]:
import datetime

# 今の時間
now = datetime.datetime.now()
print(now)
print(now.isoformat()) # 国際規格での表示
print(now.strftime('%d/%m/%Y')) # 自分で表記を変える (日/月/年)

2022-08-29 15:15:20.098690
2022-08-29T15:15:20.098690
29/08/2022


In [None]:
# 年月日のみ扱う
today = datetime.date.today()
print(today)
print(today.isoformat()) # 国際規格での表示
print(today.strftime('%d/%m/%y')) # 自分で表記を変える (日/月/年)

2022-08-29
2022-08-29
29/08/22


In [None]:
# 時間
t = datetime.time(hour=2, minute=13, second=4, microsecond=100)
print(t)
print(t.isoformat())
print(t.strftime('%H-%M-%S-%f'))

02:13:04.000100
02:13:04.000100
02-13-04-000100


### 日付の計算

In [None]:
# 日付の計算
print(now)
d = datetime.timedelta(weeks=-1) # 一週間前
print(now + d)

# こちらでも一週間前になる
d = datetime.timedelta(weeks=1)
print(now - d)

d = datetime.timedelta(weeks=1) # 一週間後
print(now + d)

d = datetime.timedelta(days=1) # 一日後
print(now + d)

# 基本的には週、日、時、分、秒、ミリ秒あるが年はないので日付で指定
d = datetime.timedelta(days=365) # 一年後
print(now + d)

2022-08-29 15:15:20.098690
2022-08-22 15:15:20.098690
2022-08-22 15:15:20.098690
2022-09-05 15:15:20.098690
2022-08-30 15:15:20.098690
2023-08-29 15:15:20.098690


In [None]:
import time
print('処理開始')
time.sleep(3) # 引数秒スリープする
print('処理終了')

処理開始
処理終了


### 活用例

*   ファイルのバックアップを取る



In [None]:
import os
import shutil

# test.txtが存在する場合はファイル名.現在時刻でコピーを行う
file_name = 'test.txt'
if os.path.exists(file_name) == True:
    shutil.copy('test.txt', f"{file_name}_{now.strftime('%Y-%m-%d')}")

with open(file_name, 'w') as f:
    f.write('test')