# 第8章 ファイルの読み書き

## 8.1 ファイルとファイルパス
### 8.1.1 Windowsのバックスラッシュ、MACやLinuxのスラッシュ
全てのosに対応できるように文字列をつなげる

In [1]:
import os
os.path.join('usr','bin','spam')

'usr\\bin\\spam'

In [2]:
#以下のようにファイルのフルパスを作る際に使用する

my_files=['accounts.txt','details.csv','invite.docx']
for filename in my_files:
    print(os.path.join('C:\\Users\\',filename))

C:\Users\accounts.txt
C:\Users\details.csv
C:\Users\invite.docx


### 8.1.2 カレントディレクトリ

In [3]:
os.getcwd() #カレントディレクトリを取得

'C:\\Users\\nakam\\Python'

In [4]:
os.chdir('C:\\Users\\nakam\\Python\\Data\\Boring_Python') #カレントディレクトリを変更
os.getcwd()

'C:\\Users\\nakam\\Python\\Data\\Boring_Python'

### 8.1.3 絶対パスと相対パス

In [5]:
#.で始まると現在のフォルダ、..で始まると親フォルダを表す

os.chdir('C:\\Users\\nakam\\Python\\Data\\Boring_Python')
os.chdir('..\\Scikit-Learn') #親フォルダからの相対パスを表示
os.getcwd()

'C:\\Users\\nakam\\Python\\Data\\Scikit-Learn'

### 8.1.4 os.makedirs()関数を用いた新しいフォルダ作成

In [7]:
#フォルダの作成
os.makedirs('C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.1.4',exist_ok=True) #exist_ok=Trueで存在している場合は作成しない

## 8.2 os.pathモジュール
### 8.2.1 絶対パスと相対パスの操作

In [8]:
#絶対パスを返す

os.path.abspath('.') #.はカレントディレクトリを表す

'C:\\Users\\nakam\\Python\\Data\\Scikit-Learn'

In [9]:
#絶対パスであればTrueを返す

os.path.isabs('.') 

False

In [10]:
#os.path.relpath(start,path) でstartからpathの相対パスを返す

os.path.relpath('C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.1.4','C:\\Users\\nakam\\Python\\Data\\Scikit-Learn')

'..\\Boring_Python\\8.1.4'

In [11]:
#ファイルの場所を表示

os.path.dirname('C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.2.1\\Hello.txt')

'C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.2.1'

In [12]:
#ファイル名を表示

os.path.basename('C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.2.1\\Hello.txt')

'Hello.txt'

In [13]:
#ファイルの場所とファイル名を表示

os.path.split('C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.2.1\\Hello.txt') #タプルを取得する

('C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.2.1', 'Hello.txt')

In [14]:
#フォルダ毎に分割する場合はos.sepを用いたsplit()メソッドを使う

file='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.2.1\\Hello.txt'
file.split(os.sep)

['C:',
 'Users',
 'nakam',
 'Python',
 'Data',
 'Boring_Python',
 '8.2.1',
 'Hello.txt']

### 8.2.2 ファイルサイズとフォルダ内容を調べる

In [15]:
#ファイルサイズを調べる

file='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.2.1\\Hello.txt'
os.path.getsize(file) 

11

In [16]:
#フォルダ内のファイル、フォルダを表示

os.listdir('..') #親フォルダを表示

['Boring_Python', 'Python - ショートカット.lnk', 'Scikit-Learn']

フォルダ内のファイルサイズの合計を表示

In [17]:
folder='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.2.1'

total_size=0
for filename in os.listdir(folder):
    total_size=total_size+os.path.getsize(os.path.join(folder,filename))
print(total_size)

44


### 8.2.3 パスを検査する

In [18]:
#パスが存在すればTrueを返す

folder='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.2.3'
os.path.exists(folder)

False

In [19]:
#パスが存在し、それがファイルであればTrueを返す

file='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.2.1\\Hello.txt'
os.path.isfile(file)

True

In [20]:
#パスが存在し、それがフォルダであればTrueを返す

file='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.2.1\\Hello.txt'
os.path.isdir(file)

False

## 8.3 ファイルの読み書きの方法
### 8.3.1 open()関数,read()関数

In [21]:
file='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.2.1\\Hello.txt'

hello_file=open(file) #hello_fileにfileオブジェクトが格納される
hello_content=hello_file.read() #readメソッドを用いて文字列を取得する
hello_content

'Hello World'

### 8.3.3 ファイルの書き込み

In [22]:
#ファイルに書き込む方法

file='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.3.3\\Hello.txt'

hello_file=open(file,'w') #wモードで書き込み、ファイルが存在しない場合は作成する
hello_file.write('Hello World!!')
hello_file.close() #操作が完了したらcloseする

#以下ファイルの表示
hello_file=open(file) #hello_fileにfileオブジェクトが格納される
hello_content=hello_file.read() #readメソッドを用いて文字列を取得する
print(hello_content)

Hello World!!


In [23]:
#ファイルに追記する方法

hello_file=open(file,'a') #aモードで追加
hello_file.write('\nNice To Meet You!!')
hello_file.close()

#以下ファイルの表示
hello_file=open(file) #hello_fileにfileオブジェクトが格納される
hello_content=hello_file.read() #readメソッドを用いて文字列を取得する
print(hello_content)

Hello World!!
Nice To Meet You!!


## 8.4 shelveモジュールを用いて変数を保存する

In [24]:
#変数の保存方法は以下

import shelve

file='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.4\\Mydate'
shelf_file=shelve.open(file)
cats=['Zophie','Mike']
shelf_file['pets']=cats #辞書のように登録される
shelf_file.close

<bound method Shelf.close of <shelve.DbfilenameShelf object at 0x000001CCB79F6448>>

In [25]:
#変数の読み込み方法は以下

shelf_file=shelve.open(file)
print(type(shelf_file))
print(shelf_file['pets'])
shelf_file.close()

<class 'shelve.DbfilenameShelf'>
['Zophie', 'Mike']


In [26]:
#辞書と同様keys(),values()メソッドがある

shelf_file=shelve.open(file)
print(list(shelf_file.keys())) #リスト風オブジェクトを返すので、list()関数を用いてリスト化する
print(list(shelf_file.values()))
shelf_file.close()

['pets']
[['Zophie', 'Mike']]


## 8.5 pprint.pformat()関数を用いて変数を保存する
テキストで開いて修正したい場合は.pyファイルに保存する方法もある、それ以外であればshelveで保存が便利

In [27]:
#pprint.pformatを用いて.pyファイルに書き込める文字列を取得できる⇒保存

folder='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.5'

import pprint
cats=[{'name':'Zophie','desc':'chubby'},{'name':'Pooka','desc':'fluffy'}]
pprint.pformat(cats)
file_obj=open(folder+'\\'+'myCats.py','w') #.pyファイルに保存
file_obj.write('cats =' +pprint.pformat(cats)+'\n')
file_obj.close()

In [28]:
#.pyファイルなのでimport可能

import myCats
myCats.cats

[{'desc': 'chubby', 'name': 'Zophie'}, {'desc': 'fluffy', 'name': 'Pooka'}]

## 8.6 プロジェクト：ランダムな問題集ファイルを作成する

In [29]:
#! python3
# randomQuizGenerator.py - ランダム順に問題と答えを並べ問題集と解答集を作る

#保存先を指定
folder='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.6\\'

import random 

# 問題のデータ。キーが都道府県で、値が県庁所在地
capitals = {'北海道': '札幌市', '青森県': '青森市', '岩手県': '盛岡市', 
  '宮城県': '仙台市', '秋田県': '秋田市', '山形県': '山形市', '福島県': '福島市',
  '茨城県': '水戸市', '栃木県': '宇都宮市', '群馬県': '前橋市',
  '埼玉県': 'さいたま市', '千葉県': '千葉市', '東京都': '東京',
  '神奈川県': '横浜市', '新潟県': '新潟市', '富山県': '富山市', '石川県': '金沢市',
  '福井県': '福井市', '山梨県': '甲府市', '長野県': '長野市', '岐阜県': '岐阜市',
  '静岡県': '静岡市', '愛知県': '名古屋市', '三重県': '津市', '滋賀県': '大津市',
  '京都府': '京都市', '大阪府': '大阪市', '兵庫県': '神戸市', '奈良県': '奈良市',
  '和歌山県': '和歌山市', '鳥取県': '鳥取市', '島根県': '松江市',
  '岡山県': '岡山市', '広島県': '広島市', '山口県': '山口市', '徳島県': '徳島市',
  '香川県': '高松市', '愛媛県': '松山市', '高知県': '高知市', '福岡県': '福岡市',
  '佐賀県': '佐賀市', '長崎県': '長崎市', '熊本県': '熊本市', '大分県': '大分市',
  '宮崎県': '宮崎市', '鹿児島県': '鹿児島市', '沖縄県': '那覇市'}

# 35個の問題集を作成する
for quiz_num in range(35):
    # 問題と答えのファイルを作成する
    quiz_file = open(folder+'capitalsquiz{}.txt'.format(quiz_num + 1), 'w')
    answer_key_file = open(folder+'capitalsquiz_answers{}.txt'.format(quiz_num + 1), 'w')

    # 問題のヘッダを書く
    quiz_file.write('名前:\n\n日付:\n\n')
    quiz_file.write((' ' * 20) + '都道府県庁所在地クイズ (問題番号 {})'.format(quiz_num + 1))
    quiz_file.write('\n\n')

    # 都道府県の順番をシャッフルする
    prefectures = list(capitals.keys())
    random.shuffle(prefectures)

    for question_num in range(len(prefectures)):
        # 正解と誤答を取得する
        correct_answer = capitals[prefectures[question_num]]
        wrong_answers = list(capitals.values())
        del wrong_answers[wrong_answers.index(correct_answer)]
        wrong_answers = random.sample(wrong_answers, 3)
        answer_options = wrong_answers + [correct_answer]
        random.shuffle(answer_options)

        # 問題文と回答選択肢を問題ファイルに書く
        quiz_file.write('{}. {}の都道府県庁所在地は?\n'.format(question_num + 1,
            prefectures[question_num]))
        for i in range(4):
            quiz_file.write(' {}. {}\n'.format('ABCD'[i], answer_options[i]))
        quiz_file.write('\n')

        # 答えの選択肢をファイルに書く
        answer_key_file.write('{}. {}\n'.format(question_num + 1, 'ABCD'[
            answer_options.index(correct_answer)]))

    quiz_file.close()
    answer_key_file.close()


## 8.7 プロジェクト：マルチクリップボード
キーワードを入力し、クリップボードのテキストを登録する

In [30]:
#! python3
# mcb.pyw - クリップボードのテキストを保存・復元
# Usage:
# py.exe mcb.pyw save <keyword> - クリップボードをキーワードに紐づけて保存
# py.exe mcb.pyw <keyword> - キーワードに紐づけられたテキストをクリップボードにコピー
# py.exe mcb.pyw list - 全キーワードをクリップボードにコピー

#保存先を指定
folder='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.7\\'

import shelve, pyperclip, sys

mcb_shelf = shelve.open(folder+'mcb')

# クリップボードの内容を保存
if len(sys.argv) == 3 and sys.argv[1].lower() == 'save':
    mcb_shelf[sys.argv[2]] = pyperclip.paste()
elif len(sys.argv) == 2:
    # キーワード一覧と、内容の読み込み
    if sys.argv[1].lower() == 'list':
        pyperclip.copy(str(list(mcb_shelf.keys())))
    elif sys.argv[1] in mcb_shelf:
        pyperclip.copy(mcb_shelf[sys.argv[1]])

mcb_shelf.close()

## 8.10 演習プロジェクト
### 8.10.1 マルチクリップボードを拡張する
マルチクリップボードに削除機能を追加する

In [31]:
#! python3
# -*- coding: utf-8 -*-

# 演習プロジェクト 8.10.1 
# mcb2.pyw - クリップボードのテキストを保存・復元
#
# Usage:
# py.exe mcb2.pyw save <keyword> - クリップボードをキーワードに紐づけて保存
# py.exe mcb2.pyw <keyword> - キーワードに紐づけられたテキストをクリップボードにコピー
# py.exe mcb2.pyw list - 全キーワードをクリップボードにコピー
#
# 以下、演習プロジェクトで追加した機能
# py.exe mcb2.pyw delete <keyword> - キーワードに紐づけられたテキストを削除
# py.exe mcb2.pyw delete all - すべてのテキストを削除

#保存先を指定
folder='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.7\\'

import shelve, pyperclip, sys

mcb_shelf = shelve.open(folder+'mcb')

# クリップボードの内容を保存
if len(sys.argv) == 3:
    if sys.argv[1].lower() == 'save':
        mcb_shelf[sys.argv[2]] = pyperclip.paste()
    elif sys.argv[1].lower() == 'delete':  # 削除機能
        if sys.argv[2].lower() == 'all':
           mcb_shelf.clear()          # 全削除
        else:
           del mcb_shelf[sys.argv[2]] # 指定したキーワードのテキストを削除
elif len(sys.argv) == 2:
    # キーワード一覧と、内容の読み込み
    if sys.argv[1].lower() == 'list':
        pyperclip.copy(str(list(mcb_shelf.keys())))
    elif sys.argv[1] in mcb_shelf:
        pyperclip.copy(mcb_shelf[sys.argv[1]])
else:
    print("""使い方：
py.exe mcb2.pyw save <keyword> - クリップボードをキーワードに紐づけて保存
py.exe mcb2.pyw <keyword> - キーワードに紐づけられたテキストをクリップボードにコピー
py.exe mcb2.pyw list - 全キーワードをクリップボードにコピー
py.exe mcb2.pyw delete <keyword> - キーワードに紐づけられたテキストを削除
py.exe mcb2.pyw delete all - すべてのテキストを削除
""")

mcb_shelf.close()

### 8.10.2 作文ジェネレータ
文章の動詞、形容詞、名詞を書き換える作文ジェネレータ

In [32]:
import sys
import re

src_data='The ADJECTIVE panda walked to the NOUN and then VERB. A nearby NOUN was unaffected by these events.'

# 置き換える文字列
pattern = re.compile(r'(ADJECTIVE|NOUN|VERB|ADVERB)')

while True: #すべての置換が終わるまでループ
    # 出現順にユーザに問い合わせる
    mo = pattern.search(src_data)
    if not mo:
        break

    # プロンプトを表示して、入力を受け付ける。
    print('Enter a', end='')
    # ADJECTIVE と ADVERB の場合は、冠詞を an にする
    if mo.group(1)[0] == 'A':
        print('n', end='')
    print(' ' + mo.group(1).lower() + ':')
    repl = input()

    # ひとつだけ置換する
    src_data = src_data.replace(mo.group(1), repl, 1) #1個目のみ置換

# 置換結果を画面に表示する
print(src_data, end='')

Enter an adjective:
ADJ
Enter a noun:
NOU
Enter a verb:
VER
Enter a noun:
NOU
The ADJ panda walked to the NOU and then VER. A nearby NOU was unaffected by these events.

### 8.10.3 正規表現検索
フォルダ内のすべてのtxtファイルを開いて、正規表現にマッチする行を検索する

In [33]:
import os
import re

print('keywordを入力してください')
keyword=input()
print('')

pattern=re.compile(keyword)
folder='C:\\Users\\nakam\\Python\\Data\\Boring_Python\\8.2.1'

for filename in os.listdir(folder):
    if not filename.lower().endswith('.txt'):
        continue
    # テキストファイルを開く。文字コードはUTF-8とする。
    # シフトJISコードの場合は、encoding='shift_jis'としてください。
    
    txt_file = open(folder+'\\'+filename, 'r', encoding='utf-8')
    for line in txt_file:
        mo = pattern.search(line)
        if mo: #正規表現に一致した場合
            print(filename, ':',  line)
    txt_file.close()

keywordを入力してください
World

Hello - コピー - コピー - コピー.txt : Hello World
Hello - コピー - コピー.txt : Hello World
Hello - コピー.txt : Hello World
Hello.txt : Hello World
