In [1]:
# OSの機能を使う
fout = open('opps.txt', 'wt')
print('Oops, I created a file.', file=fout)
fout.close()

In [2]:
# exists()でファイルの存在をチェック
import os
os.path.exists('opps.txt')

True

In [3]:
os.path.exists('./opps.txt')

True

In [4]:
os.path.exists('waffles')

False

In [5]:
os.path.exists('.')

True

In [6]:
os.path.exists('..')

True

In [7]:
a = ['opps.txt', 'waffles']
os.path.exists(a)

TypeError: stat: path should be string, bytes, os.PathLike or integer, not list

In [8]:
# isfile()によるファイルタイプのチェック　普通のファイルかどうか
name = 'opps.txt'
os.path.isfile(name)

True

In [9]:
os.path.isdir(name)

False

In [10]:
os.path.isdir('.')

True

In [11]:
# isabs()による絶対パスか否かのチェック
os.path.isabs(name)

False

In [14]:
os.path.isabs('/big/fake/name')

True

In [15]:
os.path.isabs('big/fake/name/without/a/leading/slash')

False

In [16]:
# copy()関数はshutilという別のモジュールに含まれている
# opps.txtをohno.txtにコピーする
import shutil
shutil.copy('opps.txt', 'ohno.txt')

'ohno.txt'

In [17]:
# shutil.move()はファイルをコピーしてからオリジナルを削除する

In [18]:
# rename()によるファイル名の変更
import os
os.rename('ohno.txt', 'ohwell.txt')

In [19]:
# link(), symlink()によるリンクの作成
# islink()はファイルがシンボリックリンクか否かをチェック
os.link('opps.txt', 'yikes.txt')
os.path.isfile('yikes.txt')

FileExistsError: [Errno 17] File exists: 'opps.txt' -> 'yikes.txt'

In [20]:
os.path.islink('yikes.txt') # ハードリンクはFalse

False

In [21]:
os.symlink('opps.txt', 'jeepers.txt')
os.path.islink('jeepers.txt')

FileExistsError: [Errno 17] File exists: 'opps.txt' -> 'jeepers.txt'

In [22]:
# chmod()によるパーミッションの変更
# opps.txtをオーナーによる読み出しだけを認める
os.chmod('opps.txt', 0o400)# [オーナー][オーナーが所属するメイングループ][その他のユーザー] [rwx][rwx][rwx]

In [23]:
# 8進値を使わない
import stat
os.chmod('opps.txt', stat.S_IRUSR)

In [24]:
os.chmod('opps.txt', 0o777)

In [25]:
# chown()によるオーナーの変更
# 数値でユーザーID(uid), グループID(gid)を指定すれば、ファイルのオーナー、グループ所有権を変更できる
uid = 5
gid = 22
os.chown('opps.txt', uid, gid)

PermissionError: [Errno 1] Operation not permitted: 'opps.txt'

In [26]:
# abspath()によるパス名の取得
# 相対パス名を絶対パス名に拡張する
os.path.abspath('opps.txt')

'/Users/inoueshinichi/Google ドライブ/Python/Python Beginer/opps.txt'

In [27]:
# realpath()によるシンボリックリンクパス名の取得
# jeepers.txtからopps.txtの名前を得ることができる
os.path.realpath('jeepers.txt')

'/Users/inoueshinichi/Google ドライブ/Python/Python Beginer/opps.txt'

In [28]:
# remove()によるファイルの削除
os.remove('opps.txt')
os.path.exists('opps.txt')

False

In [29]:
# mkdir()によるディレクトリの作成
os.mkdir('poems')
os.path.exists('poems')

FileExistsError: [Errno 17] File exists: 'poems'

In [30]:
# rmdir()によるディレクトリの削除
os.rmdir('poems')
os.path.exists('poems')

OSError: [Errno 66] Directory not empty: 'poems'

In [31]:
# listdir()による内容リストの作成
os.mkdir('poems')
os.listdir('poems')

FileExistsError: [Errno 17] File exists: 'poems'

In [32]:
# サブディレクトリを作成
os.mkdir('poems/mcintyre')
os.listdir('poems')

FileExistsError: [Errno 17] File exists: 'poems/mcintyre'

In [33]:
# ./poems/mcintyreサブディレクトリにファイルを作成
fout = open('poems/mcintyre/the_good_man', 'wt')
fout.write('''Cheerful and happy was his mood,
He to the poor was kind and good,
And he oft%' times did find them food,
Also supplies of coal and wood,
He never spake a word was rude,
And cheer%'d those did o%'er sorrows brood,
He passed away not understood,
Because no poet in his lays
Had penned a sonnet in his praise,
%'Tis sad, but such is world%'s way.
''')

345

In [34]:
fout.close()

In [35]:
os.listdir('poems/mcintyre/')

['the_good_man']

In [36]:
# chdir()によるカレントディレクトリの変更
import os
os.chdir('poems')
os.listdir('.')

['mcintyre']

In [37]:
# glob()によるパターンにマッチするファイルのリスト作成
# 規則
# *はすべてのものにマッチする(正規表現なら.*とすべきところ)
# ?は任意の1文字にマッチする
# [abc]は, a, b, cのどれかにマッチする
# [!abc]は, a, b, c以外の文字にマッチする

# mで始まるファイル, ディレクトリのリストを作る
import glob
glob.glob('m*')

['mcintyre']

In [38]:
# 中身はなんであれ、2文字の名前を持つファイル, ディレクトリを探す
glob.glob('??')

[]

In [39]:
# mで始まりeで終わる8文字のファイル名があったはずだが。。。
glob.glob('m??????e')

['mcintyre']

In [40]:
# k, l, mのどれかで始まりeで終わるファイル
glob.glob('[klm]*e')

['mcintyre']

In [41]:
# プログラムとプロセス
# プロセスはシステムリソース(CPU, メモリ, ディスク・スペース)と
# OSのカーネルのデータ構造(ファイル, ネットワーク接続, 利用統計など)を使う.
# プロセスは他のプロセスから切り離されている
# 外のプロセスを邪魔することはできない

In [42]:
# プロセスIDとカレントディレクトリを取得する
import os
os.getpid()

1016

In [43]:
os.getcwd()

'/Users/inoueshinichi/Google ドライブ/Python/Python Beginer/poems'

In [44]:
# ユーザーIDとグループIDを取得する
os.getuid()

501

In [45]:
os.getgid()

20

In [46]:
# subprocessによるプロセスの作成
# subprocessモジュールによるPythonからの既存プログラムの起動、終了
# 単にシェルの中で外のプログラムを起動し、そのプログラムが生成した出力（標準出力、標準エラー出力）を知りたい
# だけならgetoutput()を使えばいい

In [47]:
# Unixのdataプログラムの出力を取り出している
import subprocess
ret = subprocess.getoutput('date')

In [48]:
ret

'2018年 2月 2日 金曜日 19時42分13秒 JST'

In [49]:
ret

'2018年 2月 2日 金曜日 19時42分13秒 JST'

In [50]:
ret = subprocess.getoutput('date')

In [51]:
ret

'2018年 2月 2日 金曜日 19時42分20秒 JST'

In [52]:
# getoutput()の引数は完全なシェル・コマンドを表す文字列なので、引数、パイプ<と>のI/Oリダイレクトなどを
# 入れることができる
ret = subprocess.getoutput('date -u')

In [53]:
ret

'2018年 2月 2日 金曜日 10時42分34秒 UTC'

In [54]:
# wcコマンドにパイプを介して渡すと、1行6語29文字だと計算される
ret = subprocess.getoutput('date -u | wc')
ret

'       1       6      48'

In [55]:
# check_output()はコマンドと引数のリストを受け付ける
# デフォルトは文字列ではなくbytes形式で標準出力だけが返さえる
# そして、シェルは使われない
ret = subprocess.check_output(['date', '-u'])
ret

b'2018\xe5\xb9\xb4 2\xe6\x9c\x88 2\xe6\x97\xa5 \xe9\x87\x91\xe6\x9b\x9c\xe6\x97\xa5 10\xe6\x99\x8243\xe5\x88\x8610\xe7\xa7\x92 UTC\n'

In [56]:
# getstatusoutpu()を使うと、プログラムの終了ステータスと出力をタプリ形式で見ることができる
ret = subprocess.getstatusoutput('date')
ret

(0, '2018年 2月 2日 金曜日 19時43分12秒 JST')

In [57]:
# 出力を受け取って、処理する必要がなく、ただ終了ステータスだけを知りたいときは、call()を使う
ret = subprocess.call('date')

In [58]:
ret

0

In [59]:
# Unix系のシステムでは通常は終了ステータス0が成功を表す
# 返されてきた日時情報は出力に表示されるが、プログラムには渡されない。代わりに終了ステータスをretに保存できる

In [60]:
# プログラムに引数を渡す方法 -> 2つ　'コマンド 引数1 引数2 ...'とするか['コマンド', '引数1', 引数2']とリスト
# 指定して、渡す

# date -uというコマンドを認識させ、別々の文字列に分割し、*などのワイルドカード文字を展開するためには、shell=True
# 指定が必要(今回は使っていない)
ret = subprocess.call('date -u', shell=True)
ret

0

In [61]:
# multiprocessingによるプロセスの作成
# multiprocessingモジュールを使えば、Python関数を別個のプロセスとして実行できる
# ひとつのプログラムの中で複数の独立したプロセスを実行することもできる。

In [62]:
# mp.pyというファイルに保存し、python mp.pyと入力して実行する
import multiprocessing
import os

def do_this(what):
    whoami(what)
    
def whoami(what):
    print("Process %s says: %s" % (os.getpid(), what))

whoami("I'm the main program")
for n in range(4):
    p = multiprocessing.Process(target=do_this, args=("I'm function %s" % n,))
    p.start()

Process 1016 says: I'm the main program
Process 1221 says: I'm function 0
Process 1222 says: I'm function 1
Process 1223 says: I'm function 2
Process 1224 says: I'm function 3


In [84]:
# terminate()によるプロセスの強制終了
import multiprocessing
import time
import os

def whoami(name):
    print("I'm %s, in process %s" % (name, os.getpid()))
    
def loopy(name):
    whoami(name)
    start = 1
    stop = 10000
    for num in range(start, stop):
        print("\tNumber %s of %s. Honk!" % (num, stop))
        time.sleep(1)
        
whoami("main")
p = multiprocessing.Process(target=loopy, args=("loopy",))
p.start()
time.sleep(5)
p.terminate()

I'm main, in process 741
I'm loopy, in process 2413
	Number 1 of 10000. Honk!
	Number 2 of 10000. Honk!
	Number 3 of 10000. Honk!
	Number 4 of 10000. Honk!
	Number 5 of 10000. Honk!


In [63]:
# カレンダーとクロック
# July 29 1984, 29 July 1984, 29/7/1984, 7/29.1984　など様々なので解析が難しい

In [64]:
# 閏年のチェック　4年に一度来る
import calendar
calendar.isleap(1900)

False

In [65]:
calendar.isleap(1996)

True

In [66]:
calendar.isleap(1992)

True

In [67]:
calendar.isleap(2000) # 400で割り切れるので閏年ではない

True

In [68]:
calendar.isleap(2002)

False

In [69]:
calendar.isleap(2004)

True

In [70]:
# Pythonモジュールには時間にまつわるものが多い
# datetime, time, calendar, dateutil

In [71]:
# datetimeモジュール
# ・年月日を対象とするクラス date
# ・時分秒を対象とする time
# ・日付と時刻の両方 datetime
# ・日付と時刻の間隔を対象とする　timedelta

from datetime import date
halloween = date(2014, 10, 31)
halloween

datetime.date(2014, 10, 31)

In [72]:
halloween.day

31

In [73]:
halloween.year

2014

In [74]:
halloween.month

10

In [75]:
# dateの内容はisoformat()で表示できる
halloween.isoformat()

'2014-10-31'

In [76]:
from datetime import date
now = date.today()
now

datetime.date(2018, 2, 2)

In [77]:
now.isoformat()

'2018-02-02'

In [78]:
# timedeltaオブジェクトでdateの1日後, 17日後, 1日前を計算する
from datetime import timedelta
one_day = timedelta(days=1)

In [80]:
tomorrow = now + one_day
tomorrow

datetime.date(2018, 2, 3)

In [82]:
yesterday = now - one_day
yesterday

datetime.date(2018, 2, 1)

In [83]:
now + 17 * one_day

datetime.date(2018, 2, 19)

In [84]:
date.min

datetime.date(1, 1, 1)

In [85]:
date.max

datetime.date(9999, 12, 31)

In [87]:
# 1日のなかの時刻を表現する->timeオブジェクト
from datetime import time
noon = time(12, 0, 0)
noon

datetime.time(12, 0)

In [89]:
noon.isoformat()

'12:00:00'

In [90]:
noon.hour

12

In [91]:
noon.minute

0

In [92]:
noon.second

0

In [93]:
noon.microsecond

0

In [95]:
# 2014年1月2日午前3時4分5秒6μ秒を直接指定する
from datetime import datetime
some_day = datetime(2014, 1, 2, 3, 4, 5, 6)
some_day

datetime.datetime(2014, 1, 2, 3, 4, 5, 6)

In [96]:
some_day.isoformat()

'2014-01-02T03:04:05.000006'

In [98]:
from datetime import datetime
now = datetime.now()
now

datetime.datetime(2018, 2, 2, 20, 15, 8, 498299)

In [99]:
now.isoformat()

'2018-02-02T20:15:08.498299'

In [100]:
# combine()を使ってdateオブジェクトとtimeオブジェクトを結合してdatetimeオブジェクトを作る
from datetime import datetime, time, date
noon = time(12)
this_day = date.today()
noon_today = datetime.combine(this_day, noon)
noon_today

datetime.datetime(2018, 2, 2, 12, 0)

In [101]:
# date(), time()メソッドをつかってdatetimeオブジェクトからdateとtimeを抽出
noon_today.date()

datetime.date(2018, 2, 2)

In [102]:
noon_today.time()

datetime.time(12, 0)

In [103]:
noon_today.time().microsecond

0

In [104]:
# timeモジュールの使い方
# datetimeのtimeとは全く別物
# しかも,timeモジュールにはtime()関数という紛らわしいものがある

In [106]:
# UNIX時間 1970年1月1日午前0時からの秒数を使う
# エポックという
import time # UNIX時間を使う
now = time.time()
now

1517570457.060003

In [107]:
# ctime()を使ってUnix時間を文字列に変換
time.ctime(now)

'Fri Feb  2 20:20:57 2018'

In [108]:
# Unix時間はJavaScriptなど、ほかのシステムと日付、時刻データを交換するときに最大公約数的に使える。
# しかし、実際の日、時間などの値が欲しくなるときがある。timeはstruct_timeオブジェクトとしてこれらの
# 値を提供する。localtime()はシステムの標準時での日時を返すgmtimeはUTCでの時刻を返す

time.localtime(now) # 東京

time.struct_time(tm_year=2018, tm_mon=2, tm_mday=2, tm_hour=20, tm_min=20, tm_sec=57, tm_wday=4, tm_yday=33, tm_isdst=0)

In [109]:
time.gmtime(now) # ロンドン　ちょうど9時間の時差

time.struct_time(tm_year=2018, tm_mon=2, tm_mday=2, tm_hour=11, tm_min=20, tm_sec=57, tm_wday=4, tm_yday=33, tm_isdst=0)

In [110]:
# localtime(), gmtime()に引数を与えなければ、現在の時刻が返される
time.localtime()

time.struct_time(tm_year=2018, tm_mon=2, tm_mday=2, tm_hour=20, tm_min=26, tm_sec=35, tm_wday=4, tm_yday=33, tm_isdst=0)

In [111]:
time.gmtime()

time.struct_time(tm_year=2018, tm_mon=2, tm_mday=2, tm_hour=11, tm_min=26, tm_sec=42, tm_wday=4, tm_yday=33, tm_isdst=0)

In [113]:
# mktime()はstruct_timeオブジェクトをUnix時間に変換する
tm = time.localtime(now)
time.mktime(tm)

1517570457.0

In [114]:
# struct_timeオブジェクトは秒単位までしか管理していないので、time.time()の出力とは若干異なる

In [115]:
# ローカルの標準時よりもUTCを使おう。特にサーバーでは...
# サマータイムは使わない。 春に1時間すすめる。　秋に1時間遅らせる ->データ消失の要因となる

In [116]:
# 日時の読み書き
import time
now = time.time()
time.ctime(now)

'Fri Feb  2 20:31:27 2018'

In [117]:
# strftime()メソッド -> datetime, timeモジュールに対応
# %Y -> 年, 1900...
# %m -> 月, 01-12
# %B -> 月名, January
# %b -> 月略称, Jan
# %d -> 日, 01-31
# %A -> 曜日, Sunday
# %a -> 曜日略称, Sun
# %H -> 時間(24), 00-23
# %I -> 時間(12), 01-12
# %M -> 分, 00-59
# %S -> 秒, 00-59
import time
fmt = "It's %A, %B %d, %Y, local time %I:%M:%S%p"
t = time.localtime()
t

time.struct_time(tm_year=2018, tm_mon=2, tm_mday=2, tm_hour=20, tm_min=37, tm_sec=46, tm_wday=4, tm_yday=33, tm_isdst=0)

In [118]:
time.strftime(fmt, t)

"It's Friday, February 02, 2018, local time 08:37:46PM"

In [119]:
# dateオブジェクトでこれをすると日付の部分だけが整形されて、時刻の部分はデフォルトで深夜0時となる
from datetime import date
some_day = date(2014, 7, 4)
some_day.strftime(fmt)

"It's Friday, July 04, 2014, local time 12:00:00AM"

In [120]:
# timeオブジェクトを使うと、時刻の部分だけが変換
from datetime import time
some_time = time(10, 35)
some_time.strftime(fmt)

"It's Monday, January 01, 1900, local time 10:35:00AM"

In [121]:
# 逆に文字列を日時情報に変換するには同じ書式指定子(fmt)とstrptime()を使う
# fmtの中身で%○以外のフォーマットは正確に一致している必要がある

In [124]:
# 悪い例
import time
fmt = "%Y-%m-%d"
time.strptime("2012 01 29", fmt) # スペースとダッシュの違い!

ValueError: time data '2012 01 29' does not match format '%Y-%m-%d'

In [126]:
# OK
time.strptime("2012-01-29", fmt)

time.struct_time(tm_year=2012, tm_mon=1, tm_mday=29, tm_hour=0, tm_min=0, tm_sec=0, tm_wday=6, tm_yday=29, tm_isdst=-1)

In [127]:
# 値が範囲外だとアウト
time.strptime('2012-13-01', fmt)

ValueError: time data '2012-13-01' does not match format '%Y-%m-%d'

In [130]:
# ロケールの変更 -> setlocale()
import locale
from datetime import date
halloween = date(2014, 10, 31)
for lang_country in ['en_us', 'fr_fr', 'de_de', 'es_es', 'is_is', 'ja_jp']:
    locale.setlocale(locale.LC_TIME, lang_country)
    print(halloween.strftime('%A, %B %d'))

Friday, October 31
Vendredi, octobre 31
Freitag, Oktober 31
viernes, octubre 31
föstudagur, október 31
金曜日, 10月 31


In [131]:
# ロケール一覧
import locale
names = locale.locale_alias.keys()

In [132]:
names

dict_keys(['a3', 'a3_az', 'a3_az.koic', 'aa_dj', 'aa_er', 'aa_et', 'af', 'af_za', 'am', 'am_et', 'american', 'an_es', 'ar', 'ar_aa', 'ar_ae', 'ar_bh', 'ar_dz', 'ar_eg', 'ar_in', 'ar_iq', 'ar_jo', 'ar_kw', 'ar_lb', 'ar_ly', 'ar_ma', 'ar_om', 'ar_qa', 'ar_sa', 'ar_sd', 'ar_sy', 'ar_tn', 'ar_ye', 'arabic', 'as', 'as_in', 'ast_es', 'ayc_pe', 'az', 'az_az', 'az_az.iso88599e', 'be', 'be@latin', 'be_bg.utf8', 'be_by', 'be_by@latin', 'bem_zm', 'ber_dz', 'ber_ma', 'bg', 'bg_bg', 'bho_in', 'bn_bd', 'bn_in', 'bo_cn', 'bo_in', 'bokmal', 'bokmål', 'br', 'br_fr', 'brx_in', 'bs', 'bs_ba', 'bulgarian', 'byn_er', 'c', 'c-french', 'c.ascii', 'c.en', 'c.iso88591', 'c.utf8', 'c_c', 'c_c.c', 'ca', 'ca_ad', 'ca_es', 'ca_es@valencia', 'ca_fr', 'ca_it', 'catalan', 'cextend', 'chinese-s', 'chinese-t', 'crh_ua', 'croatian', 'cs', 'cs_cs', 'cs_cz', 'csb_pl', 'cv_ru', 'cy', 'cy_gb', 'cz', 'cz_cz', 'czech', 'da', 'da_dk', 'danish', 'dansk', 'de', 'de_at', 'de_be', 'de_ch', 'de_de', 'de_li.utf8', 'de_lu', 'deutsch'

In [133]:
good_names = [name for name in names if len(name) == 5 and name[2] == '_']

In [134]:
good_names[:5]

['a3_az', 'aa_dj', 'aa_er', 'aa_et', 'af_za']

In [136]:
# ドイツ語のすべてのロケールを抽出
de = [name for name in good_names if name.startswith('de')]
de

['de_at', 'de_be', 'de_ch', 'de_de', 'de_lu']