# Python modules

## os
https://docs.python.org/ja/3/library/os.html?highlight=os#module-os

### .path
https://docs.python.org/ja/3/library/os.path.html?highlight=path#module-os.path

* このモジュールには、パス名を操作する便利な関数が実装されています。

#### .join
os.path.join(path, *paths)  
https://docs.python.org/ja/3/library/os.path.html?highlight=join#os.path.join

* 1 つあるいはそれ以上のパスの要素を賢く結合します。

In [3]:
import os

os.path.join('User','me','test.txt')

'User/me/test.txt'

## collections
https://docs.python.org/ja/3/library/collections.html

### .OrderedDict
class collections.OrderedDict([items])  
https://docs.python.org/ja/3/library/collections.html#collections.OrderedDict  

* 順序が保持された辞書を生成する

In [None]:
from collections import OrderedDict

od=OrderedDict(k1=1,k2=2) # 辞書の生成
print(od)

del od['k2']  # 要素の削除
print(od)

od.update(k1=2,k3=3)  # 要素の変更と追加
print(od)

od['k4']=4  # 要素の追加
print(od)

od['k3']=5  # 要素の変更
print(od)

OrderedDict([('k1', 1), ('k2', 2)])
OrderedDict([('k1', 1)])
OrderedDict([('k1', 2), ('k3', 3)])
OrderedDict([('k1', 2), ('k3', 3), ('k4', 4)])
OrderedDict([('k1', 2), ('k3', 5), ('k4', 4)])


### .Counter
class collections.Counter([iterable-or-mapping])  
https://docs.python.org/ja/3/library/collections.html?highlight=collections%20counter#collections.Counter  

* ハッシュ可能なオブジェクトをカウントする dict のサブクラスです。これは、要素を辞書のキーとして保存し、そのカウントを辞書の値として保存するコレクションです。

In [None]:
from collections import Counter

cnt=Counter()
colors=['red','green','blue','blue','red']

for color in colors:
    cnt[color]+=1

print(cnt)

Counter({'red': 2, 'blue': 2, 'green': 1})


## copy
https://docs.python.org/ja/3/library/copy.html?highlight=copy#module-copy

### .deepcopy
copy.deepcopy(x[, memo])  
https://docs.python.org/ja/3/library/copy.html?highlight=deepcopy#copy.deepcopy

* 多次元配列の深い層まで値渡しをする

In [None]:
import copy

x=[[1,2,3],[4,5,6]]
print('x=',x)
y=x
z=x.copy()
a=copy.copy(x)
b=copy.deepcopy(x)

x[1].append(10)
print('x[1].append(10)')
print('x=',x,'id(x[1])=',id(x[1]))
print('y=x ->',y,'id(y[1])=',id(y[1]))    #y[1]は参照渡し
print('x.copy() ->',z,'id(z[1])=',id(z[1]))   #z[1]は参照渡し
print('copy.copy(x) ->',a,'id(a[1])=',id(a[1]))   #a[1]は参照渡し
print('copy.deepcopy(x) ->',b,'id(b[1])=',id(b[1]))   #b[1]は値渡し

x= [[1, 2, 3], [4, 5, 6]]
x[1].append(10)
x= [[1, 2, 3], [4, 5, 6, 10]] id(x[1])= 4592936128
y=x -> [[1, 2, 3], [4, 5, 6, 10]] id(y[1])= 4592936128
x.copy() -> [[1, 2, 3], [4, 5, 6, 10]] id(z[1])= 4592936128
copy.copy(x) -> [[1, 2, 3], [4, 5, 6, 10]] id(a[1])= 4592936128
copy.deepcopy(x) -> [[1, 2, 3], [4, 5, 6]] id(b[1])= 4592215488


## keyword
https://docs.python.org/ja/3/library/keyword.html?highlight=keyword#module-keyword

### .iskeyword
keyword.iskeyword(s)  
https://docs.python.org/ja/3/library/keyword.html?highlight=iskey#keyword.iskeyword  

* 与えられた文字列がPythonのキーワードの場合、Trueを返す

In [None]:
import keyword

print(keyword.iskeyword('for'))
print(keyword.iskeyword('while'))
print(keyword.iskeyword('if'))
print(keyword.iskeyword('break'))

print(keyword.iskeyword('list'))
print(keyword.iskeyword('football'))

True
True
True
True
False
False


## csv
https://docs.python.org/ja/3/library/csv.html?highlight=csv#module-csv

### .reader
csv.reader(csvfile, dialect='excel', **fmtparams)  
https://docs.python.org/ja/3/library/csv.html?highlight=reader#csv.reader

* 与えられたcsvfile内の行を反復処理するようなreaderオブジェクトを返す
* イテレータ(iterator)プロトコルに対応したオブジェクトなのでfor文やnextで行データを取得することが可能
* 行データはリストなのでインデックスでアクセスできる


In [None]:
import csv

with open('data/access.csv', newline='') as csvfile:
  reader = csv.reader(csvfile,delimiter=',',quotechar='"')

  for row in reader:
    print(row[0])

cost
173
191
134
100
117
112
35
87
203
50
26
163
270
160
160
60
199
237
215
145


### .DictReader
class csv.DictReader(f, fieldnames=None, restkey=None, restval=None, dialect='excel', *args, **kwds)  
https://docs.python.org/ja/3/library/csv.html?highlight=dictreader#csv.DictReader  

* イテレータ(iterator)プロトコルに対応したオブジェクトで返却される
* 行データが辞書型で表現されているため、カラム名を指定して取得することができる
* カラム名は自動的に一行目が読み込まれる


In [None]:
import csv

with open('data/access.csv', newline='') as csvfile:
  reader = csv.DictReader(csvfile)
  for row in reader:
    print(row)

{'cost': '173', 'sales': '1497'}
{'cost': '191', 'sales': '1488'}
{'cost': '134', 'sales': '1176'}
{'cost': '100', 'sales': '1002'}
{'cost': '117', 'sales': '1155'}
{'cost': '112', 'sales': '1161'}
{'cost': '35', 'sales': '933'}
{'cost': '87', 'sales': '930'}
{'cost': '203', 'sales': '1554'}
{'cost': '50', 'sales': '978'}
{'cost': '26', 'sales': '999'}
{'cost': '163', 'sales': '1278'}
{'cost': '270', 'sales': '1971'}
{'cost': '160', 'sales': '1203'}
{'cost': '160', 'sales': '1284'}
{'cost': '60', 'sales': '960'}
{'cost': '199', 'sales': '1569'}
{'cost': '237', 'sales': '1779'}
{'cost': '215', 'sales': '1614'}
{'cost': '145', 'sales': '1230'}


## math
https://docs.python.org/ja/3/library/math.html

### .pow
math.pow(x, y)  
https://docs.python.org/ja/3/library/math.html?highlight=pow#math.pow  

* x の y 乗を返します。

In [1]:
#Python の pow と math の pow はどう違うか？
a = pow(-2, 0.5)
print(a)  # (8.659560562354934e-17+1.4142135623730951j)
b=(-2)**0.5
print(b)
c = math.pow(-2, 0.5)
print(c)  # ValueError: math domain error

'''
0.5 乗の定義域は 0 以上の実数なので、pow(-2, 0.5) はそもそも実数の関数として定義できない(虚数になる)
よってエラーの出ているmathが正しい
'''

(8.659560562354934e-17+1.4142135623730951j)
(8.659560562354934e-17+1.4142135623730951j)


NameError: name 'math' is not defined

## random
https://docs.python.org/ja/3/library/random.html?highlight=random#module-random

### .randint
random.randint(a, b)  
https://docs.python.org/ja/3/library/random.html?highlight=randint#random.randint  

* 与えられた２つの整数の範囲から一つの整数をランダムに発生させる

In [7]:
import random

print(random.randint(0,100))

18


### .shuffle
random.shuffle(x[, random])  
https://docs.python.org/ja/3/library/random.html?highlight=shuffle#random.shuffle  

* 与えられた配列の要素をシャッフルする


In [8]:
a=[1,2,3,4,5]
random.shuffle(a)
print(a)

[3, 2, 1, 4, 5]


### .sample
random.sample(population, k, *, counts=None)  
https://docs.python.org/ja/3/library/random.html?highlight=sample#random.sample  

* 与えられた配列の要素をシャッフルして新しい配列を生成する

In [9]:
a=[1,2,3,4,5]
b=random.sample(a,len(a))
c=random.sample(a,2)
print('a=',a)
print('b=',b)
print('c=',c)

a= [1, 2, 3, 4, 5]
b= [2, 3, 4, 1, 5]
c= [5, 2]


## pickle
https://docs.python.org/ja/3/library/pickle.html?highlight=pickle#module-pickle

### dump
pickle.dump(obj, file, protocol=None, *, fix_imports=True, buffer_callback=None)  
https://docs.python.org/ja/3/library/pickle.html?highlight=dump#pickle.dump  

* オブジェクト（配列、変数など）をひとつのまとまり（ファイル）として保存する

In [4]:
import pickle

a=[111,'abc',{'k1':34}]
with open('data/test.pkl','wb') as f:
  pickle.dump(a,f)

### .load
pickle.load(file, *, fix_imports=True, encoding='ASCII', errors='strict', buffers=None)  
https://docs.python.org/ja/3/library/pickle.html?highlight=load#pickle.load  

* あるオブジェクトの pickle 化表現を、オープンしている ファイルオブジェクト file から読み込み、その中で指定されているオブジェクト階層に再構成して返します。

In [5]:
with open('data/test.pkl','rb') as f:
  a=pickle.load(f)
  print(a)
  print(a[2]['k1'])

[111, 'abc', {'k1': 34}]
34


## statistics
https://docs.python.org/ja/3/library/statistics.html  

数理統計関数

### .mean
statistics.mean(data)  
https://docs.python.org/ja/3/library/statistics.html?highlight=mean#statistics.mean  

* 与えられた配列の平均値を返す

In [15]:
import statistics

a=[1,2,3,4,5,6,7]
print(a)
print(statistics.mean(a))

[1, 2, 3, 4, 5, 6, 7]
4


### .median
statistics.median(data)  
https://docs.python.org/ja/3/library/statistics.html?highlight=median#statistics.median  

* 与えられた配列の中央値を返す

In [17]:
a=[1,2,3,4,5,6,7,8]
print(a)
print(statistics.median(a))

[1, 2, 3, 4, 5, 6, 7, 8]
4.5


### mode
statistics.mode(data)  
https://docs.python.org/ja/3/library/statistics.html?highlight=mode#statistics.mode  

* 与えられた配列の最頻値を返す


In [18]:
import numpy as np

a=np.random.randint(0,10,10)
print(a)
print(statistics.mode(a))

[2 5 0 4 4 0 5 2 9 0]
0


## bisect
https://docs.python.org/ja/3/library/bisect.html  

配列二分法アルゴリズム

### .bisect
bisect.bisect(a, x, lo=0, hi=len(a))  
https://docs.python.org/ja/3/library/bisect.html?highlight=bisect#bisect.bisect  

* a に含まれる x のうち、どのエントリーよりも後ろ(右)にくるような挿入点を返します。

In [24]:
import bisect

a=[1,2,3,3,4,5,5,6]
bisect.bisect(a,4)

5

### .insort
bisect.insort(a, x, lo=0, hi=len(a))  
https://docs.python.org/ja/3/library/bisect.html?highlight=insort#bisect.insort  

* a に含まれる x のうち、どのエントリーよりも後ろに x を挿入します。

In [25]:
a=[1,2,3,3,4,5,5,6]
bisect.insort(a,3)
a

[1, 2, 3, 3, 3, 4, 5, 5, 6]

## datetime

https://docs.python.org/ja/3/library/datetime.html

* 基本的な日付型および時間型

### .datetime
class datetime.datetime(year, month, day, hour=0, minute=0, second=0, microsecond=0, tzinfo=None, *, fold=0)  
https://docs.python.org/ja/3/library/datetime.html?highlight=datetime%20datetime#datetime.datetime  

In [20]:
import datetime
import pandas as pd

date=datetime.datetime(2022,1,20)
print(date)
print(type(date))

pd_date=pd.Timestamp(date)
print(pd_date)
print(type(pd_date))

np_date=pd_date.to_numpy()
print(np_date)
print(type(np_date))
print(np_date.astype('int64'))
print(np_date.astype('int64')/10**9)    # POSIX時刻（UNIX時間）

2022-01-20 00:00:00
<class 'datetime.datetime'>
2022-01-20 00:00:00
<class 'pandas._libs.tslibs.timestamps.Timestamp'>
2022-01-20T00:00:00.000000000
<class 'numpy.datetime64'>
1642636800000000000
1642636800.0


### .now
classmethod datetime.now(tz=None)  
https://docs.python.org/ja/3/library/datetime.html?highlight=now#datetime.datetime.now  

* 現在のローカルな日時を返します。



In [11]:
import datetime
import numpy as np

now=datetime.datetime.now()
print(now)
print(type(now))

2022-01-18 14:51:45.759437
<class 'datetime.datetime'>


## re
https://docs.python.org/ja/3/library/re.html  
* 正規表現操作

### .compile
re.compile(pattern, flags=0)  
https://docs.python.org/ja/3/library/re.html  

* 正規表現パターンを 正規表現オブジェクト にコンパイルし、以下に述べる match() 、 search() その他のメソッドを使ってマッチングに使えるようにします。
* 式の挙動は flags の値を指定することで加減できます。値は以下の変数のうち任意のものを、ビット単位 OR ( | 演算子) で組み合わせたものです。