## 2.1 実行環境構築（テキスト確認 434-598)

## 2.2.2 基本構文

### 条件分岐と繰り返し

In [1]:
for year in [1950, 2000, 2020]:
    if year < 1989:
        print('昭和')
    elif year < 2019:
        print('平成')
    else:
        print('新元号')

昭和
平成
新元号


### 例外処理

In [2]:
# 例外処理はtry exceptで行う
# 例外が発生した場合はexcept節の中が実行される

In [3]:
try:
    1/0
except ZeroDivisionError:
    print('0で割れません')

0で割れません


### 内包表記
  
- リスト内包表記（以下の例）  
- セット内包表記  
- 辞書内包表記

In [4]:
# 繰り返し処理での表記　リスト内にある文字列のリストを生成
names = ['spam', 'ham', 'eggs']
lens=[]
for name in names:
    lens.append(len(name)) # appendで、空になっているlensのリストにnamesの文字数を追加している
lens

[4, 3, 4]

In [5]:
# リスト内包表記
[len(name) for name in names]

[4, 3, 4]

In [6]:
# セット内包表記 {}で定義　文字列の長さのセットを作成
{len(name) for name in names}


{3, 4}

In [7]:
# 辞書内包表記 　　文字列とその長さの辞書を作成
{name: len(name) for name in names} 

{'spam': 4, 'ham': 3, 'eggs': 4}

In [8]:
#　内包表記は条件式やネストでも可能だが、複雑になりすぎる場合はfor文を使う

In [9]:
[x*x for x in range(10) if x % 2 ==0]

[0, 4, 16, 36, 64]

In [10]:
[[(y, x*x) for x in range(10) if x % 3 ==0] for y in range(3)]

[[(0, 0), (0, 9), (0, 36), (0, 81)],
 [(1, 0), (1, 9), (1, 36), (1, 81)],
 [(2, 0), (2, 9), (2, 36), (2, 81)]]

### ジェネレーター式
  
  値を一つずつ返す。リスト式と違って一度に大量のメモリを確保しないため負荷を軽減できる

In [50]:
# 10万までの２乗のリストを生成

I = [x*x for x in range(100000)] 
type(I), len(I) # 型と要素数を確認

(list, 100000)

In [51]:
# ジェネレーター式で定義

g = (x*x for x in range(100000))
type(g) # 型を確認

generator

In [13]:
# 値を順番に取り出せる
next(g), next(g), next(g)

(0, 1, 4)

### ファイル入出力  
  
  open関数を使う　ファイルの閉じ忘れを防ぐためにwith文を使うと良い

In [53]:
with open('sample.txt', 'w', encoding = 'utf-8') as f: # w は書き込みwritingの意味
    f.write ('こんにちは\n')
    f.write('Python\n')

In [54]:
f.closed # ファイルが閉じていることを確認

True

In [55]:
with open('sample.txt', encoding = 'utf-8') as f:
    data = f.read()
data

'こんにちは\nPython\n'

In [56]:
print(data)

こんにちは
Python



### 文字列操作

In [18]:
s1 = 'hello python'
s1.upper(), s1.lower(), s1.title()

('HELLO PYTHON', 'hello python', 'Hello Python')

In [19]:
s1.replace('hello', 'Hi') #文字列の置換

'Hi python'

In [20]:
s2 = '    spam  ham    eggs    '

s2.split() # 文字列を空白文字で分割

['spam', 'ham', 'eggs']

In [21]:
s2.strip()  # 左右の空白文字を削除

'spam  ham    eggs'

In [22]:
s3 = 'sample.jpg'

s3.endswith(('jpg', 'gif', 'png')) # 文字列の末尾をチェック

True

In [23]:
'123456789'.isdigit() # 文字列が数値の文字列かをチェック

True

In [24]:
len(s1) # 文字列の長さを取得 スペース含む　hello python

12

In [25]:
'py' in s1  # 文字列の中に任意の文字列が存在するかをチェック

True

In [26]:
'-'.join(['spam', 'ham', 'eggs'])  # 複数の文字列を - で連結

'spam-ham-eggs'

In [27]:
# formatメソッド：テンプレートの文字列に対して変数の値などを入れてメッセージを生成する時によく使われる

In [28]:
lang, num, name = 'python', 10, 'takanory'

'{}は{}が好きです'.format(name, lang)

'takanoryはpythonが好きです'

In [29]:
'{1}は{0}が好きです'.format(lang, name)  # 引数の順番で指定

'takanoryはpythonが好きです'

In [30]:
'{n}は{num}の{num}乗{l}が好きです'.format(l=lang, n=name, num=num)  # キーワード引数名で指定

'takanoryは10の10乗pythonが好きです'

## 標準ライブラリ

### 正規表現モジュール  
  
  reモジュール

In [57]:
import re

prog = re.compile('[P|[yth|l]|Z]o[pn]e?')  # 正規表現オブジェクトを生成

prog.search('Python') # マッチする場合はmatchオブジェクトを返す

<re.Match object; span=(0, 1), match='P'>

In [32]:
prog.search('Spam') # マッチしない場合はNoneを返す

### loggingモジュール  
  
  バッチ処理などの途中経過を出力する際、printより便利  
  ログレベルを指定して任意のファイルにフォーマットを指定してログが出力できる

In [33]:
import logging

logging.basicConfig(
    filename='example.log',  # 出力ファイルを指定
    level=logging.INFO,      # ログレベルを指定
    format='%(asctime)s:%(levelname)s:%(message)s'
)

In [34]:
# 実際にログを出力　出力されるのは指定されたログレベル（ここではINFO）より重要なもののみ

In [35]:
# デバッグから重要度が低い順に各ログレベルのログを出力

logging.debug('デバッグレベル')

logging.info('INFOレベル')

logging.warning('警告レベル')

logging.error('エラーレベル')

logging.critical('重大なエラー')

In [36]:
# example.logというログファイルが生成され、ファイルの中にINFOレベル以上のログが出力される

### datetimeモジュール  

日付などの処理に使う

In [37]:
from datetime import datetime, date

datetime.now() # 現在日時を取得

datetime.datetime(2020, 7, 24, 11, 51, 34, 172911)

In [38]:
date.today()

datetime.date(2020, 7, 24)

In [39]:
date.today() - date(2008, 12, 3)  # Python 3.0リリースからの日数を計算

datetime.timedelta(days=4251)

In [40]:
datetime.now().isoformat()  # ISO8601形式の文字列を取得

'2020-07-24T11:53:02.720559'

In [41]:
date.today().strftime('%Y年%m月%d日')  # 日付を文字列に変換

'2020年07月24日'

In [42]:
datetime.strptime('2018年7月11日', '%Y年%m月%d日')  # 文字列を日時に変換

datetime.datetime(2018, 7, 11, 0, 0)

### Pickleモジュール  
  
 pythonのオブジェクトを直列化（serialization）？？？してファイルなどで読み書きできるようにする

In [43]:
import pickle

d = {'today': date.today(),  # 辞書データを定義
     'delta': date(2019, 1, 1) - date.today()}

d

{'today': datetime.date(2020, 7, 24), 'delta': datetime.timedelta(days=-570)}

In [44]:
pickle.dumps(d)  # 直列化した情報を確認

b'\x80\x03}q\x00(X\x05\x00\x00\x00todayq\x01cdatetime\ndate\nq\x02C\x04\x07\xe4\x07\x18q\x03\x85q\x04Rq\x05X\x05\x00\x00\x00deltaq\x06cdatetime\ntimedelta\nq\x07J\xc6\xfd\xff\xffK\x00K\x00\x87q\x08Rq\tu.'

In [45]:
with open('date.pkl', 'wb') as f:  # ファイルをバイト書き込みモードで開く
    pickle.dump(d, f)  # Pickle形式のデータを保存
    
with open('date.pkl', 'rb') as f:  # ファイルをバイト読み込みモードで開く
    new_d = pickle.load(f)  # Pickle形式のデータを読み込む
    
new_d # 元のデータ(d)と同じことを確認

{'today': datetime.date(2020, 7, 24), 'delta': datetime.timedelta(days=-570)}

 ### pathlibモジュール  ???
   
   Pythonでファイルのパスを扱う時に便利

In [46]:
from pathlib import Path

p = Path() # Pathオブジェクトを現在のディレクトリで生成

p

PosixPath('.')

In [47]:
for filepath in p.glob('*.txt'):  # .txtファイルを順番に開いて読込む
    with open(filepath, encoding='utf-8') as f:
        data = f.read()

p = Path('/spam')

p / 'ham' / 'eggs.txt' # /演算子でパスを作成

PosixPath('/spam/ham/eggs.txt')

In [48]:
p = Path('date.pkl')

p.exists() # ファイルの存在チェック

True

In [49]:
p.is_dir() # ディレクトリかをチェック

False

* Python 標準ライブラリ https://docs.python.org/ja/3/library/index.html