# 12.2  Pythonコードを見つけてこよう

Pythonの標準ライブラリは、範囲が広く、内容的に深く、基本的に明確に書かれている  
まずここで探す 

次に行く場所は、PyPI(Python Package Index)で探す  
コンスタントPythonパッケージが集まっており、直接サーチすることもできる

人気の高いリポジトリとしてはGitHubもある  
他にもPopular Python recipesには短いPythonプログラムが集められている

# 12.3  パッケージのインストール

- 可能ならpipを使う
- オペレーティングシステムのパッケージマネージャを使えることがある
- ソースからインストールする

## 12.3.1  pipの使い方

pipの最も簡単な使い方は最新バージョンをインストールすることで`pip install モジュール名`でできる  
インストールすると、ダウンロードしてsetup.pyを実行してディスクにファイルをインストールして、その他細かいことをしたと表示される

pipに特定のバージョンを指定することもでき`pip install モジュール名==バージョン`できる

最低限必要なバージョンを指定することもできる`pip install 'モジュール名>=バージョン'`  
クォートで囲んでいる点に注意

## 12.3.3  ソースからのインストール

Pythonができたばかりで、作者がpipでインストールできるようにしていないということが時々ある  
その場合パッケージを構築するには以下のようにする  
1. コードをダウンロードする  
2. アーカイブ化されていたり圧縮されていたりする場合は、zip、tarなどの適切なツールを使ってファイルを抽出する  
3. setup.pyファイルが格納されているディレクトリで、python install setup.pyを実行する

# 12.4  IDE(統合開発環境)

IDEとは、テキストエディタ、デバッガ、ライブラリ検索などのツールを使えるようになっているGUIのこと

## 12.4.1  IDLE

IDLEは標準ディストリビューションに含まれている唯一のPython IDEである

## 12.4.2  PyCharm

PyCharmは、多機能なグラフィックIDEで、コミュニティエディションは無料で使える

## 12.4.3  IPython

機能豊かなIDE  
改良された対話型インタープリタで、ウェブベースのノートブックにコード、グラフ、テキスト、その他を埋め込んで公開できる  
anacondaによって自動的にインストールされる

# 12.5  名前とドキュメント

デベロッパーは自分が書いたものを忘れるもので、コードのドキュメントが役立つのはそのためだ  
ドキュメントにはコメントと、docstringが含まれるが、変数、関数、モジュール、クラスにもわかりやすい名前をつけることも含まれる  
以下は例で改良しなければいけない点がいくつかある

In [1]:
def froc(f_temp):
    "華氏の温度<f_temp>を摂氏に変換して返す"
    f_boil_temp = 212.0
    f_freeze_temp = 32.0
    c_boil_temp = 100.0
    c_freeze_temp = 0.0
    f_range = f_boil_temp - f_freeze_temp
    c_range = c_boil_temp - c_freeze_temp
    f_c_ratio = c_range / f_range
    c_temp = (f_temp - f_freeze_temp) * f_c_ratio + c_freeze_temp
    return c_temp

Pythonに定数はないが、定数と考えるべき変数に名前を付けるときは、大文字とアンダースコアを使うことを推奨している  
定数値に基づいた計算を行っているが定数値の部分はトップレベルの関数外に移動させると、関数を呼び出したときの処理速度が上がる

In [2]:
F_BOIL_TEMP = 212.0
F_FREEZE_TEMP = 32.0
C_BOIL_TEMP = 100.0
C_FREEZE_TEMP = 0.0
F_RANGE = F_BOIL_TEMP - F_FREEZE_TEMP
C_RANGE = C_BOIL_TEMP - C_FREEZE_TEMP
F_C_RATIO = C_RANGE/ F_RANGE

def ftoc(f_temp):
    "華氏の温度<f_temp>を摂氏に変換して返す"
    c_temp = (f_temp - F_FREEZE_TEMP) * F_C_RATIO + C_FREEZE_TEMP
    return c_temp

# 12.6  コードのテスト

Pythonプログラムのテストで最も単純なのはprint関数の追加だ  
しかし、本番コードでprintを使うのは避けたほうが良い

## 12.6.1  pylint, pyflakes, pep8によるチェック

In [None]:
# python3 - pyworks\style1.py
a = 1
b = 2
print(a)
print(b)
print(c)

上のコードを `$ pylint style1.py` で実行すると  
`************* Module style1  
 style1.py:8:0: C0304: Final newline missing (missing-final-newline)  
 style1.py:1:0: C0114: Missing module docstring (missing-module-docstring)  
 style1.py:4:0: C0103: Constant name "a" doesn't conform to UPPER_CASE naming style (invalid-name)  
 style1.py:5:0: C0103: Constant name "b" doesn't conform to UPPER_CASE naming style (invalid-name)  
 style1.py:8:6: E0602: Undefined variable 'c' (undefined-variable)  
 \-------------------------------------------------------------------  
 Your code has been rated at -8.00/10 (previous run: 0.00/10, -8.00)`  
と悪いところと、最後に10点満点のうち何点かを教えてくれる  
Eがエラーを表す

In [None]:
# python3 - pyworks\style2.py
"ここにモジュールのdocstringを書く"

def func():
    "ここに関数のdocstringを書く"
    first = 1
    second = 2
    third = 3
    print(first)
    print(second)
    print(third)

func()

これをpylintで実行すると  
`--------------------------------------------------------------------  
 Your code has been rated at 10.00/10 (previous run: 10.00/10, +0.00)`  
と全て改善してあると10点で返してくれる

`$ pep8 style3.py` で実行すると  
`style2.py:6:1: E302 expected 2 blank lines, found 1`  
と返ってきて  
関数のdocstringの後ろに空行を入れたほうが良いと教えてくれる

## 12.6.2  unittestによるテスト

コードをソース管理システム(Git)にコミットする前に、独立のテストプログラムを書いてテストに合格することを確認する作業はよいことだ  
早い段階で問題を見つけるためにテストは本当に役立つ  
よく書けているPythonパッケージを見れば、必ずテスト用のコードが含まれている  

標準ライブラリには、二つのテストパッケージが含まれている  
unittestはその一つになる

In [10]:
# python3 - pyworks\cap.py
def just_do_it(text):
    # "<text>に含まれるすべての単語をタイトルケースに"
    return text.capitalize()

テストの基本は、特定の入力からどのような結果を求めているかを決め、テスト対象の関数に入力を与え、期待通りの結果が返されたかをチェックする  
期待された結果はアサーションと呼ばれる  
unittestでは、assertで始まる名前を持つメソッドで結果をチェックする

In [None]:
# python3 - pyworks\test_cap.py
import unittest, cap
class TestCap(unittest.TestCase):
    def setUp(self):
        pass
    def tearDown(self):
        pass
    def test_one_word(self):
        text = "duck"
        result = cap.just_do_it(text)
        self.assertEqual(result, "Duck")
    def test_multiple_words(self):
        text = "a veritable flock of ducks"
        result = cap.just_do_it(text)
        self.assertEqual(result, "A Veritable Flock Of Ducks")
        
if __name__ == "__main__":
    unittest.main()

これを`$ python test_cap.py`で実行すると  
F.  
\======================================================================  
FAIL: test_multiple_words (__main__.TestCap)  
\----------------------------------------------------------------------  
Traceback (most recent call last):  
  File "test_cap.py", line 22, in test_multiple_words  
    self.assertEqual(result, "A Veritable Flock Of Ducks")  
AssertionError: 'A veritable flock of ducks' != 'A Veritable Flock Of Ducks'  
\- A veritable flock of ducks  
?   ^         ^     ^  ^  
\+ A Veritable Flock Of Ducks  
?   ^         ^     ^  ^  


----------------------------------------------------------------------  
Ran 2 tests in 0.001s  

FAILED (failures=1)

と返ってきて期待された結果と異なるところを教えてくれる

内容としては、テスト用のクラスにunittestモジュールの TestCase クラスを継承した子クラスを作る  
unittestのTestCaseクラスの setUp メソッドと tearDown メソッドはテストメソッドの前後でそれぞれ呼び出されるメソッドで、テストが必要とする外部リソースを確保、開放することで、この場合自己完結しているのでpassして定義をしていない  
次にテスト用の関数を定義する  
関数内で関数を実行し、unittest.TestCase の assertEqual 関数に実行結果と期待される値を渡すことで、チェックする内容を決めることができる  
最後にunittestモジュールの main 関数を呼び出すことでチェックを開始できる

In [12]:
# python3 - pyworks\cap.py
def just_do_it(text):
    "Capitalize all words in <text>"
    return text.title()

cap.pyの内容を変更して修正して、もう一度`$ python test_cap.py`を実行すると  
..  
\----------------------------------------------------------------------  
Ran 2 tests in 0.001s  

OK`  
と問題が期待通りの値が得られたことがわかる

しかし、次のメソッドをtest_cap.pyに追加してみると

In [13]:
    def test_words_with_apostrophes(self):
        text = "I'm fresh out of ideas"
        result = cap.just_do_it(text)
        self.assertEqual(result, "I'm Fresh Out Of Ideas")

再び`$ python test_cap.py`を実行すると  
..F  
\======================================================================  
FAIL: test_words_with_apostrophes (__main__.TestCap)  
\----------------------------------------------------------------------  
Traceback (most recent call last):  
  File "test_cap.py", line 27, in test_words_with_apostrophes  
    self.assertEqual(result, "I'm Fresh Out Of Ideas")  
AssertionError: "I'M Fresh Out Of Ideas" != "I'm Fresh Out Of Ideas"  
- I'M Fresh Out Of Ideas  
?   ^  
+ I'm Fresh Out Of Ideas  
?   ^  


\----------------------------------------------------------------------
Ran 3 tests in 0.001s  
  
FAILED (failures=1)  
と表示され、期待された値と違ったことを教えてくれる

In [14]:
# python3 - pyworks\cap.py
def just_do_it(text):
    "Capitalize all words in <text>"
    from string import capwords
    return capwords(text)

上のようにcap.pyを変更してもう一度`$ python test_cap.py`を実行すると、期待通りの値が得られたことがわかる

unittestは、小規模ながら強力なアサーションセットを提供しており、値をチェックしたり、望んだどおりのクラスをを手に入れているかどうかを確認したり、エラーが生成されたかどうかを判定したりすることができる

## 12.6.3  doctestによるテスト

標準ライブラリに含まれるもう一つのテストパッケージはdoctestになる  
このパッケージを使えば、docstringの中にテストを書き、ドキュメントとして使うこともできる

In [15]:
# python3 - pyworks\cap2.py
def just_do_it(text):
    """
    >>> just_do_it("duck")
    'Duck'
    >>> just_do_it("a veritable flock of ducks")
    'A Veritable Flock Of Ducks'
    >>> just_do_it("I'm fresh out of ideas")
    "I'm Fresh Out Of Ideas"
    """
    from string import capwords
    return capwords(text)

if __name__ == "__main__":
    import doctest
    doctest.testmod()

上のコードを`$ python cap2.py`と実行して、すべてのテスト結果が問題なければ何も表示されない  
もし何が起きたかも知りたい場合は`$ python3 cap2.py -v`とすると  
`Trying:  
     just_do_it("duck")  
 Expecting:  
     'Duck'  
 ok  
 Trying:  
     just_do_it("a veritable flock of ducks")  
 Expecting:  
     'A Veritable Flock Of Ducks'  
 ok  
 Trying:  
     just_do_it("I'm fresh out of ideas")  
 Expecting:  
     "I'm Fresh Out Of Ideas"  
 ok  
 1 items had no tests:  
     __main__  
 1 items passed all tests:  
    3 tests in __main__.just_do_it  
 3 tests in 2 items.  
 3 passed and 0 failed.  
 Test passed.`  
 と実行内容も表示してくれる

## 12.6.4  noseによるテスト

unittestとは異なり、テストメソッドを含むクラスを作る必要はない  
名前の中にtestが含まれている関数が実行される

In [None]:
# python3 - pyworks\test_cap_nose.py
import cap
from nose.tools import eq_
def test_one_word():
    text = "duck"
    result = cap.just_do_it(text)
    eq_(result, "Duck")
def test_multiple_words():
    text = "a varitable flock of ducks"
    result = cap.just_do_it(text)
    eq_(result, "A Varitable Flock Of Ducks")
def test_words_with_apostrophes():
    text = "I'm fresh out of ideas"
    result = cap.just_do_it(text)
    eq_(result, "I'm Fresh Out Of Ideas")
def test_words_with_quotes():
    text = "\"You're despicable,\" said Daffy Duck"
    result = cap.just_do_it(text)
    eq_(result, "\"You're Despicable,\" Said Daffy Duck")

コマンドプロンプトで `$ nosetests test_cap_nose.py`を実行すると  
...F  
\======================================================================  
FAIL: test_cap_nose.test_words_with_quotes  
\----------------------------------------------------------------------  
Traceback (most recent call last):  
  File "C:\Users\kumak\anaconda3\lib\site-packages\nose\case.py", line 197, in runTest  
    self.test(*self.arg)  
  File "C:\Users\kumak\pyworks\test_cap_nose.py", line 25, in test_words_with_quotes  
    eq_(result, "\"You're Despicable,\" Said Daffy Duck")  
AssertionError: '"you\'re Despicable," Said Daffy Duck' != '"You\'re Despicable," Said Daffy Duck'  
  
\----------------------------------------------------------------------  
Ran 4 tests in 0.000s  
  
FAILED (failures=1)  
と表示されて、ひとつの関数で期待の結果が得られなかったことがわかる  
noseパッケージのtoolsモジュールのeq_関数に結果の値と、期待の値を入れることでチェックできる

## 12.6.6  継続的インテグレーション

新しいコードがチェックインされるたびに全てのコードに対してテストを実行するようにソース管理システムを自動化することができる  
- buldbot  
このソース管理システムは、Pythonで書かれており、ビルド、テスト、リリースを自動化する  
- jenkins  
Javaで書かれていて、CIツールとしてよいとされているもの  
- travis-ci  
GitHubをホストとするプロジェクトを自動化する

# 12.7  Pythonコードのデバッグ

Pythonでデバッグするときに最も単純なのは、文字列を表示してみることだ  
表示に役立つものとしてvars関数がある  

In [1]:
def func(*args, **kwargs):
    print(vars())

In [2]:
func(1,2,3)

{'args': (1, 2, 3), 'kwargs': {}}


In [3]:
func(["a","b","argh"])

{'args': (['a', 'b', 'argh'],), 'kwargs': {}}


In [5]:
func(a=1,b=2)

{'args': (), 'kwargs': {'a': 1, 'b': 2}}


vars関数は関数への引数を含むローカル変数の値を抽出する

デコレータは、関数自体のコードを変更せずに関数呼び出しの前後にコードを呼び出すことができる  
これを利用して関数呼び出し時の入出力引数の値を表示できる

In [16]:
def dump(func):
    "入力引数と出力値を表示する"
    def wrapped(*args, **kwargs):
        print(f"Function name: {func.__name__}")
        print(f"Input arguments: {' '.join(map(str, args))}")
        print(f"Input keyword arguments: {kwargs.items()}")
        output = func(*args,**kwargs)
        print(f"Output: {output}")
        return output
    return wrapped

In [19]:
@dump
def double(*args, **kwargs):
    "Double every argument"
    output_list = [2 * arg for arg in args]
    output_dict = {k:2*v for k,v in kwargs.items()}
    return output_list, output_dict

In [20]:
double(3,5,first=100,next=98.6,last=-40)

Function name: double
Input arguments: 3 5
Input keyword arguments: dict_items([('first', 100), ('next', 98.6), ('last', -40)])
Output: ([6, 10], {'first': 200, 'next': 197.2, 'last': -80})


([6, 10], {'first': 200, 'next': 197.2, 'last': -80})

# 12.8  pdbによるデバッグ

In [1]:
import csv

In [None]:
city_list =[["France","Paris"],["venuzuela","caracas"],["LithuniA","vilnius"],["quit",""]]

In [4]:
with open(r".\pydata\cities1.csv", "w",newline="") as f:
    writer = csv.writer(f)
    for city in city_list:
        writer.writerow(city)

pdbはPython標準のデバッガで以下に使い方を説明する

In [5]:
# python3 - pyworks\capitals.py
def process_cities(filename):
    with open(filename, "r") as file:
        for line in file:
            line = line.strip()
            if "quit" in line.lower():
                return
            country, city = line.split(",")
            city = city.strip()
            country = country.strip()
            print(city.title(), country.title(), sep=",")
            
process_cities(input())

C:\Users\kumak\pydata\cities1.csv
Paris,France
Caracas,Venuzuela
Vilnius,Lithunia


上のコードはCSVファイルの国名と首都を取り出し、頭文字を大文字、ほかを小文字にして、もしquitが文字列に入っていたら終了するようにしている

上のようにすれば問題なく動作している

In [6]:
city_list = [["argentina","buenos aires"],["bolivia", "la paz"],["brazil","brasilia"],["chile","santiago"],["clombia","Bogota"],
             ["ecuador","quito"],["falkland islands","stanley"],["french guiana","cayenne"],["guyana","georgetown"],
             ["paraguay","Asuncion"],["peru","lima"],["suriname","paramaribo"],["uruguay","montevideo"],["venezuela","caracas"],["quit",""]]

In [8]:
with open(r".\pydata\cities2.csv","w",newline="") as f:
    writer = csv.writer(f)
    for city in city_list:
        writer.writerow(city)

問題なく動作したので本番として上で作ったCSVファイルを使う

In [9]:
process_cities(input())

C:\Users\kumak\pydata\cities2.csv
Buenos Aires,Argentina
La Paz,Bolivia
Brasilia,Brazil
Santiago,Chile
Bogota,Clombia


なぜか、上の5個を出力して止まってしまった  
これを確かめるためにpdbを使ってみる  
`python -m pdb capitals.py
 Filename`
とオプションで-m pdbを渡して起動してファイルを入力すると  
`> c:\users\kumak\pyworks\capitals.py(1)<module>()  
 -> def process_cities(filename):  
 (Pdb)`  
と対話形式のような形になる  
c(continue、継続)のコマンドを入力すると  
`(Pdb) c  
 Buenos Aires,Argentina  
 La Paz,Bolivia  
 Brasilia,Brazil  
 Santiago,Chile  
 Bogota,Clombia  
 The program finished and will be restarted`  
`> c:\users\kumak\pyworks\capitals.py(1)<module>()  
 -> def process_cities(filename):`  
とシステムが正常に、もしくはエラーが起こるまで動く  
s(step、ステップ)と入力すると  
`(Pdb) s`  
`> c:\users\kumak\pyworks\capitals.py(12)<module>()  
 -> if __name__ == "__main__":  
 (Pdb) s`  
`> c:\users\kumak\pyworks\capitals.py(13)<module>()  
 -> import sys  
 (Pdb) s`  
`> c:\users\kumak\pyworks\capitals.py(14)<module>()  
 -> process_cities(sys.argv[1])  
 (Pdb) s  
 --Call--`  
`> c:\users\kumak\pyworks\capitals.py(1)process_cities()  
 -> def process_cities(filename):  
 (Pdb) s`  
`> c:\users\kumak\pyworks\capitals.py(2)process_cities()  
 -> with open(filename, "r") as file:`  
と呼び出すたびに1行ずつ順番に実行していく  
ちなみにn(next)を入力すると関数には入らずに関数のところはスキップする  
lを入力すると  
`(Pdb) l  
 1     def process_cities(filename):  
 2  ->     with open(filename, "r") as file:  
 3             for line in file:  
 4                 line = line.strip()  
 5                 if "quit" in line.lower():  
 6                     return  
 7                 country, city = line.split(",")  
 8                 city = city.strip()  
 9                 country = country.strip()  
10                 print(city.title(), country.title(), sep=",")`  
プログラムの数行先を見ることができる  
矢印は現在の位置を表す  
bを入力するとブレークポイントを行に指定することができ、ブレークポイントの行で実行を停止させることができる  
6行目にブレークポイントを設定するときは`b 6`と入力する  
`(Pdb) b 6  
Breakpoint 1 at c:\users\kumak\pyworks\capitals.py:6`  
そして、ブレークポイントまで実行させる  
`(Pdb) c  
Buenos Aires,Argentina  
La Paz,Bolivia  
Brasilia,Brazil  
Santiago,Chile  
Bogota,Clombia`  
`> c:\users\kumak\pyworks\capitals.py(6)process_cities()  
-> return`  
この第6行で処理が終了しているので、その時のlineの値を調べたい、そのときは`p line`と入力することでその値を調べることができる  
`(Pdb) p line  
'ecuador,quito'`  
quitが入っていることで終了していることがわかる  
この時点でまだ仕事が残っている場合はbコマンドのみを入力することですべてのブレークポイントを見ることができる  
`(Pdb) b  
Num Type         Disp Enb   Where  
1   breakpoint   keep yes   at c:\users\kumak\pyworks\capitals.py:6  
        breakpoint already hit 1 time`  
lと行数を渡すことでその行からプログラムのコードを見ることができる  
`(Pdb) l 1  
  1     def process_cities(filename):  
  2         with open(filename, "r") as file:  
  3             for line in file:  
  4                 line = line.strip()  
  5                 if "quit" in line.lower():  
  6 B->                 return  
  7                 country, city = line.split(",")  
  8                 city = city.strip()  
  9                 country = country.strip()  
 10                 print(city.title(), country.title(), sep=",")`  
矢印が現在位置、Bがブレークポイントを表す  

In [13]:
# python3 - pyworks\capitals.py
def process_cities(filename):
    with open(filename, "r") as file:
        for line in file:
            line = line.strip()
            if "quit" == line.lower():
                return
            country, city = line.split(",")
            city = city.strip()
            country = country.strip()
            print(city.title(), country.title(), sep=",")
            
process_cities(input())

C:\Users\kumak\pydata\cities2.csv
Buenos Aires,Argentina
La Paz,Bolivia
Brasilia,Brazil
Santiago,Chile
Bogota,Clombia
Quito,Ecuador
Stanley,Falkland Islands
Cayenne,French Guiana
Georgetown,Guyana
Asuncion,Paraguay
Lima,Peru
Paramaribo,Suriname
Montevideo,Uruguay
Caracas,Venezuela
,Quit


修正するとうまく動作した

# 12.9  エラーメッセージのロギング

ログとはメッセージを蓄積するシステムファイルのことで、タイムスタンプやプログラムを実行しているユーザーの名前など役に立つ情報が書かれていることが多い  
ログは毎日ローテーション(名前変更)され、、圧縮されることが多い  
そうすることにより、ログがディスクを埋め尽くして障害の原因にならないようにしている  
プロがラムでどこかが問題を起こしたときに、適切なログファイルを見れば何が起きたかがわかる  
ロギングのPython標準ライブラリは logging で、次のようなコンセプトから構成されている  
- ログに保存したいメッセージ  
- ランク付けのための優先順位レベルとそれに対応する関数  
- モジュールとの主要な通信経路となるひとつの以上のロガーオブジェクト  
- メッセージを端末、ファイル、データベース、その他の場所に送るハンドラ  
- 出力を作成するフォーマッタ  
- 入力に基づいて判断を下すフィルタ

In [4]:
import logging
logging.debug("Looks like rain")
logging.info("And hail")
logging.warning("Did I hear thunder?")
logging.error("Was that lightning?")
logging.critical("Stop fencing and get inside!")

ERROR:root:Was that lightning?
CRITICAL:root:Stop fencing and get inside!


上のloggingモジュールの debug info warning error critical の関数がログを出力する関数で右に行くほどログレベルが上がっていく  
デフォルトではwarningから高いレベルのログが出力される  

In [5]:
import logging
logging.basicConfig(level=logging.DEBUG)
logging.debug("Looks like rain")
logging.info("And hail")

loggingモジュールの basicConfig を使うことでいろいろと設定をできる  
上ではキーワード引数の level にlogging.DEBUGを渡すことでdebugレベル以上(全てのレベル)を出力するようにしている  

In [6]:
import logging
logging.basicConfig(level=logging.DEBUG)
logger = logging.getLogger("bunyan")
logger.debug("Timber")

ログはロガーをオブジェクトを使っても作成することができる  
ロガーオブジェクトを使うと名前を付けることができる  
ロガーオブジェクトは getLogger 関数に付けたい名前を渡すことでできる  

In [7]:
import logging
logging.basicConfig(level=logging.DEBUG, filename=r".\pydata\blue_ox.log")
logger = logging.getLogger("bunyan")
logger.debug("Where's my axe?")
logger.warning("I need my axe")



ハンドラを使うことでメッセージを別の場所に送ることができる  
上では、basicConfig 関数にキーワード引数のfilenameにファイル名を渡すことでFileHandlerが作られ、ロガーが使えるようになる  
ファイルだけではなく、メールやウェブサーバーなどにもハンドラの種類を使い分けることで送ることができる  

In [3]:
import logging
fmt = "%(asctime)s %(levelname)s %(lineno)s %(message)s"
logging.basicConfig(level=logging.DEBUG, format=fmt)
logger = logging.getLogger("bunyan")
logger.error("Where's my other plaid shirt?")

2020-07-19 00:09:14,332 ERROR 5 Where's my other plaid shirt?


ログの書式は好きなように変更することができる  
basicConfig関数でキーワード引数のformatに特定の書式を使った文字列を渡すことでできる  
文字列の中で特殊な変数を`%(変数名)s`のような形で入れることでいろいろな情報を出力することができ  
上の例ではasctime(ISO8601 文字列形式の日時)、levelname、lineno(行番号)、messageを出力している

# 12.10  コードの最適化

## 12.10.1  実行時間の計測

In [8]:
from time import time

In [9]:
t1 = time()
num = 5
num *= 2
print(time() - t1)

0.0


上のようにすれば実行してから結果を出すまでにかかった時間を計測することができる

In [10]:
from timeit import timeit

In [11]:
print(timeit("num = 5; num *= 2", number=1))

1.3999999737279722e-06


標準ライブラリの timeit モジュールの timeit 関数を使うことで処理にかかった時間を簡単に計算することができる  
処理内容は第一引数に文字列をして渡さなければならない  
キーワード引数の number に数字を渡すことで実行回数を指定することができる(デフォルトだと100万)  

In [12]:
from timeit import repeat

In [13]:
print(repeat("num = 5; num *= 2", number=1, repeat=3))

[4.999999418942025e-07, 1.0000007932831068e-07, 1.999999312829459e-07]


timeitモジュールの repeat 関数を使うことで、処理の計測を複数回できるようになる  
timeit関数と同じように、文字列の処理内容とnumber引数に実行回数を渡し、更にキーワード引数の repeat に計測の回数を渡すことで複数回まとめて計測できる(デフォルトだと5回)

## 12.10.2  アルゴリズムとデータ構造

In [14]:
def make_list_1():
    result=[]
    for value in range(1000):
        result.append(value)
    return result

In [15]:
def make_list_2():
    result = [value for value in range(1000)]
    return result

上の二つは同じ結果が得られる関数だが、どちらのほうが良い関数だろうか  
良いといっても、高速に動くか、わかりやすいか、メモリ消費が少ないかなどいろいろあるが  
今回は処理の速さを比べてみる

In [16]:
print("make_list_1 takes", timeit(make_list_1, number=1000))
print("make_list_2 takes", timeit(make_list_2, number=1000))

make_list_1 takes 0.06960900000012771
make_list_2 takes 0.03129699999999502


結果を見るとリスト内包表記を使った方が2倍近く処理が速いことがわかる  
関数を計測するときはtimeit関数に文字列ではなく、そのまま関数を渡すことでできる

## 12.10.3  Cython、NumPy、Cエクステンション

CythonはPythonとCのハイブリットで、Pythonにパフォーマンスに関連するアノテーション(注釈やタグのようなもの)を付けたものをコンパイルされたCコードに変換する  
このアノテーションはごく小規模なもので、変数、関数の引数、戻り値の型の宣言などである  
このCythonを追加することで処理はかなり高速になる  

NumPyは数学ライブラリで、スピードを確保するためにCで書かれている

Pythonとその標準ライブラリの多くは、スピードを確保するためにCで書かれている

## 12.10.4  PyPy

PyPyは新しいPythonインタープリタで、Javaに使われたトリックを応用している  
開発者のベンチマークテストによると、CPythonよりも高速に動作する

# 12.11  ソース管理

数人のデベロッパーのグループで仕事をする場合にソース管理は必須になる

## 12.11.1  Mercurial

MercurialはPythonで書かれている  
習得はかなり簡単で、Mercurialリポジトリからコードのダウンロード、ファイルの追加、変更のチェックイン、異なるソースからの変更のマージのための少数のサブコマンドを覚えればよい

## 12.11.2  Git

Gitの最大のホストはGitHubで、他にも多くのサイトがある  

gitがインストールされているマシンで`git clone https://github.com/madscheme/introducing-python`と入力することで入門Pythonのサンプルコードをダウンロードすることができる  
他にもGitHubのWebページで「Download ZIP」をクリックすることでもできる  

In [17]:
import os
os.mkdir(r".\pydata\git_dir")

コマンドプロンプトで作成したディレクトリに移動し、`$ cd git_dir`  
`$ git init`と入力することでローカルGitリポジトリを作ることができる  
`Initialized empty Git repository in C:/Users/kumak/git_dir/.git/`  
と返ってきて.gitという隠しファイルが作らていることがわかる

In [None]:
# python3 - pyworks\test.py
print("Oops")

作成したディレクトリに上のPythonファイルを追加する  
`$ git add test.py`と入力することで  
そのファイルをGitリポジトリに追加する  
`$ git status`と入力すると、今の状態を教えてくれる  
`On branch master`  
  
`No commits yet`  
  
`Changes to be committed:  
   (use "git rm --cached <file>..." to unstage)  
         new file:   test.py`  
と返ってきてtest.pyはローカルリポジトリの一部にはなっているが、変更がまだコミットされていないことがわかる

`$ git commit -m "my first commit"`と入力することでコミットできる  
`[master (root-commit) 5d36a49] my first commit
 1 file changed, 1 insertion(+)
 create mode 100644 test.py`
-m "メッセージ" の部分はコミットメッセージで、そのファイルのgit変更履歴の一部になる  
`$ git status`と今の状態を聞いてみると  
`On branch master  
 nothing to commit, working tree clean`  
とコミットされていないファイルがないことを教えてくれる  
つまり、ファイルに変更を加えてもコミットしたときのファイルデータが失われなくなる

In [None]:
# python3 - pyworks\test.py
print("Ops!")

そしてファイルを上のように書き換えて今の状態を聞いてみる  
`$ git status`  
`On branch master  
 Changes not staged for commit:  
   (use "git add <file>..." to update what will be committed)  
   (use "git restore <file>..." to discard changes in working directory)  
         modified:   test.py`  

`no changes added to commit (use "git add" and/or "git commit -a")`  
と返ってきて変更されたファイルがあることを教えてくれる

`$ git diff`  
と入力するとどの行が書き換えられているか教えてくれる  
`diff --git a/test.py b/test.py  
 index 519c2cf..e8ee913 100644  
 --- a/test.py  
 +++ b/test.py  
 @@ -1 +1 @@  
 -print("Oops")  
 \ No newline at end of file  
 +print("Ops!")  
 \ No newline at end of file`  

この変更をコミットするとしても、先にステージング(add)をしなければいけないことは変わらない  
先にコミットしようとしても`$ git commit -m "change the print string"`  
`On branch master  
 Changes not staged for commit:  
   (use "git add <file>..." to update what will be committed)  
   (use "git restore <file>..." to discard changes in working directory)  
         modified:   test.py`  

`no changes added to commit (use "git add" and/or "git commit -a")`  
コミットするために先にステージングしなければいけないことを注意されてしまう

`$ git add test.py`と入力してもよいし、すべての変更ファイルをステージングしたければ`$ git add .`と入力することでできる  
`$ git commit -m "my first change"`  
`[master f89282b] change the print string  
 1 file changed, 1 insertion(+), 1 deletion(-)`  
と変更ファイルをコミットできた  

test.pyに今までどのような変更をしてきたかを知るには、`git log test.py`と入力することで  
`commit f89282b38b6e4f3d57c6915473f6759c3814cbeb (HEAD -> master)  
 Author: kumak127 <kumakiyo127@gmail.com>  
 Date:   Mon Jul 20 00:11:20 2020 +0900`  

`    change the print string`  

`commit 5d36a4901495c61a00ce32feff2ad8ddeff51c1c  
 Author: kumak127 <kumakiyo127@gmail.com>  
 Date:   Sun Jul 19 23:53:00 2020 +0900`  

`    my first commit`  
と返ってきて変更した人や、変更した時間が返ってくる