# Chapter2:Pythonと環境
5/40問(12.5%)

## 2-1:実行環境構築

### Python公式版をインストール
* 公式版からインストーラー拾ってこようね
* OSによってバージョン確認しようね

### venv:Pythonの仮想環境
* venv：Pythonの仮想環境を作成・管理する仕組み
    * プロジェクトごとにパッケージのバージョン管理がかんたんに行える

### pipコマンド
* pip:サードパーティのパッケージをインストールするためのコマンド

### Anaconda
* Pythonのディストリビューション。
* venvと異なる仮想環境作成方法、pipと異なるパッケージ管理システムを採用してる

## 2-2:Pythonの基礎

### Python文法
* 環境構築
    * python 3.6.6
* 文法の考え方
    * Pythonの設計思想：「シンプルで読みやすいコードが書けること」
    * 同じ動作をするプログラム＝似たようなコードとなる
* インデント
    * コードのブロック構造をインデントで表現するよ
* コーディング規約
    * PEP8 - Style Guide for Python Code
    * pycodestyle - PEP8に違反してないかチェックするツール
    * Flake8 - 使ってないモジュールとか変数をチェックするツール

### 基本構文



In [1]:
# 条件分岐と繰り返し
for year in [1950,2000,2020]:
    if year < 1989:
        print('昭和')
    elif year < 2019:
        print('平成')
    else:
        print('令和')

昭和
平成
令和


In [2]:
# 例外処理
try:
    1/0
except ZeroDivisionError:
    print('0で割れません')

0で割れません


In [3]:
# 内包表記（通常の繰り返し処理）
names = ['spam','ham','eggs']
lens = []
for name in names:
    lens.append(len(name))

lens

[4, 3, 4]

In [4]:
# 内包表記（リスト内包表記）
[len(name) for name in names]

[4, 3, 4]

In [5]:
# 内包表記（セット内包表記）
{len(name) for name in names}

{3, 4}

In [6]:
# 内包表記（辞書内包表記）
{name: len(name) for name in names}

{'spam': 4, 'ham': 3, 'eggs': 4}

In [7]:
# 内包表記内に条件式を配置
[x*x for x in range(10) if x % 2 ==0]

[0, 4, 16, 36, 64]

In [8]:
# 内包表記に内包表記をネスト
[[(y,x*x) for x in range(10) if x % 2 == 0] for y in range(3)]

[[(0, 0), (0, 4), (0, 16), (0, 36), (0, 64)],
 [(1, 0), (1, 4), (1, 16), (1, 36), (1, 64)],
 [(2, 0), (2, 4), (2, 16), (2, 36), (2, 64)]]

In [9]:
# リスト内包表記で1~１０万までの２乗のリストを生成
l = [x*x for x in range(100000)]

type(l),len(l)

(list, 100000)

In [10]:
# ジェネレータ式で定義
g = (x*x for x in range(100000))

type(g) #ジェネレータ型にlenは使えない
next(g),next(g),next(g)

(0, 1, 4)

In [11]:
# ファイル入出力：組み込み関数のopen関数を使用。
# ファイルの閉じ忘れを防ぐためにwithを推奨。

with open('sample.txt', 'w', encoding='utf-8') as f:
    f.write('Hello\n')
    f.write('Python\n')
    
f.closed # ファイルが閉じていることを確認

True

In [12]:
with open('sample.txt', encoding='utf-8') as f:
    data = f.read()

data

'Hello\nPython\n'

In [13]:
# 文字列操作
s1 = 'hello python'

s1.upper(), s1.lower(), s1.title() # 全部大文字、全部小文字、頭だけ大文字

('HELLO PYTHON', 'hello python', 'Hello Python')

In [14]:
s1.replace('hello', 'Hi') # 置換

'Hi python'

In [15]:
s2 = '      spam   ham       eggs     '

s2.split() # 文字列を空白部分で分割

['spam', 'ham', 'eggs']

In [16]:
s2.strip() # 左右の空白文字を削除

'spam   ham       eggs'

In [17]:
s3 = 'sample.jpg'

s3.endswith(('jpg','gif','png')) # 文字列の末尾を確認

True

In [18]:
'123456789'.isdigit() # 文字列が数字禍どうかチェック

True

In [19]:
len(s1) # 文字列の長さを取得

12

In [20]:
'py' in s1 # 文字列の中に任意の文字列が存在するかをチェック

True

In [21]:
'-'.join(['spam', 'ham', 'eggs']) # 複数の文字列を連結

'spam-ham-eggs'

In [22]:
# テンプレートの文字列に対して変数の値などを入れるformatメソッド

lang,num,name = 'python', 10, 'takanory'
'{}は{}が好きです'.format(name,lang)

'takanoryはpythonが好きです'

In [23]:
'{1}は{0}が好きです'.format(lang,name)

'takanoryはpythonが好きです'

In [24]:
'{n}は{num}の{num}乗{l}が好きです'.format(l=lang, n=name, num=num)

'takanoryは10の10乗pythonが好きです'

### 標準ライブラリ

In [25]:
# 正規表現モジュール

import re

prog = re.compile('(P(yth|l)|Z)o[pn]e?') # 正規表現オブジェクトを生成
prog.search('Python') # マッチする場合はmatchオブジェクトを返す

<re.Match object; span=(0, 6), match='Python'>

In [26]:
prog.search('Spam') # マッチしない場合はNoneを返す

In [27]:
# loggingモジュール

import logging
logging.basicConfig(
    filename = 'example.log', # 出力ファイルの指定
    level = logging.INFO, # ログレベルを指定
    format = '%(asctime)s:%(levelname)s:%(message)s'
)

In [28]:
logging.debug('デバッグレベル')

In [29]:
logging.info('INFOレベル')

In [30]:
logging.warning('警告レベル')

In [31]:
logging.error('エラーレベル')

In [32]:
logging.critical('重大なエラー')

In [33]:
# datetimeモジュール

from datetime import datetime, date

datetime.now() # 現在日時を取得

datetime.datetime(2020, 10, 11, 16, 4, 47, 986324)

In [34]:
date.today() # 今日の日付を取得

datetime.date(2020, 10, 11)

In [35]:
date.today() - date(2008,12,3) # 日付の差を取得

datetime.timedelta(days=4330)

In [36]:
datetime.now().isoformat() # ISO8601形式の文字列を取得

'2020-10-11T16:04:48.006317'

In [37]:
date.today().strftime('%Y年%m月%d日') # 日付を文字列に変換

'2020年10月11日'

In [38]:
datetime.strptime('2018年7月11日', '%Y年%m月%d日') # 文字列を日付に変換

datetime.datetime(2018, 7, 11, 0, 0)

In [39]:
# pickleモジュール
# Pythonのオブジェクトを直列化。ファイルなどで読み書きできるようにする

import pickle

d = {'today': date.today(),
     'delta': date(2019, 1, 1) - date.today()} # 辞書データを定義

d

{'today': datetime.date(2020, 10, 11), 'delta': datetime.timedelta(days=-649)}

In [40]:
pickle.dumps(d) # 直列化した情報

b'\x80\x03}q\x00(X\x05\x00\x00\x00todayq\x01cdatetime\ndate\nq\x02C\x04\x07\xe4\n\x0bq\x03\x85q\x04Rq\x05X\x05\x00\x00\x00deltaq\x06cdatetime\ntimedelta\nq\x07Jw\xfd\xff\xffK\x00K\x00\x87q\x08Rq\tu.'

In [41]:
with open('date.pkl', 'wb') as f: # ファイルをバイト書き込みモードで開く
    pickle.dump(d, f) # pickle形式のデータを保存
    
with open('date.pkl', 'rb') as f: # ファイルをバイト読み込みモードで開く
    new_d = pickle.load(f) # pickle形式のデータを読み込む
    
new_d # 元のデータ(d)と等しい

{'today': datetime.date(2020, 10, 11), 'delta': datetime.timedelta(days=-649)}

In [42]:
# pathlibモジュール
# ファイルのパスを扱うモジュール

from pathlib import Path

p = Path()

p

PosixPath('.')

In [43]:
for filepath in p.glob('*.txt'): # .txtファイルを順番に開いて読み込む
    with open(filepath, encoding='utf-8') as f:
        data = f.read()

p = Path('/spam')

p / 'ham' / 'eggs.txt' # /演算子でパスを作成

PosixPath('/spam/ham/eggs.txt')

In [44]:
p = Path('date.pkl')

p.exists() # ファイルの存在チェック

True

In [45]:
p.is_dir() # ディレクトリかのチェック

False


## 2-3:Jupyter Notebook

### Jupyter Notebookとは
データ分析、可視化、機械学習などに使われてるツール。

### インストール
pipコマンドでインストールする

### 基本的な使い方
略


In [53]:
# 便利な使い方1:マジックコマンド

%timeit -n 1000 -r 10 [x*x for x in range(10000)]

359 µs ± 4.09 µs per loop (mean ± std. dev. of 10 runs, 1000 loops each)


In [54]:
%%timeit -n 1000 -r 10

ret = []
for x in range(10000):
    ret.append(x*x)

579 µs ± 2.07 µs per loop (mean ± std. dev. of 10 runs, 1000 loops each)


In [55]:
# 便利な使い方2：シェルコマンド
!pip list

Package                            Version
---------------------------------- -------------------
alabaster                          0.7.12
anaconda-client                    1.7.2
anaconda-navigator                 1.9.12
anaconda-project                   0.8.3
argh                               0.26.2
asn1crypto                         1.3.0
astroid                            2.3.3
astropy                            4.0
atomicwrites                       1.3.0
attrs                              19.3.0
autopep8                           1.4.4
Babel                              2.8.0
backcall                           0.1.0
backports.functools-lru-cache      1.6.1
backports.shutil-get-terminal-size 1.0.0
backports.tempfile                 1.0
backports.weakref                  1.0.post1
beautifulsoup4                     4.8.2
bitarray                           1.2.1
bkcharts                           0.2
bleach                             3.1.0
bokeh                              1.4.

### 第4章以降で使用する環境の準備

省略