# 1-1. 数値演算

## 簡単な算術計算

In [2]:
7 ** 2

49

In [3]:
7 // 2

3

In [5]:
7 / 2

3.5

In [7]:
7 % 2

1

## 数学関数(モジュールのインポート)

In [2]:
import math

In [9]:
# べき乗
math.sqrt(2)

1.4142135623730951

In [10]:
math.sin(0)

0.0

In [3]:
# 円周率
math.pi

3.141592653589793

## 黄金比を求める

In [19]:
(math.sqrt(5) + 1) / 2

1.618033988749895

In [21]:
phi

1.618033988749895

# 1-2. 変数と関数の基礎

In [23]:
w = 90
h = 173

In [25]:
# BMI の計算
w / (h/100.0) ** 2

30.071168431955627

## 関数の定義と返値

In [4]:
def bmi(height, weight):
    return weight / (height/100.0) ** 2

# 関数の定義 def 関数名(引数, ...):

**引数** とは、関数が受け取る値を指し示す変数のことです。仮引数ともいう。

**return 式**
return に続く式の評価結果を、関数の呼び出し元に返して関数を終了する。

In [27]:
bmi(173.0, 90.0)

30.071168431955627

**予約語**
- Pythonでの def や return は、関数定義やreturn文の始まりを記述するための特別な記号。それ以外の用途に使用できない。 
- Codeセルの構文ハイライトで（太字緑色などで）強調されるものが予約語だと覚えておけば大体問題ありません。

In [35]:
def ft_to_cm(f, i):
    ...

In [38]:
assert round(ft_to_cm(5, 2) - 157.48, 6) == 0
assert round(ft_to_cm(6, 5) - 195.58, 6) == 0

TypeError: unsupported operand type(s) for -: 'NoneType' and 'float'

In [39]:
def quadratic(a, b, c, x):
    ...

In [40]:
assert quadratic(1, 2, 1, 3) == 16
assert quadratic(1, -5, -2, 7) == 12

AssertionError: 

## ローカル変数

In [5]:
import math

def heron(a, b, c):
    s = 0.5*(a+b+c)  # s がローカル変数。　この関数の中だけで利用可能な変数。
    return math.sqrt(s * (s-a) * (s-b) * (s-c))

In [42]:
heron(3,4,5)

6.0

In [50]:
def heron_a(a,b,c):
    s = 0.5*(a+b+c)
    print('The value of s is', s)
    return math.sqrt(s * (s-a) * (s-b) * (s-c))

In [51]:
heron_a(1,1,1)

The value of s is 1.5


0.4330127018922193

### print

- print は関数内から呼び出すことでローカル変数の値を確認できる
- print は任意個の引数を取得可能。
- コンマ, の区切りには空白文字が出力される。
- 引数を与えずに呼び出した場合には、改行のみを出力する。

In [54]:
def heron(a, b, c):
    s = 0.5*(a+b+c)
    print('The value of s is', s)
    return print(math.sqrt(s * (s-a) * (s-b) * (s-c)))

In [55]:
heron(1,1,1)

The value of s is 1.5
0.4330127018922193


- 関数が値を返すことを期待されている場合は、必ず **return** を使う
- 関数定義にはコメントを付加して、あとから読んでもわかるようにする。 

In [1]:
# heron  の公式により三角形の面積を返す
def heron(a, b, c): # a, b, c は3辺の長さ

    # 辺の合計の半分をsに置く
    s = 0.5*(a+b+c)
    print('The value of s is', s)

    return math.sqrt(s * (s-a) * (s-b) * (s-c))

## グローバル変数
- 関数の中で代入が行われない変数。
- 関数の中から参照することができる。

In [2]:
g = 9.8

In [3]:
def force(m):
    return m*g

In [4]:
force(104)

1019.2

In [5]:
g = g/6

In [6]:
force(104)

169.86666666666667

In [11]:
a = 10 # グローバル変数
def foo():
    return a
def bar():
    a = 3 # bar のローカル変数
    return a

In [8]:
foo()

10

In [9]:
bar()

3

In [10]:
a

10

# 1-3. 論理・比較演算と条件分岐
## if文による条件分岐

In [12]:
def bmax(a,b):
    if a > b:
        return a
    else:
        return b

In [66]:
def absolute(x):
    if x < 0:
        return -x
    else :
        return x

In [68]:
assert absolute(5) == 5
# assert absolute(-5)

In [63]:
# x が正ならば1,負ならば-1, 0ならば0を返す関数sign(x)を定義

def sign(x):
    if x > 0:
        return 1
    elif x < 0:
        return -1
    return 0

In [65]:
assert sign(1)
assert sign(-1)
assert sign(0) == 0


## 真理値を返す関数
 - 真理値: True or False  組み込み定数

In [36]:
x = 3
x > 1

True

In [37]:
x < 1

False

In [38]:
# 真理値を返す関数を定義

def is_even(x):
    return x%2 == 0

In [41]:
is_even(4)

True

In [43]:
# if のあとにも使用可能
def is_odd(x):
    if is_even(x):
        return False
    else:
        return True 

In [44]:
is_odd(2)

False

In [45]:
is_odd(3)

True

## オブジェクト
- python での値(式の評価結果)は全てオブジェクトと総称される。

In [46]:
# None

None

In [47]:
print(None)

None


In [48]:
if None:
    print('ok')
else:
    print('ng')

ng


In [49]:
# return == return None

## 条件として使われる他の値
- 数のうち、0や0.0は偽、その他は真とみなされる。
- 文字列では、空文字列 '' のみ偽、その他は真とみなされる。
- 組み込み定数 None は偽とみなされる。

In [69]:
if 0 :
    print('ok')
else :
    print('ng')

ng


In [51]:
if 1.1:
    print('ok')
else:
    print('ng')

ok


## 再帰
- 定義しようとするもの自身を定義の中で参照すること。
- 再帰による定義を再帰的定義と言う。 例: 漸化式

In [70]:
# 漸化式

def fib(n):
    if n < 2:
        return n
    else:
        return fib(n-1) + fib(n-2)

# 1-4. テストとデバッグ

## 仕様・テスト・デバッグ
### 用語
- 仕様: プログラムを書くときに、実現しようとしている事柄
- テスト: 対象のプログラムが仕様に適合しているかを、実際にプログラムを動作させて検査すること
- テストケース: テストの際に、テスト対象に与える入出力ペアのこと
- バグ: 仕様に反したプログラムの振る舞いの原因
- デバッグ: バグを取り除くこと

プログラミングでは、下記の4つの作業を必要に応じて繰り返す。
- 仕様を分析
- プログラムを書く
- テストする
- デバッグする


## assert 文
- テストとデバッグに有用
- assert の次に書かれた条件式が真であるべきだと仕様を宣言する文。
- 偽だった場合、AssertionError が発生。プログラムがそこで停止。
- テストケースが満たされた(つまりassert文で停止しなかった)からと言って、テスト対象が正しいとは言えないが、仕様への適合度が高いことから妥当だと言える。

In [71]:
def square(x):
    return x*x

x = -2
assert square(x) >= 0

In [72]:
def square(x):
    return x+x # バグ

x = -2
assert square(x) >= 0

AssertionError: 

In [73]:
def square(x):
    return x*x

assert square(2) == 4
assert square(-2) == 4
assert square(0) == 0

## エラーの分類

### 構文エラー(SyntaxError)
プログラムコードが、Python の構文に違反しているときに生じるエラー

Python における構文エラーの典型例として、
- クォートやカッコの閉じ忘れ
- コロンのつけ忘れ
- インデントの崩れ
- 全角スペースの利用
- == の代わりに = を使う
- 変数の代わりに文字列を使う
など...

Python の構文エラーは、実行しようとするプログラムコードの解釈に失敗することでエラーが生じる。
つまり、プログラムを実行できなかったことで生じるエラー。

In [99]:
def m():
　return ("pythonで書いています。")

SyntaxError: invalid non-printable character U+3000 (1394725705.py, line 2)

In [112]:
print("pythonで書いています。")
283866296949

pythonで書いています。


### 実行時エラー(runtime error)
プログラムを実行した際に生じるエラー全般を指す。プログラムを異常停止させるエラー。

Python における実行時エラーが生じる典型的な状況として

- 存在しない名前を利用(変数名・関数名・メソッド名の誤植)
- グローバル変数のつもりでローカル変数を参照
- ゼロによる除算
- 辞書に登録されていないキーに対する値を取得
- 存在しないファイルの読み込み
- assert 文における条件の不成立
など...

送出される例外名(NameError, UnboundLocalError など)が自己説明的です。
また、付随するエラーメッセージも、原因をわかりやすく説明しています。

実行時エラーに直面した際は、
1. 発生した例外名とエラーメッセージをよく読む
2. エラーに関連する言語機能(例えば辞書やファイル)の仕組みを改めて確認。

### 論理エラー(logic error)
プログラムは実行できるが、意図したように動作しないこと。プログラムを書いた人のエラー。

バグの多くは、論理エラーであることが多い。
したがって、デバッグでは下記の2点を行う。
- プログラムを書いた人の意図
- プログラムの振る舞いを比較検証

assert 文は、仕様違反という論理エラーを、
AssertionError という実行時エラーに変換していると見做すことができる。

## デバッグの具体例
次の関数 median(x, y, z) は、 x と y と z の中央値を求めようとするものです。
ただし、x と y と z は相異なる数であると仮定します。

In [78]:
def median(x, y, z):
    if x > y:
        x = y
        y = x
    if z < x:
        return x
    if z < y:
        return z
    return y

In [79]:
assert median(3, 1, 2) == 2

AssertionError: 

In [82]:
def median(x, y, z):
    print(x, y, z)
    if x > y:
        x = y
        y = x
    print(x, y, z)
    if z < x:
        return x
    if z < y:
        return z
    return y

In [83]:
assert median(3, 1, 2) == 2

3 1 2
1 1 2


AssertionError: 

In [86]:
def median(x, y, z):
    print(x, y, z)
    if x > y:
        w = x
        x = y
        y = w
    print(x, y, z)
    if z < x:
        return x
    if z < y:
        return z
    return y

In [87]:
assert median(3, 1, 2) == 2

3 1 2
1 3 2


In [88]:
def median(x, y, z):
    if x > y:
        w = x
        x = y
        y = w
    if z < x:
        return x
    if z < y:
        return z
    return y

In [89]:
assert median(3, 1, 2) == 2

## コーディングスタイル

- バグを生じにくくする予防法の方が、大切
- 可読性の低いコードだと、些細なミスが生じやすく、見つけにくい

Python では PEP8 と呼ばれる公式のスタイルガイドがる。
代表的なものは
- インデントは半角スペースを4つで1レベル
- = += == などの演算子の前後に半角スペースを1つ入れる
-     * と + の複合式では + の前後に半角スペースを1つ入れる (例: 2*x + y)
- 関数の開き括弧の前にスペースを入れない
- l I O を変数名として使わない
- 真理値の比較に == や is を使わない

PEP8に基づいたコーディングスタイルの自動検査器もある (pycodestyle, PEP8online) 

プログラミング一般に重要なこともある。
- 記号的に意味がわかる変数を使う
- 不要なコードは削除する
- 1つの関数では1つのタスクだけ処理する
など

勘違いはバグを引き起こす原因になる。自らが勘違いしないコードを書くことが肝心。

# 2-1. 文字列(string)

- 文字の並びを 'xxx' or "xxx" で囲んで記述
- 複数行の記述は'''xxx''' or """xxx""" ※コメントでも用いる 無難は"""xxx"""
- 文字列は変更不可能なデータ
- 文字列の加工は、新たに別の文字列を作成する

In [2]:
word1 = 'hello'
word1

type(word1)

str

In [9]:
# 数値を文字列に変換する
word3 = str(123)
word3
print(type(word3))

# 文字列を整数に変換する
i = int('123')
i 
print(type(i))

# 文字列を実数に変換する
f = float('123.4')
f
print(type(f))

# 文字列の長さを求める
len(word1)

<class 'str'>
<class 'int'>
<class 'float'>


5

## 文字列とインデックス

In [11]:
# 文字列 'hello' の 3 番目の文字を取得したい
'hello'[2]

word1 = 'hello'
word1 [2]  # [] の数値がインデックス 0, 1, 2, ... とはじまる

# 取得した文字は、長さが 1 の文字列として扱う

'l'

## 文字列とスライス
スライス: 文字列の一部を取得

In [12]:
digitsl = '0123456789'
digitsl[1:4]

'123'

In [13]:
digitsl[0:3]

'012'

In [14]:
digitsl[:3]

'012'

In [15]:
digitsl[3:]

'3456789'

In [16]:
digitsl[3:5]

'34'

In [17]:
digitsl[-4:-1]

'678'

In [18]:
digitsl[3:9:2]

'357'

In [19]:
digitsl[8:4:-1]

'8765'

## 空文字列 
- 文字列の中からある部分文字列を取り除くのに使用

In [None]:
blank = ''

In [20]:
price = '2,980円'
price.replace(',', '')

'2980円'

In [21]:
digits1='0123456789'
print('空文字列1 = ', digits1[4:2])
print('空文字列2 = ', digits1[-1:-4])
print('空文字列3 = ', digits1[3:3])
print('空文字列ではない = ', digits1[3:-1])

空文字列1 =  
空文字列2 =  
空文字列3 =  
空文字列ではない =  345678


## 文字列の検索
文字列A が文字列B を含むかどうかを調べるには、
In 演算子を使う

In [23]:
# 文字列B in 文字列A

'lo' in 'hello'
'z' in 'hello'

False

In [24]:
word1 = 'hello'
substr1 = 'lo'
substr1 in word1

True

In [25]:
substr2 = 'z'
substr2 in word1

False

In [26]:
word1 = 'hello'
substr2 = 'z'
substr2 not in word1

True

## エスケープシーケンス

In [27]:
escaped1 = 'This is \'MINE\''
escaped1

"This is 'MINE'"

In [29]:
doublequated = "This is 'MINE'"
doublequated

"This is 'MINE'"

In [32]:
escaped2 = "時は金なり\n\"Time is money\"\nTime is\\"
print(escaped2)

時は金なり
"Time is money"
Time is\


In [34]:
triple_double_quated = """時は金なり'Time is money'Time is \\"""
print(triple_double_quated)

時は金なり'Time is money'Time is \


## バックスラッシュの表示と入力

## 文字列の連結

In [35]:
word1 = 'hello'
word2 = ' world'
text1 = word1 + word2
text1

'hello world'

In [36]:
word1 = 'hello'
word1 * 3

'hellohellohello'

## 文字列とメソッド

```
文字列.メソッド名(式, ...)
# あるいは
文字列変数.メソッド名(式, ...)
```

### 置換(replace)
```
文字列.repalce(部分文字列A, 文字列B)
```

In [37]:
word1 = 'hello'
word1.replace('l', '123')

'he123123o'

In [38]:
word1

'hello'

### 練習
英語の文章からなる文字列 str_engsentences が引数として与えられたとき、str_engsentences 中に含まれる全ての句読点（., ,, :, ;, !, ?）を削除した文字列を返す関数 remove_punctuations を作成してください。 （練習の解答はこのノートブックの一番最後にあります。）

次のセルの ... のところを書き換えて remove_punctuations(str_engsentences) を作成してください。



In [41]:
def remove_punctuations(str_engsentences):
    return str_engsentences.replace(',', ' ')


In [42]:
print(remove_punctuations('Quiet, uh, donations, you want me to make a donation to the coast guard youth auxiliary?') == 'Quiet uh donations you want me to make a donation to the coast guard youth auxiliary')


False


### 練習
ATGCの4種類の文字から成る文字列 str_atgc が引数として与えられたとき、文字列 str_pair を返す関数 atgc_bppair を作成してください。ただし、str_pair は、str_atgc 中の各文字列に対して、 A を T に、T を A に、G を C に、C を G に置き換えたものです。

次のセルの ... のところを書き換えて atgc_bppair(str_atgc) を作成してください。

## 検索
- 指定した部分文字列B が 文字列A のどこに存在するか調べることができる。
```
文字列A.index(部分文字列B)
```

In [43]:
word1 = 'hello'
word1.index('lo')

3

In [44]:
word1.index('l')

2

In [45]:
word1 = 'hello'
word1.find('a')

-1

## 練習
コロン (:) を1つだけ含む文字列 str1 を引数として与えると、コロンの左右に存在する文字列を入れ替えた文字列を返す関数 swap_colon(str1) を作成してください。

次のセルの ... のところを書き換えて swap_colon(str1) を作成してください

## 数え上げ
指定した部分文字列B が 文字列A にいくつ存在するか調べることができる
```
文字列A.count(部分文字列B)
```

In [46]:
word1 = 'hello'
word1.count('l')

2

In [47]:
'aaaaaa'.count('aa')

3

## 練習
ATGCの4種類の文字から成る文字列 str_atgc と塩基名（A, T, G, C のいずれか）を指定する文字列 str_bpname が引数として与えられたとき、str_atgc 中に含まれる塩基 str_bpname の数を返す関数 atgc_count を作成してください。

次のセルの ... のところを書き換えて atgc_count(str_atgc, str_bpname) を作成してください。

## 大文字・小文字
文字列の中の英文字を小文字に変換したり、大文字に変換したりすることができます。
もとの文字列は変化しない。

In [49]:
upper_dna = 'DNA'
upper_dna.lower() # 全ての文字を小文字にする

'dna'

In [50]:
upper_dna

'DNA'

In [51]:
lower_text = 'hello world!'
lower_text.capitalize() # 先頭文字を大文字にする

'Hello world!'

In [52]:
lower_text

'hello world!'

In [53]:
lower_text.upper() # 全ての文字を大文字にする

'HELLO WORLD!'

In [54]:
lower_text

'hello world!'

## 空白文字の削除
- '', \n, \t, '　'

In [56]:
'　abc\n'.strip()

'abc'

In [57]:
'　abc\n'.lstrip()

'abc\n'

In [58]:
'　abc\n'.rstrip()

'\u3000abc'

## 文字列の比較演算
比較演算子をなどを用いて、2つの文字列を比較する

In [59]:
print('abc' == 'abc')
print('ab' == 'abc')

True
False


In [60]:
print('abc' != 'abc')
print('ab' != 'abc')

False
True


In [61]:
print('abc' <= 'abc')
print('abc' < 'abc')
print('abc' < 'abd')
print('ab' < 'abc')

True
False
True
True


## 初心者によくある誤解 - 変数と文字列の混乱

In [62]:
def func(str1):
    return str1.upper()

In [63]:
str2 = 'abc'
func(str2)

'ABC'

In [64]:
str2 = 'abc'
func('str2')

'STR2'

# 2-2. リスト(list)

In [65]:
numbers = [0, 10, 20, 30, 40, 50]
numbers

[0, 10, 20, 30, 40, 50]

In [66]:
type(numbers)

list

In [67]:
fruits = ['apple', 'banana', 'chelly']
fruits

['apple', 'banana', 'chelly']

In [68]:
numbers_fruits = [10, 'apple', 20, 'banana', 30]
numbers_fruits

[10, 'apple', 20, 'banana', 30]

In [69]:
empty = []
empty

[]

## リストとインデックス
```
リスト[x-1]
```

In [70]:
abcd = ['a', 'b', 'c', 'd']
abcd[2]

'c'

In [71]:
abcd = ['a', 'b', 'c', 'd']
abcd[2] = 'hello'
abcd

['a', 'b', 'hello', 'd']

In [72]:
abcd = ['a', 'b', 'c', 'd']
abcd[1:3]

['b', 'c']

In [73]:
abcd = ['a', 'b', 'c', 'd']
abcd[0:4:2]

['a', 'c']

In [74]:
abcd = ['a', 'b', 'c', 'd']
abcd[1:3] = ['x', 'y', 'z']
abcd

['a', 'x', 'y', 'z', 'd']

## 多重リスト

In [75]:
lns = [[1, 2, 3], [10, 20, 30], ['a', 'b', 'c']]

In [76]:
lns[1][0]

10

In [77]:
lns[2]

['a', 'b', 'c']

In [78]:
lns2 = [lns, ['x', 1, [11, 12, 13]], ['y', [100, 120, 140]]]
lns2

[[[1, 2, 3], [10, 20, 30], ['a', 'b', 'c']],
 ['x', 1, [11, 12, 13]],
 ['y', [100, 120, 140]]]

In [79]:
lns2[0]

[[1, 2, 3], [10, 20, 30], ['a', 'b', 'c']]