# データ型
*  文字列や数値など，値には様々な種類がある
*  代表的な値の種類： 整数 (integer)，実数 (real number)，文字列 (string)など
*  これらの種類によって，Python内部での取り扱い方が異なる ⇒ 型を意識することが重要
*  値の種類のことを，一般に**データ型 (type)** と呼ぶ
*  本講義では，文脈によってデータ型を「クラス (class)」と呼ぶこともある


## データ型の種類（一部）
|データ型| 値の内容 |
|:--|:--|
|int（整数型）| 整数（小数を含まない数） |
|float（浮動小数点型）| 実数（小数を含む数） |
|str（文字列型）| 文字列 |
|bool（論理型）| TrueとFalseのいずれか |
|list（リスト）| 複数の値をまとめて格納 |
|tuple（タプル）| 複数の値をまとめて格納 |
|set（セット）| 複数の値をまとめて格納（要素の重複を許さない） |
|dict（ディクショナリ）| キー（key）と値（value）の組合せで複数の値を格納 |

## `type` 関数
*  値のデータ型を調べるには `type` 関数を使う
*  `type` 関数は組み込み関数の一つ
*  `type` 関数の引数として括弧内に値そのものを指定することもできるし，変数を指定することもできる
*  変数を指定した場合は，変数に代入されている値のデータ型を調べることになる

In [None]:
num = 2
var = 35 + num
# num += '5' # エラー
GLOBAL = '世界' + str(num) + 'か国'
check_code = num * ( 9 / 3 )
value = [[num], []]

print(f'varのデータ型: {type(var)}')
print(f'GLOBALのデータ型: {type(GLOBAL)}')
print(f'check_codeのデータ型: {type(check_code)}')
print(f'valueのデータ型: {type(value)}')

# 文字列

## 文字列のインデックス指定
*  文字列の後ろに「`[0]`」や「`[1]`」といったインデックスを指定することで，指定したインデックスの場所のみの文字を取り出すことができる  
*  インデックスに「`[-1]`」を指定すると，末尾の文字が取り出される

## 文字列のスライス指定
文字列のインデックス指定を拡張したスライス指定を使うと，文字列の一部の文字列を取り出すことができる．  
  
**書式**： `文字列[開始インデックス:終了インデックス+1:ステップ数]`
  
ステップ数は省略することもできる（この場合のステップ数は1）．  
また，開始インデックスが文字列の先頭の場合と終了インデックスが末尾の場合は数値を省略できる．

## 文字列（str）に対するメソッド

|メソッド名|意味|
|:--|:--|
`lower` | 文字列の全ての文字を小文字にして返す． |
`upper` | 文字列の全ての文字を大文字にして返す． |
`count` | 引数で指定した文字（列）の登場回数を数える． |
`replace` | 文字列内の指定した文字列を検索し，別に指定した文字列にすべて置き換える． |
`find` | 指定した文字列（文字）が初めて登場するインデックスを返す． |
`rfind` | 文字列（文字）が最後に登場するインデックスを返す． | 
`strip` | 文字列の先頭や末尾にある空白文字（スペースや改行など）を取り除く|

In [None]:
text = 'university'
print(text[-3])
print(text[1:4:2])
print(text.rfind('i'))

# `if`文による条件分岐
*  条件分岐とはプログラムの基本構造の「分岐」に対応する処理
*  ある条件を満たす or 満たさないのいずれかで異なる動作をするように制御すること
*  条件分岐は`if`文を使って実現する

## 条件式
*  条件分岐では，結果がbool（論理型）のデータとなる条件式を使う
*  条件式が成り立つとき ⇒ `True` （真）
*  条件式が成り立たないとき ⇒ `False` （偽）
*  条件式には比較演算子，論理演算子，`in`／`not in`演算子などが使われる

<img src="./fig/04_if-else.png" width="600">

## `if`ブロック
*  条件式が`True`のときに実行する文のまとまりを`if`ブロックと呼ぶ
*  `if`ブロックの範囲は，インデントによって定義される

## `else`ブロック
* 条件式が`False`のときに実行する処理を記述する場合は，ifブロックの後に（インデントを解除して）`else:`を記述し（コロンを忘れないように注意すること），その下の行にインデントを設定して処理を記述する
* 条件式が`False`のときに実行する文のまとまりを`else`ブロックと呼ぶ．

In [None]:
x = 8
if x % 2 != 0:
    print('A')
else:
    print('B')

# `while`文による繰り返し
*  `while`の直後に半角スペースを入れたあと，繰り返し処理の条件式を記述して，最後にコロン`:`を入れる
*  条件式のデータ型は`if`文と同様にboolとなる
*  条件式が `True`（真） である間，`while`ブロック内の処理を繰り返す
*  ブロックの意味は`if`文と同じ
*  条件式が `False`（偽）になったら繰り返しが終わる ⇒ `while`ブロック直後の処理へ

<img src="./fig/05_while.jpg" width="450">


In [None]:
s, x = 1, 1
while x < 5:
    s, x = s * x, x + 1
print(s)

# `for`文による繰り返し
*  `for`の直後に半角スペースを入れたあと，繰り返しの処理の中で用いる変数を記述
*  その変数の直後に半角スペースを入れたあと，`in`と記述
*  `in`の直後に半角スペースを入れたあと，イテラブル（iterable）と呼ばれる繰り返し処理が可能なオブジェクトを記述して，最後にコロン`:`を入れる
*  イテラブルは複数の要素からなり，要素を順番に取り出すことができるオブジェクトの総称（「イテラブルなオブジェクト」と呼ぶこともある）
*  各繰り返しで，イテラブルの要素が順番に1つずつ変数に格納される
*  取り出す要素がなくなるまで処理を繰り返す
*  もう少し細かく言うと，`for`文で指定したイテラブルは，イテレータ（iterator）と呼ばれるオブジェクトを経由して利用されている（説明は省略）
*  `for`文では，リストなどのコンテナや`range`関数（後述）がイテラブルとしてよく使われる
*  `for`文で繰り返す処理は，`for`ブロックとして記述する
*  `for`ブロックはインデントを使って設定する

<img src="./fig/05_for.png" width="550">

## イテラブルに`range`関数を用いた`for`文
*  `range`関数は，引数として指定した範囲の整数（等差数列）を要素とするイテラブルを返す
*  `range`関数をfor文のイテラブルとして用いることで，決まった回数の繰り返し処理を実行することができる
*  `range`関数の記述方法: `range(開始の値, 終了の値, ステップ幅)`
>*  引数は3つ指定できる
>*  開始の値とステップ幅は省略することもできる
>*  引数が1つの場合 ⇒ 終了の値
>*  引数が2つの場合 ⇒ 開始の値，終了の値
>*  引数が3つの場合 ⇒ 開始の値, 終了の値, ステップ幅
>*  開始の値を指定していない場合 ⇒ 0
>*  ステップ幅を指定していない場合 ⇒ 1


## 繰り返しの制御
*  `for`文の中に，`break`文や`continue`文を組み合わせると，より高度な繰り返し制御ができる
*  `break`文と`continue`文は，`if`文と組み合わせて使う
*  `break`文: `if`文の条件式が`True` ⇒ 繰り返し処理の途中で終了（即座に`for`文を抜ける）
*  `continue`文: `if`文の条件式が`True` ⇒繰り返し処理の途中で処理をスキップ（即座に`for`文の次の繰り返しに移る）

In [None]:
for i in range(3, 15):
    if i % 3 == 0:
        continue
    if i % 5 == 0:
        continue
    if i % 7 == 0:
        continue
    print(i)

# 関数の定義
*  `def`の直後に半角スペースを入れて，関数名を記述する
*  関数名の直後は丸括弧`( )`を記述し，最後にコロン`:`をつける
*  `( )`の中には，引数を記述する（引数がない場合は何も記述しない）
*  引数は，関数の呼び出し元から渡された値を格納するための変数の役割を果たす
*  `def`を記述している行を「ヘッダ」と呼ぶ
*  ヘッダの下の行に，関数が呼び出されたときに実行する処理を記述する
*  この部分を関数プロックと呼び，`if`文や`for`文のプロックと同様，インデントしてプロックの範囲を定める
*  戻り値がある場合は，`return`の直後に半角スペースを入れて記述する
*  戻り値を複数指定することもできる

<img src="./fig/06_function_definition.jpg" width="700">

## デフォルト引数とデフォルト値
*  関数を定義するときに，`引数 = 値`といった形で仮引数に値を設定することができる
*  このような引数と値を，それぞれデフォルト引数，デフォルト値と呼ぶ
*  デフォルト引数を指定した関数を呼び出すときには，実引数の記述を省略できる
*  省略した場合はあらかじめ定めておいた値（デフォルト値）が仮引数に渡される
*  違う値を仮引数に渡すときにだけ，実引数を指定して呼び出せばよい

In [None]:
def power(base, exp=3):
    return base ** exp
print(power(2))

## フィボナッチ数列
* フィボナッチ数列とは，1から始めて前の数字を加算していく数列のことで，以下の漸化式で表現できる
$$
F_1 = 1 \\
F_2 = 1 \\
F_{n+2} = F_{n} + F_{n+1}, \ \ n = 2,3,\ldots
$$
  
* $n$が10までのフィボナッチ数列は下表のとおり

|$n$|1|2|3|4|5|6|7|8|9|10|
|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|
| $F_n$ |1|1|2|3|5|8|13|21|34|55|

* 次のコードでは，1以上の整数$n$を引数として，フィボナッチ数列の第$n$項を戻り値とする関数`fibonacci`を定義している

In [None]:
def fibonacci(n):
    x, y = 0, 1
    for i in range(n):
        x, y = y, x + y
    return x

for i in range(1, 11):
    print(fibonacci(i), end=' ')

## ユークリッドの互除法
* 2つの正の整数`a`と`b`に共通する約数（公約数）の中で最大のものを最大公約数と呼ぶ
* 「ユークリッドの互除法」は最大公約数を**効率的に**求めるための有名なアルゴリズム
* ここで，`a`と`b`の最大公約数を `gcd(a, b)` とおくと，以下の関係が成り立つ
>* `gcd(a, b) = gcd(b, a % b)`
>* `gcd(a, 0) = a`
* この関係を用いると，次のコードのようにユークリッドの互除法を再帰関数として実装することができる


In [None]:
def gcd(a, b):
    if b == 0:
        return a
    return gcd(b, a % b)

integer1 = 9
integer2 = 6
result = gcd(integer1, integer2)
print(f'{integer1}と{integer2}の最大公約数: {result}')

# ミュータブル（可変）とイミュータブル（不変）
*  オブジェクトには，変更可能（ミュータブル: mutable）なものと，変更不可能（イミュータブル: immutable）なものがある
*  ミュータブルなクラス: list, dict, set など
*  イミュータブルなクラス: int, float, str, tuple など

## コンテナオブジェクトとメモリ
*  リストなど複数の要素を持つコンテナオブジェクトをメモリに格納する場合は，要素の値そのものではなく，各要素が格納されているアドレス（参照）を格納する
*  コンテナオブジェクトを変数に代入する場合のメモリ内の様子は，下図のようなイメージとなる
>*  コンテナオブジェクトを代入するための変数の先頭アドレスが 0100
>*  この変数の区画に，オブジェクトが格納されている先頭アドレス 0046 が格納される
>*  アドレス0046からの区画にコンテナオブジェクトの各要素が格納されている先頭アドレス 0000, 0013, 0026 を格納する


<img src="./fig/07_container_in_memory.png" width="700">

## `id`関数
*  オブジェクトのアドレスを確認する方法として，`id`関数を用いる方法がある
*  `id`関数は，オブジェクトが存在している間，そのオブジェクトを一意に識別する整数値を返す
*  この整数値を identity と呼ぶ
*  identityは，オブジェクトが格納されている区画の先頭のアドレスと解釈してよい
*  `id`関数呼び出しの書式: `id(オブジェクトまたは変数)`
*  `id`関数の引数は変数を指定して使うことが多い

In [None]:
text = input()
x = ['ABC']
y = [text]
print(x[0] == y[0])
print(id(x[0]) == id(y[0]))
y = x
y[0] ='XYZ'
print(x[0])

# 二分探索アリゴリズム
**アルゴリズムの流れ**
*  探索対象の要素をリストとして与える
*  ただし，リストがソートされていることを前提する
*  目的の要素（探索したい要素）を与える
*  探索する範囲の中央にある要素と目的の要素を比較
>*  目的の要素が中央の要素より小さい場合: 探索範囲を左半分に絞り込む
>*  目的の要素が中央の要素より大きい場合: 探索範囲を右半分に絞り込む。
*  絞り込んだ範囲で再び中央の要素と比較し，同様の処理を繰り返す
*  探索範囲が1つの要素になるまで繰り返し，目的の要素が見つかればそのインデックスを返す
*  見つからなければ「見つからない」こと表す「-1」を出力
  
**二分探索の動作例**
例: ソートされたリスト`[1, 2, 4, 5, 6, 9]`に対して，目的の要素が2の場合:
*  リストの中央の要素4を比較

> <img src="./fig/binary_search_example1.jpg" width="400">

*  目的の要素2は4より大きいので，次は左側`[1, 2]`を探索
*  新たな中央の要素1と目的の要素を比較

> <img src="./fig/binary_search_example2.jpg" width="280">

*  目的の要素2は1より大きいので右側`[2]`を探索
*  新たな中央の要素2と目的の要素を比較
*  目的の要素2と一致するので，インデックス1を返す

> <img src="./fig/binary_search_example3.jpg" width="380">

*  合計探索回数（比較回数）は 3回

## 二分探索アルゴリズムの実装
* 次のコードで，探索結果のインデックスと探索回数（比較回数）の2つの値を戻り値とする関数「`binary_search2`」を定義する
* 比較回数を数えるので，比較を行う直前で，カウンタ変数の値を1増やす処理を行えばよい

In [None]:
def binary_search2(data, value):
    cnt = 0
    h = 0
    t = len(data) - 1
    while h <= t:
        cnt += 1
        m = (h + t) // 2
        print(f'照合データ: {data[m]}')
        if data[m] == value:
            print('HIT!\n')
            return m, cnt
        elif data[m] < value:
            h = m + 1
        else:
            t = m - 1
    return -1, cnt

p = [2, 3, 5, 7, 11, 13, 17]
value = 11
result, times = binary_search2(p, value)
if result != -1:
    print(f'探索データ{value}はp[{result}]にあります．')
    print(f'探索回数は{times}回です．')
else:
    print(f'\n探索データ{value}は存在しません．')
    print(f'探索回数は{times}回です．')

# クイックソート
**アルゴリズムの流れ**
*  基準となるデータ（これをピボットと呼ぶ）を選ぶ
*  ピボットの値より小さいか，大きいかでデータを2つのグループに分割
*  分割したグループ内で同じことを繰り返す

  
**クイックソートの動作例**
例: リスト`A = [6, 5, 9, 2, 4]`を昇順にソートする場合:
*  ピボットを決める（ここでは右端である`A[4]`をピボットとした）

> <img src="./fig/quicksort_example1.jpg" width="350">

* ピボットの値と各要素を比較し，ピボット以下とそれより大きい要素に分割
* この分割に必要な比較回数: 4回

> <img src="./fig/quicksort_example2.jpg" width="460">

* 左側のグループの要素が1個なので，この時点で 2が最小値であることが確定する
* さらに，ピボットであった 4 の位置も確定する
* 同様の操作を分割した要素のグループごとに行い（確定しているグループは除く），すべての要素の位置が確定するまで繰り返す

> <img src="./fig/quicksort_example3.jpg" width="460">

* よって，合計比較回数は7回となる
* クイックソートの合計比較回数は，ソート前のリストの配置によって異なる

## クイックソートの実装
*  ソート対象のリストを引数とした`quick_sort`関数を**再帰関数**として定義する
*  `quick_sort`関数はソート後のリストを戻り値としている

**`quick_sort`関数のイメージ: リスト`A = [6, 5, 9, 2, 4]`を昇順にソートする場合**
* 引数からピボットを取り出す
* ピボットを基準に小さいデータ（left）と大きいデータ（right）に分割 ⇒ これらを引数として関数を再帰的に呼び出す
* 引数のデータ数が1, または0のときは関数を呼び出さない（引数そのものを戻り値として返す）

> <img src="./fig/quicksort_recursion.jpg" width="750">

In [None]:
def quick_sort(data):
    left_set = []
    right_set = []

    if len(data) <= 1:
        return data

    pivot = data.pop()

    for i in range(len(data)):
        if data[i] <= pivot:
            left_set.append(data[i])
        else:
            right_set.append(data[i])

    left_set = quick_sort(left_set)
    right_set = quick_sort(right_set)
    return left_set + [pivot] + right_set

a =  [6, 5, 9, 2, 4]
print(f'ソート前のデータ: {a}')
result = quick_sort(a.copy())
print(f'ソート後のデータ: {result}')

# 実習
* 上記の`quick_sort`関数を改良して，合計比較回数もカウントする`quick_sort2`関数を実装したコードを作成しなさい．
* 変更箇所は以下のとおりで，その他の処理は`quick_sort`関数と同じ（引数と戻り値も同じ）
* 要件に従ってコードを作成する

**＜変更箇所＞**
* グローバル変数`count`を定義し，0を代入する
* `global`文を使って，関数内でグローバル変数に値を代入できるようにする
* 比較を行う処理の前で，`count`を1増やす

**＜要件＞**
*  すでに入力されているコードは削除・変更しない
*  3行目のコードの上にコードを記述する（必要に応じて改行してよい）
*  コメントはすべて削除する
  
**実行結果**
```
ソート前のデータ: [6, 5, 9, 2, 4]
ソート後のデータ: [2, 4, 5, 6, 9]
比較回数: 7 回
```

In [None]:
# ここにコードを記述

a =  [6, 5, 9, 2, 4]
print(f'ソート前のデータ: {a}')
result = quick_sort2(a.copy())
print(f'ソート後のデータ: {result}')
print(f'比較回数: {count} 回')

# 授業評価アンケート
実習が完了しましたら，授業評価アンケートの回答にご協力ください．

[商学部トップ](https://www.bus.nihon-u.ac.jp/#gsc.tab=0) ⇒ [在学生の方へ](https://www.bus.nihon-u.ac.jp/student/#gsc.tab=0) ⇒ [WEB教務情報システム](https://www-unias.bus.nihon-u.ac.jp/uniasv2/UnSSOLoginControl2) ⇒ 授業アンケートの順にアクセスするとアンケートに回答できます．