<a href="https://colab.research.google.com/github/takatakamanbou/ML/blob/2022/omake02.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ML omake02

<img width=64 src="https://www-tlab.math.ryukoku.ac.jp/~takataka/course/ML/ML-logo.png">


----
# Python の初歩 その2
----

C言語プログラミングを少し学んでいる方を想定して， プログラミング言語 Python の初歩の初歩を解説してみます．Colab notebook なので，そのまま実行してみてね．

----
## 文字列

C言語では，`char`型の変数一つで1文字を表します．ASCIIという文字コードを用いるため，表せる文字の種類がアルファベットや数字，記号等に限られています．複数の文字の連なりである文字列を扱いたい場合は，`char`型の配列を用います．

一方，Pythonでは，文字列を一つの変数に格納できます．
最近の Python（Python3）では Unicode という文字コード体系を用いるため，日本語も普通に扱えます．

文字列は，前後を `"`または `'` で囲んで表記します．どちらの記号を使っても構いませんが，一つの文字列を囲む記号は同じでなければなりません．

In [None]:
s1 = "hoge"
s2 = 'ほげ'
print(s1, s2)

文字列同士の `+` 演算は，文字列の連結．

In [None]:
s3 = s2 + s1
s4 = s2 + " \(^o^)/ " + s1
s5 = '123' + "456"
print(s3)
print(s4)
print(s5)

文字列に整数を掛けると...

In [None]:
print('ほげ'*10)

組み込み関数 `len` で文字数を得られます．

In [None]:
s = 'hoge'
print(s, len(s))
s = 'ほげほげ'
print(s, len(s))

組み込み関数 `str` を使って整数や浮動小数点数等を文字列に変換できます．

In [None]:
M = 12
D = 1
M + '月' + D + '日'  # これは「整数＋文字列」の演算があるのでエラーになる

In [None]:
str(M) + '月' + str(D) + '日' # これならok

逆に組み込み関数 `int` や `float` を使って文字列を数値に変換することもできます．

In [None]:
s1 = '46' + '49'
s2 = int('46') + int('49')
s3 = int('1001', 10)  # int関数の第2引数を指定すると...
s4 = int('1001', 2)
print(s1, s2, s3, s4)

Python公式ドキュメントの組み込み関数 `int` の説明: https://docs.python.org/ja/3/library/functions.html?highlight=int#int

他にも文字列処理に利用できる機能（strクラスのメソッド（注））がたくさんあります．

文字列メソッドいろいろ: 
https://docs.python.org/ja/3/library/stdtypes.html?highlight=str%20%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%82%B7%E3%83%BC%E3%82%B1%E3%83%B3%E3%82%B9#string-methods


注: 「メソッド」については，とりあえず「関数みたいなもの」と思っておけばよいです．クラスとかメソッドという概念は，「オブジェクト指向プログラミング」を学ぶとわかるようになります．

In [None]:
# 文字列メソッドの利用例

# 適当な文字列を用意
s1 = "それはそれは     たいへんでしたね おつかれさまです"
# それを空白で複数の文字列に分ける
L = s1.split()  # L は複数の文字列がならんだリスト
# それを `ww ` をはさんで連結する
s2 = 'ww '.join(L)
print(s2)

----
## リスト

複数の数値や文字列などを並べて格納することのできる，**リスト**というデータ構造があります．C言語の配列に似ています．
要素を `,` で区切って並べたものを `[` と `]` で囲むとリストを作ることができます．

In [None]:
L = [0, 11, 22, 33, 44, 55] # 6つの整数値を並べたリスト
print(L[0], L[3])  # 先頭から数えて 0 番目と 3 番目の要素

In [None]:
# これはエラー
print(L[6])

In [None]:
# これはエラー？
print(L[-1])

In [None]:
# これは？
print(L[-2])

C言語の配列は「`int`型の配列」や「`char`型の配列」といった具合に要素の型を決めて作りますので，その型の値しか格納できません．

しかし，Pythonのリストにはそのような制約はなく，いろんなものを混在させることができます．


In [None]:
L2 = [0, 'いち', '二', 3.1415, ['ほげ', 'ふが'], 'Go']
for item in L2:
    print(item)

組み込み関数 `len` で要素数を得ることができます．

In [None]:
print(len(L2))

したがって，上記の for ループは，次のように書くこともできます（`i`の値を表示してるところが上記と違いますが）．

In [None]:
for i in range(len(L2)):
    print(i, L2[i])

リストのメソッド `append` を使うことで，リストに要素を追加することができます．

In [None]:
L2.append('ほ〜げほげほげほげらった〜')
print(L2)

他にもいろいろ便利なメソッドがありますが，ここでは説明を省略します．

リストなどの添字の範囲を指定する**スライス**というものを使うことで，リストの一部を取り出したリストを得ることができます．

In [None]:
L3 = L2[2:5]  # L3 は，L2[2] から L2[4] までの要素を含むリスト
print(L3)

スライスの始まりや終わりは省略することもできます．

In [None]:
print(L2[:3])
print(L2[5:])

こんなこともできます．

In [None]:
print(L2[1:6:2]) # L2[1], L2[3], L2[5] を並べたリストが得られる

In [None]:
print(L2[::-1]) # 始まりと終わりを省略，要素番号の増分は -1

----
## ディクショナリ



**ディクショナリ**（辞書）という便利なデータ構造も用意されています．

以下は，県の名と府県庁所在地をペアにしたディクショナリを作っている例です．

In [None]:
D = { '滋賀県':'大津市', '京都府':'京都市', '大阪府':'大阪市', '兵庫県':'神戸市' }

'滋賀県' や '京都府' のように `:` の前に書いたものを **キー** と言い，'大津市' や '京都市' のように `:` の後に書いたものを **値** と言います．ディクショナリは，キーと値のペアを複数格納するものです．

ディクショナリに対して次のようにキーを指定すると，対応する値を得ることができます．

In [None]:
print(D['滋賀県'])
print(D['兵庫県'])

次のような条件判定によって，あるキーがディクショナリ中に存在しているかどうかを知ることができます．

In [None]:
k = '大阪府'  # ここを変えていろいろ試そう．ディクショナリに存在しない都道府県名なども試してみてね
if k in D:
    print(f'{k}の県庁所在地は{D[k]}でっせ')
else:
    print(f'{k}なんて知らんわ')

文字列の章で説明しませんでしたが，上記の `print` の中に現れた，`f` で始まる文字列の書き方は「f文字列」と呼ばれるものです．興味のあるひとは調べてみてね．

ディクショナリにもまだまだいろいろ機能がありますが，省略します．

----
## 練習問題


(0) `input`を使うと，キー入力を受け取ることができます．次のセルを実行して，何かキー入力して Enter 押してみましょう．

In [None]:
x = input('なんか入力して Enter 押してね')
print(x, 'ですかそうですか')

以下のセルは無限ループします．止めたいときは，セルの左に表示される○の中に□が描かれたボタンを押してください．

In [None]:
i = 0
while True: # True は「真/偽」の「真」を表す．「偽」は False
    x = input()
    print(i, x)
    i += 1

(1) 以下のセルのコードは，キー入力された数の和を求めるつもりで書いたものですが，このままでは正しく動作しません．
正しく動作するように修正してください．

ヒント: `input` の戻り値は文字列です．



In [None]:
s = 0
while True:
    x = input('数を入力してね（負だと終了）')
    if x >= 0:
        # ここは自分で考えてね
    else:
        break  # break は C言語同様にループを抜ける
print(f'和は{s}')

(2) 以下のセルに，リスト`L`の要素中の最大値を求めるコードを書きなさい．要素はすべて浮動小数点数と仮定してよく，それ以外のものが含まれていた場合の処理は考えなくともよい．

In [None]:
import random  # ここでは説明しないが，乱数を扱うための「random モジュール」を読み込んでいる
L = [random.random() for i in range(20)] # [0, 1) の乱数20個
print(L)
print(max(L)) # 組み込み関数 max で最大値が求まる．検算用

# ここから下にコードを追加してね

(3) 以下のセルのコードを修正して，数当てゲームができるようにしよう．
キー入力した数が `n` より大きければ「大きすぎ」，小さければ「小さすぎ」のように出力して，等しければ「あたり〜」と出力して何回で当たったか教えてくれるようにしよう．

In [None]:
nmax = 255
n = random.randint(1, nmax) # 1 以上 nmax 以下の乱数
print(f"1以上{nmax}以下の数を選んだよ．当ててみ．")

cnt = 0  # 数を入力した回数をカウント

while True:
    x = input("数を入力してね:") # input はキー入力を受け付ける．戻り値は文字列であることに注意
    print(x)
        
print(cnt, "回で当たり〜")

(おまけ1) 県庁所在地あてクイズ

In [None]:
# Google Colab では， '!' に続けて Linux コマンドを書いて実行させることができる
# 以下は，takatakaのWebサーバから ex06kencho.txt というテキストファイルを入手している
! wget http://www-tlab.math.ryukoku.ac.jp/~takataka/course/AProg/ex06kencho.txt
! ls

In [None]:
import random

### ファイルを読んで県名をキー，県庁所在地を値とするディクショナリを作る
dKencho = {}
with open('ex06kencho.txt', 'r', encoding='utf-8') as f:
    for line in f:
        x, y = line.strip().split(',')
        dKencho[x] = y

### キーのリストをシャッフル
keyList = list(dKencho.keys()) 
random.shuffle(keyList)

### 出題数を決める
while True:
    n = int(input('何問やる？ '))
    if 0 < n <= len(keyList):
        break

### クイズ．正解数をカウント
cnt = 0
for i, k in enumerate(keyList[:n]):
    ans = input(f'{i+1}問目: {k}の県庁所在地は？ ')
    if dKencho[k] == ans:
        print('正解！')
        cnt += 1
    else:
        print('ちゃうで')
print(f'{n}問中{cnt}問正解やったで')

(おまけ2) 郵便番号検索

In [None]:
! wget http://www-tlab.math.ryukoku.ac.jp/~takataka/course/AProg/zipdata.txt
! ls

In [None]:
### 関数 readZIP() の定義
#      Python で関数を定義する／使う方法はまだ説明してないので，眺めてふーんって感じでok
def readZIP(fn):

    dZIP = {}       # 空のディクショナリを作る
    with open(fn, "r", encoding="utf-8") as f:  # ファイル名 fn のファイルを読み込みモードで開く
        for line in f:  # ファイルから1行ずつ読み込んでループ
            x, y = line.split()   # 空白区切りで分割．1つ目を x に，残り（2つ目）を y に
            dZIP[x] = y           # キー x, 値 y のペアを登録．x, y とも文字列

    return dZIP


# 引数にファイル名を指定して readZIP() を呼ぶ
#    何を引数に指定するかは自分で考えよう．戻り値は郵便番号データのディクショナリ
zip = readZIP('zipdata.txt')

# ディクショナリに対する len() は，キーの数を返す
print(len(zip), "件の郵便番号データを読み込みました")

while True:
    z = input('郵便番号を入力してください（\'q\'か\'Q\'で終了）')
    if z == 'q' or z == 'Q':
        break
    else:
        if z in zip:
            print(z, zip[z])
        else:
            print('見つかりません')

サンプル
```
118014 件の郵便番号データを読み込みました
郵便番号を入力してください（'q'か'Q'で終了） 1057219
1057219 東京都港区東新橋汐留メディアタワー(19階)
郵便番号を入力してください（'q'か'Q'で終了） 1057220
1057220 東京都港区東新橋汐留メディアタワー(20階)
郵便番号を入力してください（'q'か'Q'で終了） 0010010
0010010 北海道札幌市北区北十条西(1〜4丁目)
郵便番号を入力してください（'q'か'Q'で終了） 9998525
9998525 山形県飽海郡遊佐町直世
郵便番号を入力してください（'q'か'Q'で終了） 5202123
5202123 滋賀県大津市瀬田大江町
郵便番号を入力してください（'q'か'Q'で終了） 1234567
見つかりません
郵便番号を入力してください（'q'か'Q'で終了） q
```