# Python 入門編４：文字列型
## 目次
* [１．文字列の基本操作](#１．文字列の基本操作)
 * [文字列の定義](#文字列の定義)
  * [ミニ練習](#ミニ練習)
 * [添え字による文字へのアクセス](#添え字による文字へのアクセス)
 * [文字列の結合](#文字列の結合)
* [２．さまざまな文字列処理](#２．さまざまな文字列処理)
 * [練習4.1: 結合（join）](#練習4.1:-結合（join）)
 * [練習4.2: 部分文字列](#練習4.2:-部分文字列)
 * [練習4.3: 部分文字列の一致（startswith）](#練習4.3:-部分文字列の一致（startswith）)
 * [練習4.4: 探索（find）](#練習4.4:-探索（find）)
 * [練習4.5: 置換（replace）](#練習4.5:-置換（replace）)
 * [チャレンジ課題4.6: 分割（split）](#チャレンジ課題4.6:-分割（split）)
* [３．シーケンスの要素を添え字を使わずに取り出す](#３．シーケンスの要素を添え字を使わずに取り出す)
* [４．文字列と他のデータ型の相互変換](#４．文字列と他のデータ型の相互変換)
 * [文字列とリストの相互変換](#文字列とリストの相互変換)
 * [文字列と数値の相互変換](#文字列と数値の相互変換)
 * [練習4.7: 日本語電卓](#練習4.7:-日本語電卓)
* [５．format メソッド](#５．format-メソッド)
  * [表示幅](#表示幅)
  * [右寄せ・左寄せ](#右寄せ・左寄せ)
  * [表示桁数](#表示桁数)
 * [練習4.8: 式付きの九九の表](#練習4.8:-式付きの九九の表)
 * [練習4.9: 周期表](#練習4.9:-周期表)
* [課題提出の前の注意](#課題提出の前の注意)
* [６．チャレンジ課題集](#６．チャレンジ課題集)
 * [チャレンジ課題4.10：整数の漢字表記](#チャレンジ課題4.10：整数の漢字表記)
 * [チャレンジ課題4.11: 数の読み上げ](#チャレンジ課題4.11:-数の読み上げ)

---

このノートブックでは，文字列の処理について練習します．

文章は画像とならび，コンピュータから人間へ向けて情報を伝える最も基本的な手段です．コンピュータの内部では，文章は文字列データとして表現されます．このため，プログラミングを通じてコンピュータを使いこなす上で，文字列の処理になじんでおくことは重要です．

また，データとしての文字列は，文字が1次元的に連なったシンプルな構造を持つため，文字列の処理は，繰り返しや場合分けを組み合わせた基本的なプログラミングの良い練習になります．

## １．文字列の基本操作

### 文字列の定義

プログラム中で直接文字列を定義するには，`'apple'` あるいは `"banana"` のように `'` （シングルクォート）または `"` （ダブルクォート）で文字列を囲めばよい．

In [None]:
a = 'apple'
b = "banana"

print(a)
print(b)

`'...'` で囲んだ文字列は `"` を含むことができる．`"..."` で囲んだ文字列は `'` を含むことができる．

In [None]:
s1 = 'She said "Hello!"'
s2 = "I can't swim!"
print(s1)
print(s2)

`'...'` で囲んだ文字列に `'` を直接含めることはできない．同様に `"..."` に `"` を直接含めることはできない．


囲む文字（引用符）と同じ文字を含む文字列を定義したければ，バックスラッシュ（`\`）を引用符の前に置き `\'` あるいは `\"` とすればよい．

#### ミニ練習
1. まず，以下のセルを実行してエラーになることを確かめよ．
2. 次に，文字列中の引用符の前にバックスラッシュを追加し
```
s = 'it\'s OK'
t = "She said \"Hello!\""
```
と修正することで，引用符を含んだ文字列が正しく出力されることを確かめよ．

In [None]:
s = 'it's OK'
t = "She said "Hello!""
print(s)
print(t)

### 添え字による文字へのアクセス
リストと同様に，添え字によって文字列から文字を取り出すことができる．
添え字はゼロ始まりである．
つまり，最初の文字は添え字 0，次の文字は添え字 1 に対応する．

下のセルを実行したときに表示される文字を予想してから確かめなさい：

In [None]:
s = "abcde"
print(s[2])

C言語と違い，文字と文字列には型の区別がない．すなわち，文字は長さ１の文字列である．

In [None]:
s = "abc"
print(s[0] == "a")

文字列の長さは，`len` 関数で取得できる．

In [None]:
s = "abcde"
len(s)

リストとは異なり，添え字を使って文字列の中の文字を書き換えることは**できない**．

以下のセルを実行して，エラーが起きることを確かめよ：

In [None]:
s = "hello"
# "hello" -> "Hello" と書き換えたい
# （後でコメントアウトする）
s[0] = "H"

上のセルの実行結果がエラーになることを確かめたら，後で「全て実行（Run All Cells）」したときに止まらないように `s[0] = "H"` の行を<font color="red">コメントアウトしなさい</font>．

コメントアウトとは行の先頭に '#' を入れて，その行が実行されないようにすること．つまり上のセルの4行目の先頭に '#' を入れて以下のような状態にする：
```python
s = "hello"
# "hello" -> "Hello" と書き換えたい
# （後でコメントアウトする）
#s[0] = "H"
```

コメントアウトしたあともう一度セルを実行して，エラーにならないことを確かめなさい．

**ミニ練習**: 与えられた文字列 `s` を先頭から1文字ずつ，各文字の後で改行して出力する関数 `tategaki(s)` を実装しなさい．

例: `tategaki("こんにちは")`  の実行結果：
```
こ
ん
に
ち
は
```

In [None]:
def tategaki(s):
    ### 実装しなさい


実装できたら下のセルをクリックしてテストしなさい：

In [None]:
tategaki("テストです")

### 文字列の結合
2つの文字列を結合するには `+` 演算子を使えばよい：

In [None]:
s1 = "私は"
s2 = "猫です"
s = s1 + s2
print(s)

ある文字列に，次々に文字列を付け加えていくには `+=` 演算子を使えばよい：

In [None]:
s = "" # 空の文字列
s += "私は"   # --> s は "私は" になる
s += "黒"     # --> s は "私は黒" になる
s += "猫です" # --> s は "私は黒猫です" になる
print(s)

## ２．さまざまな文字列処理
文字列型には，さまざまなメソッドがすでに定義されている（[マニュアル](https://docs.python.org/ja/3/library/string.html)）．

このセクションでは，いくつかの文字列メソッドと同じ動作をする関数を自分で実装してみよう．

すでに存在する機能を再実装することは「車輪の再発明」と呼ばれ一般的には避けるべきだが，
* 既存の機能を正しく理解する
* プログラミングの基本を身に付ける

の2つの目的のためには非常に有効である．

このセクションの練習では，前のセクション「文字列の基本操作」で説明した
* 添え字による文字の取り出し
* `+` あるいは `+=` による文字列の結合
* `len` 関数による長さの取得
* for 文，if 文など

だけを使って実装すること．

まず以下のセルを実行して，後でテストに使う関数の定義を有効にしなさい．

この関数 `test_eq` は，プログラムの出力 `out` と正しい答え `ans` を引数として `test_eq(out, ans)` の形で実行すると，
プログラムの出力が正しい答えと一致するか調べて結果を報告する．（実装の詳細についていま理解する必要はない．）

In [None]:
# 入力
#   out: 実装した関数の出力
#   ans: 正しい出力
#   noerr: 失敗時にエラーにしない（default: False）
def test_eq(out, ans, noerr=False):
    msg = "テスト成功" if out == ans else "テスト失敗"
    print("{}: あなたの出力: {:10}\t正しい出力: {:10}".format(msg, str(out), str(ans)))
    if out != ans and not noerr:
        raise RuntimeError("テスト失敗")

### 練習4.1: 結合（join）
文字列 `s` に対し，文字列のリスト `[t1, t2, ..., t_n]` を引数として `s.join([t1, t2, ..., t_n])` を実行すると，`s` を区切りとして `t1, t2, ..., t_n` を結合した文字列すなわち `t1 + s + t2 + s + ... + s + t_n` と同じ値が返される．

以下のセルの実行結果を予想してから確かめてみなさい：

In [None]:
"-".join(["a", "b", "c"])

これと同様の動作をする関数（メソッドではなく）`my_join(s, [t1, t2, ..., t_n])` を実装しなさい．

つまり，`my_join(s, [t1, t2, ..., t_n])` は第1引数 `s` を区切りとして，第2引数のリストの中の文字列を結合した `t1 + s + t2 + s + ... + s + t_n` と同じ値を返す関数である．

たとえば `my_join("-", ["a", "b", "c"])` は上の `join` メソッドの例と同じ "a-b-c" を返す．

ヒント（ダブルクリックで表示）
<!--
次のように考えればよい：
* まず，空の文字列 r = "" を用意する
* 第2引数（連結される文字列のリスト）を ts とするとき，
  i = 0, 1, ..., len(ts)-1 のそれぞれについて
  * i == 0 ならば，r に ts[i] を結合する
  * i >= 1 ならば，r に s と ts[i] を結合する
* さいごに r を return する
-->

さらにヒント（ダブルクリックで表示）
<!--
例えば区切り文字列 s = "/", 文字列リスト ts = ["a", "b", "c"] なら
まず文字列 r を

r = ""

と初期化し，３回繰り返すループの各回でそれぞれ

r += "a"         # ts[0] を結合する
r += "/" + "b"   # s と ts[1] を結合する
r += "/" + "c"   # s と ts[2] を結合する

という順に r に徐々に文字列を追加していけばよい．

これをどんな入力に対しても行うには，
i が 0, 1, 2, ..., len(ts) - 1 と変化するように

for i in ... 

という形のループを作り（... のところは自分で考える）
ループの中では

もし i == 0 なら
   r に ts[i] を連結する
そうでなければ
   r に "/" と ts[i] を連結する

という場合わけを行えばよい．
-->

In [None]:
# 入力:
#  s : 区切り文字列
#  ts : 文字列のリスト
# 出力:
#  s を区切りとして ts の要素を結合した文字列
def my_join(s, ts):
    # *** 実装しなさい ***


実装できたら，`join` メソッドの出力と比べてテストしてみましょう．

In [None]:
test_eq(my_join("-", ["a", "b", "c"]), "-".join(["a", "b", "c"]))
test_eq(my_join("-", []), "-".join([])) # 第2引数が空の場合

test_eq(my_join("/", ["2022", "09", "13"]), "/".join(["2022", "09", "13"]))
test_eq(my_join("!!", ["今日", "は", "水曜日", "です"]), "!!".join(["今日", "は", "水曜日", "です"]))

### 練習4.2: 部分文字列
文字列 `s` の `i` 文字目（0文字目が最初の文字）から `j-1` 文字目までの部分文字列を取り出すには `s[i:j]` とすればよい．
これをスライス記法という．

つまり i < j ならば
```
  s[i:j] == s[i] + s[i+1] + ... + s[j-1]
```
が成り立つ．

以下のセルの実行結果を予想してから，実行して確かめなさい：

In [None]:
s = "Hello"
print(s[1:4])

スライス記法と同様の動作をする関数 `substr(s, i, j)` を実装してみよう．すなわち `substr(s, i, j)` の返り値は，文字列 `s` の `i` 文字目から `j-1` 文字目までの部分文字列である．
* `0 <= i <= j < len(s)` すなわち `i <= j` であり，かつ `i, i+1, ..., j-1` が `s` の添え字の範囲を出ないことは仮定してよい．
* `i == j` の場合は空文字列が返るようにせよ．

ヒント（ダブルクリックで表示）
<!--
まず空の文字列 r = "" を用意し，ループを使って，s[i], s[i+1], ..., s[j-1] を順に r に結合していけばよい

k = i, i+1, i+2, ..., j-1 のそれぞれに対して繰り返すループは

  for k in range(i, j):
    ...
    
とすればよい．
-->

In [None]:
# 入力：
#   s: 文字列
#   i, j: i <= j を満たす非負整数
# 出力：
#   s の i 番目（ゼロ始まりで）から j-1 番目までの部分文字列
def substr(s, i, j):
    # *** 実装しなさい ***


実装できたら，スライス記法の結果と比較してテストしてみましょう：

In [None]:
s = "ABCDE"
test_eq(substr(s, 1, 4), s[1:4])
test_eq(substr(s, 0, 3), s[0:3])
test_eq(substr(s, 0, 5), s[0:5])
test_eq(substr(s, 3, 5), s[3:5])
test_eq(substr(s, 3, 3), s[3:3])

### 練習4.3: 部分文字列の一致（startswith）
文字列 `s` に対し，`s.startswith(t, i)` は，`s` の `i` 番目の文字から始まる部分文字列が `t` と一致するとき True, そうでないとき False を返す．

例：結果を予想してからクリックして確かめること．

In [None]:
s = "coconat"
print(s.startswith("coco", 0))
print(s.startswith("ccoo", 0))
print(s.startswith("cona", 2))

以下は，`s.startswith(t, i)` と同じ動作をする関数 `my_startswith(s, t, i)` の**誤った実装**である．誤りを見つけて修正しなさい．

ヒント（ダブルクリックで開く）
<!--
まず，２つ下のテストのセルを実行し，エラーメッセージを見てみること

"IndexError: string index out of range" は，文字列に対する添え字が
可能な範囲（すなわち 0 から 文字列の長さ-1 まで）を超えていることを
意味する
-->

In [None]:
# 入力:
#  s, t : 文字列
#  i : 整数
# 出力:
#  s の i 文字目から i+len(t)-1 文字目までの部分文字列が
#  t と一致していたら True，それ以外は False
def my_startswith(s, t, i):
    # t[0], t[1], ..., t[len(t)-1] が
    # s[i], s[i+1], ..., s[i+len(t)-1] と
    # 同じかどうか調べる
    for j in range(0, len(t)):
        if s[i + j] != t[j]:
            # 異なる文字があった
            return False
    return True

誤りを修正できたら，あるいはどこが誤りか分からなかったら，以下を実行してテストしなさい：

In [None]:
s = "Hello"
test_eq(my_startswith(s, "hell", 0), s.startswith("hell", 0))
test_eq(my_startswith(s, "ll", 2),   s.startswith("ll", 2))
test_eq(my_startswith(s, "lll", 2),  s.startswith("lll", 2))
test_eq(my_startswith(s, "loo", 3),  s.startswith("loo", 3))
test_eq(my_startswith(s, "llo", 2),  s.startswith("llo", 2))

エラーメッセージ "IndexError: string index out of range" は，添え字として使った値が大きすぎること，つまり，添え字が最後の文字の添え字である「文字列の長さ-1」を超えていることを表す．

エラー原因が見つからない人のためのヒント（ダブルクリックで表示）
<!--
my_startswith(s, t, i) において，s[i] 以降の文字列が t よりも
短い場合は，文字列の中身を調べるまでもなく結果は False になるべきである．

つまり例えば s = "abc", t = "bcd", i = 1 ならば，
s[i] 以降の文字列は "bc" で長さ 2 であり，これが長さ 3 である t と
一致することはない．

なので，for ループで１文字ずつ比べる前に s の s[i] 以降の文字列の長さ
つまり len(s) - i と len(t) を比べて，前者の方が短かったら False を返せばよい．

このチェックをしないで for ループを始めると，s の方の添字がいずれ s の長さ以上になり
そこでエラーが起こる．
-->

### 練習4.4: 探索（find）
文字列 `s` に対し，`s.find(t)` は
* `s` が部分文字列として `t` を含むならば，その最初の出現位置を返す
* `s` が部分文字列として `t` を含まないならば，`-1` を返す

ここで言う「部分文字列」は，とびとびではダメである．つまり `"tom-is-a-cat".find("tomcat")` は `-1` を返す．
また，`s` が `t` を含む場合の「最初の出現位置」とは，`s` 中の部分文字列 `t` の最初の文字の添え字に当たる数である．
すなわち，`"XYZXYZ".find("YZ")` は `1` を返す．

以下のセルの実行結果を予想してから実行して確かめなさい：

In [None]:
s = "abracadabra"
s.find("cad")

メソッド `s.find(t)` と同じ動作をする関数 `my_find(s, t)` を実装しなさい．

ヒント（ダブルクリックで表示）
<!--
上で実装した my_startswith(s, t, i) を使えばよい．

すなわち，
  * my_startswith(s, t, i) が True となるような位置 i が
    あれば，そのうち最小のものが my_find(s, t) の値である

  * そのような i がない（つまり s は t を含まない）ならば
    my_find(s, t) の値は -1 となる
-->

さらにヒント（ダブルクリックで表示）
<!-- 
my_find(s, t) は，my_startswith(s, t, i) が True になる
最小の i を return すればよいのだから，次のように実装できるだろう

for i in range(....): # range の引数をどうすればいいかは考えること
    もし my_startswith(s, t, i) が成り立てば
        return i
return -1 # ループ中いちども my_startswith(s, t, i) が True にならなかった場合
-->

In [None]:
# 入力:
#   s : 文字列
#   t : 文字列
# 出力:
#   s が t を含むならその最初の出現位置
#   それ以外のとき -1
def my_find(s, t):
    # *** 実装しなさい ***


実装できたら，メソッド `find` の結果と比較してテストしてみましょう．

In [None]:
s = "abracadabra"
test_eq(my_find(s, "cad"),   s.find("cad"))
test_eq(my_find(s, "bra"),   s.find("bra"))
test_eq(my_find(s, "abra"),  s.find("abra"))  # 返り値 == 0 のケース
test_eq(my_find(s, "dabra"), s.find("dabra")) # 末尾で見つかるケース
test_eq(my_find(s, "brabra"), s.find("brabra")) # 見つからず，返り値 == -1 のケース

t = "abc"
for u in ["abc", "ababd", "abxxabcyy", "abcab", "xxabcyyabczz"]:
    print("----")
    print("my_find({}, {})".format(u, t))
    test_eq(my_find(u, t), u.find(t))

### 練習4.5: 置換（replace）
文字列メソッド `s.replace(t, u)` は，文字列 `s` に出現する部分文字列 `t` を全て `u` に置き換える．

以下のセルを実行した結果を予想してから確かめなさい：

In [None]:
"フルーツコウモリはフルーツが大好き".replace("フルーツ", "吸血")

メソッド `s.replace(t, u)` と同じ動作をする関数 `my_replace(s, t, u)` を実装しなさい．

この課題では，**while 文**による繰り返しを使うと便利である．while 文の一般的な形式は
```python
while 条件式:
    ループの中身
```
であり，`条件式` の値が真（True）である間，`ループの中身` が実行され続ける．

while 文を使うと，my_replace は大体，以下のように実装できるだろう：
```python
def my_replace(s, t, u):
    r = "" # 置換結果の文字列
    i = 0
    while i < len(s):
        if (s の i 文字目から i+len(t)-1 文字目が t と一致):
            r に置き換え結果である u を結合する
            s の中の t に一致する部分の次の文字を指すように i を変更する
        else:
            s の i 文字目以降は t と一致しないので，r に s[i] を結合する
            i += 1
    return r
```

例えば `s = "aabc", t = "ab", u = "AB"` の場合は以下のような動きになる
```txt
r = "" # 結果を初期化
i = 0

s の i 文字目から i+len(t)-1 文字目，すなわち 0 文字目から 1 文字目 (= "aa") は t と一致しない
  -> r に s の i 文字目すなわち "a" を結合し，i を 1 増やす
    
# この時点では i = 1, r = "a"

s の i 文字目から i+len(t)-1 文字目，すなわち 1 文字目から 2 文字目 (= "ab") は t と一致する
  -> r に置き換え結果である u (= "AB") を結合し，i を len(u) すなわち 2 増やす
    
# この時点では i = 3, r = "aAB"
    
s の i 文字目から i+len(t)-1 文字目，すなわち 3 文字目から 4 文字目は t と一致しない (添字が s の長さを超える）
  -> r に s の i 文字目すなわち "c" を結合し，i を 1 増やす

# この時点では i = 4, r = "aABc"

i < len(s) が成り立たないので while ループは終了．r を return する．                                                        
```

さらにヒント（ダブルクリックで表示）
<!--
s の i 文字目から i+len(t)-1 文字目が t と一致するかどうかを調べるには
my_startswith(s, t, i) を使えばよい．
-->

In [None]:
def my_replace(s, t, u):
    # *** 実装しなさい ***


実装できたら，`replace` メソッドの結果と比べてテストしましょう：

In [None]:
test_eq(my_replace("abcde", "cd", "CD"), "abcde".replace("cd", "CD"))

# 2か所以上置換されるケース
test_eq(my_replace("abracadabra", "bra", "BRA"), "abracadabra".replace("bra", "BRA"))

# 一つも置換されないケース
test_eq(my_replace("0123456789", "99", "00"), "0123456789".replace("99", "00"))

### チャレンジ課題4.6: 分割（split）
これは余力のある人向けの課題です．必須課題だけやる人は次の「3. 発展：シーケンスの要素を添え字を使わずに取り出す」に進んでください．

文字列メソッド `split` は，`join` の逆の動作をする．すなわち，指定した区切り文字列で，ある文字列を分割した結果を文字列のリストとして返す．
区切り文字列は，分割結果に含まれない．

以下のセルの実行結果を予想してから確かめよ：

In [None]:
s = "1,2,3,100"
s.split(",")

区切り文字列は2文字以上の文字列でもよい：

In [None]:
s = "1足す2足す3足す4は10"
s.split("足す")

区切り文字列が連続した場合，その間には空文字列 `""` があると見なされ，区切り結果に `""` が含まれる：

In [None]:
# "1" + "<" + "2" + "<" + "" + "<" + "99" と解釈される
s = "1<2<<99"
s.split("<")

同様に，文字列の先頭あるいは末尾に区切り文字列がある場合も，区切り結果の先頭あるいは末尾に `""` が含まれる：

In [None]:
print(",1,2".split(","))
print("1,2,".split(","))

文字列メソッド `s.split(sep)` と同じ動作をする関数 `my_split(s, sep)` を実装せよ．

ヒント（ダブルクリックで表示）
<!--
いろいろなやり方がありうるが，次のように考えることができる．

* 区切った結果を保存する空リストを用意する
* s のうち，まだ調べていない部分を保存する変数（rest という名前とする）を s で初期化する
* my_find を用いて，rest に出現する最初の区切り文字列の位置（next_sep とする）を得る
* rest に区切り文字列が含まれる間（つまり next_sep != -1 である間），以下を繰り返す
  * rest のうち最初の区切り文字列より前の部分を結果のリストに追加する
  * rest のうち最初の区切り文字列の終わり以降の部分を再度 rest にセットする
  * next_sep に my_find(rest, sep) の結果をセットする
* くり返し終了後の rest （つまり最後の区切り文字列より後の部分）を結果のリストに追加する
* 保存した区切り結果を return する
-->

In [None]:
# 入力:
#   s, sep: 文字列
# 出力:
#   文字列 s を区切り文字列 sep で区切った結果のリスト
def my_split(s, sep):
    # *** 実装しなさい ***
    # 以下はダミーの実装．課題に取り組む人は削除しなさい：
    return []

実装できたら，`split` メソッドの結果と比較してテストしましょう：

In [None]:
print(my_split("1::20::30::4", "::") == "1::20::30::4".split("::"))

# 区切り文字が連続するケース
print(my_split("1,2,,30,4", ",") == "1,2,,30,4".split(","))

# 区切り文字から始まるケース
print(my_split(",1,200,3", ",") == ",1,200,3".split(","))

# 区切り文字で終わるケース
print(my_split("10,2,30,", ",") == "10,2,30,".split(","))

## ３．シーケンスの要素を添え字を使わずに取り出す
リストは，データが一列にならんだ構造だった．文字列も，文字が一列に並んだデータとみなせる．

リストや文字列などの「要素が一列に並んだデータ」は，Python では**シーケンス型**と呼ばれ，同じ名前のメソッドや関数を通じて統一的に扱える．

シーケンス `s` に対する最も基本的な操作は，添え字演算子 `s[i]` で `i` 番目の要素を取り出すことだった．

しかし，例えば for ループのなかでリストや文字列の要素を処理する場合でも，単に「全部の要素について何かをしたい」だけであって，添え字の値そのものは必要ない場合も多い．

そのような場合，シーケンス型に対しては，添え字を使わずに，要素を順番に取り出す以下のようなループの書き方ができる：
```python
for x in xs:
    ... x に対する処理 ...
```

これを，添え字を使った以下のループと比べると，少しだけ簡単になっていることが分かるだろう：
```python
for i in range(len(xs)):
    ... x[i] に対する処理 ...
```

たとえば，与えられた文字列 `s` の各文字の後に "!" を挿入した文字列を返す関数 `exclaim(s)` は以下のように書ける：

In [None]:
def exclaim(s):
    t = "" # ここに文字+"!" を追加していく
    for c in s: # s の各文字 c についてのループ
        t += c + "!"
    return t

以下を実行してテストしてみなさい：

In [None]:
exclaim("ABC")

また，与えられた数値のリスト `xs` の要素を全て掛け合わせた数を返す関数 `prod(xs)` は以下の様に定義できる：

In [None]:
def prod(xs):
    p = 1 # 積を 1 で初期化
    for x in xs:
        p *= x
    return p

以下のセルの実行結果はどうなるか？予想してから実行して確かめなさい：

In [None]:
prod([1, 2, 3, 4])

**ミニ練習**: `for c in s` の形のループを使って，与えられた文字列 `s` の文字を逆順に並べた文字列を返す関数 `rev(s)` を実装しなさい:

ヒント（ダブルクリックで表示）
<!--

* 空の文字列 r = "" を最初に用意し，s の各文字 c を r の「先頭」に結合していけばよい．
* r の先頭に c を結合した文字列は c + r である．

-->

In [None]:
def rev(s):
    # *** 実装しなさい ***

# テスト
rev("かすまめよ")

## ４．文字列と他のデータ型の相互変換
### 文字列とリストの相互変換
`list` 関数を用いると，文字列を文字のリストに変換できる：

In [None]:
list("abcdあいうえ")

逆に，文字のリストを結合して文字列を得るには，空文字列を区切りとして `join` メソッドを用いればよい：

In [None]:
"".join(["あ", "い", "う"])

### 文字列と数値の相互変換
数値を表す文字列から，整数や小数点数としての値を得るには，数値の型に応じて `int` 関数（整数の場合）あるいは `float` 関数（小数点数の場合）を用いればよい：

In [None]:
n_str = "123"
n = int(n_str)
print(n * 2)

In [None]:
f_str = "1.23"
f = float(f_str)
print(f * 2)

`int` 関数に整数でない数を表す文字列を与えると，自動的に四捨五入されたりせず，エラーが発生する：

In [None]:
int("1.23")

エラーになることを確かめたら後で「Run All」で止まらないように上のセルの先頭に `#` を入れてコメントアウトしておきなさい．

---
基本的だが大事な注意：<font color="red">「数値を表す文字列」と「数値」は全く違う．</font>

例えば `10 + 10` と `"10" + "10"` は値が全く違う．結果を予想してから確かめなさい：

In [None]:
print(10 + 10)
print("10" + "10")

この違いは，`+` 演算子は数値に対しては「足し算」の意味だが，文字列に対しては「結合」を表すことによる．

`==` で比べる場合も，数値の `10` と文字列の `"10"` は「異なる」と判定される：

In [None]:
10 == "10"

---
ここでついでに `input` 関数について説明しておく．

Jupyter notebook （今使っているシステム）で，文字列 `msg` を引数として `input(msg)` を実行すると，セルの下に文字列 `msg` に続けてユーザが入力するための箱（入力フィールド）が現れる．`input` 関数の返り値は，入力フィールドにユーザ（あなた）が入力した文字列になる．

In [None]:
ret = input("何か入力して Enter キーを押してください：")
print("入力された文字列:", ret)

ユーザが数値を入力した場合も，`input` 関数の返り値の型は文字列なので，ユーザから数値を受け取りたいときは `input` の返り値を `int` 関数や `float` 関数で変換する必要がある：

In [None]:
f_str = input("３倍したい数を入力して下さい：")
print(float(f_str) * 3)

### 練習4.7: 日本語電卓
ユーザから以下の形式のどれかに当てはまる文字列を受け取って，結果を数値として返す関数 `jp_calc` を実装しなさい．

入力形式：
* "&lt;n&gt; 足す &lt;m&gt;"
* "&lt;n&gt; 引く &lt;m&gt;"
* "&lt;n&gt; かける &lt;m&gt;"
* "&lt;n&gt; 割る &lt;m&gt;"
    
上の，&lt;n&gt; と &lt;m&gt; は小数点数（整数でもよい）を表す．また，数値 &lt;n&gt;, &lt;m&gt; と「足す」「引く」などの間には空白が一つずつ入っている．


In [None]:
def jp_calc():
    s = input("式：")
    # *** 実装してください ***
    # * 空白 ' ' で入力を区切る： s.split(' ')
    # * 区切った結果（文字列のリスト）の 
    #   0 番目（<n>) と 2 番目 (<m>)を float 関数で数値に変換する
    # * 区切った結果の 1 番目（演算を表す文字列）に応じて計算を行い，
    #   結果を return する


実装できたら，テストしましょう：

In [None]:
ans = jp_calc()
print("答えは", ans)

## ５．format メソッド
文字列のメソッドの一つである `format` は，数値や文字列などのデータを見やすく整えて出力するために使う．

`format` の最も簡単な使い方は，以下の様に，データを埋め込む場所を示す `{}` をいくつか含む文字列に対して，`{}` と同じ数の引数を与えて呼び出すやり方である：

In [None]:
n = 3
m = 6
print("{} かける {} は {} です".format(n, m, n * m))

上の例では，3つの `{}` を含む文字列（フォーマット文字列という）に対して，`n`, `m`, `n * m` の3つの引数を与えて `format` を呼び出している．

3つの引数の値は，引数と同じ順番でフォーマット文字列の中の `{}` の位置に埋め込まれる．埋め込んだ結果の文字列が `format` メソッドの返り値となる．上の例ではその返り値を `print` で表示している．

引数の値を `{}` の位置に埋め込むやり方について，さらに細かい指定をすることができる．ここでは代表的なものだけ紹介する．

#### 表示幅
フォーマット文字列で，`N` を整数として，`{:N}` とすることで，表示する際の幅を指定できる:

In [None]:
print("{:10} ... {:3} yen".format("Apple", 250))
print("{:10} ... {:3} yen".format("Kiwi fruit", 120))
print("{:10} ... {:3} yen".format("Banana", 99))

引数の値の表示結果が，指定した幅よりも短ければ，残りは空白で埋められる．

#### 右寄せ・左寄せ
表示幅を指定したとき，引数が文字列ならば表示幅内で左寄せ（左から詰めて表示），引数が数値ならば右寄せ（右から詰めて表示）になる．

フォーマット文字列で幅の前に `<` を入れて，`{:<10}` のようにすると左寄せ，`>` を入れて `{:>10}` のようにすると右寄せにできる：

In [None]:
print("{:>10} ... {:<3} yen".format("Apple", 250))
print("{:>10} ... {:<3} yen".format("Kiwi fruit", 120))
print("{:>10} ... {:<3} yen".format("Banana", 99))

#### 表示桁数
表示する桁数を `{:.3}` のように `{:.桁数}` の形式で指定できる．ここでの「表示する桁数」とは，正確に言えば，有効数字の数，つまり，先頭のゼロが続く部分 0.000... を除いた後の，整数部（あれば）の桁数 + 小数点以下の桁数 である．

In [None]:
print(" 2 ÷ 3 ≒ {:.3}".format(2 / 3))
print("20 ÷ 3 ≒ {:.3}".format(20 / 3))

上の例のように，表示する桁の一つ下で四捨五入した結果が埋め込まれる．

`{:10.5}` のように，表示幅に続けて桁数を指定することもできる（この場合「幅10文字分の中に5桁まで表示」の意味）．

In [None]:
print("2 ÷ 3   ≒ {:10.4}".format(2 / 3))
print("2 ÷ 0.3 ≒ {:10.4}".format(2 / 0.3))

### 練習4.8: 式付きの九九の表
`format` を使いながら，以下のものと同じ，左辺の式も含めた九九の表を表示せよ：
```
1x1= 1, 2x1= 2, 3x1= 3, 4x1= 4, 5x1= 5, 6x1= 6, 7x1= 7, 8x1= 8, 9x1= 9
1x2= 2, 2x2= 4, 3x2= 6, 4x2= 8, 5x2=10, 6x2=12, 7x2=14, 8x2=16, 9x2=18
1x3= 3, 2x3= 6, 3x3= 9, 4x3=12, 5x3=15, 6x3=18, 7x3=21, 8x3=24, 9x3=27
1x4= 4, 2x4= 8, 3x4=12, 4x4=16, 5x4=20, 6x4=24, 7x4=28, 8x4=32, 9x4=36
1x5= 5, 2x5=10, 3x5=15, 4x5=20, 5x5=25, 6x5=30, 7x5=35, 8x5=40, 9x5=45
1x6= 6, 2x6=12, 3x6=18, 4x6=24, 5x6=30, 6x6=36, 7x6=42, 8x6=48, 9x6=54
1x7= 7, 2x7=14, 3x7=21, 4x7=28, 5x7=35, 6x7=42, 7x7=49, 8x7=56, 9x7=63
1x8= 8, 2x8=16, 3x8=24, 4x8=32, 5x8=40, 6x8=48, 7x8=56, 8x8=64, 9x8=72
1x9= 9, 2x9=18, 3x9=27, 4x9=36, 5x9=45, 6x9=54, 7x9=63, 8x9=72, 9x9=81
```

* 上の例では各行の最初に空白があるが，その空白は不要
* 答えの部分（= の後）は幅２文字分で右寄せにする
* 式と式の間はカンマと空白ひとつで区切る

ヒント:
* 文字列の後で改行せずに print するには `print(文字列, end="")` とすればよい
* 何も表示せず，ただ改行だけするには，引数なしで `print()` とすればよい
* 1行全部を`format`でいっぺんに作るのではなく `2x4= 8` のような式を1つずつ`format`で作って表示するのが簡単である

注意：Chrome だと表示が崩れる（位置が揃わない）ことがあるようです．その場合は Safari で Notebook を開きなおしてください．下の周期表の問題も同じ．

In [None]:
# *** 実装しなさい ***


### 練習4.9: 周期表
以下のセルの `elements` は，元素記号を H （水素，原子番号1）から Xe (キセノン，原子番号54）まで並べたリストである．

また，`table` は[周期表](https://ja.wikipedia.org/wiki/%E5%91%A8%E6%9C%9F%E8%A1%A8)で各行，各列に配置される元素の原子番号を表す２重リストである．要素 0 は，そのマスには元素が入らない（空欄）であることを意味する．

これらを組み合わせて用い，以下のように周期表を表示せよ．
```
 H                                                  He
 Li Be                               B  C  N  O  F  Ne
 Na Mg                               Al Si P  S  Cl Ar
 K  Ca Sc Ti V  Cr Mn Fe Co Ni Cu Zn Ga Ge As Se Br Kr
 Rb Sr Y  Zr Nb Mo Tc Ru Rh Pd Ag Cd In Sn Sb Te I  Xe
```
* 各行の最初の空白はいくつでもよい（が，全ての行で同じ数の空白を最初に入れること）
* それ以外の，元素記号の間の空白の個数や，1文字の元素記号と2文字の元素記号の位置関係などは完全に再現せよ

In [None]:
elements = ["H", "He", "Li", "Be", "B", "C", "N", "O", "F", "Ne",
            "Na", "Mg", "Al", "Si", "P", "S", "Cl", "Ar",
            "K", "Ca", "Sc", "Ti", "V", "Cr", "Mn", "Fe", "Co", "Ni", "Cu", "Zn",
            "Ga", "Ge", "As", "Se", "Br", "Kr", "Rb", "Sr", "Y", "Zr", "Nb", "Mo",
            "Tc", "Ru", "Rh", "Pd", "Ag", "Cd", "In", "Sn", "Sb", "Te", "I", "Xe"]
table = [
    [ 1,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  2],
    [ 3,  4,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0,  5,  6,  7,  8,  9, 10],
    [11, 12,  0,  0,  0,  0,  0,  0,  0,  0,  0,  0, 13, 14, 15, 16, 17, 18],
    [19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36],
    [37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54]
]

# *** ここ以下に周期表を表示するプログラムを追加する ***


---
お疲れ様でした．以上で今回の必須課題は終わりです．

## 課題提出の前の注意
* かならずメニューの "Run" から "Run All Cells" を選択し，全てのセルが正しく実行されることを確認すること
  * <font color="red">"Run All Cells" したとき，`input` 関数を使っているセルでは入力フィールドに何か入れるまで実行が先に進まないので，適当に入力して最後まで実行させること</font>
* "Run All Cells" を実行したら，各セルの実行結果が表示されている状態で保存のボタンを押してノートブックを保存すること
* 上記のようにして，実行結果まで含めて保存してからノートブックを提出すること．
* 以下の「チャレンジ課題」は余力がある人のための課題です．セルを正しく実装して提出すれば加点します．

## ６．チャレンジ課題集
文字列処理の応用練習をしましょう．

### チャレンジ課題4.10：整数の漢字表記
整数を入力して，その漢字表記を出力する関数を作りたい．例えば
* 123 $\rightarrow$ 百二十三
* 1232525 $\rightarrow$ 百二十三万二千五百二十五

のように変換したい．入力としては1以上，9,999,999,999,999,999（9999兆9999億9999万9999）まで受け付けるようにする．

**準備 1**: まず整数 $n \; (1\le n \le 9)$ が入力されたとき対応する漢字を返す関数 `kanji(n)` を実装しましょう：

In [None]:
# 入力:
#  n : 1 から 9 までの整数
# 出力:
#  n の漢字表記（一, ニ, ..., 九 のいずれか）
def kanji(n):
    # *** 実装しなさい ***
    # 以下はダミーの実装です．課題に取り組む人は削除してください．
    return ""

実装できたらテストしましょう：

In [None]:
for n in range(1, 10):
    print("{} -> {}".format(n, kanji(n)))

**準備 2**: 正の整数 $n$ とゼロ以上の整数 $r$ を入力したとき，$n$ の十進表記の $10^r$ の位の数を返す関数 `digit_at(n, r)` を実装しなさい．つまり，`digit_at(n, 0)` は `n` の一の位，`digit_at(n, 1)` は十の位，... を返す．
$10^r > n$ のときは 0 を返すようにしましょう．

例）
* `digit_at(567, 0)` → `7`
* `digit_at(567, 1)` → `6`
* `digit_at(567, 2)` → `5`
* `digit_at(567, 3)` → `0`

In [None]:
def digit_at(n, r):
    # *** 実装しなさい ***
    # 以下はダミーの実装です．課題に取り組む人は削除してください．
    return 0

テストしましょう：

In [None]:
print(digit_at(567, 0) == 7)
print(digit_at(567, 1) == 6)
print(digit_at(567, 2) == 5)
print(digit_at(567, 3) == 0)

ここからが本題．

**Step 1**: まずは，入力された 1 から 9999 までの整数に対して，その漢字表記を返す関数 `thousands` を実装しましょう．

実行例：
* `thousands(9876)` → `"九千八百七十六"`
* `thousands(12)` → `"十二"`
* `thousands(102)` → `"百二"`

ヒント（ダブルクリックで表示）
<!--
以下の手順でできるでしょう．
1. 空の文字列 s = "" を用意する
2. 千の位の数を d とする
   もし d == 0 ならば
       何もしない
   もし d == 1 ならば
       s += "千"  #  "一千" にはしない
   それ以外ならば
       d を漢字に変換したものを c として
       s += c + "千"
3. 百の位，十の位についても同様にする
4. 一の位については...考えてみてください
5. s を返す: return s

* 千の位～十の位の処理（上の 2. と 3.）は
  ループにまとめることができる
* 少し工夫すれば一の位の処理もループにまとめれらる
-->

In [None]:
# 入力：
#   n : 1 <= n <= 9999 の整数
# 出力:
#   n の漢数字表記
def thousands(n):
    # *** 実装しなさい ***
    # 以下はダミーの実装です．課題に取り組む人は削除してください．
    return ""

`thousands(n)` が実装できたら，テストしましょう：

In [None]:
print(thousands(9876) == "九千八百七十六")
print(thousands(12)   == "十二")
print(thousands(102)  ==  "百二")
print(thousands(1000) == "千")

**Step 2**: 1 ～ 9999兆9999億9999万9999 の範囲の数 `n` を受け取り，その漢字表記を返す関数 `num_to_kan(n)` を実装しましょう．

「○○兆」「○○億」「○○万」「○○（千の位以下の部分）」の「○○」の部分は上で実装した `thousands` を使えば全て同じように作れることが分かるでしょう．ただし「○○」の部分がゼロの場合は特別あつかいが必要です．

「○○兆」の部分，「○○万」の部分，... を入力 `n` から取り出すにはどうしたらよいか．下の例を見て考えてください．

* 12345678 の「○○万」の部分 = 12345678 を 10000 で割った商 = `12345678 // 10000` = `12345678 // (10 ** 4)` = 1234
* 12345678 の千の位以下の部分 = 12345678 を 10000 で割った余り = `12345678 % 10000` = 5678
* 111122223333 の「○○万」の部分 = 11112222 の千の位以下の部分 = `(111122223333 // (10 ** 4)) % 10000` = 2222

In [None]:
def num_to_kan(n):
    # *** 実装しなさい ***
    # 以下はダミーの実装です．課題に取り組む人は削除してください．
    return ""

実装できたら，いくつかの数をいれて試してみましょう：

In [None]:
print(num_to_kan(99_0208_3932_8492))
print(num_to_kan(1000000))
print(num_to_kan(1111222233334444))

もう少しテストしましょう：

In [None]:
# Python の整数は適当に _ を挟んで書ける：1_2_3 と 123 は同じ
print(num_to_kan(1234_5678_1234_5678) == '千二百三十四兆五千六百七十八億千二百三十四万五千六百七十八')
print(num_to_kan(1000_0000_0001_0000) == "千兆一万") 
print(num_to_kan(9080_0101) == "九千八十万百一")

### チャレンジ課題4.11: 数の読み上げ
1 ～ 9999万9999 の範囲の数 `n` を受け取って，その読み方を**ひらがな表記**で返す関数 `num_to_yomi(n)` を実装しましょう．

実行例：
* `num_to_yomi(12)` → `"じゅうに"`
* `num_to_yomi(801)` → `"はっぴゃくいち"`
* `num_to_yomi(12345678)` → `"せんにひゃくさんじゅうよんまんごせんろっぴゃくななじゅうはち"`

いろいろな方針が考えられますが，次のようにやってみましょう．
* 1～9 の数の読みを返す関数 `yomi_1` を作る
* 1～99 の数の読みを返す関数 `yomi_10` を，`yomi_1` を利用しながら作る
* 1～999 の数の読みを返す関数 `yomi_100` を，`yomi_1`, `yomi_10` を利用しながら作る
* 1～9999 の数の読みを返す関数 `yomi_1000` を，`yomi_1`～`yomi_100` を利用しながら作る
* 8桁以下（9999万9999以下）の数の読みを返す関数 `num_to_yomi` を作る

**Step 1**: まずは一けたの数字の読みを返す関数 `yomi_1(n)` を実装しましょう．

* 「4」は「よん」「し」両方ありますが，「400」は「しひゃく」とは読めないので「4」は「よん」にしておくのが便利でしょう．
* 「0」が入力されたときは空文字列 `""` を返すようにしておくと後で便利かもしれません．

In [None]:
def yomi_1(n):
    # 実装しなさい
    # 以下はダミーの実装です．課題に取り組む人は削除してください．
    return ""

テスト：

In [None]:
for n in range(10):
    print("{} -> {}".format(n, yomi_1(n)))

**Step 2**: つぎに，二けた以下（一けたの場合もある）数の読みを返す関数 `yomi_10(n)` を実装しましょう．

二けたの数の読みは「十の位の読み ＋ 一の位の読み」だから `yomi_1(n // 10) + "じゅう" + yomi_1(n % 10)` になる場合が多いですが，

* 「12」は「いちじゅうに」ではなく「じゅうに」
* 入力が一けたの場合も正しく処理できるようにする

に気を付ける必要があります．

In [None]:
def yomi_10(n):
    # 実装しなさい
    # 以下はダミーの実装です．課題に取り組む人は削除してください．
    return ""

テストしましょう：

In [None]:
# 適当にテストを書いて試しなさい

**Step 3**: 三ケタ以下の数の読みを返す関数 `yomi_100(n)` を実装しましょう．

* 「100」は「いちひゃく」ではなく「ひゃく」
* 「300」は「さんひゃく」ではなく「さんびゃく」
* 「600」「800」は「ろくひゃく」「はちひゃく」ではなく「ろっぴゃく」「はっぴゃく」

に気を付ける必要があります

In [None]:
def yomi_100(n):
    # 実装しなさい
    # 以下はダミーの実装です．課題に取り組む人は削除してください．
    return ""

**Step 4**: 四ケタ以下の数の読みを返す関数 `yomi_1000(n)` を実装しましょう．

千の位の読みのうち，気を付けなければならないのはどの場合でしょう？

In [None]:
def yomi_1000(n):
    # 実装しなさい
    # 以下はダミーの実装です．課題に取り組む人は削除してください．
    return ""

**Step 5**: 八ケタ以下（9999万9999以下）の数の読みを返す関数 `num_to_yomi(n)` を実装しましょう．

In [None]:
def num_to_yomi(n):
    # 実装しなさい
    # 以下はダミーの実装です．課題に取り組む人は削除してください．
    return ""

すべて実装できたら，いくつかの数について試して見ましょう：

In [None]:
test_eq(num_to_yomi(11), "じゅういち", True)
test_eq(num_to_yomi(34), "さんじゅうよん", True)
test_eq(num_to_yomi(301), "さんびゃくいち", True)
test_eq(num_to_yomi(450), "よんひゃくごじゅう", True)
test_eq(num_to_yomi(610), "ろっぴゃくじゅう", True)
test_eq(num_to_yomi(888), "はっぴゃくはちじゅうはち", True)
test_eq(num_to_yomi(1100), "せんひゃく", True)
test_eq(num_to_yomi(1234), "せんにひゃくさんじゅうよん", True)
test_eq(num_to_yomi(3210), "さんぜんにひゃくじゅう", True)
test_eq(num_to_yomi(8601), "はっせんろっぴゃくいち", True)
test_eq(num_to_yomi(32105678), "さんぜんにひゃくじゅうまんごせんろっぴゃくななじゅうはち", True)

<!-- **さらに拡張**: 16桁以下（9999兆9999億9999万9999）の数まで対応するように `num_to_yomi(n)` を拡張しなさい．-->
## 課題提出の前の注意
* かならずメニューの "Run" から "Run All Cells" を選択し，全てのセルが正しく実行されることを確認すること
* "Run All Cells" を実行したら，各セルの実行結果が表示されている状態で保存のボタンを押してノートブックを保存すること
* 上記のようにして，実行結果まで含めて保存してからノートブックを提出すること．
* 以下の「チャレンジ課題」は余力がある人のための課題です．セルを正しく実装して提出すれば加点します．

**入門編４：おわり**