# 文字と情報

人類の扱う情報の大半は、文字によって伝えられます。したがって、文字や文字列を扱うことは、情報処理の基本中の基本と言えます。今回は、Pythonの文字列処理を練習しましょう。





## 文字と文字**列**

文字は、コンピュータの内部では、文字コードと呼ばれる番号で表現されています。

![ascii-fs8.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/57754/a3570dc4-ba9d-26a1-39e3-2ee18a50ae56.png)

文字コードは覚える必要はありません。Python の関数で相互に変換することができます。

__文字コードcから文字へ__: `chr(c)`


In [1]:
chr(65)

'A'

__文字cから文字コードへ__: `chr('A')`

In [None]:
65

<div class="alert alert-info">

Pythonの文字

Pythonでは、文字は1文字長の文字列に過ぎません。ユニコードに対応しているため、日本語も１文字として扱うことができます。

</div>

文字 `c` の種類の判定は文字コードに基づいておこないます。
Python は便利な文字列メソッドも用意してくれているので、通常は２つ目の書き方を使います。

__数字の判定__
```
'0' <= c and c <= '9'   # もしくは、c.isdigit()
```

__英大文字の判定__
```
'A' <= c and c <= 'Z'　# もしくは、c.isupper()
```

__英小文字の判定__
```
'a' <= c and c <= 'z' # もしくは c.islower()
```



### 文字列

文字列は、文字通り、文字の列です。
リストと同じように、文字列を先頭から数えて i 番目の文字のように取り出すことができます。

__例. 文字列の最初の文字__

In [2]:
s = "ABC"
s[0]   # 最初の1文字

'A'

Python は、文字と文字列を区別しません。文字は長さ 1 の文字列となります。`"A"`も`'A'`もどちらも文字列リテラルです。文字列`s`の長さは、リストと同様に`len(s)`で得られます。

In [None]:
s = 'Hello, World'
len(s)

特殊な文字は、エスケープシーケンスで表現できます。

|エスケープシーケンス|意味 |
|----|----|
|`\\`|	バックスラッシュ|
|`\'`|	一重引用符|
|`\"`|	二重引用符|
|`\a`|	ASCII 端末ベル|
|`\b`|	ASCII バックスペース|
|`\f`|	ASCII フォームフィード|
|`\n`|	ASCII 行送り|
|`\r`|	ASCII 復帰|
|`\t`|	ASCII 水平タブ|
|`\v`|	ASCII 垂直タブ|
|`\xhh`|	16進数hhを持つASCII文字|
|`\Uxxxxxxxx`|	32ビットのUnicode文字|


In [None]:
s = 'Hello\nWorld\n'
len(s)

複数行にわたる文字列(テキスト)は、トリプルクオート(`'''`, `"""`)で囲むことでも記述できます。

In [None]:
s = """
吾輩は猫である
名前はまだない
"""
len(s)

### 文字列と文字リスト

Pythonのデータ構造は、オブジェクト指向プログラミングの設計手法にしたがって、操作がよく共通化されています。例えば、列の特徴があるデータ構造は、全て`len()`で列の長さが取れ、インデックスで$n$番目の値が得られるようになっています。


In [None]:
s = "abc"
print(len(s))
print('s[0]', s[0])
print('s[-1]', s[-1])



In [None]:
a = ['a', 'b', 'c']
print('len(a)', len(a))
print('a[0]', a[0])
print('a[-1]', a[-1])


文字列と「文字のリスト」の大きな違いは、破壊的な操作、つまり変更できるかどうかにあります。
リストは変更できますが、文字列は変更できません。

<div class="alert alert-info">

不変性

値が変更できないこと

</div>

もし文字列の並びを変更したいときは、文字列を文字リストに変換して操作することができます。

* 文字列から文字リストに変換する: `cs = list(s)`
* **文字リストを変更する**
* 文字リストから文字列に戻す `s = "".join(cs)`

<div class="admonition tip">

**例題（文字列のソート）**

入力された文字列をアルファベット順（文字コード順）に並べ変えた文字列にしよう。

入力例：
```
hello
```

出力例：
```
ehllo
```
</div>

文字列を文字のリストに変換し、`sort()`でソートします。
ソートしたのち、再度、文字列に変換して戻します。

In [3]:
s = "hello"
cs = list(s)  # 文字のリストに変換
cs.sort()
s = ''.join(cs) # 文字列に変換
print(s)

ehllo


## 文字列操作

文字列は、メソッドを使って文字列操作することができます。
Pythonは、便利なメソッドが揃っているので是非使えるように練習しておきましょう。

|**基本操作**||
|--|--|
|`len(s)`|文字列`s`の文字数|
|`s[i]`|文字列`s`の`i`番目の文字|
|`s[i:j]`|`i` 番目から `j` 番目までの部分文字列|
|`s[i:]`|`i` 番目から末尾までの部分文字列|
|`s[i:j]`|先頭から`j`番目までの部分文字列|
|`x in s`|文字列sにxが含まれるかどうか|
|`s.find(x)`|文字列s内の最初のxの位置(ない場合は-1)|
|`s.rfind(x)`|文字列s内の最後のxの位置(ない場合は-1)|
|`s.count(x)`|文字列s内のxの出現回数|

|**新しい文字列**||
|--|--|
|`""`|空の文字数|
|`str(e)`|eの文字列表記|
|`f"{e}"`| 書式文字列中に式eを埋め込んだ文字列|
|`s.join(a)`| 文字列リストaをsで連結した文字列|

|**文字列の判定**||
|--|--|
|`s.startswith(x)`|文字列sがxで始まるかどうか|
|`s.endswith(x)`|文字列sがxで終わるかどうか|
|`s.isupper()`|文字列sが英大文字かどうか|
|`s.islower()`|文字列sが英小文字かどうか|
|`s.isdigit()`|文字列sが数字かどうか|

|**文字列の変形**||
|--|--|
|`s + t`|文字列sをtを連結した文字列|
|`s * n`|文字列sをn回連結した文字列|
|`s[::-1]`|文字列sを反転した文字列|
|`s.replace(o, n)`|文字列 s 内の o を n に置き換えた文字列|
|`s.upper()`|文字列 s を英大文字に変換した文字列|
|`s.lower()`|文字列 s を英小文字に変換した文字列|
|`list(s)`|文字列 s の文字リスト|
|`s.split(c)`|文字列 s を c で分割した文字列のリスト|


<div class="admonition tip">

**例題（文字列操作）**

次の文字列を文字列操作によって求める

1. `'Hello'`を全て英大文字に変換する
2. `'Hello'`の中に含まれる`l`の数
3. `'12'`, `'50'`, `'00'`を`':'`で連結した文字列
4. `1,3,4,8`を数字のリスト(`[1,3,4,8]`)に変換する


</div>



## 見本

<div class="alert alert-info">

Let's try

`2 ** (1//2)` が、正しく $\sqrt{2}$ にならない理由を考えてみよう

</div>

まずは、リストを使わなくても解ける問題ですが、リストの練習を兼ねて解いてみましょう。

### 平均点

<div class="admonition tip">

**例題（平均点）**

期末試験は5人受験した。
点数が40点未満の生徒は全員，補習を受け，成績が40点になった。
5人の平均点を求めよ。

入力例：
```
10
65
100
30
95
```

出力例：
```
68
```

[AtCoder (JOI2014 予選)](https://atcoder.jp/contests/joi2014yo/tasks/joi2014yo_a)

</div>

__(解法) リストを使う場合__

1. 期末試験を記録する空の得点リスト `scores` を用意する
2. 5人分繰り返し、点数を読んで、`scores` に追加する 
3. 平均点は `sum(scores) // 5`



|Python|説明|
|--------|-------------|
|`max(a)`|数列`a`の最大値|
|`min(a)`|数列`a`の最小値|
|`sum(a)`|数列`a`の合計値| 


## 演習問題

* [文字列の連結](https://atcoder.jp/contests/abc149/tasks/abc149_a)
* [文字列の比較](https://atcoder.jp/contests/abc152/tasks/abc152_b)
* [文字の置き換え](https://atcoder.jp/contests/abc154/tasks/abc154_b)
* [クリスマスイブ](https://atcoder.jp/contests/abc115/tasks/abc115_a): if文使わずに書いてみよう
* [天気予報](https://atcoder.jp/contests/abc139/tasks/abc139_a)
* [９月９日](https://atcoder.jp/contests/abc073/tasks/abc073_a)
* [アルファベット](https://atcoder.jp/contests/abc171/tasks/abc171_a): 英大文字か英小文字の判定
* [セキュリティコード](https://atcoder.jp/contests/abc131/tasks/abc131_a): 入力しやすい
* [Coffee](https://atcoder.jp/contests/abc160/tasks/abc160_a)
* [しりとり](https://atcoder.jp/contests/abc060/tasks/abc060_a)
* [文字列の置き換え](https://atcoder.jp/contests/abc111/tasks/abc111_a): ちょっと工夫してください
* [エコー](https://atcoder.jp/contests/abc145/tasks/abc145_b): 部分文字列の練習です
* [...](https://atcoder.jp/contests/abc168/tasks/abc168_b): 実用的な文字列処理
* [奇数文字目](https://atcoder.jp/contests/abc072/tasks/abc072_b): スライスでもできます

* [クイズ](https://atcoder.jp/contests/abc184/tasks/abc184_b)