注：このページはPython2.6以降のバージョンを対象に書かれています。

# 文字列操作
## string型
Pythonで文字列を扱うための組み込みクラスとして、**string**という型があります。別の言い方として、**文字列型**や**str**などと呼ばれることもあります。  
大概の文字列操作はこのクラスだけで出来ちゃうので、マスターするとファイル入出力などで困ることがぐっと減ります。数値をフォーマットして文字列に変換したり、必要な部分を抜き出したり、特定文字を区切り文字として複数の文字列に分割したりと多機能なクラスです。


In [1]:
s = "hello"
type(s)

str

Cでの**char**やFortranでの**character**と違い、文字そのものも長さが１の文字列として扱います。事前に配列を定義する必要があったり、結合しているうちに最初に定義した配列サイズを超えるといったことはなく、直感的な操作が可能です。

### 文字列の結合

多くのスクリプト言語と同様に、文字列を結合するためには**+**記号を使います。

In [2]:
"hello" + "," + "world"

'hello,world'

ここで一つ注意しなければならないのは、**int**や**float**といった数値の型はstring型と「＋」を用いた結合ができないということです。数値をstring型と結合するためには、数値をstring型に明示的にキャスト（型の変換）する必要があります。

In [3]:
# 1 + "a"　#TypeError
str(1) + "a"

'1a'

このような少し面倒な仕様になっているのは、意図していない結合をした場合に必ずエラーが出るようにするためです。  
CやFortranのように型を事前に指定して変数を定義するコンパイル言語と違い、Pythonを始めとしたスクリプト言語では、変数に異なる型を代入できるために、間違った型を入れたままコードを書いてしまうことがあります。  
一例を上げると、

In [4]:
num1 = 1
num2 = "3" #ファイルからの読み取りの際、stringのままに変数に保存
num1 + num2 #TypeError

TypeError: unsupported operand type(s) for +: 'int' and 'str'

このコードを書いた人は最後の行では何をしようとしたのでしょうか？可能性は２つあります。  
- num1, num2のどちらも**string**だと思って計算し、出力では「13」を出そうとした
- num1, num2のどちらも**int**だと思って計算し、出力では「4」を出そうとした

もちろん、Pythonのインタプリタ（コードを一行ごと読み込んで実行するもの）はどちらが本来意図されていたかを知る由もないのでエラーを吐き出すわけです。  
この面倒な仕様は、スクリプト言語の宿命とも言える産物なのです。

### format関数
上記のような宿命は納得したとしても、さすがに毎回キャストするのは面倒です。
２つの文字列を結合するぐらいならキャストでいいかもしれませんが、大抵の場合、もっと多くの文字列を結合したいはずなので、これを簡単にする関数として**str.format**が用意されています。  
複数の文字列、数値などを連結する場合に非常によく使います。特に、科学技術計算などで数値をフォーマット（桁数を指定するなど）する際に役立ちます。  
生の文字列もstringなので、実は関数を呼び出すことができ、format関数を使うときには大抵このように記述します。

In [5]:
"正の整数で一番小さいものは、「{}」".format(1)

'正の整数で一番小さいものは、「1」'

基本的にformat関数は、文字列中の「{ }」の場所に、引数をstringにキャストして埋め込むという機能を持ちます。  
formatの引数は複数入れることも可能で、その場合、引数の個数に対応した「{}」を文字列の中に含んでいなければなりません。  
「{ }」の中に埋め込みたい引数の位置を明示的に番号で与えることもできます。

In [6]:
num1 = 1
num2 = 3
"{} + {} = {}".format(num1, num2, num1 + num2)

'1 + 3 = 4'

In [7]:
"{0} {1} {2} {1}".format("一個目","二個目","三個目")

'一個目 二個目 三個目 二個目'