# 文字列を使う

はじめにことばありき。文字は人類最大の発明と言われています。文字を使うことで、いろいろな情報を扱い、伝えることができます。

数や記号を組み合わせて記述する数値も文字の一種です。ただ、数値はたいてい、何を表す数かという情報を伴ってはじめて意味を持ちます。そのためには、もっと たくさんの種類の文字を使う必要があります。 

例えば、「36」という数字だけでは何を表現しているのかよくわかりません。 「36°C」と文字を添えることで、数値が温度を表現していることがわかります。 

同じ温度でも、さらに文字を付け加えることで意味が違ってきます。「体温が 36°C」であればなにも問題ありませんが、「気温が36°C」ならたいていの人がうんざりするはずです。文字を使うことによって、より明確で詳しい情報を伝えることができるわけです。

プログラムでは、文字の集まりを**文字列**として扱います。「Python」、「VI号重戦車ティガーI」といった単語や固有名詞は文字列の一種です。「この世にあるすべては変化し何事も同じではない」というような文章も文字列ですし、小説や論文のような長い文章も文字列として扱うことができます。

![](PyIntro-02-fig3.png)

## 文字列を定義する

Pythonで文字列を定義して、変数に入れてみましよう。文字列を定義するためには、**ダブルクォーテーション**("〜")、または**シングルクォーテンション**('〜'）を使い、これらを引用符と言います。最初の引用符を、最後の引用符で閉じた(囲 んだ)範囲が文字列になります。

#### 〔構文〕文字列の定義方法

    “文字列”

引用符は必ずペアになっている必要があります。1つだけで閉じ忘れてしまうと、 どこまでが文字列かわからず、エラー(SyntaxError、文法エラー)になってしまいます。

Jupyter Notebookを使って、1つ引用符（'や"）を入力するとカーソルの先にもう1つ引用符が自動的に入力されます。これは文字列の入力補助機能です。片方の引用符を入力した後、そのまま文字列を入力すればよいわけです。うっかり引用符を消してしまわない限り、閉じ忘れてエラーを起こす心配がないので便利です。

ただしWebブラウザによってはこの機能が正常に機能しないものがあります。 たとえばGoogle Chromeでは問題ありませんが、Safariでは適切な補完が行われません。うまく機能しない場合はデフォルトのWebブラウザを変更してください。

文字列を定義して、変数に代入してみましよう。


In [17]:
spam = "spam"

Pythonでは、変数を扱うときも「`spam`」のように文字の集まりを使います。文字列は引用符で囲むのに対して、変数名はむき出しでプログラムに書きます。このようにして、変数名と文字列データ(文字列リテラル)を区別しているわけです。

Jupyter Notebookを使うと、引用符で囲まれた文字列の部分は色づけされて表示されます。シンタックスカラーリングという入力補助機能が働いているためです。

アルファベットだけでなく、日本語も文字列として扱えます。前の例と同じよう に、日本語の文字を引用符で囲むだけです。

    


In [16]:
a_lylic = "でもね私のエネルギーは"

## 文字列の連結

文字列と文字列の足し算をすると、文字列同士を**連結**する(つなげる)ことがで きます。

![](PyIntro-02-fig4.png)

先ほど定義した`a_lylic`という変数を使って、実際に試してみましよう。

    

In [15]:
a_lylic = a_lylic+"すでにインフィニティだよ。"

この例では、変数に入った文字列に別の文字列を足しています。2つの文字列を 足した結果を、イコールを使って元の変数に代入しています。結果として、元の変数の内容が、2つの文字列をつなげた新しい文字列に置き換わります。セルの最後の行で変数名だけを入力して変数の内容を表示し、変数の内容が変わっているか確認してみましよう。

### 文字列を連結する

    a_lylic = "でもね私のエネルギーは"
    a_lylic = a_lylic+"すでにインフィニティだよ。"
    alylic

In [12]:
# コードを打ち込んで実行してみよう

文字列を連結した結果を、変数に代入して受け取る、というところがポイントです。

セルの下に表示された文字列はシングルクォーテーション（`'`）で囲まれているのが見えるでしようか。表示しているデータは文字列であるということがわかるように、このように表示されています。

また、コードではダブルクォーテーション(")を使って文字を囲んでいますが、 表示された文字列ではシングルクォーテーションに変わっています。前述のとおり、Pythonではどちらの引用符でも文字列を定義できるのですが、シングルクォーテーションはグレイヴ・アクセント（\`）と間違えやすいので、サンプルコードでは ダブルクォーテーションを使っています。

## 複合演算子

変数を使って、ある文字列に別の文字列を連結するというようなコードをプログラムではよく書きます。先ほど見た例では、変数に別の文字列を足して、その結果 作られたコピーを変数に代入するというコードを書きました。

このコードを、もっとシンプルに書く方法があります。`+=`という、`+`演算子と代入のイコールをつなげた演算子を使うのです。この演算子を使うと、足す(連結する)操作と、代入する操作を一度に実行できます。見た通りの機能を持っているわけです。

![](PyIntro-02-fig5.png)

この演算子を使って、文字列を連結するコードを書いてみましよう。

### 複合演算子を使ってみる

    1ylic2 = "ずっと笑顔ばかりを選んで"
    1ylic2 +="泣き顔見せるのを迷ってた"
    1ylic2


In [12]:
# コードを打ち込んで実行してみよう

この演算子は、演算と代入の2種類の処理をあわせ持っていることから**複合演算子**と呼ばれています。複合演算子は、文字列だけでなく、数値など他のデータでも使えます。

文字列の演算では、「`+=`」がよく使われます。数値型では、マイナスとイコールを合わせた複合演算子なとが使われます。Pythonでは、次のような複合演算子を使えます。

### 複合演算子

|演算子|説明|
|:--:|:--|
|+=|足し算、連結をして代入する|
|-=|引き算をして代入する|
|\*=|かけ算をして代入する|
|/=|割り算をして代入する|

複合演算子を使う上で注意すべきことがあります。定義されていない変数に対して、複合演算子を使うことはできないのです。Pythonでは代入をすると変数が定義されます。つまり、複合演算子を使う前に、変数に値を代入しておく必要があるということです。

複合演算子を使うと、Pythonは代入を行う前に演算をしようとします。演算をするには、左側に置いた変数の中に入っているデータの値を見る必要がありますが、未定義の変数だと、データが取り出せません。このため、未定義の変数に対して複合演算子を使うと、エラーになってしまうのです。

また、プログラミング言語の中には、**`++`**や**`--`**というような演算子を持っているものがあります。それぞれ変数に1を足す、1を引くという機能を持った演算子で すが、Pythonにはこのような演算子はありません。

### 文字列定義の応用

Pythonでは、「`"`」のように1つのクォーテーションをペアにして文字列を定義することができます。 また、クォーテーションを3つ連ねた三連クォーテーションをペアにして使えば、 改行を含む文字列を定義することができます。


In [18]:
lylic3 = """
強い人になろうとして
弱い僕を封じ込めて
ひとりぼっちになった"""

## 型を揃えるPythonの流儀

数値や文字列のように、プログラムではいろいろな種類のデータを扱います。 データは、目的や性質によって種類に分けられています。データの種類のことを、 **型（type）**と呼ぶことがあります。「数値」や「文字列」のような、データの種類に「型」という語を補って、**数値型**、**文字列型**という呼び方をすることがあります。データの種類のことを、まとめて**データ型**と呼ぶことがあります。

先ほど、文字列と文字列を足して連結するという例を示しました。では、文字列 と数字を足し算したら、つまり、**型の違うデータ同士で足し算**をしたらどうなるでしょうか。

変数に日数が入っていて、そこに「日」という文字列を足して「24日」のような文 字列を作ることを考えます。次のようなコードをPythonで書いてみました。このコードを実行してみましよう。

### 違うデータ型を足し算した場合の工ラー


In [19]:
day = 24
date = day+"日"

TypeError: unsupported operand type(s) for +: 'int' and 'str'

Jupyter Notebookの出力部分にエラーが出てしまいました。エラーの内容が英語で書かれています。簡単に翻訳すると、**数値と文字列を十で計算することはできません**、というような内容のエラーです。

数値に文字列を連結しようとしているわけですから、数値を自動的に文字列に変換してくれてもいいような気がします。事実、異なる型のデータをなんとなくうまいこと扱ってくれるJavaScriptやPHPのようなプログラミング言語も存在します。しかし、そうならないのが**Pythonの流儀**なのです。

Pythonでは基本的に、数値なら数値とだけ、文字列なら文字列とだけ計算ができるようになっています。つまり、**型を揃えて操作をする**のがPythonの流儀なのです。なぜそうなっているかというと、利点が多いからです。

ここで、100と8924という2つの数字があったとします。この2つの数字は、状況によって異なった扱われ方をします。

例えば、長さや重さのように、単位を持った数量かもしれません。この場合は、 数値として計算をします。

または、郵便番号のように2つの番号をそのまま表記して意味を成す数かもしれません。その場合は、文字列として扱います。「100-8924」は国会議事堂（衆議院）の郵便番号です。これを数値の式として扱ってしまうと、引き算の式になってしまいます。郵便番号を引き算してマイナスの数値にすると、意味が失われてしまいます。

プログラムで**何をしたい**か、またデータがどんな**性質**を持っていて、どのように扱うべきか、ということは、状況によって異なります。プログラミング言語側がデータをどう扱うかを勝手に決めるのではなく、**プログラムを書く人間が明確に決める**というのがPythonの流儀なのです。



## 文字列と数値の変換（型変換）

先ほどの例のように、数値を文字列として扱って他の文字列と連結したい場合には、Pythonではどうすればいいでしようか。この場合、数値を文字列に変換します。 データの種類を揃えて、文字列と文字列の連結をしたいということを、明確にしてプログラムを書くのです。

データの種類を変換することを**型変換**と呼びます。数値を文字列に変換するのも型変換です。

Pythonで型変換をするには、関数を使います。関数を使うと、データを加工するというような処理を実行できます。



