# データの種類を決める「型」を理解する
- このセクションで学ぶこと
    - 文字列
    - データの種類と型
    - 概念としての型、実データとしての値
    - 関数（詳細は3章）
    - type関数で型を調べる方法
    - キャストを使った型の変換方法

## 文字列
- テキストデータは「文字列」と呼ばれる。文字が１つの字でそれが列（複数）となるので文字列
- 1文字もない（空文字と呼ばれる）や1文字でも文字列と呼ばれる
- 文字列は「シングルクォーテーション（'）」か「ダブルクォーテーション（"）」でテキストを囲うことで宣言できる。Pythonではシングルクォーテーションを使うのが一般的

In [1]:
a = 'h'
b = 'hello'
c = 'hello world'
d = "hello 123"
e = ''

## 文字列の演算
- 文字列も数値も同じように演算できる
- ただし足し算（結合）できるが、引き算はできない
- 数値の「123」と文字列「'123'」はデータの種類が異なるので同じではない

In [2]:
'abc' + '123'

'abc123'

In [3]:
'123' + '456'

'123456'

In [4]:
a = '123'
a += '456'
a

'123456'

In [5]:
456 - 123

333

In [6]:
'456' - '123'

TypeError: unsupported operand type(s) for -: 'str' and 'str'

## 日本語の文字列
- Python3では日本語の文字列も使える。Python2は日本語が苦手
- アルファベットと異なり「文字コード（Shift-JISうあUTF-8など）」
- Python3のデフォルト文字コードはUTF-8なので「Pythonでは常にUTF-8を使う」とルール化するのが一般的
- Shift-JISなどを含んだ日本語の詳細は7章で扱う

In [7]:
'あいうえお' + 'かきくけこ'

'あいうえおかきくけこ'

## 概念とデータ - 型が持つ2つの性格
- 「123」と「'123'」の演算は異なる動きとなった
- これは両者の値の「型（データの種類）」が異なるため
- 型が「データの概念レベル」で値が「実際のデータ」
- どの型がどういった処理をできるか覚えるのが最初のプログラミングの最初の一歩

## 関数
- 「受け取った値」に対しいぇ「決められた処理」を行い、「結果を返す」仕組みをプログラミングでは「関数」と呼ぶ
- 「結果を受け取る変数 = 関数名（関数に与える値）」という書式で使うのが一般的
- 関数に与える値のことを「引数」と呼び、関数から返される値を「返り値」と呼ぶ
- 関数の詳細は第3章で扱う

In [8]:
print(15)

15


In [9]:
print('hello world')

hello world


## type関数を使った型の確認
- Pythonは「あまり型にうるさくない言語」
    - メリット：気軽にコーディングをおこなえる
    - デメリット：変数に入っている型が想定していたものと違うといったトラブルがある
- 「type関数」を使うことで変数の型を確認できる
- 拘束性は高くないが変数名に型を宣言することも可能（割愛）

In [10]:
a = 10
type(a)

int

In [11]:
a = 'hello'
type(a)

str

## キャストを使った型の変換
- プログラミングでは型を変換する場面が多々ある
- たとえば「文字列型の値と整数型の値は結合できない」ので整数型を文字列型に変換してから結合など
- 型の変換のことを「キャスト」と呼ぶ

In [12]:
price = 100
# 数値と文字列型の結合でエラー発生
price + 'yen'

TypeError: unsupported operand type(s) for +: 'int' and 'str'

## キャストを使った型の変換
- 文字列型への変換には「str関数」を使う
- 整数型への変換には「int関数」を使う
- 文字列から数値へのキャストは変換できれば成功し、変換できない場合は失敗する

In [13]:
price = 100
str(price) + ' yen'

'100 yen'

In [14]:
int('100')

100

In [15]:
int('hello')

ValueError: invalid literal for int() with base 10: 'hello'

## コラム：シングルクォートとダブルクォート
- ダブルクォートの文字列内ではシングルクォートが使え、シングルクォートの文字列内ではダブルクォートがつかえる
- そのため、以下の使い分けがおすすめ
    - 通常時：シングルクォート（Pythonでは一般的なため）
    - 文字列内にシングルクォートを持つ場合：ダブルクォート
- エスケープシーケンス（後述）を使うことでシングルクォートの文字列内でシングルクォートを使うこともできる。ダブルクォートも同様

In [16]:
'hello I'm Taro'

SyntaxError: invalid syntax (<ipython-input-16-e495b37e0303>, line 1)

In [17]:
"hello I'm Taro"

"hello I'm Taro"

In [18]:
'hello I\'m Taro'

"hello I'm Taro"

## 演習
- 値「123」と値「'123'」の違いを説明してください
- 「'123'+'123'」の結果がどうなるか確認し、キャストを使って結果が246になるように式を変更してください
- 数値「1.1」の型をtype関数で確認してください

In [19]:
int('123') + int('123')

246

In [20]:
type(1.1)

float