# Pythonのデータ型

ここでは，この講座でよく利用するPythonのデータ型について，簡単に説明します．
基本的なデータ型には次のものがあります．

 | データ型 | 意味 | 例 |
|:---:|:---:|:---:|
| str |文字列      |'abcd'|
| int |整数        | 100  |
|float|浮動小数点数| 3.14 |

Pythonでは明示的にデータ型の宣言を行いません．
変数に値を代入するときに，その値に対応したデータ型が自動的に割り当てられます．

*****
## type関数

Pythonにおけるデータ型を確認するための関数が<font color=green>type()</font>関数です．
データ型の確認はデータ整備のプロセスの最初に行うことです．  

ここでは，同じ変数 x に色々な値を代入して，変数 x のデータ型を確認します．

文字型データのデータ型を確認します．
```Python
x = 'abcd'
type(x)
```

In [1]:
x = 'abcd'
type(x)

str

整数型のデータ型を確認します．
```Python
x = 100
type(x)
```

In [2]:
x = 100
type(x)

int

浮動小数点数型のデータ型を確認します．
```Python
x = 3.14
type(x)
```

In [3]:
x = 3.14
type(x)

float

type()関数は，あらゆる複雑なデータ型にも対応しています．
したがって，そのデータの構造を知る上でtype()関数は重要です．

*****
## 配列：リスト，タプル，辞書

Pythonにはリスト，タプル，辞書という3種類の配列があります．
それぞれの記法は次のようになります．

```Python
myList = [1,2,3,4,5]
myTuple = (1,2,3,4,5)
myDict = {'one':1,'two':2,'three':3,'four':4,'five':5}
```

In [4]:
myList = [1,2,3,4,5]
myTuple = (1,2,3,4,5)
myDict = {'one':1,'two':2,'three':3,'four':4,'five':5}

リスト，タプル，辞書の違いは下表の通りです．

| 配列の種類 | データ型 | 特徴 |
|:---:|:---:|:---:|
| リスト | list  | 配列の要素について追加，削除，変更が可能 |
| タプル | tuple | 配列の要素について追加，削除，変更ができない |
| 辞書   | dict  | 配列の要素がキーと値のペアになっている |

配列についてもtype()関数によってデータ型を調べることができます．

リスト配列のデータ型を確認します．
```Python
type(myList)
```

In [5]:
type(myList)

list

タプル配列のデータ型を確認します．
```Python
type(myTuple)
```

In [6]:
type(myTuple)

tuple

辞書配列のデータ型を確認します．
```Python
type(myDict)
```

In [7]:
type(myDict)

dict

*****
## range()関数とlist()関数

リスト配列を作成するときに，<font face='courier new' color='green'>myList = [1,2,3,4,5]</font> というように要素を記述する方法は，要素数が多い場合は向いていません．
要素数が多く，かつ要素に規則性がある場合は，range()関数を利用することができます．

range()関数は，返り値として，数値列を生成する　rangeオブジェクトを生成します．
range()関数の構文は2種類あります．

> <font face='courier new' color='green'>range(終了値)</font>

この場合は，0から始まって，1づつ増加して，終了値より小さい値までの数列を返すオブジェクトが作成されます．

> <font face='courier new' color='green'>range(開始値, 終了値, 間隔値)</font>

この場合は，開始値から始まって，間隔値づつ増加して，終了値より小さい値までの数列を返すオブジェクトが作成されます．

生成される数列に終了値が含まれないことに注意しましょう．

例として，0から始まって4までの数値を返すrangeオブジェクトは次のようになります．

```Python
range(5)
```

In [8]:
range(5)

range(0, 5)

このように返り値はオブジェクトになります．
このオブジェクトからリスト配列を生成するには，list()関数を利用します．

> <font face='courier new' color='green'>list(rangeオブジェクト)</font>

このlist()関数とrange()関数を組み合わせて，0から始まって4までの数値のリスト配列を作成してみます．

```Python
list(range(5))
```

In [9]:
list(range(5))

[0, 1, 2, 3, 4]

次の例は，1から始まって，3づつ増加して，20未満の数値のリスト配列を生成してみます．

```Python
list(range(1,20,3))
```

In [10]:
list(range(1,20,3))

[1, 4, 7, 10, 13, 16, 19]

*****
## set関数と集合型

配列の要素を重複の無い集合を求めるには<font color=green>set()</font>関数を使用します．

```Python
myList = ['apple','orange','banana','orange','banana','apple']
set(myList)
```

In [11]:
myList = ['apple','orange','banana','orange','banana','apple']
set(myList)

{'apple', 'banana', 'orange'}

このように元のリストの要素から重複を除いた要素の集合が求まります．
set()関数は，カテゴリー値データの変量について，実際に記載されている値の確認に使用します．

集合オブジェクトのデータ型は set になります．
これを集合型と言います．

```Python
mySet = {'alpha','beta','gamma'}
type(mySet)
```

In [12]:
mySet = {'alpha','beta','gamma'}
type(mySet)

set

集合型は，重複を除いたデータの集まりです．
集合型にはインデックスはありませんので，利用頻度はあまり高くありません．

*****
## 列挙型データ

Pythonにおける列挙型データについて紹介します．
列挙型は，取りうる値が有限個で指定されたカテゴリー値しか持たないデータです．

例として，性別を<font face='courier new' color='green'>{'male','female','others'}</font>の3種類のカテゴリーとします．
このようなカテゴリー値を取る列挙型のクラスGenderを定義します．
列挙型のデータを定義するために，enumライブラリーから型宣言のためのEnumモジュールと自動附番を行うauto関数を搬入します．

```Python
from enum import Enum, auto
```

In [13]:
from enum import Enum, auto

性別の定義を与える変数のクラスGenderを定義します．

```Python
class Gender(Enum):
    male =auto()
    female = auto()
    others = auto()
```

In [14]:
class Gender(Enum):
    male =auto()
    female = auto()
    others = auto()

とり得る3つの値をリスト配列として定義してみます．

```Pyython
[Gender.male, Gender.female, Gender.others]
```

In [15]:
[Gender.male, Gender.female, Gender.others]

[<Gender.male: 1>, <Gender.female: 2>, <Gender.others: 3>]

このようにそれぞれの値は，その名前と値の組み合わせになっています．

列挙型データのデータ型についても確認してみましょう．

```Python
x = Gender.male
type(x)
```

In [16]:
x = Gender.male
type(x)

<enum 'Gender'>

この講座の中では列挙型データを使用しませんが，確定的な値を保証するときに便利な方法です．
*****