# 型について

## 型の確認

* typeを使って調べる

In [5]:
### 型の例
print(type('Hello'))
print(type(b'Hello'))
print(type(-123))
print(type(12.3))
print(type([1,2,3]))
print(type((1,2,3)))
print(type({"a":  1, "b": 2}))
print(type(set('abc')))

<class 'str'>
<class 'bytes'>
<class 'int'>
<class 'float'>
<class 'list'>
<class 'tuple'>
<class 'dict'>
<class 'set'>


* `<class 'XXX'>`
    * Python3においてクラスと型は全く同じ意味を持つ
* list型
    * Pythonの配列
    * シーケンス型
        * `[]`を使ってindexで要素にアクセスできる
* tuple型
    * 複数の要素から構成されそれを一つのモノとして扱える機能
    * シーケンス型
    * list型との違い
        * tupleは作成した後に要素の追加や削除が出来ない
* dict型
    * Pythonのハッシュ
        * キーと値のペアのリスト
    * シーケンス型ではない
* set型
    * 複数のデータを持つデータ型の一つで、集合を表現することができる
    * シーケンス型ではない
    * set型の特徴
        * 重複のないデータ型
            * 同じ値は一つのみ登録可能
        * in演算子が高速
        * 集合に関する関数が豊富
* str型
    * 文字列
    * unicode文字列として扱われる
        * Python2の「u'hoge'」と同じ
* bytes型
    * バイト列
    * バイナリデータ
        * 文字列っぽく使えるがstr型と連結はできない
    * 用途
        * 特定の文字コードの文字列を持ちたい場合など

※ 型のメソッド等はtype.ipynbを参照

## list型

* Pythonの配列

In [83]:
### 基本
a = [1,'hello',3.14]
print(a)

### 改行して記述できる
b = [
    1,
    2,
    3
]
print(b)

### 要素の値を変更できる
b[0] = 4
print(b)

### 各要素にforでアクセス
for x in a:
    print(x)

### indexでアクセス
### この場合index 0は「1」、index 1は「2」
c = [1,2,3,4,5,6,7,8,9]
print(c[0])

### 一番後ろの要素
print(c[-1])

### c[n:m] でindex nからindex m-1まで。Rubyだとc[n...m]
print(c[2:5])

### c[-n:-m]で　一番後ろからn個分の要素から一番後ろからm個分の要素を除く
print('c[-5:-2]')
print(c[-5:-2])

### index 2以降の要素
print(c[2:])

### index 5より前(index 5の要素は含まない)の要素
print(c[:5])

### c[n:m:l]で　index n から index m-1 まで l個飛ばしで参照
print(c[0:8:2])

[1, 'hello', 3.14]
[1, 2, 3]
[4, 2, 3]
1
hello
3.14
1
9
[3, 4, 5]
c[-5:-2]
[5, 6, 7]
[3, 4, 5, 6, 7, 8, 9]
[1, 2, 3, 4, 5]
[1, 3, 5, 7]


In [23]:
%%bash
### Ruby
ruby -e "c = [1,2,3,4,5,6,7,8,9]; print c[2...5]"

[3, 4, 5]

### メソッド

* len
    * リストの要素の個数を調べる
* tuple
    * リストをタプルに変換する

In [64]:
a = [1,2,3,4,5]
print(len(a))
print(tuple(a))

5
(1, 2, 3, 4, 5)


* in演算子
    * 値が要素に存在するか調べる

In [230]:
a = [1,2,3,4,5]
print(3 in a)
print(9 in a)

True
False


* map
    * リストの各要素に演算をしてくれる関数
    * ` map(func, iterable, ...) `
        * 第一引数 : 
        * 第二引数以降
            * iterableを順にfuncに渡した結果をyieldで返す 
            * 第一引数の関数の引数に順番に渡される

In [134]:
a = [1,2,3]
b = [7,8,9]

### iterator objectが返る
print(map(int, a))

### 第一引数に型を指定すると、要素の型を変更・指定して返す
print(list(map(int, a )))
print(list(map(float, a )))
print(list(map(str, a )))

### 2倍する関数を定義して各要素に演算を適用する
def two_times(x):
    return x * 2
print(list(map(two_times, a )))

### ラムダ式を使って1行で演算する
print(list(map(lambda x: x*2 , a )))

### listではなくtupleではさむとtupleになる
print(tuple(map(lambda x: x*2 , a )))

<map object at 0x11372fb00>
[1, 2, 3]
[1.0, 2.0, 3.0]
['1', '2', '3']
[2, 4, 6]
[2, 4, 6]
(2, 4, 6)


* filter
    * リストの要素を抽出して処理する
    * `filter(func, iterable)`
        * iterableのオブジェクトを順にfuncに渡し、funcがTrueで返したオブジェクトをyieldで返す

In [36]:
### 3で割れるものを抽出する
a = [1,2,3,4,5,6,7,8,9]
print(list(filter(lambda x: x  % 3 == 0, a)))

### 空の要素を削除する
b = ['a','b','','c','','']
print(list(filter(lambda x: x != '', b)))

[3, 6, 9]
['a', 'b', 'c']


* reduce
    * リストの最初の2要素を引数に処理を呼び出し、結果と次の要素を引数に処理の呼び出しを繰り返して単一の結果を返す
    * Python3からグローバル空間から取り除かれた
        * functoolsをインポートして使う

In [159]:
from functools import reduce
a = [1,2,3,4,5,6,7,8,9,10]
reduce(lambda x ,y : x + y, a)

55

In [158]:
%%bash
### Ruby
ruby -e "
a = [1,2,3,4,5,6,7,8,9,10]
print a.reduce{|x,y| x + y}
"

55

### リスト内包表記

In [145]:
a = [1,2,3,4,5,6,7,8,9]
print([x * 2 for x in a])
print([x for x in a if x % 3 == 0])

[2, 4, 6, 8, 10, 12, 14, 16, 18]
[3, 6, 9]


## 要素の追加、削除

* append
    * 最後に要素を追加する
* insert
    * 指定した位置に要素を追加する
* del
    * 要素を削除する
* pop
    * 指定したindexの要素を削除する

In [228]:
a = [1,2,3]

a.append(4)
print(a)

a.insert(0,'hoge')
print(a)

a.insert(3,'insert index 3')
print(a)

del a[0]
print(a)

a.pop(2)
print(a)

[1, 2, 3, 4]
['hoge', 1, 2, 3, 4]
['hoge', 1, 2, 'insert index 3', 3, 4]
[1, 2, 'insert index 3', 3, 4]
[1, 2, 3, 4]


* a[m,n] = [9 ,9]
    * index m からindex n-1 を削除して 9,9の要素をindex mから後ろに挿入する

In [196]:
a = [1,2,3,4,5]
a[2:2] = [9,9]
print(a)

[1, 2, 9, 9, 3, 4, 5]


In [199]:
a = [1,2,3,4,5]
a[2:3] = [9,9]
print(a)

[1, 2, 9, 9, 4, 5]


In [200]:
a = [1,2,3,4,5]
a[2:4] = [9,9]
print(a)

[1, 2, 9, 9, 5]


In [201]:
a = [1,2,3,4,5]
a[2:5] = [9,9]
print(a)

[1, 2, 9, 9]


### 重複した要素を削除

* いったんsetにしてからlistに戻す

In [2]:
a = [1,2,3,2,4,5,3,4,5,6,1,2,3,4,1,5]
print(list(set(a)))

[1, 2, 3, 4, 5, 6]


## リストの結合

* `+`
    * リストを結合したものを表示する
* extend
    * リストを結合する
    * 破壊的メソッド
* `*`
    * 複数の値の繰り返しのリストを生成

In [211]:
a = [1,2,3]
b = [4,5]

print(a + b)
a.extend(b)
print(a)

[1, 2, 3, 4, 5]
[1, 2, 3, 4, 5]


In [213]:
a = [1,2,3]
a * 3

[1, 2, 3, 1, 2, 3, 1, 2, 3]

### for文でindexを取得する

In [49]:
a = ["hoge","fuga","haga"]

### 普通のfor文
for i in a:
    print(i)

print('================================================')
### rangeを使ってindexを取得する
for i in range(len(a)):
    item = a[i]
    print('{0} : {1}'.format(i, item))
    
print('================================================')
### enumeratorを使ってindexを取得する 
for i, j in enumerate(a):
    print('{0} : {1}'.format(i, j))

hoge
fuga
haga
0 : hoge
1 : fuga
2 : haga
0 : hoge
1 : fuga
2 : haga


## tuple型

* 複数の要素から構成されそれを一つのモノとして扱える機能
* list型との違い
    * tupleは作成した後に要素の追加や削除が出来ない

In [61]:
### 基本
a = (1,'hello',3.14)
print(a)

### 改行して記述できる
b = (
    1,
    2,
    3
)
print(b)

### 要素の変更はできない
try:
    b[0] = 4
except TypeError:
    print(u'タプルの要素は変更できません')

### 要素が一つのtupleを作る場合は最後にカンマを入れる
### 単なる数値の10
c = (10)
print(c)

### index 0の要素10のみのタプル
d = (10,)
print(d)

(1, 'hello', 3.14)
(1, 2, 3)
タプルの要素は変更できません
10
(10,)


### メソッド

* len
    * タプルの要素の個数を調べる
* list
    * タプルをリストに変換する

In [65]:
a = (1,2,3,4,5)
print(len(a))
print(list(a))

5
[1, 2, 3, 4, 5]


## dict型

* Pythonのハッシュ
    * キーと値のペアのリスト

In [91]:
a = {
    'a': 'Hello',
    'b': 123,
    'c': 4.56,
    'd': [1,2,3],
    'e': (4,5,6),
    'f': set('xyz')
}
print(a)

### keyからvalueにアクセス
print(a['b'])

{'a': 'Hello', 'b': 123, 'c': 4.56, 'd': [1, 2, 3], 'e': (4, 5, 6), 'f': {'y', 'z', 'x'}}
123


In [4]:
abc = {}
abc['def'] = 'ghi'
print(abc)

abc['jkl'] = 'mnl'
print(abc)

{'def': 'ghi'}
{'def': 'ghi', 'jkl': 'mnl'}


### メソッド

In [101]:
a = {
    'a': 'Hello',
    'b': 123,
    'd': [1,2,3]
}

### tupleでkeyと値のセットを返す
for x in a.items():
    print(x)

### 引数を２つにするとkeyと値をそれぞれ返す
for key, value in a.items():
    print('key = {0}, value = {1}'.format(key, value))

### keyを返す
for key in a.keys():
    print('key = {0}'.format(key))

### valueを返す
for value in a.values():
    print('value = {0}'.format(value))

('a', 'Hello')
('b', 123)
('d', [1, 2, 3])
key = a, value = Hello
key = b, value = 123
key = d, value = [1, 2, 3]
key = a
key = b
key = d
value = Hello
value = 123
value = [1, 2, 3]


* dictの中のlistにdictを追加する
    * 参考 https://blogs.yahoo.co.jp/dpdtp652/39381397.html

In [15]:
faminfo = {'member': [{'name': 'Takao', 'age': 38 }] }
print(faminfo)

Sosuke = {'name': 'Sosuke', 'age': 5 }

faminfo["member"].append(Sosuke)
print(faminfo)

{'member': [{'age': 38, 'name': 'Takao'}]}
{'member': [{'age': 38, 'name': 'Takao'}, {'age': 5, 'name': 'Sosuke'}]}


## set型

* 複数のデータを持つデータ型の一つで、集合を表現することができる
* シーケンス型ではない
* set型の特徴
    * 重複のないデータ型
        * 同じ値は一つのみ登録可能
    * in演算子が高速
    * 集合に関する関数が豊富
    
### 参考

* [セット（Set）に入門する](http://www.yoheim.net/blog.php?q=20160605)

In [81]:
set('xyz')

{'x', 'y', 'z'}

## str型

In [29]:
print('テスト')

### u'～'と同じ
print(u'テスト')

### 改行を含む
print('1234\n5678')

テスト
テスト
1234
5678


## メソッド

### 文字列をリストに入れる

In [34]:
### デフォルトは1文字ずつ要素に入る
a = 'あいうえお かきくけこ'
print(list(a))

### 半角空白を区切りに指定
b = 'あいうえお かきくけこ'.split(" ")
print(list(b))

### 改行を区切りに指定
c = 'あいうえお\nかきくけこ'
print(c)
print(c.split("\n"))

['あ', 'い', 'う', 'え', 'お', ' ', 'か', 'き', 'く', 'け', 'こ']
['あいうえお', 'かきくけこ']
あいうえお
かきくけこ
['あいうえお', 'かきくけこ']


## bytes型

In [17]:
utf8 = 'テストutf-8'.encode('utf-8')
shiftjis = 'テストshift-jis'.encode('shift-jis')
eucjp = 'テストeuc-jp'.encode('euc-jp')

print(utf8)
print(shiftjis)
print(eucjp)
print('================================================')
print(utf8.decode('utf-8'))
print(shiftjis.decode('shift-jis'))
print(eucjp.decode('euc-jp'))

b'\xe3\x83\x86\xe3\x82\xb9\xe3\x83\x88utf-8'
b'\x83e\x83X\x83gshift-jis'
b'\xa5\xc6\xa5\xb9\xa5\xc8euc-jp'
テストutf-8
テストshift-jis
テストeuc-jp
