# 3章データ型とデータ構造
## 西野泰平

参考資料
https://qiita.com/7shi/items/41d262ca11ea16d85abc

### 3.1基本データ型

#### 浮動小数点

In [1]:
#2進数の数を10進数に変換するには、2進数の数の先頭に0bを付けて表現します.
0b101

5

In [2]:
#2進数に変換するにはbin()を使います。
bin(5)

'0b101'

In [3]:
#Pythonでは、2進数表現につかえるビット数に依存します。
b = 0.35 

In [4]:
b + 0.1


0.44999999999999996

In [5]:
#decimalモジュールは浮動小数点数に対して任意精度で、精度のオプションも備えたオブジェクトを提供します。

In [6]:
import decimal 
from decimal import Decimal 

In [7]:
decimal. getcontext() 

Context(prec=28, rounding=ROUND_HALF_EVEN, Emin=-999999, Emax=999999, capitals=1, clamp=0, flags=[], traps=[InvalidOperation, DivisionByZero, Overflow])

In [8]:
d = Decimal(1) / Decimal (11) 
d 

Decimal('0.09090909090909090909090909091')

In [9]:
decimal.getcontext().prec = 4

In [10]:
e = Decimal(1) / Decimal (11) 
e 

Decimal('0.09091')

In [11]:
f = d + e
f

Decimal('0.1818')

#### ブール値(真偽値、論理値)

In [12]:
import keyword 

In [13]:
keyword.kwlist 

['False',
 'None',
 'True',
 'and',
 'as',
 'assert',
 'async',
 'await',
 'break',
 'class',
 'continue',
 'def',
 'del',
 'elif',
 'else',
 'except',
 'finally',
 'for',
 'from',
 'global',
 'if',
 'import',
 'in',
 'is',
 'lambda',
 'nonlocal',
 'not',
 'or',
 'pass',
 'raise',
 'return',
 'try',
 'while',
 'with',
 'yield']

#数値としては、Pythonが Falseを0、Trueを1に解釈します。数を bool()関数で boolオブジェク ト
に変換すると 、0が False、それ以外の数がTrueになります。

In [14]:
bool(1)


True

In [15]:
bool(10.5)

True

In [16]:
bool(0)

False

In [17]:
bool(0.0) 


False

In [18]:
bool(0.0001)

True

In [19]:
bool(-3)

True

#### 文字列

In [20]:
t ='this is a string object' 

In [21]:
#組み込みメソッ ドには、例えば、先頭の語を大文字で始める capitalizeがあります。
t.capitalize() 


'This is a string object'

In [22]:
#単語に分けて全単語の listオブジェクトを作る splitもある。
t.split()

['this', 'is', 'a', 'string', 'object']

In [23]:
#文字列に単語があるか探して、あれば先頭文字の位置を返します。空白の欄の所も字数に含みます。
#見つからなければ-1を返します。
t.find('string')

10

In [24]:
t.find('Python')

-1

In [25]:
#文字列の文字を置き換える方法は、replace(）メソッドで簡単にできます。
t.replace(' ','|')

'this|is|a|string|object'

In [26]:
# この関数は、文字列の先頭と末尾から指定した文字全部を削除します。
'https://www.python.org'.strip('htps:/')

'www.python.org'

In [27]:
'https://www.python.org'.strip('htps:/w')

'.python.org'

### 3.2基本データ構造

##### データ構造とは他のオブジェクトを含んだオブジェクトのことです。

#### タプル

In [28]:
#tupleは高度なデータ構造ですが、丸括弧で囲むだけです。
t = (1, 2.5,'data') 
type(t)

tuple

In [29]:
#丸括弧を使わず、カンマで区切るだけでも表現できます。
#ただし、カンマを使うとタプルとして認識されてしまうので、注意する。
t = 1, 2.5,'data' 
type(t) 

tuple

In [30]:
t[2]

'data'

In [31]:
type(t[2]) 

str

In [32]:
#tupleには 2つのメソッド count()とindex()しかありません。count()はオブジェクトの出現回数、index(）はオブジェクトの最初の出現位置を示します。
t.count('data')

1

In [33]:
t.index(1)

0

#### リスト

In [34]:
#ファイナンスでは株価を格納したり、新たなデータを追加したりとlistオブジェクトで多くのことができる。listオブジェクトは角括弧で定義し、基本機能はtupleと同じです。
l = [1, 2.5,'data']
l[2]

'data'

In [35]:
l = list(t)
l

[1, 2.5, 'data']

In [36]:
type(l)

list

##### tupleの機能に加えて listオブジェクトはさまざまなメソッドにより、追加削除ができます。つまり、strとtupleはインデックス付き更新不能シーケンスオブジェクトであり、作成後変更できませんが、listは変更可能でさまざまな変更演算があります。

In [37]:
#listオブジェクトを末尾に追加する。
l.append([4, 3])
l

[1, 2.5, 'data', [4, 3]]

In [38]:
#別の要素のリストを追加する。
l.extend([1.0, 1.5, 2.0])
l

[1, 2.5, 'data', [4, 3], 1.0, 1.5, 2.0]

In [39]:
#インデックスの位置にオブジェクトを挿入する。
l.insert(1,'insert')
l

[1, 'insert', 2.5, 'data', [4, 3], 1.0, 1.5, 2.0]

In [40]:
#先頭のオブジェクトを削除する。
l.remove('data')
l

[1, 'insert', 2.5, [4, 3], 1.0, 1.5, 2.0]

In [41]:
#インデックスの位置にあるオプジェクトを取り出して返す。
p = l.pop(3)
print(l, p)

[1, 'insert', 2.5, 1.0, 1.5, 2.0] [4, 3]


##### データセットをより小さな(使える)部分に分割するスライスも簡単です。

In [42]:
#3番目から5番目の要素を返す。インデックスのstartは含まれ、endは含まれない。
l[2:5]

[2.5, 1.0, 1.5]

#### トピックス ：制御構造 

##### forループのような制御構造はPythonではlistオブジェクトについて出てきます。
##### 下の例では、forループが、listオブジェクトlの中のインデックスが2から4の要素についてループして、各要素の二乗を出力します。2行目のインデント(空白4つ)が重要です。

In [43]:
for element in l[2:5]: 
    print(element ** 2)

6.25
1.0
2.25


##### カウンタを使った普通のループより柔軟性に優れますが、rangeオブジェクトを使うことも可能です。

In [44]:
#引数は start,end, step-size。
r = range(0, 8, 1)
r

range(0, 8)

In [45]:
type(r)

range

In [46]:
for i in range(2, 5): 
    print(l[i] ** 2) 

6.25
1.0
2.25


##### Pythonには、if,elif,elseを使った条件制御や、for,whileを使った実行制御がある。

In [47]:
# %は剰余演算子。iを2で割った余りが0なら偶数、そうでなければ奇数となる。
for i in range(1, 10): 
    if i % 2 == 0: 
        print("%d is even"% i) 
    elif i % 3 == 0: 
        print ("%d is multiple of 3" % i) 
    else: 
        print("%d is odd"% i)

1 is odd
2 is even
3 is multiple of 3
4 is even
5 is odd
6 is even
7 is odd
8 is even
9 is multiple of 3


In [48]:
total= 0 
while total< 100: 
    total+= 1 
print(total) 

100


##### Pythonにはリスト内包表記があり,listオブジェクトでループしなくても、簡潔にループした結果のlistオブジェクトができます。

In [49]:
m = [i ** 2 for i in range(5)]
m


[0, 1, 4, 9, 16]

#### 辞書

##### dictオブジェクトは辞書構造の変更可能シーケンスで、(例えばstrオブジェクトの)キーによるデータ検索ができます。
##### listオプジェクトには順序がありソート可能ですが、dictオブジェクトには順序がなくソートできません。次の例がlistオブジェクトとの別の相違点を示しています。波括弧でdictオブジェクトを定義します。

In [50]:
d = {'Name':'Angela Merkel', 
'Country':'Germany', 
'Profession':'Chancelor', 
'Age' : 64 } 
type(d)

dict

In [51]:
print(d['Name'],d['Age'])

Angela Merkel 64


##### dietオブジェ クトにも多くの組み込みメソッ ドがあります。

In [52]:
d.keys() 


dict_keys(['Name', 'Country', 'Profession', 'Age'])

In [53]:
d.values()

dict_values(['Angela Merkel', 'Germany', 'Chancelor', 64])

In [54]:
d.items()

dict_items([('Name', 'Angela Merkel'), ('Country', 'Germany'), ('Profession', 'Chancelor'), ('Age', 64)])

In [55]:
birthday= True 
if birthday:
    d['Age'] += 1 
print(d['Age']) 

65


##### dictオブジェクトからiteratorオブジェクトを作るメソッドがいくつもあります。iteratorオブジェクトは反復処理でlistオブジェクトのように振る舞います。

In [56]:
for item in d.items(): 
    print(item)

('Name', 'Angela Merkel')
('Country', 'Germany')
('Profession', 'Chancelor')
('Age', 65)


In [57]:
for value in d.values(): 
    print(type(value))

<class 'str'>
<class 'str'>
<class 'str'>
<class 'int'>


#### set(集合)

##### setは要素に重複がなく、順序のないオブジェクトの集まりです。

In [58]:
s = set(['u','d','ud','du','d','du']) 
s

{'d', 'du', 'u', 'ud'}

In [59]:
t = set (['d','dd','uu','u'])
t

{'d', 'dd', 'u', 'uu'}

##### setオブジェクトで数学の集合の甚本演算(例えば、和、積、差)を行えます。

In [60]:
#sとtの全部
s.union(t)

{'d', 'dd', 'du', 'u', 'ud', 'uu'}

In [61]:
#sとt両方にある要素(積集合)の要素
s.intersection(t) 

{'d', 'u'}

In [62]:
#sにありtにない要素
s.difference(t)

{'du', 'ud'}

In [63]:
#tにありsにない要素
t.difference(s)

{'dd', 'uu'}

In [64]:
#sかtのどちらかにあるが両方にはない要素
s.symmetric_difference(t)

{'dd', 'du', 'ud', 'uu'}

##### listオブジェクトから重複を除くために setオブジェク トを使うことができます。

In [65]:
#0から10の範囲の1000個の乱数
#lの要素数
from random import randint 
l = [randint(0, 10) for i in range(1000)]
len(l)

1000

In [66]:
l[:20]

[4, 7, 0, 1, 8, 2, 5, 8, 1, 8, 7, 7, 6, 4, 4, 8, 3, 0, 1, 8]

In [67]:
s = set(l)
s

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

### 3.3結論

#### 基本データ型

##### 特にファイナンスでは、int, float, bool, strといったクラスがアトミックデータ型である。
##### アトミックデータ型は、それ以上分解できないデータ型である。

#### 標準デー夕構造

##### tuple, list, diet, setが金融アプリケーションで使われ、特に、listが柔軟でほとんどのユースケースがある。
