## 8.1.1  writeによるテキストファイルへの書き込み

In [1]:
poem = """There was a young lady named Bright,
Whose speed was far faster than light;
She started one day
In a relative way,
And returned on the previous night."""

In [2]:
with open(r".\pydata\relativity.txt","w") as f:
    f.write(poem)

In [3]:
with open(r".\pydata\relativity.txt","w") as f:
    print(poem, file=f)

テキストファイルへの書き込みは、ファイルオブジェクトにwriteメソッドを使う方法だけでなく、  
print関数にキーワード引数のfileにファイルオブジェクトを使うことでもできる

In [4]:
with open(r".\pydata\relativity.txt","w") as f:
    size = len(poem)
    offset = 0
    chunk = 100
    while True:
        if offset > size:
            break
        f.write(poem[offset:chunk + offset])
        offset += chunk

書き込みたいテキストの内容が多い場合は上のようにすればチャンクごとに分けながら文章を書き込んでくれる

## 8.1.2  read,readline,readlinesによるテキストファイルの読み出し

In [5]:
with open(r".\pydata\relativity.txt","r") as f:
    poem = f.read()

In [6]:
print(poem)

There was a young lady named Bright,
Whose speed was far faster than light;
She started one day
In a relative way,
And returned on the previous night.


In [7]:
poem = ""
with open(r".\pydata\relativity.txt","r") as f:
    chunk = 100
    while True:
        fragment = f.read(chunk)
        if not fragment: # fragmentが空文字列の場合
            break
        poem += fragment

In [8]:
print(poem)

There was a young lady named Bright,
Whose speed was far faster than light;
She started one day
In a relative way,
And returned on the previous night.


上のようにすれば大きなデータを小さく分けながらテキストを追加していくことができる

In [9]:
with open(r".\pydata\relativity.txt","r") as f:
    for i in range(5):
        print(f.readline(),end="")

There was a young lady named Bright,
Whose speed was far faster than light;
She started one day
In a relative way,
And returned on the previous night.

In [10]:
with open(r".\pydata\relativity.txt","r") as f:
    for line in f.readlines():
        print(line, end="")

There was a young lady named Bright,
Whose speed was far faster than light;
She started one day
In a relative way,
And returned on the previous night.

## 8.1.3  writeによるバイナリファイルの書き込み

In [11]:
bdata = bytes(range(256))

In [12]:
bdata

b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f !"#$%&\'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_`abcdefghijklmnopqrstuvwxyz{|}~\x7f\x80\x81\x82\x83\x84\x85\x86\x87\x88\x89\x8a\x8b\x8c\x8d\x8e\x8f\x90\x91\x92\x93\x94\x95\x96\x97\x98\x99\x9a\x9b\x9c\x9d\x9e\x9f\xa0\xa1\xa2\xa3\xa4\xa5\xa6\xa7\xa8\xa9\xaa\xab\xac\xad\xae\xaf\xb0\xb1\xb2\xb3\xb4\xb5\xb6\xb7\xb8\xb9\xba\xbb\xbc\xbd\xbe\xbf\xc0\xc1\xc2\xc3\xc4\xc5\xc6\xc7\xc8\xc9\xca\xcb\xcc\xcd\xce\xcf\xd0\xd1\xd2\xd3\xd4\xd5\xd6\xd7\xd8\xd9\xda\xdb\xdc\xdd\xde\xdf\xe0\xe1\xe2\xe3\xe4\xe5\xe6\xe7\xe8\xe9\xea\xeb\xec\xed\xee\xef\xf0\xf1\xf2\xf3\xf4\xf5\xf6\xf7\xf8\xf9\xfa\xfb\xfc\xfd\xfe\xff'

In [13]:
with open(r".\pydata\bfile.txt","wb") as f:
    f.write(bdata)

In [14]:
with open(r".\pydata\bfile2.txt","wb") as f:
    size = len(bdata)
    offset = 0
    chunk = 100
    while True:
        if offset > size:
            break
        f.write(bdata[offset:chunk + offset])
        offset += chunk

上のようにすればチャンク単位で書き込むことができる

## 8.1.4  readによるバイナリファイルの読み出し

In [15]:
with open(r".\pydata\bfile.txt","rb") as f:
    bdata = f.read()

In [16]:
bdata

b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\x1e\x1f !"#$%&\'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_`abcdefghijklmnopqrstuvwxyz{|}~\x7f\x80\x81\x82\x83\x84\x85\x86\x87\x88\x89\x8a\x8b\x8c\x8d\x8e\x8f\x90\x91\x92\x93\x94\x95\x96\x97\x98\x99\x9a\x9b\x9c\x9d\x9e\x9f\xa0\xa1\xa2\xa3\xa4\xa5\xa6\xa7\xa8\xa9\xaa\xab\xac\xad\xae\xaf\xb0\xb1\xb2\xb3\xb4\xb5\xb6\xb7\xb8\xb9\xba\xbb\xbc\xbd\xbe\xbf\xc0\xc1\xc2\xc3\xc4\xc5\xc6\xc7\xc8\xc9\xca\xcb\xcc\xcd\xce\xcf\xd0\xd1\xd2\xd3\xd4\xd5\xd6\xd7\xd8\xd9\xda\xdb\xdc\xdd\xde\xdf\xe0\xe1\xe2\xe3\xe4\xe5\xe6\xe7\xe8\xe9\xea\xeb\xec\xed\xee\xef\xf0\xf1\xf2\xf3\xf4\xf5\xf6\xf7\xf8\xf9\xfa\xfb\xfc\xfd\xfe\xff'

## 8.1.6   seekによる位置の変更

In [17]:
f = open(r".\pydata\bfile.txt","rb")

In [18]:
f.tell()

0

In [19]:
f.seek(255)

255

In [20]:
f.tell()

255

In [21]:
bdata = f.read()

In [22]:
bdata

b'\xff'

In [23]:
f.close()

ファイルオブジェクトの tell 関数は現在のオフセット(先頭からの位置)をバイト単位で返す  
ファイルオブジェクトの seek 関数は渡した整数の位置のオフセットに移動することができる

In [24]:
f = open(r".\pydata\bfile.txt","rb")

In [25]:
f.tell()

0

In [26]:
f.seek(150,0)

150

In [27]:
f.seek(20,1)

170

In [28]:
f.seek(-1,2)

255

In [29]:
import os
print(os.SEEK_SET, os.SEEK_CUR, os.SEEK_END)

0 1 2


seek 関数には第二引数として0～2の数字を渡すこともでき、  
0はデフォルトで先頭からの指定したオフセット位置に移動  
1は現在のオフセット位置から指定した数字分移動  
2は末尾から指定したオフセットの位置に移動  
0～2の値はosモジュールのSEEK_SET,SEEK_CUR,SEEK_ENDで定義されている

## 8.2.1  CSV

In [30]:
import csv

In [31]:
villains = [
    ["Doctor","NO"],
    ["Rosa","Klebb"],
    ["Mister","Big"],
    ["Auric","Goldfinger"],
    ["Ernst","Blofeld"],
    ]
with open(r".\pydata\villains.csv","w",newline="") as f:
    csv_writer = csv.writer(f)
    for row in villains:
        csv_writer.writerow(row)

In [32]:
with open(r".\pydata\villains.csv","r") as f:
    csv_reader = csv.reader(f)
    villains = [row for row in csv_reader] # 単純にlist関数にcsv_readerオブジェクトを渡したほうが楽かもしれない

In [33]:
print(villains)

[['Doctor', 'NO'], ['Rosa', 'Klebb'], ['Mister', 'Big'], ['Auric', 'Goldfinger'], ['Ernst', 'Blofeld']]


csvファイルへの書き込みは csv モジュールの writer 関数に書き込み専用のファイルオブジェクトを渡して作る csv_writerオブジェクト を使う  
そのcsv_writerオブジェクトの writerow メソッドに書き込みたい行の文字列を追加することでできる  
新しい行を追加するたびに2重改行されてしまうのでnewlineを改行なしにする必要がある

csvファイルへの読み込みは csv モジュールの reader 関数に読み込み専用のファイルオブジェクトを渡して作る csv_readerオブジェクト を使う  
そのcsv_readerオブジェクトをイテレータとしてfor文に使うことで行単位で内容を取り出すことができる

csvは列はカンマ、行は改行で区切られる

In [34]:
with open(r".\pydata\villains.csv","r") as f:
    csv_reader = csv.DictReader(f,fieldnames=["first","last"])
    villians = [row for row in csv_reader]

In [35]:
villians

[OrderedDict([('first', 'Doctor'), ('last', 'NO')]),
 OrderedDict([('first', 'Rosa'), ('last', 'Klebb')]),
 OrderedDict([('first', 'Mister'), ('last', 'Big')]),
 OrderedDict([('first', 'Auric'), ('last', 'Goldfinger')]),
 OrderedDict([('first', 'Ernst'), ('last', 'Blofeld')])]

csvの DictReader 関数にファイルオブジェクトと、キーワード引数(もしくは第二引数)のfieldnamesに付けたいヘッダーの名前をリストにして渡して、csv_readerオブジェクトを作って読み込むことで、仮のヘッダーをつけた辞書のようなものを返してくれる

In [36]:
villains = [
    {"first":"Doctor","last":"No"},
    {"first":"Rosa","last":"Klebb"},
    {"first":"Mister","last":"Big"},
    {"first":"Auric","last":"Goldfinger"},
    {"first":"Ernst","last":"Blofeld"}
]

In [37]:
with open(r".\pydata\villains2.csv","w",newline="") as f:
    csv_writer = csv.DictWriter(f,["first","last"])
    csv_writer.writeheader()
    for row in villains:
        csv_writer.writerow(row)

csvファイルへの書き込みで、辞書のキーをヘッダーとして行を書き込んでいきたいときは、csvの DictWriter メソッドにファイルオブジェクトと第二引数(もしくはfieldnames)にヘッダーにしたい値のリストを渡すことでできるcsv_writerオブジェクトを使うことでできる  
このままだとヘッダーは追加されないので、csv_writerオブジェクトの writerheader メソッドを呼び出すことでヘッダーを記入できる

In [38]:
with open(r".\pydata\villains2.csv","r") as f:
    csv_reader = csv.DictReader(f)
    villains = list(csv_reader)

In [39]:
villains

[OrderedDict([('first', 'Doctor'), ('last', 'No')]),
 OrderedDict([('first', 'Rosa'), ('last', 'Klebb')]),
 OrderedDict([('first', 'Mister'), ('last', 'Big')]),
 OrderedDict([('first', 'Auric'), ('last', 'Goldfinger')]),
 OrderedDict([('first', 'Ernst'), ('last', 'Blofeld')])]

csv_readerオブジェクトを作成するときにDictReader関数の第二引数(firldnames)を省略すると、1列目の行をヘッダーとした辞書のようなものを返してくれる

## 8.2.2  XML

XMLはHTMLのような構造をしていて、以下のような特徴がある

- タグは<文字から始まる
- 空白は無視される
- 通常<menu\>のような開始タグの後ろにはほかのコンテンツが続き、</menu\>のような終了タグで締めくくる
- タグはほかのタグの中で何段階にでもネスト(入れ子構造に)できる
- 開始タグにはオプションの属性を組み込める <タグ 属性>
- タグは値を持つことができる <タグ>値</タグ>
- タグが値も子も持たない場合、開始タグと終了タグを使わなくてもタグを閉じる>の前にスラッシュをいれれば1つのタグになる <タグ/>
- データをどこに入れるかに特別な規則はない <タグ 属性=データ/>でも<タグ>データ<タグ/>でもよい

In [40]:
import xml.etree.ElementTree as et

In [41]:
tree = et.ElementTree(file=r".\pydata\menu.xml")

In [42]:
root = tree.getroot()

In [43]:
root.tag

'menu'

In [44]:
for child in root:
    print(f"tag: {child.tag} , attributes: {child.attrib}")
    for grandchild in child:
        print(f"\ttag: {grandchild.tag} , attributes: {grandchild.attrib}")

tag: breakfast , attributes: {'hour': '7-11'}
	tag: item , attributes: {'price': '$6.00'}
	tag: item , attributes: {'price': '$4.00'}
tag: lunch , attributes: {'hour': '11-3'}
	tag: item , attributes: {'price': '$5.00'}
tag: dinner , attributes: {'hour': '3-10'}
	tag: item , attributes: {'price': '$8.00'}


PythonでXMLを簡単に扱うには ElementTree モジュールを使うといい(xml.etreeの中にある)  
XMLの構文を解析してタグや属性を表示するにはElementTreeモジュールの ElementTree 関数にキーワード引数にxmlファイルを指定することでできる  
ElementTreeオブジェクトを使う  
ElementTreeオブジェクトの getroot メソッドを呼ぶことで、全体を形成している最初のタグをElementオブジェクトをして取得する  
Elementオブジェクトの tag アトリビュートを呼ぶとタグ名、attrib アトリビュートを呼ぶと属性名を返してくれる  

In [45]:
root[0]

<Element 'breakfast' at 0x000002195D4919A8>

In [46]:
root[1]

<Element 'lunch' at 0x000002195D491AE8>

In [47]:
root[0][1]

<Element 'item' at 0x000002195D491A98>

Elementオブジェクトの中には、入れ子状態のタグのElementも含まれていて、for文のイテレータとして使うことで深層のタグのElementオブジェクトを取得することができる

## 8.2.4  JSON

In [48]:
menu = \
{
"breakfast":{
    "hours":"7-11",
    "items":{
        "breakfast burritos":"$6.00",
        "pancakes":"$4.00"
        }
    },
"lunch":{
    "hours":"11-3",
    "items":{
        "hamburger":"$5.00"
        }
    },
"dinner":{
    "hours":"3-10",
    "items":{
        "spaghetti":"$8.00"
        }
    }
}

In [49]:
menu

{'breakfast': {'hours': '7-11',
  'items': {'breakfast burritos': '$6.00', 'pancakes': '$4.00'}},
 'lunch': {'hours': '11-3', 'items': {'hamburger': '$5.00'}},
 'dinner': {'hours': '3-10', 'items': {'spaghetti': '$8.00'}}}

In [50]:
import json

In [51]:
menu_json = json.dumps(menu)
menu_json

'{"breakfast": {"hours": "7-11", "items": {"breakfast burritos": "$6.00", "pancakes": "$4.00"}}, "lunch": {"hours": "11-3", "items": {"hamburger": "$5.00"}}, "dinner": {"hours": "3-10", "items": {"spaghetti": "$8.00"}}}'

In [52]:
menu2 = json.loads(menu_json)
menu2

{'breakfast': {'hours': '7-11',
  'items': {'breakfast burritos': '$6.00', 'pancakes': '$4.00'}},
 'lunch': {'hours': '11-3', 'items': {'hamburger': '$5.00'}},
 'dinner': {'hours': '3-10', 'items': {'spaghetti': '$8.00'}}}

JSONはJavaScriptという枠を越えて広く使われているデータ交換形式で、変換できればプログラム間でのデータを移動することができるようになる  
PythonのデータをJSON文字列に変換するには、json モジュールの dumps 関数にPythonのデータを渡すことでできる  
逆にJSON文字列をPythonのデータに変換するには json モジュールの loads 関数にJSON文字列を渡すことでできる

In [53]:
import datetime
now = datetime.datetime.now()
now

datetime.datetime(2020, 9, 29, 0, 8, 16, 439021)

In [54]:
json.dumps(now)

TypeError: Object of type datetime is not JSON serializable

In [59]:
now_str = str(now)

In [60]:
json.dumps(now_str)

'"2020-09-29 00:08:16.439021"'

JOSN形式にないデータ型は変換できないので、変換する前に変更可能なデータに変更する必要がある

In [61]:
class DTEncoder(json.JSONEncoder):
    def default(self,obj):
        # isinstanceでオブジェクトの型をチェックする
        if isinstance(obj, datetime.datetime):
            from time import mktime
            return int(mktime(obj.timetuple()))
        # datetime型でなければ
        return json.JSONEncoder.default(self, obj)

In [62]:
json.dumps(now, cls=DTEncoder)

'1601305696'

In [63]:
time_tuple = now.timetuple() # datetime型を時間のデータをタプル形式にする

In [64]:
from time import mktime
mktime(time_tuple) # mktimeに時間のデータが入ったタプルを渡すことでエポック時間を返してくれる

1601305696.0

Pythonの特定のデータをJSON文字列に変換する際に自分の好きな形でを変換してもらうこともできる  
json.JSONEncoder という変換する際にデフォルトで使用されるクラスを親クラスとした子クラスを作成し、  
その中の default 関数を変更したうえで、jsonのdumps関数を使う際にキーワード引数の cls に作成した子クラスの名前を入れることでできる  
上ではdumpsに渡されたオブジェクトの型がdatetime型だった場合にエポック秒のint(整数)としてJSON文字列に変換するようにしている

## 8.2.5  YMAL

In [65]:
import yaml

In [69]:
with open(r".\pydata\mcintyre.yaml","r") as f:
    text = f.read()

In [70]:
text

"name:\n  first: James\n  last: McIntyre\ndates:\n  birth: 1828-05-25\n  death: 1906-03-31\ndetails:\n  bearded: true\n  themes: [cheese, Canada]\nbooks:\n  url: http://www.gutenberg.org/files/36068/36068-h/36068-h.htm\npoem:\n  - title: 'Motto'\n    text: |\n      Politeness, perseverance and pluck,\n      To their possessor will bring good luck.\n  - title: 'Canadian Charms'\n    text: |\n      Here industry is not in vain,\n      For we have bounteous crops of grain,\n      And you behold on every field\n      Of grass and roots abundant yield,\n      But after all the greatest charm\n      Is the snug home upon the farm,\n      And stone walls now keep cattle warm."

In [71]:
data = yaml.load(text)

  """Entry point for launching an IPython kernel.


In [72]:
data

{'name': {'first': 'James', 'last': 'McIntyre'},
 'dates': {'birth': datetime.date(1828, 5, 25),
  'death': datetime.date(1906, 3, 31)},
 'details': {'bearded': True, 'themes': ['cheese', 'Canada']},
 'books': {'url': 'http://www.gutenberg.org/files/36068/36068-h/36068-h.htm'},
 'poem': [{'title': 'Motto',
   'text': 'Politeness, perseverance and pluck,\nTo their possessor will bring good luck.\n'},
  {'title': 'Canadian Charms',
   'text': 'Here industry is not in vain,\nFor we have bounteous crops of grain,\nAnd you behold on every field\nOf grass and roots abundant yield,\nBut after all the greatest charm\nIs the snug home upon the farm,\nAnd stone walls now keep cattle warm.'}]}

In [73]:
data["details"]

{'bearded': True, 'themes': ['cheese', 'Canada']}

In [74]:
data["poem"][1]["title"]

'Canadian Charms'

In [75]:
yaml.dump(data)

"books:\n  url: http://www.gutenberg.org/files/36068/36068-h/36068-h.htm\ndates:\n  birth: 1828-05-25\n  death: 1906-03-31\ndetails:\n  bearded: true\n  themes:\n  - cheese\n  - Canada\nname:\n  first: James\n  last: McIntyre\npoem:\n- text: 'Politeness, perseverance and pluck,\n\n    To their possessor will bring good luck.\n\n    '\n  title: Motto\n- text: 'Here industry is not in vain,\n\n    For we have bounteous crops of grain,\n\n    And you behold on every field\n\n    Of grass and roots abundant yield,\n\n    But after all the greatest charm\n\n    Is the snug home upon the farm,\n\n    And stone walls now keep cattle warm.'\n  title: Canadian Charms\n"

YAMLはJSONと同様にキーと値を持つがJSONよりも多くのデータ型を処理する  
YAMLをPythonデータに変換するにはサードパーティの yaml モジュールの load 関数にPythonデータを渡すことでできる  
逆にYAMLに変換したい場合は dump 関数を使う

## 8.2.7  設定ファイル

In [76]:
import configparser

In [83]:
cfg = configparser.ConfigParser()

In [84]:
cfg

<configparser.ConfigParser at 0x2195d627448>

In [85]:
cfg.read(r".\pydata\settings.cfg")

['.\\pydata\\settings.cfg']

In [86]:
cfg["french"]

<Section: french>

In [87]:
cfg["french"]["greeting"]

'Bonjour'

In [88]:
cfg["files"]["bin"]

'/user/kumak/bin'

長い間使い続けるようなプログラムは設定をどこかに保存しておく必要があり、設定ファイルに保存しておくことで多くのプログラムは様々なオプションや設定を提供している
configparser モジュールは設定ファイルとしてよく使われるWindowsスタイルの.iniや.cfgファイルを処理することができる  
このようなファイルは *key* = *value*　形式の定義セクションを持つ  
設定ファイル内のデータをPythonデータに変換して取り出すには、configparserモジュールの ConfigParser 関数を使って作る Configparser オブジェクトを使う  
ConfigParserオブジェクトの read メソッドに設定ファイルを渡してオブジェクト自体に読み込み、ConfigParserオブジェクトのキーを指定することで読み出すことができる

## 8.2.9  pickleによるシリアライズ

In [89]:
import pickle
import datetime

In [90]:
now1 = datetime.datetime.now()
pickled = pickle.dumps(now1)

In [91]:
now2 = pickle.loads(pickled)

In [92]:
now1

datetime.datetime(2020, 9, 29, 0, 11, 30, 75507)

In [93]:
now2

datetime.datetime(2020, 9, 29, 0, 11, 30, 75507)

In [94]:
pickled

b'\x80\x03cdatetime\ndatetime\nq\x00C\n\x07\xe4\t\x1d\x00\x0b\x1e\x01&\xf3q\x01\x85q\x02Rq\x03.'

ファイルにデータ構造を保存することをシリアライズ(直列化)といい、Pythonでは特別なバイナリ形式でオブジェクトを保存できる pickle モジュールがある  
pickleの dumps 関数にオブジェクトを渡すことでオブジェクトをpickleオブジェクトとして保存、pickleの loads 関数にpickleオブジェクトを渡すことで復元できる

In [95]:
with open(r".\pydata\pickle_data","wb") as f:
    pickle.dump(now1,f)

In [96]:
with open(r".\pydata\pickle_data","rb") as f:
    now2 = pickle.load(f)

In [97]:
now2

datetime.datetime(2020, 9, 29, 0, 11, 30, 75507)

ファイルにデータを保存したい場合はpickleの dump 関数に保存したいオブジェクトとバイナリモードの書き込み専用ファイルオブジェクトを渡すことで、ファイルオブジェクトのファイルパスに保存される  
ファイルに保存したデータを読み込むにはpickleの load 関数にバイナリモードの読み込み専用ファイルオブジェクトを渡すことでできる

In [98]:
class Tiny:
    def __str__(self):
        return "TINY"

In [99]:
obj1 = Tiny()
obj1

<__main__.Tiny at 0x2195d63a188>

In [100]:
str(obj1)

'TINY'

In [101]:
pickled = pickle.dumps(obj1)
pickled

b'\x80\x03c__main__\nTiny\nq\x00)\x81q\x01.'

In [102]:
obj2 = pickle.loads(pickled)
str(obj2)

'TINY'

pickleはプログラム内で定義された独自のクラスやオブジェクトも処理できる

# 8.4  リレーショナルデータベース

リレーショナルデータベースとは主に属性を列、行を組としてデータを格納していく方式のデータベース構造のことを指す

## 8.4.1  SQL

SQLはリレーショナルデータベースの管理や操作を行うための人工言語のひとつ  
SQL文には大きく分けて2つのカテゴリに分類される  
- DDL(データ定義言語) : テーブルやデータベースの作成、削除、制約、許可などの処理  
- DML(データ操作言語) : データの挿入、選択、更新、削除などの処理

SQL DDLの基本コマンド

|操作|SQLのコマンドパターン|SQLのコマンド例|
|:-|:-|:-|
|データベースの作成|CREATE DATABASE *dbname*|CREATE DATABASE d|
|現在のデータベースの選択|USE *dbname*|USE d|
|データベースとテーブルの削除|DROP DATABASE dbname|DROP DATABASE d|
|テーブルの作成|CREATE TABLE tbname(coldefs)|CREATE TABLE T (id INT, count INT)|
|テーブルの削除|DROP TABLE tbname|DROP TABLE t|
|テーブルのすべての行の削除|TRUNCATE TABLE tbname|TRUNCATE TABLE t|

SQL DMLの基本コマンド

|操作|SQLのコマンドパターン|SQLのコマンド例|
|:-|:-|:-|
|行の追加|INSERT INTO *tbname* VALUES( ... )|INSERT INTO t VALUES(7, 40)|
|すべての行と列を選択|SELECT \* FROM *tbname*|SELECT \* FROM t|
|すべての行の特定の列を選択|SELECT *cols* FROM *tbname*|SELECT id, count FROM t|
|一部の行の一部の列を選択|SELECT *cols* FROM *tbname* WHERE *condition*|SELECT id, count FROM t WHERE count > 5 AND id = 9|
|一部の行の列を変更|UPDATE *tbname* SET *col* = *value* WHERE *condition*|UPDATE t SET count=3 WHERE id=5|
|一部の行を削除|DELETE FROM *tbname* WHERE *condition*|DELETE FROM t WHERE count <= 10 OR id = 16|

主要なDMLの操作はCRUDという頭文字で知られている  
- C(Create) : INSERT文を使った作成  
- R(Read) : SELECT文を使った読み出し  
- U(Update) : UPDATE文を使った更新  
- D(Delete) : DELETE文を使った削除

## 8.4.2  DB-API

APIとはあるコンピュータプログラムの機能や管理するデータなどを、ほかのプログラムから呼び出して利用するための手順やデータ形式などを定めた規約のことで、DB-APIはリレーショナルデータベースにアクセスするためのPython標準のAPIである  
DB-APIを使えばひとつのプログラムで複数のリレーショナルデータベースを操作することができる  
DB-APIの主要な関数  
- connect( ) : データベースへの接続を開設する。ユーザー名、パスワード、サーバーアドレス、その他の引数を指定できる
- cursor( ) : クエリー(質問、照会、問い合わせ、尋ねる、疑問などの意味)を管理するカーソルオブジェクトを作る
- execute( )とexecutemany( ) : データベースに対してひとつまたは複数のSQLコマンドを実行する
- fetchone( ),fetchmany( ),fetchall( ) : executeの結果を取得する

## 8.4.3  SQLite

SQLiteは軽くて優れたオープンソースのリレーショナルデータベースで、Pythonの標準ライブラリと実装され、通常のファイルにデータベースを格納する  
格納したファイルはマシン、OSの違いを超えて使うことができるため、単純なリレーショナルデータベースのアプリケーションを作りたいときに役立つ  
データベースを使ったり作ったりするときは、まずローカルなSQLiteデータベースにconnect( )する。  
特殊文字列の:memory:を指定するとメモリのみにデータベースを作り、高速でテストには役立つがプログラムを終了するとデータが失われてしまう

In [103]:
import sqlite3

In [104]:
conn = sqlite3.connect(r".\pydata\enterprice.db")

In [105]:
curs = conn.cursor()

In [106]:
curs.execute("""CREATE TABLE zoo (critter VARCHAR(20)
PRIMARY KEY, count INT, damages FLOAT)""")

<sqlite3.Cursor at 0x2195d620c00>

上では列の見出しは  
- critter : 動物の名前。主キー(可変長文字列)
- count : その動物の現在の個体数(整数)
- damages : 動物との触れ合いによる現在の損失額(整数)  
としてデータを扱っている

主キー(PRIMARY KEY)とは、テーブルに登録するレコード(データ行)の全体のうち、ひとつのデータに特定することをデータベースが保証する列のこと

まず、SQLite3 モジュールの connect 関数を使ってデータベースファイルに接続して、connect オブジェクトを取得  
connectオブジェクトの cursor メソッドを呼び出してクエリーを管理するカーソルオブジェクトを作成(cursorオブジェクト)  
cursorオブジェクトの execute メソッドを使ってSQLコマンドを実行、zooというテーブルを作成し、列として20バイトまで文字列(VARCHAR(20))を格納できる主キー(PRIMARY KEY)のcritter、整数型のcount、浮動小数点型のdamages、の3つを追加している

In [107]:
curs.execute("INSERT INTO zoo VALUES('duck', 5, 0.0)")

<sqlite3.Cursor at 0x2195d620c00>

In [108]:
curs.execute("INSERT INTO zoo VALUES('bear', 2, 1000.0)")

<sqlite3.Cursor at 0x2195d620c00>

cursorオブジェクトのexecuteメソッドに行を追加するSQLコマンドのINSERT文を入れて、critter,count,damagesのそれぞれのデータを追加している

In [109]:
ins = "INSERT INTO zoo (critter, count, damages) VALUES(?, ?, ?)"

In [110]:
curs.execute(ins,("weasel", 1, 2000.0))

<sqlite3.Cursor at 0x2195d620c00>

データの挿入にはプレースホルダーという方法を使ったより安全な方法があり、この方法を使えば繰り返しデータを挿入する際に簡略できることに加え、SQLインジェクション(システムに悪意のあるSQLコマンドを送り込む外部からの攻撃)からシステムを守ってくれる  
やり方は、まず挿入するデータの値を？にしたSQLコマンドを変数に代入する  
その変数を実際にSQLコマンドを渡すところに第一引数として渡し、第二引数として？の数に合うようにデータを入れたタプルを渡すことでできる

In [111]:
curs.execute("SELECT * FROM zoo")

<sqlite3.Cursor at 0x2195d620c00>

In [112]:
rows = curs.fetchall()
print(rows)

[('duck', 5, 0.0), ('bear', 2, 1000.0), ('weasel', 1, 2000.0)]


上ではすべてのデータを取り出してみるために、まずSQLコマンドのSELECT文を使ってzooテーブルのすべての行と列を選択している  
そのあとcursorオブジェクトの fetchall メソッドを使ってデータをすべて変数に代入している

In [113]:
curs.execute("SELECT * FROM zoo ORDER BY count")

<sqlite3.Cursor at 0x2195d620c00>

In [114]:
curs.fetchall()

[('weasel', 1, 2000.0), ('bear', 2, 1000.0), ('duck', 5, 0.0)]

In [115]:
curs.execute("SELECT * FROM zoo ORDER BY count DESC")

<sqlite3.Cursor at 0x2195d620c00>

In [116]:
curs.fetchall()

[('duck', 5, 0.0), ('bear', 2, 1000.0), ('weasel', 1, 2000.0)]

上では個体順(count順)に行(レコード)を並び替え(ソート)している  
SELECT文で行と列の全体を選択してORDER BYの後に並び替えの基準にする列名を渡すことで並び替えできる  
デフォルトでは昇順(ASC)になっているため、降順にするにいはDESCを列名の後の最後のところに渡すことでできる

In [117]:
curs.execute("""SELECT * FROM zoo WHERE damages = (SELECT MAX(damages) FROM zoo)""")

<sqlite3.Cursor at 0x2195d620c00>

In [118]:
curs.fetchall()

[('weasel', 1, 2000.0)]

上ではdamagesの値が一番大きい行のデータを取得している  
右のSELECT文の中でdamagesが最大(MAX)のものの値を探し、左のSELECT文の中でdamagesが右のSELECT文で見つけた値と同じものを選択している

In [119]:
curs.close()
conn.close()

SQLiteを使い終わった後は接続とカーソルをcloseで終了する必要がある

## 8.4.6  SQLAlchemy

個々のデータベースは機能や哲学を反映した別々のSQLを使用している  
DB-APIでカバーできるのは共通のAPIまででありほかのレベルは扱えない  
そのようなクロスデータベースを扱えるのが SQLAlchemy になる  
SQLAlchemyは複数のレベルが扱える  
- 最も低いレベルでは、データベース接続のプール、SQLコマンドの実行、結果の処理をリターンを処理する(DB-APIに近い)
- 次のレベルは、SQLの文をPythonの式として表現するSQL表現言語である
- もっとも高いレベルは、ORM(Object Relational Mapping)レイヤである。このレイヤはSQL表現言語を使ってアプリケーションコードとリレーショナルデータ構造を結びつける

SQLAlchemyは最初に渡す接続文字列によってどのドライバが必要なのかを判断するのでドライバをインストールする必要がない  
接続文字列は次のようになっている  
*dialect* + *driver* :// *user* : *password@host* : *port* / *dbname*  
- *dialect* : データベースのタイプ
- *driver* : そのデータベースに対して使いたいと思っているドライバ
- *user*と*password* : データベースの認証文字列
- *host*と*port* : データベースサーバーの位置(: *port*は、デフォルトのポートなら不要)
- *dbname* : 最初に接続するサーバー上のデータベース  
SQLAlchemyの接続先

|方言|ドライバ|
|:-|:-|
|sqlite|pysqlite(または省略)|
|mysql|mysqlconnector|
|mysql|pymysql|
|mysql|oursql|
|postgresql|psycopg2|
|postgresql|pypostgresql|

### 8.4.6.1  エンジンレイヤ

まずSQLAlchemyの最も低いレベルを試してみる(これはDB-APIとあまり変わらない)  
SQLiteのための接続文字列は*host*,*port*,*user*,*password*は不要で、*dbname*にはどのファイルにデータベースを格納するのかをSQLiteに知らせる

In [120]:
import sqlalchemy as sa

In [121]:
conn = sa.create_engine("sqlite://")

In [122]:
conn.execute("""CREATE TABLE zoo
(critter VARCHAR(20) PRIMARY KEY,
count INT,
damages FLOAT)""")

<sqlalchemy.engine.result.ResultProxy at 0x2195d44f148>

sqlalchemyの create_engine 関数に上のようにデータベースのタイプをaqliteに指定して(ドライバを省略することでsqliteに指定)メモリ内にストレージを作り、engine オブジェクト(connectオブジェクトやcorsorオブジェクトのようなもの)を変数に代入している  
次にengineオブジェクトのexecuteメソッドを呼び出して前と同じようにzooというテーブルを作り、critter、count、damagesの列を作っている  
executeメソッドを使うとResultProxyオブジェクトが返って来る(使い方は後程)

In [123]:
ins = "INSERT INTO zoo (critter, count, damages) VALUES (?, ?, ?)"

In [124]:
conn.execute(ins, ("duck", 10, 0.0))
conn.execute(ins, ("bear", 2, 1000.0))
conn.execute(ins, ("weasel", 1, 2000.0))

<sqlalchemy.engine.result.ResultProxy at 0x2195da6ae88>

ここも前回と同じようにプレースホルダーという方法を使ったデータの挿入をしている

In [125]:
rows = conn.execute("SELECT * FROM zoo")

In [126]:
print(rows)

<sqlalchemy.engine.result.ResultProxy object at 0x000002195DA63988>


In [127]:
for row in rows:
    print(row)

('duck', 10, 0.0)
('bear', 2, 1000.0)
('weasel', 1, 2000.0)


今回は前回のように選択した範囲のデータをそのまま出力しようとしたがオブジェクト名が返されただけでデータの内容を出力できなかった  
しかし、イテレータとしてfor文に渡してあげることで出力できる

### 8.4.6.2  SQL表現言語

次のレベルはSQLAlchemyのSQL表現言語で、さまざまな操作のためのSQLを作る関数が入っている  
表現言語は多くのSQLの種類の違いに対処する仕事をしているため、リレーショナルデータベースアプリケーションに値する中間的なアプローチとして便利に使える

In [128]:
import sqlalchemy as sa
conn = sa.create_engine("sqlite://")

接続はさっきと同じようにする

In [129]:
meta = sa.MetaData()

In [130]:
zoo = sa.Table("zoo", meta,
              sa.Column("critter", sa.String, primary_key=True),
              sa.Column("count", sa.Integer),
              sa.Column("damages", sa.Float)
              )

In [131]:
meta.create_all(conn)

zooテーブルの定義にSQLではなく、表現言語を使うと上のようになる  
まずSQLAlchemyの MetaData 関数を呼び出して metadata オブジェクトを作る  
そしてSQLAlchemyの Table 関数にテーブル名、作成したmetadataオブジェクト、columnオブジェクトを渡すことで table オブジェクトを作成し変数に代入している  
column オブジェクトはSQLAlchemyの Column 関数に列の名前、SQLAlchemyのアトリビュートのデータ型、(critterはprimary_ley(主キー)をTrueにしている)を渡すことでできる

そして、metadataオブジェクトの create_all 関数にengineオブジェクト(connectオブジェクトのようなもの)を渡すことでテーブルを作成する

In [132]:
conn.execute(zoo.insert(("bear", 2, 1000.0)))
conn.execute(zoo.insert(("weasel", 1, 2000.0)))
conn.execute(zoo.insert(("duck", 10, 0.0)))

<sqlalchemy.engine.result.ResultProxy at 0x2195da63408>

表現言語のデータの挿入は、engineオブジェクトのexecuteメソッドに insert オブジェクトを渡すことでできる  
insertオブジェクトは、tableオブジェクトの insert メソッドに列の数のデータが入ったタプルを渡すことでできる

In [133]:
result = conn.execute(zoo.select())

In [134]:
rows = result.fetchall()

In [135]:
print(rows)

[('bear', 2, 1000.0), ('weasel', 1, 2000.0), ('duck', 10, 0.0)]


表現言語でデータを出力するには、engineオブジェクトのexecuteメソッドにtableオブジェクトの select メソッド(SELECT \* FROM zooと同じような意味)を渡すことでできる result オブジェクトを使う  
resultオブジェクトのfetchallメソッドを使うことですべての行のデータを取得できる

### 8.4.6.3  ORM

ORM(オブジェクト関係マッピング)はSQL表現言語を使うが、実際のデータベースのメカニズムはユーザーには見えない  
クラスを定義するとORMがデータベースとのやりとりをすべてしてくれるからだ  
オブジェクト関係マッピングの基本的な考え方は、リレーショナルデータベースを使いつつ、コード内でオブジェクトを参照し、Python的なやり方でコードを書き続けられるということだ  
zooクラスを定義してそれをORMに結びつけて、SQLiteにzoo.dbファイルを使わせてORMが機能しているかを確かめていく

In [136]:
import sqlalchemy as sa
from sqlalchemy.ext.declarative import declarative_base

In [137]:
conn = sa.create_engine("sqlite:///{}".format(r".\pydata\zoo.db"))

接続は今までと同じようにしているが、ひとつ追加でsqlalchemy.ext.declarativeのdeclarative_baseをインポートしている  
また、ファイルに保存するようにzoo.dbファイルを作成している

In [138]:
Base = declarative_base()

In [139]:
class Zoo(Base):
    __tablename__ = "zoo"
    critter = sa.Column("critter", sa.String, primary_key=True)
    count = sa.Column("count", sa.Integer)
    damages = sa.Column("damages", sa.Float)
    def __init__(self, critter, count, damages):
        self.critter = critter
        self.count = count
        self.damages = damages
    def __repr__(self):
        return "<zoo({}, {}, {})>".format(self.critter, self.count, self.damages)

In [140]:
Base.metadata.create_all(conn)

ここからORMの作業に入っていく  
まず、インポートした declarative 関数を呼び、Base オブジェクトを作成する  
class文でZooクラスを作り作成したBaseオブジェクトを継承先にする  
\_\_table\_\_にテーブル名を代入する  
それぞれのcolumnオブジェクトを作成し変数に代入する  
初期化メソッドの引数に入れたい列のcolumnオブジェクトを入れるようにして作る  
\_\_repr\_\_メソッドでクラスオブジェクトが呼ばれたときにどのように表示するかを定義する

クラスの定義が終わったら、Baseオブジェクトのmetadata.create_allメソッドにengineオブジェクトを渡してデータベースとテーブルをまとめて作成する

In [141]:
first = Zoo("duck", 10, 0.0)
second = Zoo("bear", 2, 1000.0)
third = Zoo("weasel", 1, 2000.0)

In [142]:
first

<zoo(duck, 10, 0.0)>

データを挿入する準備として先ほど定義したクラスオブジェクトを作成する

In [143]:
from sqlalchemy.orm import sessionmaker

In [144]:
Session = sessionmaker(bind=conn)

In [145]:
session = Session()

次の準備として session オブジェクトを作る  
そのためにsqlalchemy.ormからsessionmaker関数をインポートして、sessionmaker のキーワード引数 bind にengineオブジェクトを指定してsessionmaker オブジェクトを作成する  
sessionmakerオブジェクトにかっこをつけてそのまま呼ぶことで sessionオブジェクトを作成する

In [146]:
session.add(first)

In [147]:
session.add_all([second, third])

用意したsessionオブジェクトの add メソッドにデータの入ったクラスオブジェクトを渡すことでデータを挿入できる  
sessionオブジェクトの add_all メソッドにデータの入ったクラスオブジェクトのリストを渡すことでまとめてデータを挿入することもできる

In [148]:
session.commit()

sessionオブジェクトの commit メソッドを呼び出すことで内容をセーブし強制的に処理を完了させる

$ C:\Users\kumak\pydata>*sqlite3 zoo.db*  
SQLite version 3.31.1 2020-01-27 19:55:54  
Enter ".help" for usage hints.  
sqlite> *.tables*  
zoo  
sqlite> *select * from zoo;*  
duck|10|0.0  
bear|2|1000.0  
weasel|1|2000.0  
sqlite>  

上のようにコマンドプロンプトで入力することで実際にdbファイルにデータが入っていることがわかる

# 8.5  NoSQLデータストア

一部のデータベースはリレーショナルではなく、SQLとは違う形でデータベースを管理している  
これらは、非常に大きなデータセットの処理、柔軟なデータ定義、カスタムデータ処理のサポートなどを目的として作られていてNoSQLと呼ばれている

## 8.5.1  dbmファミリ

dbm形式はキーバリューの組で作られ、ウェブブラウザなどのアプリケーションで様々な設定を維持・管理するために組み込まれることが多い  
dbmデータストアは次のような性質を持っていて、Pythonの辞書に似ている  
- キーに値を代入でき、代入された値は自動的にディスク上のデータベースに保存される  
- キーを値から取得できる

In [149]:
import dbm

In [150]:
db = dbm.open(r".\pydata\definitions","c")

まず dbm をインポートして、関数の open にファイル名と書き込みと読み込み両方ができる cモード で開いている  
そして返されるdbmの database オブジェクトを変数に代入している

In [151]:
db["mustard"] = "yellow"
db["ketchup"] = "red"
db["pesto"] = "green"

In [152]:
len(db)

3

In [153]:
db["pesto"]

b'green'

ファイルにデータを保存するにはdatabaseオブジェクトに入れたいキーを指定して、値を代入するだけでできる  
lenを使えばデータ数、databaseオブジェクトに存在するキーを指定すれば値をバイト型で返してくれる

In [154]:
db.close()

databaseオブジェクトの close メソッドを呼べば処理を終了、保存できる(ファイルが3つ作られる)

In [155]:
db = dbm.open(r".\pydata\definitions","r")

In [156]:
data = db["mustard"]

In [157]:
data.decode("utf-8")

'yellow'

今度は読み込み専用でdatabaseオブジェクトを作り、キーを与えてみるとしっかり値が返ってくることから、ファイルに保存されていることがわかる

## 8.5.2  memcached

memcachedはキーと値のための高速なインメモリのキャッシュサーバーで、データベースの前処理や、ウェブサーバーのセッションデータの格納に使われたりすることが多い  
http://bit.ly/memcache-win でダウンロードできる  
実際に使うにはmemcachedサーバーとPythonドライバが必要である  
Pythonドライバとしては python3-memcached がありサードパーティとしてpipを使ってダウンロードする必要がある

memcachedを使うには、memcachedサーバーに接続する必要があり、接続後は次のようなことができる
- キーを指定した値の取得・設定
- 値のインクリメント、デクリメント
- キーの削除

memcachedのデータは永続的ではなく、早い段階から書き込んだデータから消える場合がある  
これは本質的な特徴で、だからこそキャッシュサーバーなのである  
次のサンプルコードでは、同じコンピュータ上のひとつのmemcachedサーバーとだけやり取りするようにしている

`import memcache
 db = memcache.Client(["127.0.0.1:11211"])
 db.set("marco","polo")`  
True  
`db.get("marco")`  
'polo'  
`db.set("dicks", 0)`  
True  
`db.get("ducks")`  
0  
`db.incr("ducks", 2)`  
2  
`db.get("ducks")`  
2

memcache をインポートし、関数のClientにローカルなIPアドレスを渡して memcached サーバーと接続、databaseオブジェクトを変数に代入している  
databaseオブジェクトの set メソッドにキーとバリューを引数として渡してデータを保存  
databaseオブジェクトの get メソッドに取得したい値のキーを渡して値を取得  
databaseオブジェクトの incr メソッドで変更したい値のキーと値を入れることで値を変更

## 8.5.3  Redis

Redisはmemcacheと同じデータ構造サーバーだが、memcacheと異なり次のことを実行できる  
- ディスクにデータを保存できるので信頼性が高く、再起動ができる
- 古いデータを消さずに残しておける
- 単純な文字列以外のデータ構造もある  

Redisのデータ型はPythonのデータ型に非常に近く、Redisサーバーはひとつあるいは複数のPythonアプリケーションがデータを共有するための便利な中間媒体になり得る  
Pythonドライバのredis-pyはGitHubにソースコードとテストを置いており、オンラインドキュメントもある  
pipを使えばredisをダウンロードできる

windowsだとサポートされてないので https://github.com/MicrosoftArchive/redis/releases からzipファイルをインストールして、redis-server.exe ファイルを起動して許可を出す必要がある

### 8.5.3.1  文字列

In [161]:
import redis

In [162]:
conn = redis.Redis()

まず redis をインポートする  
次にredisの Redis 関数を使ってRedisサーバーに接続して、redisオブジェクトを作成する  
Redis関数の引数はなんらかのホストとなんらかのポートで、デフォルトはlocalhostと6379であり、空欄だとRedis(localhost, 6379)と同じになる  

In [163]:
conn.keys("*")

[b'logins',
 b'2013-02-26',
 b'sdiff_animal',
 b'carats',
 b'2013-02-27',
 b'fever',
 b'zoo',
 b'song',
 b'cordial',
 b'animal',
 b'sunion_animal',
 b'test',
 b'pie',
 b'2013-02-25',
 b'secret',
 b'another_animal',
 b'sinter_animal']

全てのキーのリストを表示するには上のようにすることで得られる

In [164]:
conn.set("secret","ni!")

True

In [165]:
conn.set("carats",24)

True

In [166]:
conn.set("fever","101.5")

True

redisオブジェクトの set メソッドに書き込みたいキーと値を渡すことででき、成功するとTrueが返ってくる

In [167]:
conn.get("secret")

b'ni!'

In [168]:
conn.get("carats")

b'24'

In [169]:
conn.get("fever")

b'101.5'

redisオブジェクトの get メソッドに読み出したいキーを渡すことで値を取り出すことができる(バイト文字列)

In [170]:
conn.setnx("secret","icky")

False

In [171]:
conn.setnx("natto","icky")

True

redisオブジェクトの setnx メソッドは、渡したキーが存在する場合は値を書き込まずにFalseを返し、渡したキーが存在しない場合は第二引数に渡した値を書き込みTrueを返す

In [172]:
conn.getset("natto","icky-icky")

b'icky'

In [173]:
conn.get("natto")

b'icky-icky'

redisオブジェクトの getset メソッドは、渡したキーを取り出した後に第二引数に渡した値を新しい値として書き込む

In [174]:
conn.getrange("natto",-4,-1)

b'icky'

redisオブジェクトの getrange メソッドは、渡したキーの値の範囲を指定して表示できる

In [175]:
conn.setrange("natto",0,"ICKY")

9

In [176]:
conn.get("natto")

b'ICKY-icky'

redisオブジェクトの setrange メソッドは、渡したキーの値のインデックス値の文字列を新しい文字列に書き換えることができる

In [177]:
conn.mset({"pie":"cherry","cordial":"sherry"})

True

In [178]:
conn.mget(["pie","cordial"])

[b'cherry', b'sherry']

redisオブジェクトの mset メソッドに辞書を渡すことで複数のキーと値を同時に書き込むことができる  
redisオブジェクトの mget メソッドにキーのリストを渡すことで複数の値を読み込むことができる

In [179]:
conn.delete("natto")

1

In [180]:
conn.get("natto")

redisオブジェクトの delete メソッドにキーを渡すことでキーと値を削除することができる

In [181]:
conn.get("carats")

b'24'

In [182]:
conn.incr("carats")

25

In [183]:
conn.incr("carats",10)

35

In [184]:
conn.decr("carats")

34

In [185]:
conn.decr("carats",15)

19

In [186]:
conn.get("carats")

b'19'

redisオブジェクトの incr メソッドにキーと数字を渡すことで値の数値を増やすことができる、第二引数の数字を省略すると1だけ足すことができる  
redisオブジェクトの decr メソッドにキーと数字を渡すことで値の数値を減らすことができる、第二引数の数字を省略すると1だけ減らすことができる

In [187]:
conn.incrbyfloat("fever")

102.5

In [188]:
conn.incrbyfloat("fever",0.5)

103.0

In [189]:
conn.incrbyfloat("fever",-2.0)

101.0

redisオブジェクトの incrbyfloat メソッドにキーと小数点数を渡すことで数値を増やしたり減らしたりすることができる  
第二引数を省略することで1.0だけ足すことができる  
減らすためのdecrbyfloatメソッドは存在しないので、値を減らしたい場合はマイナスをつけることでできる

### 8.5.3.2  リスト

Redisリストは文字列しか格納できない  
リストは最初の挿入を行ったときに自動で作成される

In [190]:
conn.lpush("zoo","bear")

5

In [191]:
conn.lpush("zoo","alligator","duck")

7

redisオブジェクトの lpush メソッドの第一引数にリスト名、第二引数以降に挿入したい文字列を渡すことで、リストの先頭から文字列を挿入していくことができる  

In [192]:
conn.linsert("zoo","before","bear","beaver")

8

In [193]:
conn.linsert("zoo","after","bear","cassowary")

9

redisオブジェクトの linsert メソッドの第一引数にリスト名、第二引数に"before"もしくは"after"、第三引数に挿入したい場所の基準になる文字列、第四引数に挿入したい文字列を渡すことで、場所を指定して文字列を挿入できる

In [194]:
conn.lset("zoo",2,"marmoset")

True

redisオブジェクトの lset メソッドの第一引数にリスト名、第二引数に挿入したい場所のインデックス値、第三引数に挿入したい文字列を渡すことで、好きなインデックス値に文字列を挿入できる

In [195]:
conn.rpush("zoo","yak")

10

redisオブジェクトの rpush メソッドの第一引数にリスト名、第二引数に挿入したい文字列を渡すことで、リストの末尾に文字列を挿入できる

In [196]:
conn.lindex("zoo",3)

b'bear'

redisオブジェクトの lindex メソッドの第一引数にリスト名、第二引数にインデックス値を渡すことで、リストの指定したインデックス値にある文字列を取り出すことができる(バイト文字列)

In [197]:
conn.lrange("zoo",0,2)

[b'duck', b'alligator', b'marmoset']

In [198]:
conn.lrange("zoo",0,-1)

[b'duck',
 b'alligator',
 b'marmoset',
 b'bear',
 b'cassowary',
 b'alligator',
 b'marmoset',
 b'bear',
 b'cassowary',
 b'yak']

redisオブジェクトの lrange メソッドの第一引数にリスト名、第二引数に取得したい範囲の開始インデックス値、第三引数に取得したい範囲の終了インデックス値を渡すことで、リストの指定した範囲の文字列をリストで取り出すことができる  
開始インデックス値に0、終了インデックス値に-1を渡すことでリストの中の全ての文字列を取得できる

In [199]:
conn.ltrim("zoo",1,4)

True

In [200]:
conn.lrange("zoo",0,-1)

[b'alligator', b'marmoset', b'bear', b'cassowary']

redisオブジェクトの ltrim メソッドの第一引数にリスト名、第二引数に指定したい範囲の開始インデックス値、第三引数に指定したい範囲の終了インデックス値を渡すことで、リストの指定した範囲の文字列だけを残し、残りは削除する

### 8.5.3.3  ハッシュ

RedisのハッシュはPythonの辞書に似ているが、文字列しか格納できない  
そのため、一次元の構造でしか作れない

In [201]:
conn.hset("song","mi","a note to follow re")

0

redisオブジェクトの hset メソッドの第一引数にハッシュ名、第二引数にキー、第三引数に文字列を渡すことで、キーと文字列をハッシュに挿入できる  
挿入に成功すると1を返す

In [202]:
conn.hmset("song",{"do":"a bear","re":"about a deer"})

  """Entry point for launching an IPython kernel.


True

redisオブジェクトの hmset メソッドの第一引数にハッシュ名、第二引数に辞書を渡すことで、辞書のキーと文字列をハッシュに挿入できる  
挿入に成功するとTrueを返す

In [203]:
conn.hget("song","mi")

b'a note to follow re'

redisオブジェクトの hget メソッドの第一引数にハッシュ名、第二引数にキーを渡すことで、ハッシュの中のキーに対応する文字列を取得できる(バイト文字列)

In [204]:
conn.hmget("song","re","do")

[b'about a deer', b'a bear']

redisオブジェクトの hmget メソッドの第一引数にハッシュ名、第二引数以降にキーを渡すことで、ハッシュの中のキーに対応する文字列をリストで取得できる

In [205]:
conn.hkeys("song")

[b'do', b're', b'mi', b'fa']

redisオブジェクトの hkeys メソッドにハッシュ名を渡すことで、挿入されているキーをリストにして取得できる

In [206]:
conn.hvals("song")

[b'a bear',
 b'about a deer',
 b'a note to follow re',
 b'a note that rhymes with la']

redisオブジェクトの hvals メソッドにハッシュ名を渡すことで、挿入されている文字列をリストにして取得することができる

In [207]:
conn.hgetall("song")

{b'do': b'a bear',
 b're': b'about a deer',
 b'mi': b'a note to follow re',
 b'fa': b'a note that rhymes with la'}

redisオブジェクトの hgetall メソッドにハッシュ名を渡すことで、挿入されているキーと文字列のペアを辞書にして取得することができる

In [208]:
conn.hsetnx("song","fa","a note that rhymes with la")

0

In [209]:
conn.hsetnx("song","fa","a note that rhymes with wo")

0

In [210]:
conn.hget("song","fa")

b'a note that rhymes with la'

redisオブジェクトの hsetnx メソッドの第一引数にハッシュ名、第二引数に挿入したいキー、第三引数にキーが存在しなかった場合に挿入したい文字列を渡すことで、キーが存在しない場合に第三引数の文字列をペアとして挿入し、キーが存在した場合は変更しない  
挿入した場合は1、挿入しなかった場合は0を返す

In [211]:
conn.hlen("song")

4

redisオブジェクトの hlen メソッドの第一引数にハッシュ名を渡すことで、ハッシュの中にあるペア数を取得できる

### 8.5.3.4  集合

Redisの集合はPythonのセット集合とよく似ている

In [212]:
conn.sadd("animal","duck","goat","turkey")

1

redisオブジェクトの sadd メソッドの第二引数に集合名、第二引数以降に挿入したい文字列を渡すことで、複数の文字列を同時に挿入できる

In [213]:
conn.scard("animal")

3

redisオブジェクトの scard メソッドに集合名を渡すことで、集合の中の文字列の数を取得することができる

In [214]:
conn.smembers("animal")

{b'duck', b'goat', b'turkey'}

redisオブジェクトの smembers メソッドに集合名を渡すことで、集合の中の文字列をセット集合ですべて取得することができる

In [215]:
conn.srem("animal","turkey")

1

redisオブジェクトの srem メソッドの第一引数に集合名、第二引数に削除する文字列を渡すことで、集合から文字列を削除できる

In [216]:
conn.sadd("another_animal","tiger","wolf","duck")

0

In [217]:
conn.sinter("animal","another_animal")

{b'duck'}

redisオブジェクトの sinter メソッドに2つの集合名を渡すことで、積集合(共通要素)を取得できる

In [218]:
conn.sinterstore("sinter_animal","animal","another_animal")

1

In [219]:
conn.smembers("sinter_animal")

{b'duck'}

redisオブジェクトの sinterstore メソッドの第一引数に作成したい集合名、第二引数と第三引数に積集合を求めたい集合名を2つ渡すことで、第一引数に渡した集合名を作成し、積集合の文字列が挿入される

In [220]:
conn.sunion("animal","anothe_animal")

{b'duck', b'goat'}

redisオブジェクトの sunion メソッドに2つの集合名を渡すことで、和集合(両方の全ての要素)を取得できる

In [221]:
conn.sunionstore("sunion_animal","animal","another_animal")

4

In [222]:
conn.smembers("sunion_animal")

{b'duck', b'goat', b'tiger', b'wolf'}

redisオブジェクトの sunionstore メソッドの第一引数に作成したい集合名、第二引数と第三引数に和集合を求めたい集合名を2つ渡すことで、第一引数に渡した集合名を作成し、和集合の文字列が挿入できる

In [223]:
conn.sdiff("animal","another_animal")

{b'goat'}

redisオブジェクトの sdiff メソッドの第一引数と第二引数に集合名を渡すことで、差集合(第一引数に渡した集合にあって第二引数に渡した集合にない文字列)を取得できる

In [224]:
conn.sdiffstore("sdiff_animal","animal","another_animal")

1

In [225]:
conn.smembers("sdiff_animal")

{b'goat'}

redisオブジェクトの sdiff_animal メソッドの第一引数に作成したい集合名、第二引数に差集合を求めたい集合名、第三引数に差集合を求めるための対象の集合名を渡すことで、第一引数に渡した集合名を作成し、差集合の文字列が挿入できる

### 8.5.3.5  ソート済み集合

ソート済み集合はzsetとも呼ばれるもので、それぞれの値がスコアと呼ばれる浮動小数点数も持っている  
要素には値とスコアのどちらからでもアクセスでき、次のような用途がある  
- スコアボード
- 副インデックス
- タイムライン(タイムスタンプをスコアとして使う)  

次ではタイムスタンプをを使ってユーザーのログインを監視する

In [226]:
import time
now = time.time()
logins_dict={"smeagol":now, "sauron":now+(5*60), "bilbo":now+(2*60*60), "treebeard":now+(24*60*60)}

logins_dictのキーにログインした人の名前、値にその人がログインしたUnix時間を渡して辞書を作る

In [227]:
conn.zadd("logins",logins_dict)

0

redisオブジェクトの zadd メソッドの第一引数にソート済み集合名、第二引数に値とスコアの入った辞書を渡すことで、ソート済み集合に挿入できる

In [228]:
conn.zrank("logins","bilbo")

2

redisオブジェクトの zrank メソッドの第一引数にソート済み集合名、第二引数に値を渡すことで、その値がソート済み集合のインデックス値を返してくれる

In [229]:
conn.zscore("logins","bilbo")

1601313227.8995745

redisオブジェクトの zscore メソッドの第一引数にソート済み集合名、第二引数にスコアを知りたい値を渡すことで、指定した値のスコアを取得できる

In [230]:
conn.zrange("logins",0,-1)

[b'smeagol', b'sauron', b'bilbo', b'treebeard']

redisオブジェクトの zrange メソッドの第一引数にソート済み集合名、第二引数に開始インデックス値、第三引数に終了インデックス値を渡すことで、指定した範囲の値を表示できる(0と-1を渡すことで全部表示できる)

In [231]:
conn.zrange("logins",0,-1,withscores=True)

[(b'smeagol', 1601306027.8995745),
 (b'sauron', 1601306327.8995745),
 (b'bilbo', 1601313227.8995745),
 (b'treebeard', 1601392427.8995745)]

redisオブジェクトのzrangeメソッドにキーワード引数の withscores をTrueにすると、値とスコアをセットにして取得できる

### 8.5.3.6  ビット

ビットは大量の数値を少ないスペースで高速に処理できる

次はユーザーがどのくらいの頻度でログインしているか、特定の日に何人がログインしたか、特定のユーザーがどれくらいの頻度でログインしているか、ということを管理するためにビットを使うとする

In [232]:
days = ["2013-02-25","2013-02-26","2013-02-27"]
big_spender = 1089
tire_kicker = 40459
late_joiner = 550212

In [233]:
conn.setbit(days[0],big_spender,1)
conn.setbit(days[0],tire_kicker,1)

1

In [234]:
conn.setbit(days[1],big_spender,1)

1

In [235]:
conn.setbit(days[2],big_spender,1)
conn.setbit(days[2],late_joiner,1)

1

redisオブジェクトの setbit メソッドの第一引数にビット名(日付)、第二引数に数値(ID)、第三引数にビット値(1がログインした証)を渡すことで、ビットに数値と値を挿入できる  

In [236]:
for day in days:
    print(conn.bitcount(day))

2
1
2


redisメソッドの bitcount メソッドにビット名(日付)を渡すことで、挿入されているデータ数(来訪者数)を取得することができる

In [237]:
conn.getbit(days[1],tire_kicker)

0

In [238]:
conn.getbit(days[1],big_spender)

1

redisオブジェクトの getbit メソッドの第一引数にビット名(日付)、第二引数に値(ID)を渡すことで、ビット値を取得できる  
存在しない場合は0を返す

In [239]:
help(conn.bitop)

Help on method bitop in module redis.client:

bitop(operation, dest, *keys) method of redis.client.Redis instance
    Perform a bitwise operation using ``operation`` between ``keys`` and
    store the result in ``dest``.



In [240]:
conn.bitop("and","everyday",*days)

68777

redisオブジェクトの bitop メソッドの第一引数にオペレーション(上ではandで積集合)、第二引数に新しく作成したいビット名、調べたいビット名のセットを渡すことで、すべてに含まれている値(ID)があるか調べることができる

In [241]:
conn.bitcount("everyday")

1

In [242]:
conn.getbit("everyday",big_spender)

1

In [243]:
conn.bitop("or","alldays",*days)

68777

redisオブジェクトのbitopメソッドの第一引数にorを渡すことで和集合を取得することができる

In [244]:
conn.bitcount("alldays")

3

### 8.5.3.7  キャッシュと有効期限

Redisのすべてのキーには有効期限がある  
デフォルトでは永遠になっているが、expire関数を使うことでキーの有効期限を設定できる(有効期限の値は秒単位)

In [245]:
import time
key = "now you see it"

In [246]:
conn.set(key,"but not for long")

True

In [247]:
conn.expire(key,5)

True

In [248]:
conn.ttl(key)

5

In [249]:
conn.get(key)

b'but not for long'

In [250]:
time.sleep(6)

In [251]:
conn.get(key)

上のコード急いで実行するとsleep関数の前は表示されて、あとになると表示されなくなる  
redisオブジェクトの expire メソッドの第一引数に有効期限を設定したいキー、第二引数に秒数を渡すことで、秒数の間だけ内容を保存することができる  
redisオブジェクトの ttl メソッドに有効期限を設定したキーを渡すことで保存される残り時間を知ることができる