### 60. KVSの構築
Key-Value-Store (KVS) を用い，アーティスト名（name）から活動場所（area）を検索するためのデータベースを構築せよ．

In [9]:
import leveldb
db60 = leveldb.LevelDB('data/db60')

In [1]:
import gzip
import json

In [10]:
for line in gzip.open('data/artist.json.gz'):
    data  = json.loads(line)
    name = (data['name'] + ' ' + str(data['id'])).encode()
    area = data.get('area', 'NODATA').encode()
    db60.Put(name, area)

### 61. KVSの検索
60で構築したデータベースを用い，特定の（指定された）アーティストの活動場所を取得せよ．

In [4]:
def where(name):
    for k, v in db60.RangeIter(key_from=name.encode(), key_to=(name + chr(33)).encode()):
        artist = k.decode().split()[0]
        place = v.decode()
        print(artist + '\t' + place)

In [5]:
where('Oasis')

Oasis	United Kingdom
Oasis	United States
Oasis	United Kingdom
Oasis	NODATA
Oasis	NODATA
Oasis	Kent


### 62. KVS内の反復処理
60で構築したデータベースを用い，活動場所が「Japan」となっているアーティスト数を求めよ．

In [6]:
i = 0
for k, v in db60.RangeIter():
    if v.decode() == 'Japan':
        i = i + 1
print(i)

22821


### 63. オブジェクトを値に格納したKVS
KVSを用い，アーティスト名（name）からタグと被タグ数（タグ付けされた回数）のリストを検索するためのデータベースを構築せよ．さらに，ここで構築したデータベースを用い，アーティスト名からタグと被タグ数を検索せよ．

In [7]:
db63 = leveldb.LevelDB('data/db63')

In [8]:
for line in gzip.open('data/artist.json.gz'):
    data  = json.loads(line)
    name = (data['name'] + ' ' + str(data['id'])).encode()
    if 'tags' in data:
        tags = ' '.join([tag['value'] + ' ' + str(tag['count']) for tag in data['tags']]).encode()
    else:
        tags = 'NOTAGS'.encode()
    db63.Put(name, tags)

In [9]:
def taged(name):
    for k, v in db63.RangeIter(key_from=name.encode(), key_to=(name + chr(33)).encode()):
        artist = k.decode().split()[0]
        tags = v.decode()
        print(artist + '\t' + tags)

In [10]:
taged('Oasis')

Oasis	rock 1 britpop 3 british 4 uk 1 britannique 1 rock and indie 1 england 1 manchester 1
Oasis	NOTAGS
Oasis	morning glory 1 oasis 1
Oasis	NOTAGS
Oasis	NOTAGS
Oasis	NOTAGS


### 64. MongoDBの構築
アーティスト情報（artist.json.gz）をデータベースに登録せよ．さらに，次のフィールドでインデックスを作成せよ: name, aliases.name, tags.value, rating.value

In [2]:
from pymongo import MongoClient
client = MongoClient('localhost', 27017)

In [3]:
db = client['database64']

In [4]:
collection = db['collection64']

In [6]:
for line in gzip.open('data/artist.json.gz'):
    data  = json.loads(line)
    collection.insert_one(data)

In [8]:
collection.count_documents({})

921337

In [20]:
sorted(list(collection.index_information()))[:10]

['_id_', 'name_1']

In [19]:
collection.create_index('name')

'name_1'

In [45]:
collection.create_index('aliases.name')

'aliases.name_1'

In [48]:
collection.create_index('tags.value')

'tags.value_1'

In [61]:
collection.create_index('rating.value')

'rating.value_1'

### 65. MongoDBの検索
MongoDBのインタラクティブシェルを用いて，"Queen"というアーティストに関する情報を取得せよ．さらに，これと同様の処理を行うプログラムを実装せよ．

mongo shellの実行結果

```> db.collection64.find({name:"Queen"})
{ "_id" : ObjectId("5cb96ae882efee22526bbdab"), "name" : "Queen", "area" : "Japan", "gender" : "Female", "tags" : [ { "count" : 1, "value" : "kamen rider w" }, { "count" : 1, "value" : "related-akb48" } ], "sort_name" : "Queen", "ended" : true, "gid" : "420ca290-76c5-41af-999e-564d7c71f1a7", "type" : "Character", "id" : 701492, "aliases" : [ { "name" : "Queen", "sort_name" : "Queen" } ] }
{ "_id" : ObjectId("5cb96b0882efee22526c8457"), "rating" : { "count" : 24, "value" : 92 }, "begin" : { "date" : 27, "month" : 6, "year" : 1970 }, "name" : "Queen", "area" : "United Kingdom", "tags" : [ { "count" : 2, "value" : "hard rock" }, { "count" : 1, "value" : "70s" }, { "count" : 1, "value" : "queen family" }, { "count" : 1, "value" : "90s" }, { "count" : 1, "value" : "80s" }, { "count" : 1, "value" : "glam rock" }, { "count" : 4, "value" : "british" }, { "count" : 1, "value" : "english" }, { "count" : 2, "value" : "uk" }, { "count" : 1, "value" : "pop/rock" }, { "count" : 1, "value" : "pop-rock" }, { "count" : 1, "value" : "britannique" }, { "count" : 1, "value" : "classic pop and rock" }, { "count" : 1, "value" : "queen" }, { "count" : 1, "value" : "united kingdom" }, { "count" : 1, "value" : "langham 1 studio bbc" }, { "count" : 1, "value" : "kind of magic" }, { "count" : 1, "value" : "band" }, { "count" : 6, "value" : "rock" }, { "count" : 1, "value" : "platinum" } ], "sort_name" : "Queen", "ended" : true, "gid" : "0383dadf-2a4e-4d10-a46a-e9e041da8eb3", "type" : "Group", "id" : 192, "aliases" : [ { "name" : "女王", "sort_name" : "女王" } ] }
{ "_id" : ObjectId("5cb96b4f82efee22526e3eaf"), "ended" : true, "gid" : "5eecaf18-02ec-47af-a4f2-7831db373419", "sort_name" : "Queen", "id" : 992994, "name" : "Queen" }```

In [63]:
for post in collection.find({'name':'Queen'}):
    print(post)

{'_id': ObjectId('5cb96ae882efee22526bbdab'), 'name': 'Queen', 'area': 'Japan', 'gender': 'Female', 'tags': [{'count': 1, 'value': 'kamen rider w'}, {'count': 1, 'value': 'related-akb48'}], 'sort_name': 'Queen', 'ended': True, 'gid': '420ca290-76c5-41af-999e-564d7c71f1a7', 'type': 'Character', 'id': 701492, 'aliases': [{'name': 'Queen', 'sort_name': 'Queen'}]}
{'_id': ObjectId('5cb96b0882efee22526c8457'), 'rating': {'count': 24, 'value': 92}, 'begin': {'date': 27, 'month': 6, 'year': 1970}, 'name': 'Queen', 'area': 'United Kingdom', 'tags': [{'count': 2, 'value': 'hard rock'}, {'count': 1, 'value': '70s'}, {'count': 1, 'value': 'queen family'}, {'count': 1, 'value': '90s'}, {'count': 1, 'value': '80s'}, {'count': 1, 'value': 'glam rock'}, {'count': 4, 'value': 'british'}, {'count': 1, 'value': 'english'}, {'count': 2, 'value': 'uk'}, {'count': 1, 'value': 'pop/rock'}, {'count': 1, 'value': 'pop-rock'}, {'count': 1, 'value': 'britannique'}, {'count': 1, 'value': 'classic pop and rock'},

### 66. 検索件数の取得
MongoDBのインタラクティブシェルを用いて，活動場所が「Japan」となっているアーティスト数を求めよ．

mongo shellの実行結果

```> db.collection64.find({area:"Japan"}).count()
22821```

### 67. 複数のドキュメントの取得
特定の（指定した）別名を持つアーティストを検索せよ．

In [64]:
for post in collection.find({'aliases.name':'女王'}):
    print(post)

{'_id': ObjectId('5cb96b0882efee22526c8457'), 'rating': {'count': 24, 'value': 92}, 'begin': {'date': 27, 'month': 6, 'year': 1970}, 'name': 'Queen', 'area': 'United Kingdom', 'tags': [{'count': 2, 'value': 'hard rock'}, {'count': 1, 'value': '70s'}, {'count': 1, 'value': 'queen family'}, {'count': 1, 'value': '90s'}, {'count': 1, 'value': '80s'}, {'count': 1, 'value': 'glam rock'}, {'count': 4, 'value': 'british'}, {'count': 1, 'value': 'english'}, {'count': 2, 'value': 'uk'}, {'count': 1, 'value': 'pop/rock'}, {'count': 1, 'value': 'pop-rock'}, {'count': 1, 'value': 'britannique'}, {'count': 1, 'value': 'classic pop and rock'}, {'count': 1, 'value': 'queen'}, {'count': 1, 'value': 'united kingdom'}, {'count': 1, 'value': 'langham 1 studio bbc'}, {'count': 1, 'value': 'kind of magic'}, {'count': 1, 'value': 'band'}, {'count': 6, 'value': 'rock'}, {'count': 1, 'value': 'platinum'}], 'sort_name': 'Queen', 'ended': True, 'gid': '0383dadf-2a4e-4d10-a46a-e9e041da8eb3', 'type': 'Group', 'id

### 68. ソート
"dance"というタグを付与されたアーティストの中でレーティングの投票数が多いアーティスト・トップ10を求めよ．

In [77]:
import pymongo

In [89]:
for post, i in zip(collection.find({'tags.value':'dance'}).sort('rating.count', pymongo.DESCENDING), range(10)):
    print(str(i+1)+ '位' + '\t' + str(post['rating']['count']) + '票' + '\t' + post['name'])

1位	26票	Madonna
2位	23票	Björk
3位	23票	The Prodigy
4位	15票	Rihanna
5位	13票	Britney Spears
6位	11票	Maroon 5
7位	7票	Adam Lambert
8位	7票	Fatboy Slim
9位	6票	Basement Jaxx
10位	5票	Cornershop


### 69. Webアプリケーションの作成
ユーザから入力された検索条件に合致するアーティストの情報を表示するWebアプリケーションを作成せよ．アーティスト名，アーティストの別名，タグ等で検索条件を指定し，アーティスト情報のリストをレーティングの高い順などで整列して表示せよ．