# データの保存



In [2]:
print('rank,city,population')  # 1行目のヘッダーを書き出す。

# 2行目以降を書き出す。join()メソッドの引数に渡すlistの要素はstrでなければならないことに注意。
print(','.join(['1', '上海', '24150000']))
print(','.join(['2', 'カラチ', '23500000']))
print(','.join(['3', '北京', '21516000']))
print(','.join(['4', '天津', '14722100']))
print(','.join(['5', 'イスタンブル', '14160467']))

rank,city,population
1,上海,24150000
2,カラチ,23500000
3,北京,21516000
4,天津,14722100
5,イスタンブル,14160467


In [4]:
# CSV
import csv

# ファイルを書き込み用に開く。newline=''として改行コードの自動変換を抑制する。
with open('top_cities.csv', 'w', newline='') as f:
    writer = csv.writer(f)  # csv.writerはファイルオブジェクトを引数に指定する。
    writer.writerow(['rank', 'city', 'population'])  # 1行目のヘッダーを出力する。
    # writerows()で複数の行を一度に出力する。引数はリストのリスト。
    writer.writerows([
        [1, '上海', 24150000],
        [2, 'カラチ', 23500000],
        [3, '北京', 21516000],
        [4, '天津', 14722100],
        [5, 'イスタンブル', 14160467],
    ])


In [6]:
!ls

ch1_2.ipynb              ch2_5.ipynb              index.html.1
ch1_3.ipynb              dp                       rss2.xml
ch1_4.ipynb              dp.1                     [34msample.scraping-book.com[m[m
ch2-6.ipynb              dp.html                  top_cities.csv
ch2_4.ipynb              index.html               [31myakei_kobe.csv[m[m


In [7]:
!cat top_cities.csv

rank,city,population
1,上海,24150000
2,カラチ,23500000
3,北京,21516000
4,天津,14722100
5,イスタンブル,14160467


In [10]:
import csv

with open('top_cities2.csv', 'w', newline='') as f:
    # 第1引数にファイルオブジェクトを、第2引数にフィールド名のリストを指定する。
    writer = csv.DictWriter(f, ['rank', 'city', 'population'])
    writer.writeheader()  # 1行目のヘッダーを出力する。
    # writerows()で複数の行を一度に出力する。引数は辞書のリスト。
    writer.writerows([
        {'rank': 1, 'city': '上海', 'population': 24150000},
        {'rank': 2, 'city': 'カラチ', 'population': 23500000},
        {'rank': 3, 'city': '北京', 'population': 21516000},
        {'rank': 4, 'city': '天津', 'population': 14722100},
        {'rank': 5, 'city': 'イスタンブル', 'population': 14160467},
    ])

In [11]:
!cat top_cities2.csv

rank,city,population
1,上海,24150000
2,カラチ,23500000
3,北京,21516000
4,天津,14722100
5,イスタンブル,14160467


In [15]:
import json

cities = [
    {'rank': 1, 'city': '上海', 'population': 24150000},
    {'rank': 2, 'city': 'カラチ', 'population': 23500000},
    {'rank': 3, 'city': '北京', 'population': 21516000},
    {'rank': 4, 'city': '天津', 'population': 14722100},
    {'rank': 5, 'city': 'イスタンブル', 'population': 14160467},
]

json.dumps(cities)


'[{"rank": 1, "city": "\\u4e0a\\u6d77", "population": 24150000}, {"rank": 2, "city": "\\u30ab\\u30e9\\u30c1", "population": 23500000}, {"rank": 3, "city": "\\u5317\\u4eac", "population": 21516000}, {"rank": 4, "city": "\\u5929\\u6d25", "population": 14722100}, {"rank": 5, "city": "\\u30a4\\u30b9\\u30bf\\u30f3\\u30d6\\u30eb", "population": 14160467}]'

In [17]:
json.dumps(cities, ensure_ascii=False)

'[{"rank": 1, "city": "上海", "population": 24150000}, {"rank": 2, "city": "カラチ", "population": 23500000}, {"rank": 3, "city": "北京", "population": 21516000}, {"rank": 4, "city": "天津", "population": 14722100}, {"rank": 5, "city": "イスタンブル", "population": 14160467}]'

In [19]:
print(json.dumps(cities, ensure_ascii=False, indent=2))

[
  {
    "rank": 1,
    "city": "上海",
    "population": 24150000
  },
  {
    "rank": 2,
    "city": "カラチ",
    "population": 23500000
  },
  {
    "rank": 3,
    "city": "北京",
    "population": 21516000
  },
  {
    "rank": 4,
    "city": "天津",
    "population": 14722100
  },
  {
    "rank": 5,
    "city": "イスタンブル",
    "population": 14160467
  }
]


In [21]:
with open('top_cities.json', 'w') as f:
    json.dump(cities, f)

In [22]:
!cat top_cities.json

[{"rank": 1, "city": "\u4e0a\u6d77", "population": 24150000}, {"rank": 2, "city": "\u30ab\u30e9\u30c1", "population": 23500000}, {"rank": 3, "city": "\u5317\u4eac", "population": 21516000}, {"rank": 4, "city": "\u5929\u6d25", "population": 14722100}, {"rank": 5, "city": "\u30a4\u30b9\u30bf\u30f3\u30d6\u30eb", "population": 14160467}]

In [14]:
import sqlite3

conn = sqlite3.connect('top_cities.db')  # top_cities.dbファイルを開き、コネクションを取得する。

c = conn.cursor()  # カーソルを取得する。
# execute()メソッドでSQL文を実行する。
# このスクリプトを何回実行しても同じ結果になるようにするため、citiesテーブルが存在する場合は削除する。
c.execute('DROP TABLE IF EXISTS cities')
# citiesテーブルを作成する。
c.execute('''
    CREATE TABLE cities (
        rank integer,
        city text,
        population integer
    )
''')

# execute()メソッドの第2引数にはSQL文のパラメーターのリストを指定できる。
# パラメーターで置き換える場所（プレースホルダー）は?で指定する。
c.execute('INSERT INTO cities VALUES (?, ?, ?)', (1, '上海', 24150000))

# パラメーターが辞書の場合、プレースホルダーは :キー名 で指定する。
c.execute('INSERT INTO cities VALUES (:rank, :city, :population)',
          {'rank': 2, 'city': 'カラチ', 'population': 23500000})

# executemany()メソッドでは、複数のパラメーターをリストで指定できる。
# パラメーターの数（ここでは3つ）のSQLを順に実行できる。
c.executemany('INSERT INTO cities VALUES (:rank, :city, :population)', [
    {'rank': 3, 'city': '北京', 'population': 21516000},
    {'rank': 4, 'city': '天津', 'population': 14722100},
    {'rank': 5, 'city': 'イスタンブル', 'population': 14160467},
])

conn.commit()  # 変更をコミット（保存）する。

c.execute('SELECT * FROM cities')  # 保存したデータを取得するSELECT文を実行する。
for row in c.fetchall():  # クエリの結果はfetchall()メソッドで取得できる。
    print(row)  # 保存したデータを表示する。

conn.close()  # コネクションを閉じる。


(1, '上海', 24150000)
(2, 'カラチ', 23500000)
(3, '北京', 21516000)
(4, '天津', 14722100)
(5, 'イスタンブル', 14160467)
