# SQL100本ノック
MySQLコンテナ構築手順とJupyterLabからの接続方法も知りたかったので、  
SQL100本ノックのリポジトリのコンテナは使わず自前で近い環境を構築してみた。  
[SQL100本ノックのリポジトリ](https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess/tree/master/docker/work)

In [None]:
# pymysqlあるからいらなかったかも
!pip install mysql-connector-python

In [None]:
# セルから直接SQLを実行できるようにipython-sqlをインストール
!pip install ipython-sql
!pip install sqlalchemy
!pip install pymysql

## MySQLコンテナとの接続設定＆マジックコマンド設定

In [1]:
%load_ext sql

import os
import mysql.connector
import pymysql
from sqlalchemy import create_engine

# 接続パラメータの設定
config = {
  'host': os.environ['MYSQL_IP'], 
  'user': os.environ['MYSQL_USR'],
  'password': os.environ['MYSQL_PW'],
  'database': 'test'
}

dsl = 'mysql://{user}:{password}@{host}/{database}'.format(**config)
# conn = create_engine(dsl)

# MagicコマンドでSQLを書くための設定。%sqlにそのまま文字列を指定する必要があるので、$をつけてコマンドへ渡す
%sql $dsl

## MySQLと接続出来ることを確認

In [2]:
%sql show tables

 * mysql://remote_user:***@172.20.0.2/test
3 rows affected.


Tables_in_test
receipt
sample_db
test


In [3]:
%%sql
select user from mysql.user

 * mysql://remote_user:***@172.20.0.2/test
6 rows affected.


user
remote_user
root
mysql.infoschema
mysql.session
mysql.sys
root


## 100本ノックのテーブル準備

### - レシート明細テーブル作成

In [34]:
%%sql
# レシート明細のテーブル作成
CREATE TABLE receipt (
    sales_ymd INT,
    sales_epoch INT,
    store_cd INT,
    receipt_no INT,
    receipt_sub_no INT,
    customer_id VARCHAR(255),
    product_cd VARCHAR(255),
    quantity INT,
    amount INT
)


 * mysql://remote_user:***@172.20.0.2/test
0 rows affected.


[]

In [35]:
%%sql
LOAD DATA LOCAL INFILE '../../100knocks-preprocess/docker/work/data/receipt.csv'
INTO TABLE receipt
FIELDS TERMINATED BY ',' 
ENCLOSED BY '"'
LINES TERMINATED BY '\n'
IGNORE 1 ROWS;  -- ヘッダー行がある場合

 * mysql://remote_user:***@172.20.0.2/test
104681 rows affected.


[]

※注意：  
LOAD DATA LOCAL INFILE（クライアント側にあるファイルをDBに読み込ませる）を使うには、  
local_infileの設定をサーバーとクライアント両方で有効にする必要があることに注意。  
[参考：local_infileの設定をサーバーとクライアント両方で有効にする](https://qiita.com/kawa247/items/336697936ae408c22a1e#1local_infile%E3%81%AE%E8%A8%AD%E5%AE%9A%E3%82%92%E3%82%B5%E3%83%BC%E3%83%90%E3%83%BC%E3%81%A8%E3%82%AF%E3%83%A9%E3%82%A4%E3%82%A2%E3%83%B3%E3%83%88%E4%B8%A1%E6%96%B9%E3%81%A7%E6%9C%89%E5%8A%B9%E3%81%AB%E3%81%99%E3%82%8B)


### - 店舗テーブル作成

In [39]:
%%sql
# 店舗のテーブル作成
CREATE TABLE store (
    store_cd VARCHAR(255),
    store_name VARCHAR(255),
    prefecture_cd VARCHAR(255),
    prefecture VARCHAR(255),
    address VARCHAR(255),
    addres_kana VARCHAR(255),
    tel_no VARCHAR(255),
    longitude INT, # 経度
    latitude INT, # 緯度
    floor_area INT
)


 * mysql://remote_user:***@172.20.0.2/test
0 rows affected.


[]

In [40]:
%%sql
LOAD DATA LOCAL INFILE '../../100knocks-preprocess/docker/work/data/store.csv'
INTO TABLE store
FIELDS TERMINATED BY ',' 
ENCLOSED BY '"'
LINES TERMINATED BY '\n'
IGNORE 1 ROWS;  -- ヘッダー行がある場合

 * mysql://remote_user:***@172.20.0.2/test
53 rows affected.


[]

### - 顧客テーブル作成

In [54]:
%%sql
CREATE TABLE customer (
    customer_id VARCHAR(255),
    customer_name VARCHAR(255),
    gender_cd VARCHAR(255),
    gender VARCHAR(255),
    birth_day DATE,
    age INT,
    postal_cd VARCHAR(255),
    address VARCHAR(255),
    application_store_cd VARCHAR(255),
    application_date VARCHAR(255),
    status_cd VARCHAR(255)
)


 * mysql://remote_user:***@172.20.0.2/test
0 rows affected.


[]

In [55]:
%%sql
LOAD DATA LOCAL INFILE '../../100knocks-preprocess/docker/work/data/customer.csv'
INTO TABLE customer
FIELDS TERMINATED BY ',' 
ENCLOSED BY '"'
LINES TERMINATED BY '\n'
IGNORE 1 ROWS;  -- ヘッダー行がある場合

 * mysql://remote_user:***@172.20.0.2/test
21971 rows affected.


[]

## SQL100本ノック問題＆解答

---
>S-001: レシート明細データ（receipt）から全項目の先頭10件を表示し、どのようなデータを保有しているか目視で確認せよ。

In [41]:
%%sql
select * from receipt LIMIT 10

 * mysql://remote_user:***@172.20.0.2/test
10 rows affected.


sales_ymd,sales_epoch,store_cd,receipt_no,receipt_sub_no,customer_id,product_cd,quantity,amount
20181103,1541203200,0,112,1,CS006214000001,P070305012,1,158
20181118,1542499200,0,1132,2,CS008415000097,P070701017,1,81
20170712,1499817600,0,1102,1,CS028414000014,P060101005,1,170
20190205,1549324800,0,1132,1,ZZ000000000000,P050301001,1,25
20180821,1534809600,0,1102,2,CS025415000050,P060102007,1,90
20190605,1559692800,0,1112,1,CS003515000195,P050102002,1,138
20181205,1543968000,0,1102,2,CS024514000042,P080101005,1,30
20190922,1569110400,0,1102,1,CS040415000178,P070501004,1,128
20170504,1493856000,0,1112,2,ZZ000000000000,P071302010,1,770
20191010,1570665600,0,1102,1,CS027514000015,P071101003,1,680


---
> S-002: レシート明細データ（receipt）から売上年月日（sales_ymd）、顧客ID（customer_id）、  
> 商品コード（product_cd）、売上金額（amount）の順に列を指定し、10件表示せよ。

In [8]:
%%sql
SELECT 
    sales_ymd, 
    customer_id, 
    product_cd, 
    amount 
FROM receipt 
LIMIT 10;

 * mysql://remote_user:***@172.20.0.2/test
10 rows affected.


sales_ymd,customer_id,product_cd,amount
20181103,CS006214000001,P070305012,158
20181118,CS008415000097,P070701017,81
20170712,CS028414000014,P060101005,170
20190205,ZZ000000000000,P050301001,25
20180821,CS025415000050,P060102007,90
20190605,CS003515000195,P050102002,138
20181205,CS024514000042,P080101005,30
20190922,CS040415000178,P070501004,128
20170504,ZZ000000000000,P071302010,770
20191010,CS027514000015,P071101003,680


---
> S-003: レシート明細データ（receipt）から売上年月日（sales_ymd）、顧客ID（customer_id）、商品コード（product_cd）、売上金額（amount）の順に列を指定し、10件表示せよ。  
> ただし、sales_ymdをsales_dateに項目名を変更しながら抽出すること。

In [12]:
%%sql
SELECT
    sales_ymd AS sales_date, # ASでカラム名を変えられる
    customer_id,
    product_cd,
    amount
FROM receipt
LIMIT 10;

 * mysql://remote_user:***@172.20.0.2/test
10 rows affected.


sales_date,customer_id,product_cd,amount
20181103,CS006214000001,P070305012,158
20181118,CS008415000097,P070701017,81
20170712,CS028414000014,P060101005,170
20190205,ZZ000000000000,P050301001,25
20180821,CS025415000050,P060102007,90
20190605,CS003515000195,P050102002,138
20181205,CS024514000042,P080101005,30
20190922,CS040415000178,P070501004,128
20170504,ZZ000000000000,P071302010,770
20191010,CS027514000015,P071101003,680


---
> S-004: レシート明細データ（receipt）から売上日（sales_ymd）、顧客ID（customer_id）、商品コード（product_cd）、売上金額（amount）の順に列を指定し、  
> 以下の条件を満たすデータを抽出せよ。
> - 顧客ID（customer_id）が"CS018205000001"

In [15]:
%%sql
SELECT
    sales_ymd,
    customer_id,
    product_cd,
    amount
FROM receipt
WHERE customer_id = 'CS018205000001'

 * mysql://remote_user:***@172.20.0.2/test
12 rows affected.


sales_ymd,customer_id,product_cd,amount
20180911,CS018205000001,P071401012,2200
20180414,CS018205000001,P060104007,600
20170614,CS018205000001,P050206001,990
20170614,CS018205000001,P060702015,108
20190216,CS018205000001,P071005024,102
20180414,CS018205000001,P071101002,278
20190226,CS018205000001,P070902035,168
20190924,CS018205000001,P060805001,495
20190226,CS018205000001,P071401020,2200
20180911,CS018205000001,P071401005,1100


---
> S-005: レシート明細データ（receipt）から売上日（sales_ymd）、顧客ID（customer_id）、商品コード（product_cd）、売上金額（amount）の順に列を指定し、  
> 以下の全ての条件を満たすデータを抽出せよ。
> - 顧客ID（customer_id）が"CS018205000001"
> - 売上金額（amount）が1,000以上

In [18]:
%%sql
SELECT
    sales_ymd,
    customer_id,
    product_cd,
    amount
FROM
    receipt
WHERE 
    customer_id = 'CS018205000001' 
    AND amount >= 1000

 * mysql://remote_user:***@172.20.0.2/test
3 rows affected.


sales_ymd,customer_id,product_cd,amount
20180911,CS018205000001,P071401012,2200
20190226,CS018205000001,P071401020,2200
20180911,CS018205000001,P071401005,1100


---
> S-006: レシート明細データ（receipt）から売上日（sales_ymd）、顧客ID（customer_id）、商品コード（product_cd）、売上数量（quantity）、売上金額（amount）の順に列を指定し、  
> 以下の全ての条件を満たすデータを抽出せよ。
> - 顧客ID（customer_id）が"CS018205000001"
> - 売上金額（amount）が1,000以上または売上数量（quantity）が5以上

In [21]:
%%sql
SELECT
    sales_ymd,
    customer_id,
    product_cd,
    quantity,
    amount
FROM
    receipt
WHERE 
    customer_id = 'CS018205000001' 
    AND (amount >= 1000 OR quantity >= 5)
;

 * mysql://remote_user:***@172.20.0.2/test
5 rows affected.


sales_ymd,customer_id,product_cd,quantity,amount
20180911,CS018205000001,P071401012,1,2200
20180414,CS018205000001,P060104007,6,600
20170614,CS018205000001,P050206001,5,990
20190226,CS018205000001,P071401020,1,2200
20180911,CS018205000001,P071401005,1,1100


---
> S-007: レシート明細データ（receipt）から売上日（sales_ymd）、顧客ID（customer_id）、商品コード（product_cd）、売上金額（amount）の順に列を指定し、  
> 以下の全ての条件を満たすデータを抽出せよ。
> - 顧客ID（customer_id）が"CS018205000001"
> - 売上金額（amount）が1,000以上2,000以下

In [23]:
%%sql
SELECT
    sales_ymd,
    customer_id,
    product_cd,
    amount
FROM 
    receipt
WHERE
    customer_id = 'CS018205000001'
    AND amount BETWEEN 1000 AND 2000 # A以上、B以下の行をフィルタリング


 * mysql://remote_user:***@172.20.0.2/test
1 rows affected.


sales_ymd,customer_id,product_cd,amount
20180911,CS018205000001,P071401005,1100


---
> S-008: レシート明細データ（receipt）から売上日（sales_ymd）、顧客ID（customer_id）、商品コード（product_cd）、売上金額（amount）の順に列を指定し、  
> 以下の全ての条件を満たすデータを抽出せよ。
> - 顧客ID（customer_id）が"CS018205000001"
> - 商品コード（product_cd）が"P071401019"以外

In [26]:
%%sql
SELECT 
    sales_ymd,
    customer_id,
    product_cd,
    amount
FROM 
    receipt
WHERE
    customer_id = 'CS018205000001'
    AND product_cd != 'P071401019'

 * mysql://remote_user:***@172.20.0.2/test
12 rows affected.


sales_ymd,customer_id,product_cd,amount
20180911,CS018205000001,P071401012,2200
20180414,CS018205000001,P060104007,600
20170614,CS018205000001,P050206001,990
20170614,CS018205000001,P060702015,108
20190216,CS018205000001,P071005024,102
20180414,CS018205000001,P071101002,278
20190226,CS018205000001,P070902035,168
20190924,CS018205000001,P060805001,495
20190226,CS018205000001,P071401020,2200
20180911,CS018205000001,P071401005,1100


---
> S-009: 以下の処理において、出力結果を変えずにORをANDに書き換えよ。
>
> `SELECT * FROM store WHERE NOT (prefecture_cd = '13' OR floor_area > 900)`

In [44]:
%%sql
SELECT * FROM store WHERE NOT (prefecture_cd = '13' OR floor_area > 900)

 * mysql://remote_user:***@172.20.0.2/test
3 rows affected.


store_cd,store_name,prefecture_cd,prefecture,address,addres_kana,tel_no,longitude,latitude,floor_area
S14046,北山田店,14,神奈川県,神奈川県横浜市都筑区北山田一丁目,カナガワケンヨコハマシツヅキクキタヤマタイッチョウメ,045-123-4049,140,36,831
S14011,日吉本町店,14,神奈川県,神奈川県横浜市港北区日吉本町四丁目,カナガワケンヨコハマシコウホククヒヨシホンチョウヨンチョウメ,045-123-4033,140,36,890
S12013,習志野店,12,千葉県,千葉県習志野市芝園一丁目,チバケンナラシノシシバゾノイッチョウメ,047-123-4002,140,36,808


問題文のSQLを実行すると上記の出力が得られる。  
WHERE句以降は(prefecture_cd = '13' または floor_area > 900)”でない”という意味であるから、  
言い換えると、prefecture_cd = '13'でもないし、 floor_area > 900でもない、ということになるので、  
それぞれ否定の表現に変えてANDでつなげばよい。（ドモルガンの法則）

In [49]:
%%sql
SELECT * FROM store WHERE (prefecture_cd != '13' AND floor_area <= 900)

 * mysql://remote_user:***@172.20.0.2/test
3 rows affected.


store_cd,store_name,prefecture_cd,prefecture,address,addres_kana,tel_no,longitude,latitude,floor_area
S14046,北山田店,14,神奈川県,神奈川県横浜市都筑区北山田一丁目,カナガワケンヨコハマシツヅキクキタヤマタイッチョウメ,045-123-4049,140,36,831
S14011,日吉本町店,14,神奈川県,神奈川県横浜市港北区日吉本町四丁目,カナガワケンヨコハマシコウホククヒヨシホンチョウヨンチョウメ,045-123-4033,140,36,890
S12013,習志野店,12,千葉県,千葉県習志野市芝園一丁目,チバケンナラシノシシバゾノイッチョウメ,047-123-4002,140,36,808


---
> S-010: 店舗データ（store）から、店舗コード（store_cd）が"S14"で始まるものだけ全項目抽出し、10件表示せよ。

In [52]:
%%sql
SELECT 
    * 
FROM store 
WHERE 
    store_cd LIKE 'S14%' 
LIMIT 10;

 * mysql://remote_user:***@172.20.0.2/test
10 rows affected.


store_cd,store_name,prefecture_cd,prefecture,address,addres_kana,tel_no,longitude,latitude,floor_area
S14010,菊名店,14,神奈川県,神奈川県横浜市港北区菊名一丁目,カナガワケンヨコハマシコウホククキクナイッチョウメ,045-123-4032,140,36,1732
S14033,阿久和店,14,神奈川県,神奈川県横浜市瀬谷区阿久和西一丁目,カナガワケンヨコハマシセヤクアクワニシイッチョウメ,045-123-4043,139,35,1495
S14036,相模原中央店,14,神奈川県,神奈川県相模原市中央二丁目,カナガワケンサガミハラシチュウオウニチョウメ,042-123-4045,139,36,1679
S14040,長津田店,14,神奈川県,神奈川県横浜市緑区長津田みなみ台五丁目,カナガワケンヨコハマシミドリクナガツタミナミダイゴチョウメ,045-123-4046,139,36,1548
S14050,阿久和西店,14,神奈川県,神奈川県横浜市瀬谷区阿久和西一丁目,カナガワケンヨコハマシセヤクアクワニシイッチョウメ,045-123-4053,139,35,1830
S14028,二ツ橋店,14,神奈川県,神奈川県横浜市瀬谷区二ツ橋町,カナガワケンヨコハマシセヤクフタツバシチョウ,045-123-4042,139,35,1574
S14012,本牧和田店,14,神奈川県,神奈川県横浜市中区本牧和田,カナガワケンヨコハマシナカクホンモクワダ,045-123-4034,140,35,1341
S14046,北山田店,14,神奈川県,神奈川県横浜市都筑区北山田一丁目,カナガワケンヨコハマシツヅキクキタヤマタイッチョウメ,045-123-4049,140,36,831
S14022,逗子店,14,神奈川県,神奈川県逗子市逗子一丁目,カナガワケンズシシズシイッチョウメ,046-123-4036,140,35,1838
S14011,日吉本町店,14,神奈川県,神奈川県横浜市港北区日吉本町四丁目,カナガワケンヨコハマシコウホククヒヨシホンチョウヨンチョウメ,045-123-4033,140,36,890


---
> S-011: 顧客データ（customer）から顧客ID（customer_id）の末尾が1のものだけ全項目抽出し、10件表示せよ。

In [59]:
%%sql
SELECT
    *
FROM customer
WHERE customer_id LIKE '%1' LIMIT 10

 * mysql://remote_user:***@172.20.0.2/test
10 rows affected.


customer_id,customer_name,gender_cd,gender,birth_day,age,postal_cd,address,application_store_cd,application_date,status_cd
CS037613000071,六角 雅彦,9,不明,1952-04-01,66,136-0076,東京都江東区南砂**********,S13037,20150414,0-00000000-0
CS028811000001,堀井 かおり,1,女性,1933-03-27,86,245-0016,神奈川県横浜市泉区和泉町**********,S14028,20160115,0-00000000-0
CS040412000191,川井 郁恵,1,女性,1977-01-05,42,226-0021,神奈川県横浜市緑区北八朔町**********,S14040,20151101,1-20091025-4
CS028314000011,小菅 あおい,1,女性,1983-11-26,35,246-0038,神奈川県横浜市瀬谷区宮沢**********,S14028,20151123,1-20080426-5
CS039212000051,藤島 恵梨香,1,女性,1997-02-03,22,166-0001,東京都杉並区阿佐谷北**********,S13039,20171121,1-20100215-4
CS015412000111,松居 奈月,1,女性,1972-10-04,46,136-0071,東京都江東区亀戸**********,S13015,20150629,0-00000000-0
CS004702000041,野島 洋,0,男性,1943-08-24,75,176-0022,東京都練馬区向山**********,S13004,20170218,0-00000000-0
CS041515000001,栗田 千夏,1,女性,1967-01-02,52,206-0001,東京都多摩市和田**********,S13041,20160422,E-20100803-F
CS029313000221,北条 ひかり,1,女性,1987-06-19,31,279-0011,千葉県浦安市美浜**********,S12029,20180810,0-00000000-0
CS034312000071,望月 奈央,1,女性,1980-09-20,38,213-0026,神奈川県川崎市高津区久末**********,S14034,20160106,0-00000000-0


---
> S-012: 店舗データ（store）から、住所 (address) に"横浜市"が含まれるものだけ全項目表示せよ。

In [62]:
%%sql
SELECT
    *
FROM store
WHERE address LIKE '%横浜市%';

 * mysql://remote_user:***@172.20.0.2/test
11 rows affected.


store_cd,store_name,prefecture_cd,prefecture,address,addres_kana,tel_no,longitude,latitude,floor_area
S14010,菊名店,14,神奈川県,神奈川県横浜市港北区菊名一丁目,カナガワケンヨコハマシコウホククキクナイッチョウメ,045-123-4032,140,36,1732
S14033,阿久和店,14,神奈川県,神奈川県横浜市瀬谷区阿久和西一丁目,カナガワケンヨコハマシセヤクアクワニシイッチョウメ,045-123-4043,139,35,1495
S14040,長津田店,14,神奈川県,神奈川県横浜市緑区長津田みなみ台五丁目,カナガワケンヨコハマシミドリクナガツタミナミダイゴチョウメ,045-123-4046,139,36,1548
S14050,阿久和西店,14,神奈川県,神奈川県横浜市瀬谷区阿久和西一丁目,カナガワケンヨコハマシセヤクアクワニシイッチョウメ,045-123-4053,139,35,1830
S14028,二ツ橋店,14,神奈川県,神奈川県横浜市瀬谷区二ツ橋町,カナガワケンヨコハマシセヤクフタツバシチョウ,045-123-4042,139,35,1574
S14012,本牧和田店,14,神奈川県,神奈川県横浜市中区本牧和田,カナガワケンヨコハマシナカクホンモクワダ,045-123-4034,140,35,1341
S14046,北山田店,14,神奈川県,神奈川県横浜市都筑区北山田一丁目,カナガワケンヨコハマシツヅキクキタヤマタイッチョウメ,045-123-4049,140,36,831
S14011,日吉本町店,14,神奈川県,神奈川県横浜市港北区日吉本町四丁目,カナガワケンヨコハマシコウホククヒヨシホンチョウヨンチョウメ,045-123-4033,140,36,890
S14048,中川中央店,14,神奈川県,神奈川県横浜市都筑区中川中央二丁目,カナガワケンヨコハマシツヅキクナカガワチュウオウニチョウメ,045-123-4051,140,36,1657
S14042,新山下店,14,神奈川県,神奈川県横浜市中区新山下二丁目,カナガワケンヨコハマシナカクシンヤマシタニチョウメ,045-123-4047,140,35,1044


In [None]:
# 顧客のテーブル作成
CREATE TABLE customer (
    customer_id VARCHAR(255),
    customer_name VARCHAR(255),
    gender_cd VARCHAR(255),
    gender VARCHAR(255),
    birth_day DATE,
    age INT,
    postal_cd
)

In [None]:
# # 接続パラメータの設定
# config = {
#   'host': os.environ['MYSQL_IP'], 
#   'user': os.environ['MYSQL_USR'],
#   'password': os.environ['MYSQL_PW'],
#   'database': 'test'
# }

# # データベース接続
# conn = mysql.connector.connect(**config)

# # カーソルの作成
# cursor = conn.cursor()

# # SQLクエリの実行（例）
# cursor.execute("SELECT * FROM test")

# # データの取得
# for row in cursor:
#     print(row)


In [None]:
# # 接続のクローズ
# cursor.close()
# conn.close()