# SQLクエリによるデータの取得 🐇

このノートブックでは SELECT 文を使ったデータの取得方法について確認していきます。

## 1. 初期設定

Jupyter Notebook を再起動した場合などはここから実行してください

In [None]:
! pip install ipython-sql pymysql
%load_ext sql

## 2. 接続確認

In [8]:
%%sql mysql+pymysql://hello:world@10.0.1.100/employees
select 'hello' as world

1 rows affected.


world
hello


## 3. テーブル構成の調査
まずはどんなテーブルが存在するか調べてみましょう。MySQLでは `show tables` コマンドを実行するとテーブル一覧を表示することができます。

In [9]:
%%sql
show tables

 * mysql+pymysql://hello:***@10.0.1.100/employees
8 rows affected.


Tables_in_employees
current_dept_emp
departments
dept_emp
dept_emp_latest_date
dept_manager
employees
salaries
titles


8つのテーブルが表示されました。

## 4. テーブル定義を確認する

以下はテーブル同士の関係を表したER図です（MySQL Workbenchというツールで作図できます。今回は触らないので興味があれば調べてみてください）。`employees` というテーブルに名前や性別などの情報が入っており `emp_no` というカラムを元に他のテーブルと結合することができます。ほかには部署の情報が入った `departments` というテーブルも存在し `dept_emp` テーブルを利用することで従業員と部署の対応づけができそうです。

![image.png](attachment:image.png)

MySQLで上記のようなテーブル定義の情報を確認するには `desc` コマンドを利用します。

In [10]:
%%sql
-- employees テーブルの定義を確認してみる
desc employees

 * mysql+pymysql://hello:***@10.0.1.100/employees
6 rows affected.


Field,Type,Null,Key,Default,Extra
emp_no,int(11),NO,PRI,,
birth_date,date,NO,,,
first_name,varchar(14),NO,,,
last_name,varchar(16),NO,,,
gender,"enum('M','F')",NO,,,
hire_date,date,NO,,,


`desc` コマンドを利用することでカラムのデータ型やテーブルに設定されているキーの情報などを確認することができます。

## 5. データを表示してみる

テーブルからレコードを取得するには `SELECT` 文を利用します。以下のような構文が一般的です。

```sql
SELECT
    <式>
FROM
    <テーブル>
WHERE
    <検索条件>
```

式には取得するカラム名を指定することができるほか `1+1` などの四則演算や関数呼び出しなども記述できます。

In [11]:
%%sql
select 1+1

 * mysql+pymysql://hello:***@10.0.1.100/employees
1 rows affected.


1+1
2


カラム名の後ろに `AS <別名>` と別名を付与することもできます。

In [12]:
%%sql
select
    1+1 as one_plus_one,
    9*9 as kuku

 * mysql+pymysql://hello:***@10.0.1.100/employees
1 rows affected.


one_plus_one,kuku
2,81


### LIMIT

`LIMIT` 句を利用することで取得するレコード数を制限することができクエリの動作確認をするときに活用することができます。以下は employees テーブルから3件のレコードを取得するためのクエリです。

In [13]:
%%sql
select * from employees limit 3

 * mysql+pymysql://hello:***@10.0.1.100/employees
3 rows affected.


emp_no,birth_date,first_name,last_name,gender,hire_date
10001,1953-09-02,Georgi,Facello,M,1986-06-26
10002,1964-06-02,Bezalel,Simmel,F,1985-11-21
10003,1959-12-03,Parto,Bamford,M,1986-08-28


### 検索

WHERE 句に検索条件を指定することで取得対象のレコードを絞り込むことができます。以下では `gender` カラムが `M` であるレコードを3件取得しています。

In [14]:
%%sql
select * from employees where gender = 'M' limit 3

 * mysql+pymysql://hello:***@10.0.1.100/employees
3 rows affected.


emp_no,birth_date,first_name,last_name,gender,hire_date
10001,1953-09-02,Georgi,Facello,M,1986-06-26
10003,1959-12-03,Parto,Bamford,M,1986-08-28
10004,1954-05-01,Chirstian,Koblick,M,1986-12-01


### 並べ替え

`ORDER BY` 句を利用することで指定のカラムでレコードの順番を並べ替えることができます。

```sql
ORDER BY
    <カラム名> [DESC]
```

通常は昇順に並べ替えが行われますが、カラム名の後に `DESC` をつけることで降順に並べ替えることもできます。以下は employees テーブルを `emp_no` が大きい順に並べて上位の5件を表示するクエリです。

In [15]:
%%sql
select * from employees order by emp_no desc limit 5

 * mysql+pymysql://hello:***@10.0.1.100/employees
5 rows affected.


emp_no,birth_date,first_name,last_name,gender,hire_date
499999,1958-05-01,Sachin,Tsukuda,M,1997-11-30
499998,1956-09-05,Patricia,Breugel,M,1993-10-13
499997,1961-08-03,Berhard,Lenart,M,1986-04-21
499996,1953-03-07,Zito,Baaz,M,1990-09-27
499995,1958-09-24,Dekang,Lichtner,F,1993-01-12


`ORDER BY` 句には複数のカラムを指定することもでき、その場合は指定した順序でそれぞれ並べ替えが行われます。以下は employees テーブルを `hire_date` カラムの昇順、`hire_date` が同じであるカラムについては `emp_no` が小さい順に並べ替えて上位5件を表示するクエリです。

In [16]:
%%sql
select * from employees order by hire_date, emp_no limit 5

 * mysql+pymysql://hello:***@10.0.1.100/employees
5 rows affected.


emp_no,birth_date,first_name,last_name,gender,hire_date
110022,1956-09-12,Margareta,Markovitch,M,1985-01-01
110085,1959-10-28,Ebru,Alpin,M,1985-01-01
110183,1953-06-24,Shirish,Ossenbruggen,F,1985-01-01
110303,1956-06-08,Krassimir,Wegerle,F,1985-01-01
110511,1957-07-08,DeForest,Hagimont,M,1985-01-01


## 🌱 練習問題

Q. `hire_date` が `1988-05-01` である社員のうち `birth_date` が最も小さい（or 古い or 一番年上）である社員の `first_name` を調べてください。

In [None]:
%%sql
select
    *
from
    employees
where
    -- Hint 1. この下に検索条件を記述
    
order by
    -- Hint 2. この下で並べ替えを行うカラムを指定
    
limit 5

In [None]:
# 実行後、"your answer" の右側に表示される入力ボックスに答えを入力し Enter キーを押してください m(_ _)m
import urllib.request

answer = input('your answer (first_name): ')

url = 'http://10.0.1.100:18080/submit'
data = 'q=q101&a={}'.format(answer.strip()).encode('utf-8')
req = urllib.request.Request(url, data=data, method='POST')
with urllib.request.urlopen(req) as res:
    print(res.read().decode('utf-8'))