# SQL操作
## エンジン作成
■ライブラリインポート  
- sqlalchemy：SQL操作  
- pymysql：MySQLドライバー

```python
import sqlalchemy as sa
import pymysql
```
**MySQL以外のDB**については、[Pythonコミュニティ データ共有タブ](https://teams.microsoft.com/l/entity/2a527703-1f6f-4559-a332-d8a7d288cd88/_djb2_msteams_prefix_2229130552?context=%7B%22subEntityId%22%3Anull%2C%22channelId%22%3A%2219%3ADajK3X_ewEPzYtoK7T5e6wyl-dIQQM6NkS_lkzd8yhQ1%40thread.tacv2%22%7D&groupId=0fa492dd-e1cc-4671-a7ff-a9953f5d92de&tenantId=82cc187e-25d5-45e4-8c34-8434bf6075fe)「DB接続」を参照  
Teamsが表示されない場合は、タブを一般→データ共有　と切り替えるか、Webアプリ版で開いてください。  
<br>

■エンジン、コネクションの作成
```python
url = "mysql+pymysql://[ID]:[PW]@[IP]:[port]/[DB名]?charset=utf8"
engine = sa.create_engine(url)
con = engine.connect()
```
■終わったらコネクションを閉じる  
　（「これ以上DBへの接続処理をしない」という段階で最後に閉じる。いちいち閉じないで良い）
```python
con.close()
```  
■withを使用  
（withを使うと、処理が終わると勝手にcommit/closeしてくれる）  
```python
with engine.connect() as con:
    """ここにDBに対して行う処理を書く"""
```  

In [None]:
import sqlalchemy as sa
import pymysql
import pandas as pd

url = "mysql+pymysql://kenshu:kenshu@10.110.55.59:3306/kenshu?charset=utf8"
engine = sa.create_engine(url)

In [None]:
# # "参考: f文字列を使って変数を埋め込んでも、同じことができます"

ip = "10.110.55.59"
port = "3306"
user = "kenshu"
pw = "kenshu"
schema = "kenshu"

url = f"mysql+pymysql://{user}:{pw}@{ip}:{port}/{schema}?charset=utf8"
engine = sa.create_engine(url)

# 上のセルで実行したurlと同じ文字列が入っているはず
print(url)

In [None]:
# コネクションの作成（「sqlalchemy.engine.base.Connection object at ...」みたいな表示が出て、connectionが生成されているはず）
con = engine.connect()
print(con)

In [None]:
# コネクションを閉じる（DBに接続して、やりたいことが終わった最後に書く）
con.close()

In [None]:
con.close()って最後に書くの忘れるじゃん…という人は、with句を使うとwithが終わったら勝手にcloseしてくれます（pyファイル実行時）

table_02 = "fuku_test02"
df = pd.DataFrame([["a1", 1], ["a2", 2], ["a3", 3]], columns=["PARTS", "CYC"])
display(df)

with engine.begin() as con:
    con.execute(f"drop table if exists {table_02}")
    con.execute(f"create table {table_02} (PARTS varchar(2), CYC int, primary key(PARTS))")
    df.to_sql(f"{table_02}", engine, if_exists="append", index=None)
    result = con.execute("SELECT CONNECTION_ID( )")
    print(list(result))

# with句の外でcon.executeしようとすると、ResourceClosedError: This Connection is closed（接続が閉じているので操作できない）」というエラーが出る
con.execute(f"drop table if exists {table_02}")

## SQL実行

■トランザクション無し
：上から順番に1つ1つ実行される
```python
con.execute("SQL文1")
con.execute("SQL文2")
```

■トランザクション有り
：上から順番に実行し、全てエラーなく実行できた場合にDBに反映される  
　どこかでエラーが起こった場合は、初めの状態にロールバックする
```python
con = engine.connect()
t = con.begin()
try:
    con.execute("SQL文1")
    con.execute("SQL文2")
    t.commit()
except Exception as e:
    print(e)
con.close()
```

■withを使用  
（withを使うと、処理が終わると勝手にcommit/closeしてくれる）  

```python        
with engine.connect() as con:
    with con.begin() as t:
        try:
            con.execute(sql1)
            con.execute(sql2)
        except Exception as e:
            t.rollback()
            print(e)
```

【参考】  
- SQLAlchemyを使ってPythonでORM  
https://www.kaitoy.xyz/2020/11/05/sqlalchemy-core/  

- SQLAlchemy入門 接続とSQL実行  
https://www.python.ambitious-engineer.com/archives/1471  

- ロールバック (rollback)  
https://wa3.i-3-i.info/word143.html

In [None]:
# トランザクション無し　→　エラーが出たところだけ実行されない(エラーになっていない処理は実行されてしまう)
table = "fuku_test_t1"
con.execute(f"drop table if exists {table}")
con.execute(f"create table {table} (A1 varchar(2), A2 int, primary key(A1))")

try:
    con.execute(f"insert into {table} values ('a1', 2), ('a2', 4)")
    con.execute(f"insert into {table} values ('a3', 6), ('a2', 8)")
except Exception as e:
    print(e)


In [None]:
# トランザクション有り　→　エラーが出るとすべて実行されない
table = "fuku_test_t2"
engine.execute(f"drop table if exists {table}")
engine.execute(f"create table {table} (A1 varchar(2), A2 int, primary key(A1))")

con = engine.connect()
t = con.begin()
try:
    con.execute(f"insert into {table} values ('a1', 2), ('a2', 4)")
    con.execute(f"insert into {table} values ('a3', 6), ('a2', 8)")
    t.commit()
except Exception as e:
    print(e)
con.close()


## pandasとSQLの組み合わせ
データ挿入方法は様々あり、pandasとSQLの組み合わせて実行必要なものもある

**■pandasのto_sqlで行うデータ挿入操作**  

### append：単純な挿入
```python
df.to_sql(f"{table}", engine, if_exists="append", index=None)
```  
### replace：テーブル置換  
　**★primaryキー設定、データ型などがすべてリセットされるので注意**
```python
df.to_sql(f"{table}", engine, if_exists="replace", index=None)
```

In [None]:
# # このセルでは、下準備のためのデータを作ってます
con = engine.connect()
table_tosql = "fuku_test_tosql"

con.execute(f"drop table if exists {table_tosql}")
# primaryキーの設定
con.execute(f"create table {table_tosql} (A1 varchar(2), A2 int, primary key(A1))")

df = pd.DataFrame([["a1", 1], ["a2", 2], ["a3", 3]], columns=["PARTS", "CYC"])
df.to_sql(f"{table_tosql}", engine, if_exists="replace", index=None)
display(df)

In [None]:
"""append：単純な挿入"""
df1 = pd.DataFrame([["a4", 4], ["a5", 5], ["a6", 6]], columns=["PARTS", "CYC"])
display(df1)
df1.to_sql(f"{table_tosql}", engine, if_exists="append", index=None)

In [None]:
"""replace：テーブル置換"""
df2 = pd.DataFrame([["a7", 7], ["a8", 8], ["a9", 9]])
display(df2)
df2.to_sql(f"{table_tosql}", engine, if_exists="replace", index=None)

## SQLAlchemyでDB操作

**■SQLと併用して行うデータ挿入操作**  
### upsert update：新規行は挿入し、既存行は更新

- upsert update：新規行は挿入し、既存行は更新する  
  プライマリーキーの設定が必要。**プライマリーキー設定は、con.executeする前に行ってください**（後からやると重複データがあったときに面倒）  
```python
con.execute(
    f"""
    insert into {table} values (%s,%s,…) 
    on duplicate key update カラム名1 = values(カラム名1), カラム名2 = values(カラム名2),　…
    """
    ,df.values.tolist()
)
```

※`(%s,%s,…)`はSQL文のプレースホルダとして使われている。追加されるのは第二引数の`df.values.tolist()`  
※SQLのコードが長いので、改行した方が見やすい

In [None]:
# # このセルでは、下準備のためのテーブルを作ってます
table_upsu = "fuku_test_upsu"

con.execute(f"drop table if exists {table_upsu}")
# primaryキーの設定
con.execute(f"create table {table_upsu} (COL_A1 varchar(2), COL_A2 int, COL_A3 double, primary key(COL_A1))")

df = pd.DataFrame([["a1", 1, 1.1], ["a2", 2, 2.2], ["a1", 3, 3.3]])
print(df.values.tolist())

In [None]:
"""upsert update：新規行は挿入し、既存行は更新する"""
con.execute(
    f"""
  insert into {table_upsu} values (%s, %s, %s) 
  on duplicate key update COL_A2 = values(COL_A2), COL_A3 = values(COL_A3)
  """,
    df.values.tolist(),
)

**■SQLと併用して行うデータ挿入操作（続き）**  
### truncate insert：データを削除して挿入

- truncate insert：データを削除して挿入（pandasのappendとの合わせ技）
```python
con.execute(f"truncate {table}")
df.to_sql(f"{table}", engine, if_exists="append", index=None)
```

### upsert_ignore：新規行のみ挿入  
- upsert_ignore：新規行のみ挿入  
  プライマリーキーの設定が必要  
```python
con.execute(f"insert ignore into {table} values (%s,%s,…)", df.values.tolist())
```  

In [None]:
# # このセルでは、下準備のためのテーブルを作ってます
table_upsi = "fuku_test_upsi"
con = engine.connect()

con.execute(f"drop table if exists {table_upsi}")
# primaryキーの設定
con.execute(f"create table {table_upsi} (A1 varchar(2), A2 int, primary key(A1))")

df = pd.DataFrame([["a1", 1], ["a2", 2]], columns=["A1", "A2"])
df.to_sql(f"{table_upsi}", engine, if_exists="append", index=None)
display(df)

In [None]:
print(f"create table {table_upsi} (A1 varchar(2), A2 int, primary key(A1))")

In [None]:
df_add = pd.DataFrame([["a1", 4], ["a2", 5]], columns=["A1", "A2"])
display(df_add)

In [None]:
"""truncate insert：データを削除して挿入"""
con.execute(f"truncate {table_upsi}")
df_add.to_sql(f"{table_upsi}", engine, if_exists="append", index=False)

In [None]:
df_add1 = pd.DataFrame([["a2", 6], ["a3", 7], ["a3", 8]], columns=["A1", "A2"])
display(df_add1)

In [None]:
"""insert ignore into：データがなければinsert、データがあればスキップ"""
con.execute(f"insert ignore into {table_upsi} values (%s,%s)", df_add1.values.tolist())

In [None]:
f"insert ignore into {table_upsi} values (%s,%s)"

In [None]:
df_add1.values.tolist()

**■SQLと併用して行うデータ挿入操作（続き）**  
### 既存データのみ更新

- update：更新  
  ※DataFrameのデータの並び順に注意（%sには前から値が入っていく）
```python
con.execute(f"update {table} set カラム名2 = %s, カラム名3 = %s where カラム名1 = %s", df.values.tolist())
```

In [None]:
# # このセルでは、下準備のためのテーブルを作ってます
import pandas as pd
table_upd = "fuku_test_upd"
con.execute(f"drop table if exists {table_upd}")
con.execute(f"create table {table_upd} (A1 varchar(2), A2 int, primary key(A1))")

con.execute(f"insert into {table_upd} values ('a1',2),('a2',4)")

In [None]:
"""update：更新"""
df = pd.DataFrame([["a1", 1], ["a2", 2], ["a3", 3]])
display("もとのdf", df)
df = df[[1, 0]]
display("カラム並び順変更後のdf", df)
con.execute(f"update {table_upd} set A2 = %s where A1 =%s", df.values.tolist())

In [None]:
df.values.tolist()

## その他
### DBにうまくDataFrameの値を入れられないときの操作

- 空の値が入ったDFをDBに入れる時の型変更  
　DataBaseにはNaN、NaT型の「空の値」が入らない仕様になっています。  
　→「None」型（DBの「Null」）に変更してからDBに入れてください。参考：[Python NaNを含むデータをMySQLに保存したいとき（コードとエラー対処）](https://ssrv.net/tech/python-mysql-nan/)

```python
import numpy as np
df = df.replace({np.nan: None})
```

- 文字型のカラムで、最大文字数をオーバーしてしまった（StringDataRightTruncationなどのエラーが出て、「値はvarchar(6)としては長すぎます」みたいなことを言われる）  
　→カラムの中の最大文字数を数えて、A5Mk2側で最大の文字数を設定しなおしてください。
 
```python
# ある行の要素の最大文字数を表示
df['数えたいカラム'].apply(lambda x: len(x)).max()

# 文字列以外のものが混じっていて数えてくれないとき →strに変換する
df['数えたいカラム'].astype(str).apply(lambda x: len(x)).max()
```

### 作成したDBのカラム整形  
1) df.to_sqlでDBにテーブルを作る
2) A5Mk2で、作ったテーブルを表示  
3) 「カラム」タブから物理名、データ型を選択してコピー（Ctrl + C）  
<img src="attachment:1cd4b63d-a95f-449d-89e2-298ff932a788.png" width="700" height="400">  

4) Ctrl + N で下記のウィンドウを出して、「SQL」を選択
<img src="attachment:ab009de4-1eba-484a-9211-aa7083529214.png" width="200" height="100">  
5) 新しく開いたクエリに、3)を貼り付け  
<img src="attachment:ad4282fe-39c9-4f10-9f47-a3eeed10aff3.png" width="700" height="400">  

6) 下記のような形になるように、コードを整形しSQLを実行（エラーが出ずに「〇件のレコードを操作しました」となればOK）
```mysql
alter table kenshu.fuku04         -- テーブル名はドラッグ＆ドロップ
modify PARTS varchar (4),  -- カラムの型はER図などから決定 
modify UDATE datetime,     -- 型変更する行の末尾に「, modify」を付ける　→Ctrl+Qで整形 
modify CYC int, 
add primary key (PARTS)    -- 最後にprimaryキーとなるカラムを設定  
```  

<img src="attachment:39f775b6-8e63-4086-87fc-9def6d91d527.png" width="700" height="400">  

<br>
7) カレントスキーマからスキーマを再読み込みし、対象のテーブルを開きなおして、primary keyが付いてカラムの型が変更されていることを確認する  
<img src="attachment:fcca015d-8ccf-49e2-b124-c14e073e4173.png" width="700" height="400">  