# pandas连接数据库有两种方式：

* DB-API：Python连接数据库的标准接口
* sqlalchemy：提供了另外一种方式

 - 第一种标准接口对pandas兼容不好（查询可以，无法直接将表格写入数据库），官方文档明确说明，除了SQLit数据库，其它数据库写入时不支持。若不使用pandas，或者不进行DataFrame导入导出，其它操作没有问题。

 - 第二种可以完美兼容pandas，下面首先使用这种方式。

#### 数据库：PostgreSQL

In [None]:
# 导入库
import psycopg2
from sqlalchemy import create_engine

In [1]:
# 连接数据库
# http://docs.sqlalchemy.org/en/latest/core/engines.html#sqlalchemy.create_engine
# http://docs.sqlalchemy.org/en/latest/dialects/postgresql.html#module-sqlalchemy.dialects.postgresql.psycopg2
# http://pandas.pydata.org/pandas-docs/stable/io.html#io-sql （pandas文档）

# 默认方式（其它方式点击上面官网链接查看）：create_engine('postgresql://user:password@host:port/dbname')
# 参数说明：
#          postgresql使用的数据库（这里不用修改）
#          user：数据库账户名
#          password：数据库账户密码
#          host：数据库所在服务器地址，如果是本机直接使用localhost
#          port：数据库端口号（postgresql默认5432）
#          dbname:待连接的数据库名

## ==================================================================================================
# 其它数据库参考（截取自上面pandas官方文档，未实测）

'''
    engine = create_engine('postgresql://scott:tiger@localhost:5432/mydatabase')

    engine = create_engine('mysql+mysqldb://scott:tiger@localhost/foo')

    engine = create_engine('oracle://scott:tiger@127.0.0.1:1521/sidname')

    engine = create_engine('mssql+pyodbc://mydsn')

    # sqlite://<nohostname>/<path>
    # where <path> is relative:
    engine = create_engine('sqlite:///foo.db')

    # or absolute, starting with a slash:
    engine = create_engine('sqlite:////absolute/path/to/foo.db')
'''

## 创建连接

In [15]:
engine = create_engine('postgresql://jessica:123456@192.168.31.222:5432/practicedb')

## 将pandas表格（DataFrame）写入数据库
* 数据库必须存在（需要提前创建，详见数据库安装配置文档）

In [17]:
# 读取一个excel文档作为测试数据
df_1 = pd.read_excel(u"../table/活动商品表.xlsx")

In [24]:
# 写入数据库
# http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_sql.html#pandas.DataFrame.to_sql
# to_sql 第一个参数是写入数据库后的表名（自定义），第二个参数是前面创建的连接

df_1.to_sql(u'活动表', engine) #中文表名输入时略为麻烦，需要权衡一下

## 从数据库读取整表（返回类型是DataFrame）

In [26]:
df = pd.read_sql_table('tb2', engine)

In [27]:
df

Unnamed: 0,index,编码,名称,规格,药帮忙价,数量,满减方案
0,0,Y020300140,花红 金松止痒洗液,125毫升/瓶（内附冲洗器）,18.0,≥2,满2盒免1盒
1,1,Y010105832,济民可信 小儿氨酚黄那敏颗粒,2克*10袋,4.8,≥2,满2盒免1盒
2,2,Y010105676,达力芬 头孢克肟颗粒【最低零售价：18元】,50mg*8包（无糖型）,10.2,≥5,满5盒免1盒
3,3,Y020104673,天士力 穿心莲内酯滴丸,0.15克*6袋,10.0,≥5,满5盒免1盒
4,4,Y020300018,花红 消肿止痛酊,60ml,16.5,≥5,满5盒免1盒
5,5,Y010102498,斯利安 叶酸片,0.4毫克*31片,22.0,≥5,满5盒免1盒
6,6,Y010102499,斯利安 叶酸片,0.4mg*31片*3板,53.5,≥5,满5盒免1盒
7,7,Y020104210,新博 柴黄颗粒,3克*12袋,18.4,≥5,满5盒免1盒
8,8,Y010105917,德维喜 维生素C咀嚼片,200毫克*90片,26.5,≥5,满5盒免1盒
9,9,Y010400551,顺峰康宁 盐酸特比萘芬凝胶,10克：0.1克*10克/支,12.0,≥5,满5盒免1盒


## 执行SQL相关指令

### 查询

In [None]:
# 使用数据库查询语言（SQL）

In [50]:
# 查询语句中文要用居然要用双引号，数据库中直接查询亦是如此，具体语法不了解
df = pd.read_sql_query('select * from 活动商品表 where "药帮忙价">18', engine)

In [51]:
df

Unnamed: 0,index,编码,名称,规格,药帮忙价,数量,满减方案
0,5,Y010102498,斯利安 叶酸片,0.4毫克*31片,22.0,≥5,满5盒免1盒
1,6,Y010102499,斯利安 叶酸片,0.4mg*31片*3板,53.5,≥5,满5盒免1盒
2,7,Y020104210,新博 柴黄颗粒,3克*12袋,18.4,≥5,满5盒免1盒
3,8,Y010105917,德维喜 维生素C咀嚼片,200毫克*90片,26.5,≥5,满5盒免1盒
4,16,Y020300062,肤阴洁 复方黄松洗液【最低零售价：29.8元】,250毫升,19.57,≥10,满10盒免1盒
5,17,Y010105717,益佰 克咳胶囊,0.3g*36粒,19.8,≥10,满10盒免1盒
6,21,Y011000039,斯坦定 注射用头孢哌酮钠舒巴坦钠,2g,28.5,≥10,满10盒免1盒


In [52]:
# 更常见的做法
# 将SQL语句定义为字符串变量
sql_state = 'select * from 活动商品表 where "药帮忙价">24'
df = pd.read_sql_query(sql_state, engine)

In [53]:
df

Unnamed: 0,index,编码,名称,规格,药帮忙价,数量,满减方案
0,6,Y010102499,斯利安 叶酸片,0.4mg*31片*3板,53.5,≥5,满5盒免1盒
1,8,Y010105917,德维喜 维生素C咀嚼片,200毫克*90片,26.5,≥5,满5盒免1盒
2,21,Y011000039,斯坦定 注射用头孢哌酮钠舒巴坦钠,2g,28.5,≥10,满10盒免1盒


### 插入

In [75]:
#from pandas.io import sql
# 有中文时，用单引号还是双引号很迷惑。。。待解决
# 由于语句中存在单引号和双引号，使用三引号可以不用转置

sql_insert = """INSERT INTO tb2 (index, "编码", "名称", "规格", "药帮忙价", "数量", "满减方案") \
             VALUES (24, 'YYYYY', '天香续命露', '1粒',  1000, '>=1', '无')"""
sql.execute(sql_insert, engine)

<sqlalchemy.engine.result.ResultProxy at 0x1e1de1e24e0>

### 删除

In [76]:
sql_del = 'delete from tb2 where index=20'
sql.execute(sql_del, engine)

<sqlalchemy.engine.result.ResultProxy at 0x1e1de1d6080>

# 使用DBAPI 接口（psycopg2）连接数据库

    缺点：不能直接将DataFrame写入数据库。需要先在数据库中创建与DataFrame相同表头的表，而后写入。如果表头很长，略显麻烦。
    注意：sqlite3 数据库两种连接方式都支持
    
    与前一种连接方式区别：
    * 对数据库有修改的操作不会直接反应到数据库，直到手动提交

In [82]:
# 导入库
import psycopg2

## 连接

In [78]:
conn = psycopg2.connect(database="practicedb", user="jessica", password="123456", host="192.168.31.222", port=5432)
cur = conn.cursor()

## 查询

In [84]:
import pandas.io.sql as sql
df = sql.read_sql_query('select * from tb1', conn)

In [86]:
# 下面也可以，与第一种连接方式查询语句相同
sql_state = 'select * from tb1'
df = pd.read_sql_query(sql_state, conn)

In [87]:
df

Unnamed: 0,index,exam1,exam2
0,Andre,43,24
1,Barry,81,63
2,Chris,78,56
3,Dan,75,56
4,Emilio,89,67
5,Fred,70,51
6,Greta,91,79
7,Humbert,65,46
8,Ivan,98,72
9,James,87,60


* 插入和删除的接口一样，与查询操作不同的是不需要返回值

## 插入

In [95]:
#from pandas.io import sql
# 有中文时，用单引号还是双引号很迷惑。。。待解决
# 由于语句中存在单引号和双引号，使用三引号可以不用转置

sql_insert = "insert into tb1 (index, exam1, exam2) values ('如风', 23, 45)"
sql.execute(sql_insert, conn)

# 执行后插入操作不会立即生效

<cursor object at 0x000001E1DE1D3668; closed: 0>

In [105]:
# 插入操作的安全版本，避免产生‘SQL注入攻击的安全漏洞’
# http://initd.org/psycopg/docs/cursor.html?highlight=execute#cursor.execute （官方接口文档）
# http://initd.org/psycopg/docs/usage.html#query-parameters  （示例）

cur.execute("insert into tb1 (index, exam1, exam2) values (%s, %s, %s)", ('如雨', 34, 54))

In [96]:
# 提交之前的所有操作
conn.commit()

## 删除

In [109]:
sql_del = "delete from tb1 where index='如风'"
sql.execute(sql_del, conn)

# 同样的，在提交之前不会生效

<cursor object at 0x000001E1DE199128; closed: 0>

In [110]:
# 提交之前的操作
conn.commit()