# 数据库连接使用教程

我们提供了方便的内置函数进行数据库的操作

## 取出一列数据

In [1]:
column = 'qe1' # 想要操作的列

In [2]:
data = sql(f"SELECT {column} FROM adult_2010") # 使用 sql 函数可以执行查询，返回的是 pandas 的 DataFrame 格式
data

Unnamed: 0,qe1
0,1
1,1
2,2
3,2
4,2
...,...
33593,5
33594,1
33595,2
33596,2


## 分组统计

In [3]:
data_counts = data.value_counts()
data_counts

qe1
 2     26741
 1      4338
 5      1975
 4       439
 3        96
-8         5
-1         3
-2         1
dtype: int64

## 查看数据的含义

In [4]:
schema = cfps2010.adult.schema['qe1']
schema

{'type': 'enum',
 'key': '请问您现在的婚姻状态是',
 'range': {'-10': '无法判断',
  '-9': '缺失',
  '-8': '不适用',
  '-2': '拒绝回答',
  '-1': '不知道',
  '0': '没有数据',
  '1': '未婚',
  '2': '在婚（有配偶）',
  '3': '同居',
  '4': '离婚',
  '5': '丧偶'},
 'details': [],
 'minmax': [-8.0, 5.0]}

## 可视化

In [5]:
chart = Pie()
chart.add('', [(schema["range"][str(i)], int(data_counts[i])) for i in range(1, 5+1)])
chart.set_global_opts(title_opts=opts.TitleOpts(title="2010年婚姻状态统计"))
chart.set_colors(["skyblue", "hotpink", "orange", "green", "black"])
chart.render_notebook()

## 显示数据库中的表格

In [6]:
sql("SHOW TABLES")

Unnamed: 0,Tables_in_cfps
0,adult_2010
1,adult_2010_clean
2,adult_2011
3,adult_2012
4,adult_2012_clean
5,adult_2014
6,adult_2014_clean
7,adult_2016
8,adult_2016_clean
9,child_2010


## 尝试破坏数据库 （安全性控制）

我们对数据库进行了安全加固，当前的用户没有篡改数据库的权限，这保证了数据的可靠性和安全性，如果你尝试进行非法操作，会直接报错

In [7]:
sql("DROP TABLE adult_2010")

OperationalError: (pymysql.err.OperationalError) (1142, "DROP command denied to user 'jupyterhub'@'172.17.0.2' for table 'adult_2010'")
[SQL: DROP TABLE adult_2010]
(Background on this error at: https://sqlalche.me/e/14/e3q8)

## 尝试篡改数据

In [8]:
sql("update adult_2012 set qe1=233 where pid12=12312354134")

OperationalError: (pymysql.err.OperationalError) (1142, "UPDATE command denied to user 'jupyterhub'@'172.17.0.2' for table 'adult_2012'")
[SQL: update adult_2012 set qe1=233 where pid12=12312354134]
(Background on this error at: https://sqlalche.me/e/14/e3q8)