# 第八章 数据格式化
## 8.1 中国股票交易数据的格式化存储

- 读取数据
- 处理数据
- 存储数据

## 8.2 预备知识--数据类型的转换与对象的文件存储
### 8.2.1 数据类型的转换

- 基本数据类型：字符串、数值
- 组合：字典、列表、元组

### 8.2.2 常用数据类型和格式转换
#### 基本数据类型的转换

In [4]:
s = "20.19"
f = float(s) # f = eval(s)
#d = int(s)
print(f)

20.19


In [2]:
f = 3.14
s = str(f)
print(s)

3.14


In [13]:
import datetime
import locale
locale.setlocale(locale.LC_CTYPE,"chinese")
s = "2020/12/21"
dt = datetime.datetime.strptime(s, "%Y/%m/%d")
print(dt)
s_dt = dt.strftime("%Y{y}%m{m}%d{d}".format(y='年',m='月',d='日'))
print(s_dt)

2020-12-21 00:00:00
2020年12月21日


#### 列表、集合和字典的转换

In [17]:
lst = [95,93,86,93]
s = set(lst)
print(s)

{93, 86, 95}


In [23]:
k = ["x","y","z"]
v = [10,20,30]
dic = {}
for i in range(len(k)):
    dic[k[i]] = v[i]
print(dic)

{'x': 10, 'y': 20, 'z': 30}


In [29]:
z = zip(k,v)
#print(list(z))
d = dict(z)
print(d)
list(d.items())

{'x': 10, 'y': 20, 'z': 30}


[('x', 10), ('y', 20), ('z', 30)]

#### 由字符串创建字典

In [31]:
s = "{'股票名称': '福建高速', '今开': '3.32', '成交量': '5.37万手', '最高': '3.34', '涨停': '3.66', '内盘': '4.03万手', '成交额': '1778.96万', '委比': '-18.43%', '流通市值': '90.29亿', '市盈率MRQ': '11.34', '每股收益': '0.07', '总股本': '27.44亿', '昨收': '3.33', '换手率': '0.20%', '最低': '3.28', '跌停': '3.00', '外盘': '1.34万手', '振幅': '1.80%', '量比': '0.52', '总市值': '90.29亿', '市净率': '0.96', '每股净资产': '3.43', '流通股本': '27.44亿'}"
dic = eval(s)
print(dic["股票名称"])

福建高速


In [36]:
import json
dic = json.loads(s)
print(dic)

TypeError: __init__() got an unexpected keyword argument 'ensure_ascii'

In [39]:
import json
f = open("data/StockData.txt","r", encoding="gbk")
lst = json.load(f)
print(lst)
f.close()

JSONDecodeError: Expecting property name enclosed in double quotes: line 1 column 2 (char 1)

### 8.2.3 对象的文件存储
#### 利用pickle包存储对象

In [1]:
import pickle
s = "{'股票名称': '福建高速', '今开': '3.32', '成交量': '5.37万手', '最高': '3.34', '涨停': '3.66', '内盘': '4.03万手', '成交额': '1778.96万', '委比': '-18.43%', '流通市值': '90.29亿', '市盈率MRQ': '11.34', '每股收益': '0.07', '总股本': '27.44亿', '昨收': '3.33', '换手率': '0.20%', '最低': '3.28', '跌停': '3.00', '外盘': '1.34万手', '振幅': '1.80%', '量比': '0.52', '总市值': '90.29亿', '市净率': '0.96', '每股净资产': '3.43', '流通股本': '27.44亿'}"
dic = eval(s)
f = open("data/股票.pkl", "wb")
pickle.dump(dic, f)
f.close()

#### 利用pickle包读取对象

In [3]:
import pickle
f = open("data/股票.pkl", "rb")
dic = pickle.load(f)
f.close()
print(dic["股票名称"])

福建高速


### 8.2.4 整数不同进制的转换

### 8.2.5 课堂练习之数据格式转换
#### 代码补全

In [7]:
s = '20.19万手'
# 提取“万手”前面的数字
x = float(s[:-2])
print(x)
# 将所得数乘以10000
print(x * 10000)

20.19
201900.0


#### 任务应用

## 8.3 中国股票交易数据项目实战
### 8.3.1 任务分析
- 逐行读入单只股票
- 利用字典存储单只股票信息
- 利用嵌套字典存储多只股票信息
- 股票信息保存到文件

### 8.3.2 任务实现
#### 逐行读入单只股票


In [9]:
with open("data/StockData.txt", "r") as f:
    lines = f.readlines()
print(lines[1])

{'股票名称': '中信证券', '今开': '21.05', '成交量': '96.58万手', '最高': '21.23', '涨停': '23.11', '内盘': '57.68万手', '成交额': '20.17亿', '委比': '28.43%', '流通市值': '2027.71亿', '市盈率MRQ': '14.70', '每股收益': '0.35', '总股本': '121.17亿', '昨收': '21.01', '换手率': '0.98%', '最低': '20.64', '跌停': '18.91', '外盘': '38.91万手', '振幅': '2.81%', '量比': '1.64', '总市值': '2503.35亿', '市净率': '1.59', '每股净资产': '13.03', '流通股本': '98.15亿'}



#### 利用字典存储单只股票信息


In [11]:
stock_list = []
for line in lines:
    stock = eval(line)
    
    cjl = stock["成交量"][:-2]
    if cjl.strip() == "":
        stock["成交量"] = 0
    else:
        stock["成交量"] = float(cjl) * 10000
        
    unit = stock["成交额"][-1]
    cje = stock["成交额"][:-1]
    if cje.strip() == "-":
        stock["成交额"] = 0
    else:
        if unit == "万":
            stock["成交额"] = float(cje) * 10000
        else:
            stock["成交额"] = float(cje) * 100000000
            
    wb = stock["委比"][:-1]
    if wb.strip() == "-":
        stock["委比"] = 0
    else:
        stock["委比"] = round(float(wb) / 100, 2)
        
    stock_list.append(stock)
    
print(stock_list[1])

{'股票名称': '中信证券', '今开': '21.05', '成交量': 965800.0, '最高': '21.23', '涨停': '23.11', '内盘': '57.68万手', '成交额': 2017000000.0000002, '委比': 0.28, '流通市值': '2027.71亿', '市盈率MRQ': '14.70', '每股收益': '0.35', '总股本': '121.17亿', '昨收': '21.01', '换手率': '0.98%', '最低': '20.64', '跌停': '18.91', '外盘': '38.91万手', '振幅': '2.81%', '量比': '1.64', '总市值': '2503.35亿', '市净率': '1.59', '每股净资产': '13.03', '流通股本': '98.15亿'}


#### 利用嵌套字典存储多只股票信息


In [14]:
from pprint import pprint
stock_dict = {}
for dic in stock_list:
    stock_dict[dic["股票名称"]] = dic
pprint(stock_dict)

{'*ST保千': {'今开': '--',
           '内盘': '--',
           '外盘': '--',
           '委比': 0,
           '市净率': '-0.50',
           '市盈率MRQ': '--',
           '总市值': '25.35亿',
           '总股本': '24.38亿',
           '成交量': 0,
           '成交额': 0,
           '振幅': '--',
           '换手率': '--',
           '昨收': '1.04',
           '最低': '--',
           '最高': '--',
           '每股净资产': '-2.10',
           '每股收益': '-0.03',
           '流通市值': '10.67亿',
           '流通股本': '10.26亿',
           '涨停': '1.09',
           '股票名称': '*ST保千',
           '跌停': '0.99',
           '量比': '--'},
 '*ST联谊': {'今开': '--',
           '内盘': '--',
           '外盘': '--',
           '委比': 0,
           '市净率': '--',
           '市盈率MRQ': '--',
           '总市值': '--',
           '总股本': '--',
           '成交量': 0,
           '成交额': 0,
           '振幅': '--',
           '换手率': '--',
           '昨收': '--',
           '最低': '--',
           '最高': '--',
           '每股净资产': '--',
           '每股收益': '--',
           '流通市值': '--',
  

In [15]:
print(stock_dict["万东医疗"])

{'股票名称': '万东医疗', '今开': '9.97', '成交量': 48300.0, '最高': '10.05', '涨停': '10.90', '内盘': '2.78万手', '成交额': 47957500.0, '委比': -0.1, '流通市值': '53.38亿', '市盈率MRQ': '233.51', '每股收益': '0.01', '总股本': '5.41亿', '昨收': '9.91', '换手率': '0.89%', '最低': '9.82', '跌停': '8.92', '外盘': '2.05万手', '振幅': '2.32%', '量比': '1.23', '总市值': '53.38亿', '市净率': '2.71', '每股净资产': '3.64', '流通股本': '5.41亿'}


#### 股票信息保存到文件

In [16]:
import pickle
f = open("data/股票信息.pkl", "wb")
pickle.dump(stock_dict, f)
f.close()

In [17]:
# json文件
import json
f = open("data/stcok.json", "w")
json.dump(stock_dict,f)
f.close()

In [18]:
import json
f = open("data/stcok.json", "r")
dic = json.load(f)
print(dic)
f.close()

{'福建高速': {'股票名称': '福建高速', '今开': '3.32', '成交量': 53700.0, '最高': '3.34', '涨停': '3.66', '内盘': '4.03万手', '成交额': 17789600.0, '委比': -0.18, '流通市值': '90.29亿', '市盈率MRQ': '11.34', '每股收益': '0.07', '总股本': '27.44亿', '昨收': '3.33', '换手率': '0.20%', '最低': '3.28', '跌停': '3.00', '外盘': '1.34万手', '振幅': '1.80%', '量比': '0.52', '总市值': '90.29亿', '市净率': '0.96', '每股净资产': '3.43', '流通股本': '27.44亿'}, '中信证券': {'股票名称': '中信证券', '今开': '21.05', '成交量': 965800.0, '最高': '21.23', '涨停': '23.11', '内盘': '57.68万手', '成交额': 2017000000.0000002, '委比': 0.28, '流通市值': '2027.71亿', '市盈率MRQ': '14.70', '每股收益': '0.35', '总股本': '121.17亿', '昨收': '21.01', '换手率': '0.98%', '最低': '20.64', '跌停': '18.91', '外盘': '38.91万手', '振幅': '2.81%', '量比': '1.64', '总市值': '2503.35亿', '市净率': '1.59', '每股净资产': '13.03', '流通股本': '98.15亿'}, '三一重工': {'股票名称': '三一重工', '今开': '12.95', '成交量': 916000.0, '最高': '13.05', '涨停': '14.25', '内盘': '44.10万手', '成交额': 1181000000.0, '委比': 0.29, '流通市值': '1066.42亿', '市盈率MRQ': '8.31', '每股收益': '0.38', '总股本': '83.75亿', '昨收': '12.95', '换手率': '1.

## 8.4 总结与提高--数据格式转换
### 8.4.1 数据类型的转换
#### 基本数据类型转换

#### 列表、集合和字典的转换

### 8.4.2 使用表达式求值创建对象

### 8.4.3 对象的文件存储
#### 利用pickle包进行对象的二进制文件存储

#### 利用shelve包进行对象的二进制文件存储

## 巩固与应用
### 8.5.1 列表转化字典

In [28]:
from  datetime import datetime 
import locale
locale.setlocale(locale.LC_CTYPE,"chinese")

with open("data/宁波精达.txt", "r") as f:
    lines = f.readlines()
lines = [x[:-2] for x in lines]
head = lines[0].split(",")
lines = lines[1:]
#print(lines)
#print(head)
stocks = {}
for line in lines:
    stock = {}
    line_list = line.split(",")
    for i in range(3, len(head)):
        stock[head[i]] = line_list[i]
    stock_date = line_list[0].split(" ")[0]
    stock_date = datetime.strptime(stock_date, "%Y-%m-%d").strftime("%Y年%m月%d日")
    stocks[stock_date] = stock
    
pprint(stocks)

{'2014年11月11日': {'前收盘': '8.57',
                 '开盘价': '10.28',
                 '总市值': '987200000',
                 '成交量': '21900',
                 '成交金额': '270040',
                 '换手率': '0.1095',
                 '收盘价': '12.34',
                 '最低价': '10.28',
                 '最高价': '12.34',
                 '流通市值': '246800000',
                 '涨跌幅': '43.9907',
                 '涨跌额': '3.77'},
 '2014年11月12日': {'前收盘': '12.34',
                 '开盘价': '13.57',
                 '总市值': '1085600000',
                 '成交量': '9000',
                 '成交金额': '122130',
                 '换手率': '0.045',
                 '收盘价': '13.57',
                 '最低价': '13.57',
                 '最高价': '13.57',
                 '流通市值': '271400000',
                 '涨跌幅': '9.9676',
                 '涨跌额': '1.23'},
 '2014年11月13日': {'前收盘': '13.57',
                 '开盘价': '14.93',
                 '总市值': '1194400000',
                 '成交量': '5001',
                 '成交金额': '74665',
             

 '2015年05月29日': {'前收盘': '65.52',
                 '开盘价': '62',
                 '总市值': '4932800000',
                 '成交量': '4020259',
                 '成交金额': '249775057',
                 '换手率': '20.1013',
                 '收盘价': '61.66',
                 '最低价': '58.97',
                 '最高价': '66.79',
                 '流通市值': '1233200000',
                 '涨跌幅': '-5.8913',
                 '涨跌额': '-3.86'},
 '2015年06月01日': {'前收盘': '61.66',
                 '开盘价': '61.5',
                 '总市值': '5029600000',
                 '成交量': '3201733',
                 '成交金额': '192763013',
                 '换手率': '16.0087',
                 '收盘价': '62.87',
                 '最低价': '58.37',
                 '最高价': '63',
                 '流通市值': '1257400000',
                 '涨跌幅': '1.9624',
                 '涨跌额': '1.21'},
 '2015年06月02日': {'前收盘': '62.87',
                 '开盘价': '62.38',
                 '总市值': '4884800000',
                 '成交量': '3119731',
                 '成交金额': '189909

                 '成交量': '820960',
                 '成交金额': '42569607',
                 '换手率': '3.2838',
                 '收盘价': '52.15',
                 '最低价': '51.08',
                 '最高价': '52.73',
                 '流通市值': '1303750000',
                 '涨跌幅': '-1.3058',
                 '涨跌额': '-0.69'},
 '2015年12月25日': {'前收盘': '52.15',
                 '开盘价': '52.66',
                 '总市值': '4307200000',
                 '成交量': '1376979',
                 '成交金额': '73706811',
                 '换手率': '5.5079',
                 '收盘价': '53.84',
                 '最低价': '52.3',
                 '最高价': '54.49',
                 '流通市值': '1346000000',
                 '涨跌幅': '3.2407',
                 '涨跌额': '1.69'},
 '2015年12月28日': {'前收盘': '53.84',
                 '开盘价': '55',
                 '总市值': '4120800000',
                 '成交量': '1206138',
                 '成交金额': '63687338',
                 '换手率': '4.8246',
                 '收盘价': '51.51',
                 '最低价': '51.39',
 

                 '开盘价': '46.4',
                 '总市值': '3644800000',
                 '成交量': '864747',
                 '成交金额': '39853620',
                 '换手率': '3.459',
                 '收盘价': '45.56',
                 '最低价': '45.48',
                 '最高价': '46.79',
                 '流通市值': '1139000000',
                 '涨跌幅': '-1.6832',
                 '涨跌额': '-0.78'},
 '2016年07月22日': {'前收盘': '45.56',
                 '开盘价': '45.56',
                 '总市值': '3508000000',
                 '成交量': '1497278',
                 '成交金额': '66510558',
                 '换手率': '5.9891',
                 '收盘价': '43.85',
                 '最低价': '43.66',
                 '最高价': '45.7',
                 '流通市值': '1096250000',
                 '涨跌幅': '-3.7533',
                 '涨跌额': '-1.71'},
 '2016年07月25日': {'前收盘': '43.85',
                 '开盘价': '44.01',
                 '总市值': '3556000000',
                 '成交量': '675210',
                 '成交金额': '30014069',
                 '换手率': '2.7

                 '换手率': '2.0457',
                 '收盘价': '53.05',
                 '最低价': '52.97',
                 '最高价': '53.9',
                 '流通市值': '1326250000',
                 '涨跌幅': '-1.65',
                 '涨跌额': '-0.89'},
 '2017年03月20日': {'前收盘': '53.05',
                 '开盘价': '52.8',
                 '总市值': '4348800000',
                 '成交量': '980545',
                 '成交金额': '52316695',
                 '换手率': '3.9222',
                 '收盘价': '54.36',
                 '最低价': '52.7',
                 '最高价': '55.68',
                 '流通市值': '1359000000',
                 '涨跌幅': '2.4694',
                 '涨跌额': '1.31'},
 '2017年03月21日': {'前收盘': '54.36',
                 '开盘价': '54',
                 '总市值': '4288000000',
                 '成交量': '723438',
                 '成交金额': '38804614',
                 '换手率': '2.8938',
                 '收盘价': '53.6',
                 '最低价': '53.3',
                 '最高价': '54.05',
                 '流通市值': '1340000000',
        

                 '成交量': '186310',
                 '成交金额': '8013049',
                 '换手率': '0.7452',
                 '收盘价': '43.11',
                 '最低价': '42.56',
                 '最高价': '43.25',
                 '流通市值': '1077750000',
                 '涨跌幅': '0.2791',
                 '涨跌额': '0.12'},
 '2017年11月03日': {'前收盘': '43.11',
                 '开盘价': '43.2',
                 '总市值': '3490400000',
                 '成交量': '338910',
                 '成交金额': '14686605',
                 '换手率': '1.3556',
                 '收盘价': '43.63',
                 '最低价': '42.85',
                 '最高价': '43.88',
                 '流通市值': '1090750000',
                 '涨跌幅': '1.2062',
                 '涨跌额': '0.52'},
 '2017年11月06日': {'前收盘': '43.63',
                 '开盘价': '44.75',
                 '总市值': '3564800000',
                 '成交量': '1919969',
                 '成交金额': '85586608',
                 '换手率': '7.6799',
                 '收盘价': '44.56',
                 '最低价': '43.24',
  

                 '换手率': '1.2036',
                 '收盘价': '22.4',
                 '最低价': '22.1',
                 '最高价': '22.82',
                 '流通市值': '1792000000',
                 '涨跌幅': '-1.365',
                 '涨跌额': '-0.31'},
 '2018年06月11日': {'前收盘': '22.4',
                 '开盘价': '22.36',
                 '总市值': '1800800000',
                 '成交量': '758700',
                 '成交金额': '17117946',
                 '换手率': '0.9484',
                 '收盘价': '22.51',
                 '最低价': '22.2',
                 '最高价': '22.78',
                 '流通市值': '1800800000',
                 '涨跌幅': '0.4911',
                 '涨跌额': '0.11'},
 '2018年06月12日': {'前收盘': '22.51',
                 '开盘价': '22.58',
                 '总市值': '1800800000',
                 '成交量': '702000',
                 '成交金额': '15714724',
                 '换手率': '0.8775',
                 '收盘价': '22.51',
                 '最低价': '22.07',
                 '最高价': '22.65',
                 '流通市值': '1800800000',
   

                 '最高价': '11.77',
                 '流通市值': '1314880000',
                 '涨跌幅': '1.3817',
                 '涨跌额': '0.16'},
 '2019年01月08日': {'前收盘': '11.74',
                 '开盘价': '11.72',
                 '总市值': '1326080000',
                 '成交量': '1106164',
                 '成交金额': '13018884',
                 '换手率': '0.9876',
                 '收盘价': '11.84',
                 '最低价': '11.65',
                 '最高价': '11.93',
                 '流通市值': '1326080000',
                 '涨跌幅': '0.8518',
                 '涨跌额': '0.1'},
 '2019年01月09日': {'前收盘': '11.84',
                 '开盘价': '11.96',
                 '总市值': '1319360000',
                 '成交量': '1092548',
                 '成交金额': '13001084',
                 '换手率': '0.9755',
                 '收盘价': '11.78',
                 '最低价': '11.72',
                 '最高价': '12.02',
                 '流通市值': '1319360000',
                 '涨跌幅': '-0.5068',
                 '涨跌额': '-0.06'},
 '2019年01月10日': {'前收盘': '11.78