### 导入之前使用的数据

In [1]:
import pandas as pd
import numpy as np

pd.set_option('expand_frame_repr', False)

df = pd.read_csv(filepath_or_buffer='stock_data.csv',
                encoding='gbk',
                 parse_dates=['交易日期']
                )

df = df[['交易日期', '股票代码', '开盘价', '最高价', '最低价', '收盘价', '成交量', '成交额']]
df = df[df['交易日期'] > pd.to_datetime('20171201')]
df = df[df['交易日期'] < pd.to_datetime('20190101')]
df['前收盘价'] = df.groupby('股票代码')['收盘价'].shift(1) 

df.drop(df[np.isnan(df['前收盘价'])].index, inplace=True) # 定位NaN所在的index后删除行
print(df)

             交易日期      股票代码     开盘价     最高价     最低价     收盘价           成交量           成交额    前收盘价
217    2018-01-31  sh600000   12.61   14.00   12.60   13.17  2.529676e+09  3.333193e+10   12.59
218    2018-02-28  sh600000   13.14   13.90   12.24   12.46  1.469635e+09  1.920696e+10   13.17
219    2018-03-30  sh600000   12.40   12.60   11.45   11.65  6.003535e+08  7.307852e+09   12.46
220    2018-04-27  sh600000   11.68   12.02   11.49   11.61  3.847188e+08  4.498217e+09   11.65
221    2018-05-31  sh600000   11.33   11.33   10.39   10.55  5.580226e+08  6.058957e+09   11.61
222    2018-06-29  sh600000   10.60   10.83    9.32    9.56  4.446820e+08  4.475076e+09   10.55
223    2018-07-31  sh600000    9.55   10.20    9.17   10.17  4.329690e+08  4.183506e+09    9.56
224    2018-08-31  sh600000   10.26   10.43    9.66   10.33  4.445087e+08  4.491287e+09   10.17
225    2018-09-28  sh600000   10.27   10.75    9.95   10.62  3.751380e+08  3.864051e+09   10.33
226    2018-10-31  sh600000   10.39   11

### 排序

In [2]:
print(df.sort_values(by=['交易日期'], ascending=1))

             交易日期      股票代码     开盘价     最高价    最低价     收盘价           成交量           成交额    前收盘价
426745 2018-01-03  sz002607    3.96    4.10   3.95    4.06  1.736902e+07  7.020450e+07    3.98
480547 2018-01-03  sz300441   24.09   24.59  23.85   24.05  1.708500e+06  4.123829e+07   24.21
427984 2018-01-04  sz002621   15.79   16.98  15.62   16.50  8.722557e+06  1.429489e+08   15.58
301808 2018-01-04  sz000703   21.48   26.88  21.41   26.01  8.633805e+07  2.101582e+09   21.57
440958 2018-01-05  sz002870   25.96   26.16  25.66   25.75  1.828896e+06  4.732085e+07   25.96
225981 2018-01-05  sh603822   34.95   36.75  34.81   35.91  3.311248e+06  1.185135e+08   34.94
479154 2018-01-05  sz300412   10.17   11.30   9.89   11.10  5.774638e+06  6.094900e+07   10.03
418321 2018-01-05  sz002517   22.02   22.98  21.35   21.35  8.976283e+07  1.961200e+09   22.21
440505 2018-01-08  sz002851   34.38   36.88  34.00   36.50  3.536327e+06  1.245167e+08   34.33
7212   2018-01-08  sh600051    9.45    9.77   9.41

In [5]:
print(df.sort_values(by=['交易日期', '股票代码'], ascending=[1,0]))

             交易日期      股票代码    开盘价    最高价    最低价    收盘价           成交量           成交额   前收盘价
480547 2018-01-03  sz300441  24.09  24.59  23.85  24.05  1.708500e+06  4.123829e+07  24.21
426745 2018-01-03  sz002607   3.96   4.10   3.95   4.06  1.736902e+07  7.020450e+07   3.98
427984 2018-01-04  sz002621  15.79  16.98  15.62  16.50  8.722557e+06  1.429489e+08  15.58
301808 2018-01-04  sz000703  21.48  26.88  21.41  26.01  8.633805e+07  2.101582e+09  21.57
479154 2018-01-05  sz300412  10.17  11.30   9.89  11.10  5.774638e+06  6.094900e+07  10.03
440958 2018-01-05  sz002870  25.96  26.16  25.66  25.75  1.828896e+06  4.732085e+07  25.96
418321 2018-01-05  sz002517  22.02  22.98  21.35  21.35  8.976283e+07  1.961200e+09  22.21
225981 2018-01-05  sh603822  34.95  36.75  34.81  35.91  3.311248e+06  1.185135e+08  34.94
440505 2018-01-08  sz002851  34.38  36.88  34.00  36.50  3.536327e+06  1.245167e+08  34.33
7212   2018-01-08  sh600051   9.45   9.77   9.41   9.75  1.104140e+07  1.061478e+08   9.43

### 上下合并append

In [7]:
df1 = df.iloc[0:10][['交易日期', '股票代码', '收盘价', '成交量']]
df2 = df.iloc[5:15][['交易日期', '股票代码', '收盘价', '成交量']]

print(df1, df2)

          交易日期      股票代码    收盘价           成交量
217 2018-01-31  sh600000  13.17  2.529676e+09
218 2018-02-28  sh600000  12.46  1.469635e+09
219 2018-03-30  sh600000  11.65  6.003535e+08
220 2018-04-27  sh600000  11.61  3.847188e+08
221 2018-05-31  sh600000  10.55  5.580226e+08
222 2018-06-29  sh600000   9.56  4.446820e+08
223 2018-07-31  sh600000  10.17  4.329690e+08
224 2018-08-31  sh600000  10.33  4.445087e+08
225 2018-09-28  sh600000  10.62  3.751380e+08
226 2018-10-31  sh600000  10.98  5.646983e+08           交易日期      股票代码    收盘价          成交量
222 2018-06-29  sh600000   9.56  444682049.0
223 2018-07-31  sh600000  10.17  432968988.0
224 2018-08-31  sh600000  10.33  444508687.0
225 2018-09-28  sh600000  10.62  375137970.0
226 2018-10-31  sh600000  10.98  564698321.0
227 2018-11-30  sh600000  10.71  461911533.0
228 2018-12-28  sh600000   9.80  449765261.0
765 2018-01-31  sh600004  16.90  388088856.0
766 2018-02-28  sh600004  16.37  257401539.0
767 2018-03-30  sh600004  15.64  170742782.0

In [8]:
# 不存在值的地方为NaN
print(df1.append(df2))


          交易日期      股票代码    收盘价           成交量
217 2018-01-31  sh600000  13.17  2.529676e+09
218 2018-02-28  sh600000  12.46  1.469635e+09
219 2018-03-30  sh600000  11.65  6.003535e+08
220 2018-04-27  sh600000  11.61  3.847188e+08
221 2018-05-31  sh600000  10.55  5.580226e+08
222 2018-06-29  sh600000   9.56  4.446820e+08
223 2018-07-31  sh600000  10.17  4.329690e+08
224 2018-08-31  sh600000  10.33  4.445087e+08
225 2018-09-28  sh600000  10.62  3.751380e+08
226 2018-10-31  sh600000  10.98  5.646983e+08
222 2018-06-29  sh600000   9.56  4.446820e+08
223 2018-07-31  sh600000  10.17  4.329690e+08
224 2018-08-31  sh600000  10.33  4.445087e+08
225 2018-09-28  sh600000  10.62  3.751380e+08
226 2018-10-31  sh600000  10.98  5.646983e+08
227 2018-11-30  sh600000  10.71  4.619115e+08
228 2018-12-28  sh600000   9.80  4.497653e+08
765 2018-01-31  sh600004  16.90  3.880889e+08
766 2018-02-28  sh600004  16.37  2.574015e+08
767 2018-03-30  sh600004  15.64  1.707428e+08


In [10]:
df3 = df1.append(df2, ignore_index=True)
print(df3)

         交易日期      股票代码    收盘价           成交量
0  2018-01-31  sh600000  13.17  2.529676e+09
1  2018-02-28  sh600000  12.46  1.469635e+09
2  2018-03-30  sh600000  11.65  6.003535e+08
3  2018-04-27  sh600000  11.61  3.847188e+08
4  2018-05-31  sh600000  10.55  5.580226e+08
5  2018-06-29  sh600000   9.56  4.446820e+08
6  2018-07-31  sh600000  10.17  4.329690e+08
7  2018-08-31  sh600000  10.33  4.445087e+08
8  2018-09-28  sh600000  10.62  3.751380e+08
9  2018-10-31  sh600000  10.98  5.646983e+08
10 2018-06-29  sh600000   9.56  4.446820e+08
11 2018-07-31  sh600000  10.17  4.329690e+08
12 2018-08-31  sh600000  10.33  4.445087e+08
13 2018-09-28  sh600000  10.62  3.751380e+08
14 2018-10-31  sh600000  10.98  5.646983e+08
15 2018-11-30  sh600000  10.71  4.619115e+08
16 2018-12-28  sh600000   9.80  4.497653e+08
17 2018-01-31  sh600004  16.90  3.880889e+08
18 2018-02-28  sh600004  16.37  2.574015e+08
19 2018-03-30  sh600004  15.64  1.707428e+08


 ### 数据去重

In [12]:
df3.drop_duplicates(
    # subset=['交易日期', '股票代码'], # 只要subset组出现重复就删掉
    keep='first', # 保留第一行 last保留最后一行 False都不要
    inplace=True
)
print(df3)

         交易日期      股票代码    收盘价           成交量
0  2018-01-31  sh600000  13.17  2.529676e+09
1  2018-02-28  sh600000  12.46  1.469635e+09
2  2018-03-30  sh600000  11.65  6.003535e+08
3  2018-04-27  sh600000  11.61  3.847188e+08
4  2018-05-31  sh600000  10.55  5.580226e+08
5  2018-06-29  sh600000   9.56  4.446820e+08
6  2018-07-31  sh600000  10.17  4.329690e+08
7  2018-08-31  sh600000  10.33  4.445087e+08
8  2018-09-28  sh600000  10.62  3.751380e+08
9  2018-10-31  sh600000  10.98  5.646983e+08
15 2018-11-30  sh600000  10.71  4.619115e+08
16 2018-12-28  sh600000   9.80  4.497653e+08
17 2018-01-31  sh600004  16.90  3.880889e+08
18 2018-02-28  sh600004  16.37  2.574015e+08
19 2018-03-30  sh600004  15.64  1.707428e+08


### 其他重要函数

In [None]:
df.reset_index(inplace=True, drop=True) # 重置index，drop去除原有index
df.rename(columns={'收盘价':'close', '开盘价':'open'}, inplace=True) # 改列名
df.empty # 判断是否为空
# print(pd.DataFrame().empty)
df.T # 转置