In [1]:
import pandas as pd  # 将pandas作为第三方库导入，我们一般为pandas取一个别名叫做pd

pd.set_option('expand_frame_repr', False)  # 当列太多时清楚展示

# =====导入数据
df = pd.read_csv(
    r'E:\project\stockA_coding\data\sh600000.csv',
    encoding='gbk',
    skiprows=1
)

In [2]:
# =====rolling、expanding操作
# 计算'收盘价'这一列的均值
print(df['收盘价'])

0       27.75
1       27.71
2       28.05
3       27.75
4       26.55
        ...  
4577    11.28
4578    11.44
4579    11.44
4580    11.50
4581    11.71
Name: 收盘价, Length: 4582, dtype: float64


In [3]:
# 如何得到每一天的最近3天close的均值呢？即如何计算常用的移动平均线？
# 使用rolling函数
df['收盘价_3天均值'] = df['收盘价'].rolling(3).mean()
print(df[['收盘价', '收盘价_3天均值']])
#rolling(n)即为取最近n行数据的意思，只计算这n行数据。后面可以接各类计算函数，例如max、min、std等
print(df['收盘价'].rolling(3).max())
print(df['收盘价'].rolling(3).min())
print(df['收盘价'].rolling(3).std())

        收盘价   收盘价_3天均值
0     27.75        NaN
1     27.71        NaN
2     28.05  27.836667
3     27.75  27.836667
4     26.55  27.450000
...     ...        ...
4577  11.28  11.130000
4578  11.44  11.250000
4579  11.44  11.386667
4580  11.50  11.460000
4581  11.71  11.550000

[4582 rows x 2 columns]
0         NaN
1         NaN
2       28.05
3       28.05
4       28.05
        ...  
4577    11.28
4578    11.44
4579    11.44
4580    11.50
4581    11.71
Name: 收盘价, Length: 4582, dtype: float64
0         NaN
1         NaN
2       27.71
3       27.71
4       26.55
        ...  
4577    11.03
4578    11.03
4579    11.28
4580    11.44
4581    11.44
Name: 收盘价, Length: 4582, dtype: float64
0            NaN
1            NaN
2       0.185831
3       0.185831
4       0.793725
          ...   
4577    0.132288
4578    0.206640
4579    0.092376
4580    0.034641
4581    0.141774
Name: 收盘价, Length: 4582, dtype: float64


In [4]:
# rolling可以计算每天的最近3天的均值，如果想计算每天的从一开始至今的均值，应该如何计算？
# 使用expanding操作
df['收盘价_至今均值'] = df['收盘价'].expanding().mean()
print(df[['收盘价', '收盘价_至今均值']])

# expanding即为取从头至今的数据。后面可以接各类计算函数
print(df['收盘价'].expanding().max())
print(df['收盘价'].expanding().min())
print(df['收盘价'].expanding().std())

# rolling和expanding简直是为量化领域量身定制的方法，经常会用到。


        收盘价   收盘价_至今均值
0     27.75  27.750000
1     27.71  27.730000
2     28.05  27.836667
3     27.75  27.815000
4     26.55  27.562000
...     ...        ...
4577  11.28  15.653668
4578  11.44  15.652747
4579  11.44  15.651828
4580  11.50  15.650921
4581  11.71  15.650061

[4582 rows x 2 columns]
0       27.75
1       27.75
2       28.05
3       28.05
4       28.05
        ...  
4577    61.59
4578    61.59
4579    61.59
4580    61.59
4581    61.59
Name: 收盘价, Length: 4582, dtype: float64
0       27.75
1       27.71
2       27.71
3       27.71
4       26.55
        ...  
4577     6.48
4578     6.48
4579     6.48
4580     6.48
4581     6.48
Name: 收盘价, Length: 4582, dtype: float64
0            NaN
1       0.028284
2       0.185831
3       0.157797
4       0.581997
          ...   
4577    8.744655
4578    8.743921
4579    8.743188
4580    8.742449
4581    8.741688
Name: 收盘价, Length: 4582, dtype: float64


In [5]:
# =====输出到本地文件
print(df)
df.to_csv('output.csv', encoding='gbk', index=False)

          股票代码  股票名称        交易日期    开盘价    最高价    最低价    收盘价   前收盘价          成交量           成交额   收盘价_3天均值   收盘价_至今均值
0     sh600000  浦发银行  1999-11-10  29.50  29.80  27.00  27.75  10.00  174085100.0  4.859102e+09        NaN  27.750000
1     sh600000  浦发银行  1999-11-11  27.58  28.38  27.53  27.71  27.75   29403500.0  8.215822e+08        NaN  27.730000
2     sh600000  浦发银行  1999-11-12  27.86  28.30  27.77  28.05  27.71   15008000.0  4.215916e+08  27.836667  27.836667
3     sh600000  浦发银行  1999-11-15  28.20  28.25  27.70  27.75  28.05   11921100.0  3.329528e+08  27.836667  27.815000
4     sh600000  浦发银行  1999-11-16  27.88  27.97  26.48  26.55  27.75   23223100.0  6.289083e+08  27.450000  27.562000
...        ...   ...         ...    ...    ...    ...    ...    ...          ...           ...        ...        ...
4577  sh600000  浦发银行  2019-03-29  10.98  11.30  10.98  11.28  11.03   60526266.0  6.784365e+08  11.130000  15.653668
4578  sh600000  浦发银行  2019-04-01  11.36  11.52  11.29  11.44  11