# Python课程和Python语言简介
## 一、关于我们
- 关于计量经济学教育部重点实验室（厦门大学） [微信号](images/bzs.jpg) 
    - 计算资源 [http://app.soe.xmu.edu.cn/moe/status/](http://app.soe.xmu.edu.cn/moe/status/)
    - 数据资源 [http://app.soe.xmu.edu.cn/elib/](http://app.soe.xmu.edu.cn/elib/)
- 关于WISERCLUB [微信号](images/wiserclub.png)
- 关于选课同学情况调查
    - 关于年级专业
    - 关于编程基础
    - 关于编程兴趣
- 微信群[微信群](images/weixin.png)

## 二、关于课程

### 1. 课程大纲
- ch01 Python课程和Python语言简介
    - 课程大纲、目标、学习方法和考核要求
    - Python语言的发展和应用，Python标准库和第三方库
    - 代码阅读：计算国内股票交易成本，了解股票交易业务，了解Python编程基本语法，发现Python变量和函数
- ch02 Python开发环境和开发工具
    - 初识操作系统
    - 构建Python开发环境
    - 使用pycharm和jupyter lab等开发工具
    - 代码阅读：计算股票交易收益和净值，了解股票交易业务，了解Python编程基本语法，发现复杂的代码逻辑
- ch03 Python基本语法、数据类型和控制语句
    - 掌握Python基本语法，操作基本数据结构，使用基本控制语句
    - 编程实践：猜测股票价格，掌握Python基本语法，掌握随机数，使用控制语句，开发和运行Python代码
- ch04 Python特殊语法和字符串
    - 认识Python语法糖，初步处理Python字符串
    - 代码阅读：通过股票成交推导持仓，了解股票交易业务，了解Python编程基本语法，发现业务和编程的联系
- ch05 Python函数和类
    - 了解Python的基本封装结构，了解面向对象编程
    - 编程实践：封装股票计算相关逻辑，了解股票交易业务，了解Python类的抽象和封装
- ch06 Python访问本地和远程文件
    - 熟悉Python文件操作和Pandas等第三方库相关功能
    - 代码阅读：股票文件扫单交易，了解相关业务，了解Python的操作系统IO访问能力
- ch07 Python访问数据库
    - 初识网络服务
    - 安装Mysql数据库，Python连接和读写数据库    
    - 代码阅读：封装数据库操作类
- ch08 Python访问网页和HTTP协议
    - 初识Web和HTTP协议
    - 了解网页的结构，使用requests包
    - 代码阅读：读取可转债行情，了解可转债交易业务，初步获取网页数据
- ch09 Python访问接口
    - 初识应用程序接口和HTTP接口
    - 了解面向接口编程，数据实体类的定义和转换，自定函数和类作为接口
    - 编程实践：开发通过tushare和easyquotation第三方包获取股票行情
- ch10 Python包NumPy和Pandas基础
    - 了解NumPy和Pandas的数据结构和基本操作
    - 代码阅读：使用Pandas分组计算股票交易成本和收益
- ch11 Python数据可视化
    - 使用Matplotlib进行数据可视化
    - 编程实践: 了解可转债交易业务，分析可转债和正股历史价格，可视化数据
- ch12 Python数据处理
    - 使用Pandas进行基本数据探索
    - 编程实践: 继续了解可转债交易业务，分析可转债及其相关标的历史价格
- ch13 Python数据分析
    - 了解statsmodel和sklearn包，掌握数据分析基础
    - 代码阅读：线性回归预测股票价格
- ch14 Python数据分析案例
    - 可转债正股对冲套利
    - 相关股票对冲分析
    - 可转债跨标的对冲套利
    - 实施实时风控
- ch15 Python编程进阶
    - 如何理解面向接口编程和面向对象编程

### 2. 课程目标
具备利用Python编程进行数据处理和分析的能力，由易到难达到如下三个层次：

- **工具**：利用Python开发工具，掌握Python基础编程
- **应用**：熟悉Python标准库和第三方包，完成数据处理任务
- **项目**：结合业务，团队协作，完成数据分析项目

最后的一个层次需要一个长期积累的过程，我们以达到前两个层次为目的，达到最后一个层次为期望

### 3. 学习方法
![](images/datapie.png)
- **树立目标**
- **培养兴趣**
    - 让事情好玩一点
    - 选择刚刚好的挑战
- **程序员思维方式**
    - 一定程度的完美主义
    - 一定程度的抽象：一切都是为了输入输出数据（设计），一切都是在建造能够输入输出数据的功能（编程），一切都是在输入输出数据（运行）
    - 一定程度的“偷懒”：模仿（拿来主义），实践（关注业务目标），不重复自己（不做重复的事）
- **建立知识网络**
    - 以点带面，建立知识网络
    - 面对遗忘，不去挑战人性    
- **渐进学习过程**
    - 了解背景知识
    - 提出需要解决的问题
    - 学习相关知识
    - 尝试解决问题
    - 发现更多需要解决的子问题
    - 检查子问题是不是脱离父问题太远，太远暂时放弃，不远则解决
    - 递归直到大体解决问题
    - 重构优化解决方案
    - 重复以上流程

In [1]:
import numpy as np
import matplotlib.pyplot as plt
x = np.arange(10)
plt.figure(figsize=(10,6))
plt.plot(x, x, 'b')
y = np.array([n - 2 if n % 2 == 0 else n + 2 for n in x])
plt.plot(x, y, 'r')
plt.arrow(9, 11, 0.1, 0.5, head_width=0.2, head_length=0.6, fc='r', ec='r',overhang=0.4)
plt.show()

<Figure size 1000x600 with 1 Axes>

### 4. 学习资源
- 《Python基础教程》
- 《Python核心编程》
- 《Python Cookbook》
- 《利用Python进行数据分析》
- <https://www.python.org/doc/>
- <https://github.com/>
- <http://stackoverflow.com/>
- 第三方包官方文档

### 5. 考核要求
- 平时成绩20分：平时课堂表现和课后小作业情况（课件中所有标识实践的编程题需要重现，要求：格式整洁，结构完整，题量充分）
- 期末成绩80分：期末成绩即期末大作业的成绩，包括两个部分各占50%
    - 基础分（要求：格式整洁，结构完整，可以执行）
    - 提高分（要求：逻辑清晰，结果合理；使用超过课程涉及的库或特性，完成超过要求的额外代码，获得更具意义的结论）

## 三、关于Python语言
Python是一门编程语言，与任何一门语言一样需要与业务领域结合才能发挥作用。Python的学习不在于编程，在于应用。

### 1. 编程语言排名
<http://www.tiobe.com/tiobe-index/>

- Python和其他许多语言都是很老的语言，上个世纪90年代是语言的爆发期，Java、Python、PHP、Ruby都是那个时代的产物。
- Python并不是近年才火，只是在数据时代，大家又发现了Python新的价值。

目前排名前10的编程语言：

![rank](images/index.png)

目前排名前5的编程语言的排名变化：

![trend](images/trend.png)

###　2. Python的优势
- 较容易：Python是排名前10的编程语言中最容易入门的语言
- 跨平台：Python可以跨Windows、Linux和MacOS等多个平台
- 跨领域：Python涉及数据分析、机器学习、分布式开发、Web开发，嵌入式开发等多个领域
- 跨语言：Python原生解释器CPython可以直接调用C和C++库，利用对应语言开发的解释器Jython，IronPython可以调用Java和C#库
- 开源语言：Python是开源语言，使用类BSD许可证（几乎可以为所欲为的协议），与GPL许可证兼容
- 社区活跃：Python第三方包多，Python某个功能的库可能比Python语言的关键字还多
- 数据科学：Python在数据科学领域的地位越来越牢固

![](images/data-science.png)

### 3. Python是一个家族
- CPython：用C编写的Python解释器，是Python的参考实现
- Jython：Java平台上实现的Python解释器，Python代码运行在JVM上，可以导入并使用Java类
- IronPython：.Net平台上实现的Python解释器，可以导入并使用C#类
- MicroPython：支持嵌入式系统
- PyPy(JIT)：用RPython实现的解释器，RPython是Python的子集

### 4. Python是一种解释型语言
- 解释和编译都是为了最终输出CPU可以执行的机器码
- 解释是运行时实时翻译机器码，负责翻译的程序叫解释器（Interpreter）；编译是开发时翻译机器码或中间语言，负责编译的程序叫编译器（Compiler）
- 解释型语言也称为动态语言，脚本语言

### 5. Python版本和anaconda
- Python 2和Python 3：Python 2.7作为标准有很长一段时间，Python 3已经取代Python 2（对中文等unicode字符支持更好），本课件使用Python 3.7
- x64和x86：与CPU和操作系统相关，有些Python包对该版本有要求，本课件使用64位的Python 3.7
- anaconda是一个用于科学计算的Python发行版，支持 Linux, MacOS, Windows系统，提供了包管理与环境管理的功能，可以很方便地解决多版本Python并存、切换以及各种第三方包安装问题。下载地址<https://www.anaconda.com/products/individual>

![](images/Python.jpg)

### 6. Python标准库和第三方包
与其他语言类似，伴随Python解释器一同发布的还有Python的标准库，提供了日常编程问题的标准解决方案。https://docs.python.org/zh-cn/3/library/index.html

同时由于活跃的Python社区，带来了数量庞大的Python第三方包：
- flask: Flask is a microframework for Python. http://flask.pocoo.org
- django: Django is a high-level Python Web framework that encourages rapid development and clean, pragmatic design. https://www.djangoproject.com
- requests: Python HTTP Requests for Humans. http://python-requests.org
- pyspider: A Powerful Spider(Web Crawler) System in Python. http://docs.pyspider.org
- numpy: NumPy is the fundamental package for scientific computing with Python. http://www.numpy.org
- scipy: SciPy is open-source software for mathematics, science, and engineering. https://www.scipy.org
- pandas: pandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language. http://pandas.pydata.org
- matplotlib: Matplotlib is a Python 2D plotting library. http://matplotlib.org
- seaborn: Seaborn is a Python visualization library based on matplotlib. It provides a high-level interface for drawing attractive statistical graphics. https://seaborn.pydata.org
- statsmodels: statsmodels is a Python module that provides classes and functions for the estimation of many different statistical models, as well as for conducting statistical tests, and statistical data exploration. http://www.statsmodels.org
- scikit-learn: Simple and efficient tools for data mining and data analysis. http://scikit-learn.org
- theano: Theano is a Python library that allows you to define, optimize, and evaluate mathematical expressions involving multi-dimensional arrays efficiently. http://deeplearning.net/software/theano/
- tensorflow: TensorFlow is an open source software library for numerical computation using data flow graphs. https://www.tensorflow.org/
- keras: Keras is a high-level neural networks API, written in Python and capable of running on top of either TensorFlow or Theano. https://keras.io/  http://keras-cn.readthedocs.io
- pytorch: PyTorch is an optimized tensor library for deep learning using GPUs and CPUs. https://pytorch.org/

In [2]:
import requests
r = requests.get("http://quote.eastmoney.com/concept/sz000932.html")
r.status_code

200

### 7. 天池线上开发工具
天池实验室 https://tianchi.aliyun.com/

## 四、代码阅读：计算国内股票交易成本

国内股票的交易成本主要包括以下几项：
- 印花税：卖出股票时收取，为交易市值的0.001
- 过户费：上证股票收取，为交易市值的0.00002
- 交易佣金：券商买卖双向收取，一般为交易市值0.0002，可能有最低5元限额，不同客户不同。包含交易所规费，叫实收佣金，不包含交易所规费，叫净收佣金
- 交易所规费：交易所收取，一般为交易市值0.0000687，包含在交易佣金里

In [1]:
DEFAULT_STOCK_TAX_RATE = 0.001  # 印花税率
DEFAULT_SH_TRANSFER_FEE_RATE = 0.00002  # 上证过户费率
DEFAULT_SZ_TRANSFER_FEE_RATE = 0  # 深证过户费率
DEFAULT_COMMISSION_RATE = 0.0002  # 佣金费率
DEFAULT_COMMISSION_MIN = 0  # 佣金下限
DEFAULT_EXCHANGE_FEE_RATE = 0  # 交易所规费费率
DEFAULT_OTHER_FEE_RATE = 0  # 其他费用费率


class Direction:
    """
    买卖方向
    """
    BUY = 'BUY'
    SELL = 'SELL'

class Exchange:
    """
    交易市场
    """
    SSE = 'SSE'
    SZSE = 'SZSE'


def get_exchange(stock_code):
    """
    判断股票交易市场
    60是上证A股，900是上证B股，68是上证科创板，其中688是股票、689是存托凭证
    00是深证A股，200是深证B股，002是深证中小板, 300是创业板
    50是上证封闭式基金，51是上证ETF基金
    18是深证封闭式基金，16是深证LOF基金，15是深证ETF基金或分级基金
    100或110是沪市可转债
    125或126是深市可转债
    :param str stock_code: 股票代码
    :return Exchange: 交易市场
    """
    if not stock_code:
        return None
    stock_code = stock_code.strip()    
    if stock_code.startswith('60') or stock_code.startswith('900') or stock_code.startswith('688') or stock_code.startswith('689'):
        return Exchange.SSE    
    elif stock_code.startswith('00') or stock_code.startswith('200') or stock_code.startswith('300'):
        return Exchange.SZSE    
    elif stock_code.startswith('50') or stock_code.startswith('51') or stock_code.startswith('52'):
        return Exchange.SSE    
    elif stock_code.startswith('18') or stock_code.startswith('16') or stock_code.startswith('15'):
        return Exchange.SZSE 
    elif stock_code.startswith('10') or stock_code.startswith('11'):
        return Exchange.SSE    
    elif stock_code.startswith('12'):
        return Exchange.SZSE
    return None

def get_stock_cost(stock_code, price, volume, direction, 
                   tax_rate=DEFAULT_STOCK_TAX_RATE,
                   sz_transfer_fee_rate=DEFAULT_SZ_TRANSFER_FEE_RATE,
                   sh_transfer_fee_rate=DEFAULT_SH_TRANSFER_FEE_RATE, 
                   commission_rate=DEFAULT_COMMISSION_RATE,
                   commission_min=DEFAULT_COMMISSION_MIN, 
                   exchange_fee_rate=DEFAULT_EXCHANGE_FEE_RATE,
                   other_fee_rate=DEFAULT_OTHER_FEE_RATE):
    """
    计算股票交易成本
    :param str stock_code: 股票代码
    :param float price: 成交价格
    :param int volume: 成交数量
    :param str direction: Direction，买入卖出
    :param float tax_rate: 印花税率
    :param float sh_transfer_fee_rate: 上证过户费费率
    :param float sz_transfer_fee_rate: 深圳过户费费率
    :param float commission_rate: 佣金费率
    :param float commission_min: 佣金下限
    :param float exchange_fee_rate: 交易所规费费率
    :param float other_fee_rate: 其他费用费率
    :return float: 交易成本
    """
    tax, fee, commission, exchange_fee, other_fee = 0, 0, 0, 0, 0
    amount = price * volume
    if direction == Direction.SELL:
        tax = amount * tax_rate
    if get_exchange(stock_code) == Exchange.SSE:
        fee = amount * sh_transfer_fee_rate
    elif get_exchange(stock_code) == Exchange.SZSE:
        fee = amount * sz_transfer_fee_rate
    if commission_rate:
        commission = amount * commission_rate
    if 0 < commission < commission_min:
        commission = commission_min
    if exchange_fee_rate:
        exchange_fee = amount * exchange_fee_rate
    if other_fee_rate:
        other_fee = amount * other_fee_rate
    return tax + fee + commission + exchange_fee + other_fee

get_stock_cost('600318', 76.18, 100, Direction.BUY)

1.6759600000000003

### 编程实践：尝试计算国内多支股票交易成本

In [2]:
get_stock_cost('000001', 21.15, 1000, Direction.BUY, 
               tax_rate=0.001,
               sz_transfer_fee_rate=0.00002,
               sh_transfer_fee_rate=0, 
               commission_rate=0.001,
               commission_min=5, 
               exchange_fee_rate=0,
               other_fee_rate=0)

21.573