# 重要的Python库

## NumPy
- Python科学计算基础包。

## Pandas
- 提供了能够快速便捷地处理结构化数据的大量数据结构和函数。

## matplotlib
- 用于绘制图表的Python库。

## IPython
- Python科学计算标准工具集的组成部分，它将所有的东西联系到了一起。它是一个增强的Power shell，目的是提高编写、测试、调试Python代码的速度。

## Scipy
- 专门解决科学计算中各种标准问题域的包的集合。

# Python 标准库

## collections
collections模块包含了除list、dict、和tuple之外的容器数据类型，如counter、defaultdict、deque、namedtuple、orderdict。

## functools
functools提供了一些非常有用的高阶函数（一个可以接受函数作为参数或者以函数作为返回值的函数），因为Python中函数也是对象，因此很容易支持这样的函数式特性。

## itertools
Python 内置的 itertools 模块包含了一系列用来产生不同类型迭代器的函数或类，这些函数的返回都是一个迭代器，可以通过 for 循环来遍历取值，也可以使用 next() 来取值。

## operator
operator模块输出一系列对应Python内部操作符的函数。


---
> Ref：
> 1. https://so.csdn.net/so/search?q=%E6%A0%87%E5%87%86%E5%BA%93&t=blog&u=qq_27825451
> 2. https://zhuanlan.zhihu.com/p/244847990


In [1]:
import collections

In [2]:
collections.defaultdict(int)

defaultdict(int, {})

In [3]:
collections.Counter(['a', 'b', 'c', 'a', 'b', 'b'])

Counter({'a': 2, 'b': 3, 'c': 1})

In [4]:
# OrderedDict是字典子类，记得其内容被添加的顺序
d = collections.OrderedDict()
d['a'] = 'A'
d['b'] = 'B'
d['c'] = 'C'
d['d'] = 'D'
d['e'] = 'E'
for k, v in d.items():
    print (k, v)

a A
b B
c C
d D
e E


In [5]:
# namedtuple 标准的元组使用数值索引来访问其成员
Person = collections.namedtuple('Person', 'name age gender')
print('Type of Person:', type(Person))
bob = Person(name='Bob', age=30, gender='male')
print('\nRepresentation:', bob)
jane = Person(name='Jane', age=29, gender='female')
print('\nField by name:', jane.name)
print('\nFields by index:')
for p in [bob, jane]:
    print('%s is a %d year old %s' % p)

Type of Person: <class 'type'>

Representation: Person(name='Bob', age=30, gender='male')

Field by name: Jane

Fields by index:
Bob is a 30 year old male
Jane is a 29 year old female


# 1. IPython

## 1.1 IPython 基本使用
IPython设计的目的是在交互式计算和软件开发这两个方面最大化地提高生产力。它鼓励一种“执行-探索（execute explore）”的工作模式，而不是传统的编程语言那样“编辑-编译-运行”的工作模式。此外，它跟操作系统shell和文件系统之间也有非常紧密的集成。

### 1) 内省 introspection
变量的前面或后面加上一个 `?` 就可以将有关该对象的一些通用信息显示出来。

![1](./images/ipython_introspection1.jpg)

如果该对象是一个函数或实例方法，则其docstring也会被显示出来。
使用 `??` 可以将源代码显示出来！

![2](./images/ipython_introspection2.jpg)


In [6]:
d?

In [7]:
def func():
    """
    this is a function.
    """
    pass

In [8]:
func??

### 2) `%run` 命令运行 `.py` 文件

例如：`%run test.py`

In [9]:
%run test.py

This is a test.py file.


### 3) `%paste` 执行剪切板的代码

In [10]:
%paste

UsageError: Line magic function `%paste` not found.


### 4) `%timeit` 检测语句平均执行时间

In [11]:
import numpy as np

In [12]:
a = np.random.rand(10, 10)
a

array([[0.46211168, 0.22630265, 0.28259665, 0.97387306, 0.47081586,
        0.14182512, 0.41340276, 0.12707679, 0.8895837 , 0.30759639],
       [0.84395636, 0.1248409 , 0.69082745, 0.58846353, 0.99039773,
        0.10359163, 0.60211887, 0.5774512 , 0.75732393, 0.12422298],
       [0.64821667, 0.89221404, 0.33139232, 0.18304072, 0.26270739,
        0.77921959, 0.93650007, 0.85992434, 0.77704277, 0.03891065],
       [0.35931267, 0.09012513, 0.4823769 , 0.52336705, 0.20844103,
        0.90301359, 0.00919512, 0.55454685, 0.69982842, 0.5021466 ],
       [0.20217792, 0.19311089, 0.5529079 , 0.67564787, 0.74854923,
        0.57602856, 0.96100281, 0.84684755, 0.12989536, 0.74290378],
       [0.26534835, 0.03692661, 0.57169047, 0.52466825, 0.05628971,
        0.64878741, 0.68047402, 0.31185786, 0.92138033, 0.22662803],
       [0.10471625, 0.228826  , 0.69678838, 0.17964497, 0.1648506 ,
        0.70488934, 0.6067039 , 0.00308847, 0.86371306, 0.76178354],
       [0.58855856, 0.71203543, 0.2873640

In [13]:
%time np.dot(a, a)

Wall time: 47.4 ms


array([[1.5075262 , 1.77344369, 2.04578478, 2.26586517, 2.17435409,
        2.46854704, 2.03928041, 2.49689024, 2.4492415 , 2.09501666],
       [1.94239149, 2.42234753, 2.3494751 , 2.91971792, 2.84264214,
        2.90984761, 3.16719972, 2.89725678, 2.99058765, 2.57707086],
       [2.28481157, 2.25740624, 2.73164319, 2.95410019, 3.07700359,
        2.64310586, 3.27412654, 2.39556882, 3.71175246, 2.35772097],
       [1.81913524, 1.96659567, 2.03773315, 2.31758048, 1.9020278 ,
        2.54939408, 2.38591951, 2.44514376, 2.69496918, 1.67011591],
       [2.38758637, 2.09407983, 3.09806772, 2.73807987, 2.2463577 ,
        3.64414226, 3.38912876, 2.75856444, 3.58093959, 2.67726265],
       [1.4051585 , 2.04671592, 1.96961381, 1.89263097, 1.77913221,
        2.55234246, 2.27849955, 2.177712  , 2.70994768, 1.86869604],
       [1.73811922, 2.09943626, 2.37824665, 1.87855529, 1.79351278,
        2.65711793, 2.69158968, 2.6113883 , 2.80866464, 1.79943712],
       [2.15069278, 1.60837059, 2.6845806

In [14]:
%timeit np.dot(a, a)

2.31 µs ± 188 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


### 5) 魔术命令之后添加 `?` 查看帮助

In [15]:
%timeit?

## 1.2  常用的IPython魔术命令

In [16]:
# 显示IPython的快速参考
%quickref

In [17]:
# 显示所有魔术命令的文档
%magic

In [18]:
raise ValueError("Test")

ValueError: Test

In [19]:
# 从最新的异常跟踪的底部进入交互式调试器
%debug

> [1;32m<ipython-input-18-4766714038f4>[0m(1)[0;36m<module>[1;34m()[0m
[1;32m----> 1 [1;33m[1;32mraise[0m [0mValueError[0m[1;33m([0m[1;34m"Test"[0m[1;33m)[0m[1;33m[0m[1;33m[0m[0m
[0m
ipdb> return


In [20]:
# 打印命令的输入（可选输出）的历史
%hist

import collections
collections.defaultdict(int)
collections.Counter(['a', 'b', 'c', 'a', 'b', 'b'])
# OrderedDict是字典子类，记得其内容被添加的顺序
d = collections.OrderedDict()
d['a'] = 'A'
d['b'] = 'B'
d['c'] = 'C'
d['d'] = 'D'
d['e'] = 'E'
for k, v in d.items():
    print (k, v)
# namedtuple 标准的元组使用数值索引来访问其成员
Person = collections.namedtuple('Person', 'name age gender')
print('Type of Person:', type(Person))
bob = Person(name='Bob', age=30, gender='male')
print('\nRepresentation:', bob)
jane = Person(name='Jane', age=29, gender='female')
print('\nField by name:', jane.name)
print('\nFields by index:')
for p in [bob, jane]:
    print('%s is a %d year old %s' % p)
d?
def func():
    """
    this is a function.
    """
    pass
func??
%run test.py
%paste
import numpy as np
a = np.random.rand(10, 10)
a
%time np.dot(a, a)
%timeit np.dot(a, a)
%timeit?
# 显示IPython的快速参考
%quickref
# 显示所有魔术命令的文档
%magic
raise ValueError("Test")
# 从最新的异常跟踪的底部进入交互式调试器
%debug
# 打印命令的输入（可选输出）的历史
%hist


In [21]:
# 删除交互式命令空间中的全部变量/名称
%reset

Once deleted, variables cannot be recovered. Proceed (y/[n])? n
Nothing done.


In [22]:
# 通过分页打印输出对象
%page a

In [23]:
# 显示交互式命名空间中定义的变量，信息级别/冗余度可变
%who

Person	 a	 bob	 collections	 d	 func	 jane	 k	 np	 
p	 v	 


In [24]:
%who_ls

['Person', 'a', 'bob', 'collections', 'd', 'func', 'jane', 'k', 'np', 'p', 'v']

In [25]:
%whos

Variable      Type           Data/Info
--------------------------------------
Person        type           <class '__main__.Person'>
a             ndarray        10x10: 100 elems, type `float64`, 800 bytes
bob           Person         Person(name='Bob', age=30, gender='male')
collections   module         <module 'collections' fro<...>ollections\\__init__.py'>
d             OrderedDict    OrderedDict([('a', 'A'), <...> ('d', 'D'), ('e', 'E')])
func          function       <function func at 0x000001CC189AB3A0>
jane          Person         Person(name='Jane', age=29, gender='female')
k             str            e
np            module         <module 'numpy' from 'D:\<...>ges\\numpy\\__init__.py'>
p             Person         Person(name='Jane', age=29, gender='female')
v             str            E


In [26]:
b = 10
c = b

In [27]:
# 删除变量，并尝试清楚其在IPython中的一切引用
%xdel b

In [28]:
# 变量b被删除，并把b的引用c一并删除！
c

NameError: name 'c' is not defined

## 1.3 使用命令历史

### 1) 搜索并重用命令历史
在win10 pycharm ipython console 和 jupyter notebook都测试了，发现然并卵。

### 2) 记录输入和输出！
IPython能够记录整个控制台会话，包括输入和输出。执行 `%logstart` 即可开始记录日志：

In [29]:
%logstart

Activating auto-logging. Current session state plus future input saved.
Filename       : ipython_log.py
Mode           : rotate
Output logging : False
Raw input log  : False
Timestamping   : False
State          : active


In [30]:
%logstart?

几个相似的命令
- %logoff
- %logon
- %logstate
- %logstop

In [31]:
%logon

Logging is already ON


In [32]:
%logstate

Filename       : ipython_log.py
Mode           : rotate
Output logging : False
Raw input log  : False
Timestamping   : False
State          : active


## 1.4 与操作系统交互
IPython与操作系统shell结合得非常紧密。也就是说，可以直接在其中实现标准的windows或unix命令行活动。比如执行shell命令、更改目录、将命令的执行结果保存到Python对象中等。此外，还提供了shell命令别名以及目录书签等功能。

### 1) shell命令和别名
以 `!` 开头的命令行表示其后的所有内容都需要在系统shell中执行。

In [33]:
# pycharm ipython console测试可用
# jupyter notebook不可用
!python

^C


In [34]:
# pycharm ipython console测试可用
# jupyter notebook不可用
!cmd

^C


In [35]:
%dirs

[]

### 2) 目录书签系统
IPython有一个简单的目录书签系统，它使你能够保存常用目录的别名以便实现快速跳转。首先定义书签：

In [36]:
%bookmark bm ./bookmarks/

In [37]:
cd bm

(bookmark:bm) -> ./bookmarks/
D:\Github\Time-Series-Analysis-Tutorial\03 Time Series Analysis\bookmarks


In [38]:
# 列出所有书签
%bookmark -l

Current bookmarks:
bm -> ./bookmarks/


### 3) 与系统相关的魔术命令 

In [39]:
ls

 驱动器 D 中的卷是 本地磁盘
 卷的序列号是 A094-EFBB

 D:\Github\Time-Series-Analysis-Tutorial\03 Time Series Analysis\bookmarks 的目录

2021/06/01  18:20    <DIR>          .
2021/06/01  18:20    <DIR>          ..
               0 个文件              0 字节
               2 个目录 152,952,090,624 可用字节


In [40]:
# 将当前目录入栈，并专项目标目录
%pushd ./bookmarks

[WinError 2] 系统找不到指定的文件。: './bookmarks'
D:\Github\Time-Series-Analysis-Tutorial\03 Time Series Analysis\bookmarks


['D:\\Github\\Time-Series-Analysis-Tutorial\\03 Time Series Analysis\\bookmarks']

In [41]:
# 弹出栈顶项目录，并转向目标目录
%popd

D:\Github\Time-Series-Analysis-Tutorial\03 Time Series Analysis\bookmarks
popd -> D:\Github\Time-Series-Analysis-Tutorial\03 Time Series Analysis\bookmarks


In [45]:
# 返回上级目录
!cd ..

In [46]:
# 返回一个含有当前目录栈的列表
%dirs

[]

In [47]:
# 打印目录访问历史
%dhist

Directory history (kept in _dh)
0: D:\Github\Time-Series-Analysis-Tutorial\03 Time Series Analysis
1: D:\Github\Time-Series-Analysis-Tutorial\03 Time Series Analysis\bookmarks


In [48]:
# 以字典形式返回系统环境变量
%env

{'ALLUSERSPROFILE': 'C:\\ProgramData',
 'ANDROID_HOME': 'C:\\Users\\34123\\AppData\\Local\\Android\\Sdk',
 'APPDATA': 'C:\\Users\\34123\\AppData\\Roaming',
 'ASL.LOG': 'Destination=file',
 'CLASSPATH': '.;C:\\Program Files\\Java\\jdk1.8.0_281\\lib\\dt.jar;C:\\Program Files\\Java\\jdk1.8.0_281\\lib\\tools.jar',
 'CLION': 'C:\\Project\\CLion 2020.2.3\\bin;',
 'COMMONPROGRAMFILES': 'C:\\Program Files\\Common Files',
 'COMMONPROGRAMFILES(X86)': 'C:\\Program Files (x86)\\Common Files',
 'COMMONPROGRAMW6432': 'C:\\Program Files\\Common Files',
 'COMPUTERNAME': 'DESKTOP-QGMPJ0Q',
 'COMSPEC': 'C:\\WINDOWS\\system32\\cmd.exe',
 'CONDA_DEFAULT_ENV': 'tensorflow',
 'CONDA_EXE': 'D:\\anaconda\\Scripts\\conda.exe',
 'CONDA_PREFIX': 'D:\\anaconda\\envs\\tensorflow',
 'CONDA_PREFIX_1': 'D:\\anaconda',
 'CONDA_PROMPT_MODIFIER': '(tensorflow) ',
 'CONDA_PYTHON_EXE': 'D:\\anaconda\\python.exe',
 'CONDA_SHLVL': '2',
 'CUDA_BIN_PATH': 'C:\\Program Files\\NVIDIA GPU Computing Toolkit\\CUDA\\v11.0\\bin',
 '

In [49]:
!nvcc -V

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Wed_Jul_22_19:09:35_Pacific_Daylight_Time_2020
Cuda compilation tools, release 11.0, V11.0.221
Build cuda_11.0_bu.relgpu_drvr445TC445_37.28845127_0


In [55]:
# 返回系统的当前工作目录
!pwd

'pwd' 不是内部或外部命令，也不是可运行的程序
或批处理文件。
