### 重要的Python库
* **Numpy**
<br>NumPy（Numerical Python的简称）是Python科学计算的基础包。
* **pandas**
<br>pandas提供了快速便捷处理结构化数据的大量数据结构和函数。
* **matplotlib**
<br>matplotlib是最流行的用于绘制图表和其它二维数据可视化的Python库。
* **SciPy**
<br>SciPy是一组专门解决科学计算中各种标准问题域的包的集合，主要包括下面这些包：
<br>scipy.integrate：数值积分例程和微分方程求解器。
<br>scipy.linalg：扩展了由numpy.linalg提供的线性代数例程和矩阵分解功能。
<br>scipy.optimize：函数优化器（最小化器）以及根查找算法。
<br>scipy.signal：信号处理工具。
<br>scipy.sparse：稀疏矩阵和稀疏线性系统求解器。
<br>scipy.special：SPECFUN（这是一个实现了许多常用数学函数（如伽玛函数）的Fortran库）的包装器。
<br>scipy.stats：标准连续和离散概率分布（如密度函数、采样器、连续分布函数等）、各种统计检验方法，以及更好的描述统计法。
<br>NumPy和SciPy结合使用，便形成了一个相当完备和成熟的计算平台，可以处理多
种传统的科学计算问题。
* **scikit-learn**
<br>2010年诞生以来，scikit-learn成为了Python的通用机器学习工具包。仅仅七年，就汇聚了全世界超过1500名贡献者。它的子模块包括：
<br>分类：SVM、近邻、随机森林、逻辑回归等等。
<br>回归：Lasso、岭回归等等。
<br>聚类：k-均值、谱聚类等等。
<br>降维：PCA、特征选择、矩阵分解等等。
<br>选型：网格搜索、交叉验证、度量。
<br>预处理：特征提取、标准化。
* **statsmodels**
<br>statsmodels是一个统计分析包，起源于斯坦福大学统计学教授JonathanTaylor，他设计了多种流行于R语言的回归分析模型。
<br>与scikit-learn比较，statsmodels包含经典统计学和经济计量学的算法。包括如下子模块：
<br>回归模型：线性回归，广义线性模型，健壮线性模型，线性混合效应模型等等。
<br>方差分析（ANOVA）。
<br>时间序列分析：AR，ARMA，ARIMA，VAR和其它模型。
<br>非参数方法： 核密度估计，核回归。
<br>统计模型结果可视化。
<br>statsmodels更关注与统计推断，提供不确定估计和参数p-值。相反的，scikitlearn注重预测。

### 一些常用模块的命名习惯：
* import numpy as pd
* import pandas as pd
* import matplotlib.pyplot as plt
* import seaborn as sns
* import statsmodel as sm

### 自省

In [2]:
#在变量前后使用问号？，可以显示对象的信息：
b = [1,2,3]
b?

In [6]:
#如果对象是一个函数或实例方法，定义过的文档字符串，也会显示出信息。
def add_numbers(a, b):
    """
    Add two numbers together
    Returns
    -------
    the_sum : type of arguments
    """
    return a + b

add_numbers?

In [7]:
#使用??会显示函数的源码：
add_numbers??

In [None]:
"""?还有一个用途，就是像Unix或Windows命令行一样搜索IPython的命名空间。字
符与通配符结合可以匹配所有的名字。例如，我们可以获得所有包含load的顶级
NumPy命名空间："""
np.*load*?

### %run命令

你可以用%run命令运行所有的Python程序。假设有一个文件
<br>ipython_script_test.py：
<br>def f(x, y, z):
<br>return (x + y) / za = 5
<br>b = 6
<br>c = 7.5
<br>result = f(a, b, c)

<br>可以如下运行：
<br>%run ipython_script_test.py

### 魔术命令

<br>IPython中特殊的命令（Python中没有）被称作“魔术”命令。这些命令可以使普通任务更便捷，更容易控制IPython系统。魔术命令是在指令前添加百分号%前缀。例如，可以用%timeit（这个命令后面会详谈）测量任何Python语句，例如矩阵乘法，的执行时间：
<br>In [20]: a = np.random.randn(100, 100)
<br>In [20]: %timeit np.dot(a, a)
<br>10000 loops, best of 3: 20.9 µs per loop

<br>一些魔术函数与Python函数很像，它的结果可以赋值给一个变量：
<br>In [22]: %pwd
<br>Out[22]: '/home/wesm/code/pydata-book
<br>In [23]: foo = %pwd
<br>In [24]: foo
<br>Out[24]: '/home/wesm/code/pydata-book

IPython的文档可以在shell中打开，我建议你用%quickref或%magic学习下所有特殊命令。表2-2列出了一些可以提高生产率的交互计算和Python开发的IPython指令。

![image.png](attachment:image.png)

### 集成Matplotlib

%matplotlib魔术函数配置了IPython shell和Jupyter notebook中的
matplotlib。

In [None]:
#在JUpyter命令
%matplotlib inline

### Python语法基础

In [9]:
#a和b是同一个对象
a = [1,2,3]
b = a
b

[1, 2, 3]

In [10]:
a.append(4)
b

[1, 2, 3, 4]