In [None]:
%load_ext watermark
%watermark  -d -u -a 'Andreas Mueller, Kyle Kastner, Sebastian Raschka' -v -p numpy,scipy,matplotlib

The use of watermark (above) is optional, and we use it to keep track of the changes while developing the tutorial material. (You can install this IPython extension via "pip install watermark". For more information, please see: https://github.com/rasbt/watermark).

2 Jupyter Notebooks
==================

* 按 ``[shift] + [Enter]`` 或点击 "play" 按钮运行.

![](figures/ipython_run_cell.png)

* 按``[shift] + [tab]`` 获取关于函数和对象的帮助信息

![](figures/ipython_help-1.png)

* 也可以加?看帮助信息 ``function?``

![](figures/ipython_help-2.png)

## Numpy 数组(Arrays)

对`numpy` 数组(arrays)进行操作是机器学习的一个重要部分，(其实对所有科学计算都是)，我们来快速浏览一些最重要的特性。

In [None]:
import numpy as np

# 为可复现设置随机种子
rnd = np.random.RandomState(seed=123)

# 生成随机数组
X = rnd.uniform(low=0.0, high=1.0, size=(3, 5))  # a 3 x 5 array

print(X)

(注意，像Python中的其他数据结构一样，NumPy数组使用从0开始的索引)

In [None]:
# 访问元素

# 得到单个元素
print(X[0, 0])

# 得到一行
# (here: 2nd row)
print(X[1])

# 得到一列
# (here: 2nd column)
print(X[:, 1])

In [None]:
# 矩阵转置
print(X.T)

$$\begin{bmatrix}
    1 & 2 & 3 & 4 \\
    5 & 6 & 7 & 8
\end{bmatrix}^T
= 
\begin{bmatrix}
    1 & 5 \\
    2 & 6 \\
    3 & 7 \\
    4 & 8
\end{bmatrix}
$$



In [None]:
# 创建行向量，按指定元素数均匀分布的数字
y = np.linspace(0, 12, 5)
print(y)

In [None]:
# 将行向量转换为列向量
print(y[:, np.newaxis])

In [None]:
# 获取数组的形状(shape)及整形(reshaping)

# 生成随机数组
rnd = np.random.RandomState(seed=123)
X = rnd.uniform(low=0.0, high=1.0, size=(3, 5))  # a 3 x 5 array

print(X.shape)
print(X.reshape(5, 3))

In [None]:
# 用数组做索引 (索引传递(fancy indexing))
indices = np.array([3, 1, 0])
print(indices)
X[:, indices]

要了解的还有很多，这几个操作是我们马上要用到的。

## matplotlib

机器学习的另一个重要部分是数据的可视化。Python这方面最常用的的工具是[`matplotlib`](http://matplotlib.org)，这是一个非常灵活的包，我们将在这里复习一些基础知识

在Jupyter notebooks里, 用IPython内置的方便使用的"[magic functions](https://ipython.org/ipython-doc/3/interactive/magics.html)", "matoplotlib inline"模式, 可以直接在笔记本里画图。

In [None]:
%matplotlib inline

In [None]:
import matplotlib.pyplot as plt

In [None]:
# 画一条线
x = np.linspace(0, 10, 100)
plt.plot(x, np.sin(x));

In [None]:
# 散点图
x = np.random.normal(size=500)
y = np.random.normal(size=500)
plt.scatter(x, y);

In [None]:
# 使用imshow显示图
# - 注意，默认情况下，原点位于左上角

x = np.linspace(1, 12, 100)
y = x[:, np.newaxis]

im = y * np.sin(x) * np.cos(y)
print(im.shape)

plt.imshow(im);

In [None]:
im.shape

In [None]:
# 等高线图 
# - 注意，默认情况下，原点位于左下角
plt.contour(im);

In [None]:
# 3D图
from mpl_toolkits.mplot3d import Axes3D
ax = plt.axes(projection='3d')
xgrid, ygrid = np.meshgrid(x, y.ravel())
ax.plot_surface(xgrid, ygrid, im, cmap=plt.cm.jet, cstride=2, rstride=2, linewidth=0);

还有更多的绘图类型可用。可以在[matplotlib gallery](http://matplotlib.org/gallery.html)进一步探索.

可以在notebook里很容易地测试这些例子:只需要把``源码``链接简单复制每一页，然后用``%load``魔法指令加载。
例如:

In [None]:
%load http://matplotlib.org/mpl_examples/pylab_examples/ellipse_collection.py

In [None]:
%load https://matplotlib.org/mpl_examples/shapes_and_collections/scatter_demo.py