# 2.Numpy入门

## 2.1 数据科学领域5个常用 Python 库

** Numpy/Scipy/Pandas/Matplotlib/Scikit-learn **

### Numpy

* N 维数组(矩阵), 快速高效，矢量数学运算
* 高效的 Index， 不需要循环
* 开源免费跨平台，运行效率足以和 C/Matlab 媲美

### Scipy

* 依赖于 Numpy
* 专为科学和工程设计
* 实现了多种常用科学计算：线性代数、傅立叶变换、信号和图像处理

### Pandas

* 结构化数据分析利器(依赖 Numpy)
* 提供了多种高级数据结构：Time-Series, DataFrame, Panel
* 强大的数据索引和处理能力

### Matplotlib

* Python 2D 绘图领域使用最广泛的套件
* 基本能取代 Matlab 的绘图功能(散点，曲线，柱形等)
* 通过 mplot3D 可以绘制精美的 3D 图

### Scikit-learn

* 机器学习的 Python 模块
* 建立在 Scipy 之上，提供了常用的机器学习算法：聚类、回归
* 简单易学的 API 接口

## 2.2 数学基础回顾之矩阵运算

### 基本概念

* 矩阵：矩形的数组，即二维数组。其中向量和标量都是矩阵的特例
* 向量：是指 1 x n 或者 n x 1 的矩阵
* 标量：1 x 1 的矩阵
* 数组：N 维的数组，是矩阵的延伸

### 特殊矩阵

* 全 0 全 1 矩阵
* 单位矩阵

### 矩阵加减运算

* 相加，减的两个矩阵必须要有相同的行和列
* 行和列对应元素的相加减

### 数组乘法（点乘）

* 数组乘法（点乘）是对应元素之间的乘法

### 矩阵乘法

* 设 A 为 m x p 的矩阵，B 为 p x n 的矩阵， m x n 的矩阵 C 为 A 与 B 的乘积，记 C = AB， 其中矩阵 C 中的第 i 行第 j 列元素可以表示为：

### 其他线性代数知识

* 清华大学出版的线性代数

http://bs.szu.edu.cn/sljr/Up/day_110824/201108240409437707.pdf

# 数组的创建和访问

In [1]:
import numpy as np

In [2]:
# create from python list
list_1 = [1, 2, 3, 4]

In [4]:
list_1

[1, 2, 3, 4]

In [5]:
array_1 = np.array(list_1)

In [6]:
array_1

array([1, 2, 3, 4])

In [7]:
list_2 = [5, 6, 7, 8]

In [8]:
array_2 = np.array([list_1, list_2])

In [10]:
array_2

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [11]:
array_2.shape

(2, 4)

In [12]:
array_2.size

8

In [13]:
array_2.dtype

dtype('int64')

In [14]:
array_3 = np.array([[1.0, 2, 3], [4.0, 5, 6]])

In [15]:
array_3.dtype

dtype('float64')

In [18]:
array_4 = np.arange(1, 10, 2)

In [19]:
array_4

array([1, 3, 5, 7, 9])

In [20]:
np.zeros(5)

array([ 0.,  0.,  0.,  0.,  0.])

In [21]:
np.zeros([2, 3])

array([[ 0.,  0.,  0.],
       [ 0.,  0.,  0.]])

In [22]:
np.eye(5)

array([[ 1.,  0.,  0.,  0.,  0.],
       [ 0.,  1.,  0.,  0.,  0.],
       [ 0.,  0.,  1.,  0.,  0.],
       [ 0.,  0.,  0.,  1.,  0.],
       [ 0.,  0.,  0.,  0.,  1.]])

In [23]:
np.eye(5).dtype

dtype('float64')

In [24]:
# 访问数组里的元素
a = np.arange(1, 10)
a

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [25]:
a[1]

2

In [26]:
a[1:5]

array([2, 3, 4, 5])

In [27]:
b = np.array([[1, 2, 3], [4, 5, 6]])
b

array([[1, 2, 3],
       [4, 5, 6]])

In [28]:
b[1][0]

4

In [29]:
 b[1, 0]

4

In [30]:
c = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
c

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [31]:
c[:2, 1:]

array([[2, 3],
       [5, 6]])