# Using NumPy to perform arithmetic operations on data

![截屏2025-01-09 23.30.30.png](<attachment:截屏2025-01-09 23.30.30.png>)

In [1]:
import numpy as np
from numpy.random import randn

In [2]:
np.set_printoptions(precision=2) # set the decimal point to 2 限制到小数点后两位

## Creating arrays
### Creating arrays using a list

In [3]:
a = np.array([1,2,3,4,5,6]) # create a 1D array object: of 6 values
a

array([1, 2, 3, 4, 5, 6])

In [4]:
b = np.array([[10,20,30],[40,50,60]]) # create a maxtrix object (2D array): 2 rows, 3 columns
b

array([[10, 20, 30],
       [40, 50, 60]])

## Creating arrays via assignment
## np random num generator

In [5]:
np.random.seed(25) # seed the random number generator
c = 36*np.random.randn(6) # create a 1D array object with 6 random numbers
c

array([  8.22,  36.97, -30.23, -21.28, -34.45,  -8.  ])

`np.random.seed(25)` 用于设置 NumPy 随机数生成器的种子值为 25。这样做的目的是为了确保随机数生成的结果是可重复的。每次运行代码时，只要种子值相同，生成的随机数序列也会相同。这在调试和测试时非常有用，因为它可以确保结果的一致性。

种子值（seed value）是随机数生成器的初始值。随机数生成器使用这个初始值来计算生成的随机数序列。通过设置相同的种子值，可以确保每次运行程序时生成的随机数序列是相同的，从而实现结果的可重复性。种子值本质上是随机数生成器的起点，控制了随机数生成的过程。

In [6]:
d= np.arange(1,35) # create an array with 34 values
d

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34])

## pd.DataFrame(np.random.randint())

In [None]:
# 笔记
data = pd.DataFrame(np.random.randint(30, size=(30, 3)), columns=col_names)

# np.random.randint(30, size=(30, 3)):

# This generates a 2D array of random integers between 0 and 29.
# 30: The upper limit (exclusive) for the random integers.
# size=(30, 3): Specifies the shape of the array, which will have 30 rows and 3 columns.

# pd.DataFrame(..., columns=col_names):

# This creates a DataFrame using the array generated by np.random.randint.
# columns=col_names: Assigns column names to the DataFrame. col_names should be a list of column names.

# data:

# This is the variable that stores the resulting DataFrame.


# In summary, this line of code creates a DataFrame named data with 30 rows and 3 columns, filled with random integers between 0 and 29, and assigns column names from the list col_names.

## np.arange()
--笔记--

`np.arange()` 是 NumPy 库中的一个函数，用于生成一个数组。它的常见用法如下：



In [None]:
np.arange([start, ]stop, [step, ]dtype=None)



- `start`（可选）：数组起始值，默认为 0。
- `stop`：数组终止值（不包括该值）。
- `step`（可选）：数组中值的间隔，默认为 1。
- `dtype`（可选）：数组中元素的数据类型。

例如：



In [None]:
import numpy as np

# 生成从 0 到 9 的数组
d = np.arange(10)
print(d)  # 输出: [0 1 2 3 4 5 6 7 8 9]

# 生成从 1 到 9，步长为 2 的数组
d = np.arange(1, 10, 2)
print(d)  # 输出: [1 3 5 7 9]


如果你没有提供 `stop` 参数，`np.arange()` 会抛出一个 TypeError，因为 `stop` 是必需的参数。

--笔记完--

## Array Arithmetic

In [7]:
a*10

array([10, 20, 30, 40, 50, 60])

In [8]:
c+a

array([  9.22,  38.97, -27.23, -17.28, -29.45,  -2.  ])

In [9]:
c-a

array([  7.22,  34.97, -33.23, -25.28, -39.45, -14.  ])

In [11]:
c*a

array([   8.22,   73.94,  -90.68,  -85.13, -172.24,  -48.02])

In [12]:
c/a

array([  8.22,  18.48, -10.08,  -5.32,  -6.89,  -1.33])