In [None]:
import numpy as np
from scipy import stats

speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]

# 平均值
x = np.mean(speed)

print('平均值 :', x)

# 中值
x = np.median(speed)

print('中值 :', x)

# 众数
x = stats.mode(speed,keepdims=False)
print('众数 :', x)

# 标准差
x = np.std(speed)
print('标准差 :', x)

# 方差
x = np.var(speed)
print('方差 :', x)

# 百分位数
x = np.percentile(speed, 50)
print('百分位数 :', x)

In [None]:
import matplotlib.pyplot as plt

# 创建一个包含 250 个介于 0 到 5 之间的随机浮点数的数组
x = np.random.uniform(0.0, 5.0, 250)

# 绘制直方图
plt.hist(x, 5)
plt.show()

In [None]:
# 平均值为 5.0，标准差为 1.0
x = np.random.normal(5.0, 1.0, 100000)

plt.hist(x, 100)
plt.show()

In [None]:
# 线性回归
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]


# 该方法返回线性回归的一些重要键值
# r 平方值的范围是 0 到 1，其中 0 表示不相关，而 1 表示 100％ 相关
slope, intercept, r, p, std_err = stats.linregress(x, y)

# 表示相应的 x 值将在 y 轴上放置的位置
def myfunc(x):
  return slope * x + intercept

mymodel = list(map(myfunc, x))

plt.scatter(x, y)
plt.plot(x, mymodel)
plt.show()

In [None]:
from sklearn.metrics import r2_score
# 多项式回归

# x 轴表示一天中的小时，y 轴表示速度
x = [1,2,3,5,6,7,8,9,10,12,13,14,15,16,18,19,21,22]
y = [100,90,80,60,60,55,60,65,70,70,75,76,78,79,90,99,99,100]

mymodel = np.poly1d(np.polyfit(x, y, 3))

# 指定行的显示方式，我们从位置 1 开始，到位置 22 结束
myline = np.linspace(1, 22, 100)

plt.scatter(x, y)
plt.plot(myline, mymodel(myline))
plt.show()

# r 平方值的范围是 0 到 1，其中 0 表示不相关，而 1 表示 100％ 相关
print(r2_score(y, mymodel(x)))

# 预测下午 17 点过车的速度
speed = mymodel(17)
print(speed)

In [50]:
import pandas as pd
from sklearn import linear_model
from sklearn.preprocessing import StandardScaler
scale = StandardScaler()

# 多元回归就像线性回归一样，但是具有多个独立值，这意味着我们试图基于两个或多个变量来预测一个值
df = pd.read_csv("cars.csv")

X = df[['Weight', 'Volume']]
y = df['CO2']

# 数据缩放z = (x - u) / s
# z 是新值，x 是原始值，u 是平均值，s 是标准差。
scaledX = scale.fit_transform(X)

regr = linear_model.LinearRegression()
regr.fit(X, y)

# 预测重量为 2300kg、排量为 1300ccm 的汽车的二氧化碳排放量：
predictedCO2 = regr.predict([[2300, 1300]])

print(predictedCO2)

# 系数是描述与未知变量的关系的因子
# result告诉我们，如果重量增加 1g，则 CO2 排放量将增加 0.00755095g。
# 如果发动机尺寸（容积）增加 1 ccm，则 CO2 排放量将增加 0.00780526g。
print(regr.coef_)

[107.2087328]
[0.00755095 0.00780526]


