## Cost Function

In [1]:
import numpy as np
import matplotlib.pyplot as plt

## 构建一个模型，能够根据房屋的面积预测房价。  继续使用之前的两个数据点：一套面积为1000平方英尺的房子售价为30万美元，一套面积为2000平方英尺的房子售价为50万美元。

| 面积（1000平方英尺） | 价格（以千美元为单位） |
|-------------------|------------------------|
| 1                 | 300                    |
| 2                 | 500                    |


In [2]:
x_train = np.array([1.0, 2.0])           
y_train = np.array([300.0, 500.0]) 
print(f"x_train:{x_train} y_train:{y_train}")

x_train:[1. 2.] y_train:[300. 500.]


- \($f_{w,b}(x^{(i)})$) 是使用参数 \(w\) 和 \(b\) 对第 \(i\) 个样本的预测值。  
- \($(f_{w,b}(x^{(i)}) - y^{(i)})^2$) 是目标值和预测值之间的平方差。  
- 这些差值会针对所有 \(m\) 个样本进行求和，并除以 \(2m\)，以得到成本 \(J(w,b)\)。  

In [3]:
def compute_cost(x, y, w, b): 
    m = x.shape[0] #样本的数量
    cost_sum = 0 
    for i in range(m): 
        f_wb = w * x[i] + b   
        cost = (f_wb - y[i]) ** 2  
        cost_sum = cost_sum + cost  
    total_cost = (1 / (2 * m)) * cost_sum  
    return total_cost

上面的成本公式（1）表明，如果可以选择 \(w\) 和 \(b\)，使得预测值 \($f_{w,b}(x)$) 与目标数据 \(y\) 匹配，那么 \($(f_{w,b}(x^{(i)}) - y^{(i)})^2$) 项将为零，成本也将最小化。

 \(b=100\) 是一个最优解，将 \(b\) 设置为100，专注于 \(w\)。


In [4]:
b=100
w=100
print(f"w={w},cost={compute_cost(x_train,y_train,w,b)}")
w=150
print(f"w={w},cost={compute_cost(x_train,y_train,w,b)}")
w=200
print(f"w={w},cost={compute_cost(x_train,y_train,w,b)}")
w=250
print(f"w={w},cost={compute_cost(x_train,y_train,w,b)}")
w=300
print(f"w={w},cost={compute_cost(x_train,y_train,w,b)}")

w=100,cost=12500.0
w=150,cost=3125.0
w=200,cost=0.0
w=250,cost=3125.0
w=300,cost=12500.0


### 当w=200时cost最小为0