1. 监督学习
2. 数据集的划分
3. 平均平方误差MSE
4. 线性模型Linear Model
用穷举法确定线性模型的参数
import numpy as np
import matplotlib.pyplot as plt
x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]
def forward(x):
return x * w
# loss function 是 均方根误差 loss = (y_hat - y) ** 2
def loss(x, y):
y_pred = forward(x)
return (y_pred - y) * (y_pred - y)
w_list = []
mse_list = []
for w in np.arange(0.0, 4.0, 0.1):
print('w=', w)
l_sum = 0
for x_val, y_val in zip(x_data, y_data): # A zip object yielding tuples until an input is exhausted;
y_pred_val = forward(x_val)
loss_val = loss(x_val, y_val) # 传入的是x_val,但是经过loss中的forward计算后,已经是y_hat(估计值)了;
l_sum += loss_val
print('\t', x_val, y_val, y_pred_val, loss_val)
print('MSE=', l_sum / len(x_data)) # 求一下 损失的均值
w_list.append(w)
mse_list.append(l_sum / len(x_data))
plt.plot(w_list, mse_list)
plt.ylabel('Loss')
plt.xlabel('w')
plt.show()
详细过程
本课程的主要任务是构建一个完整的线性模型:
导入numpy和matplotlib库;
导入数据 x_data 和 y_data;
定义前向传播函数:
forward:输出是预测值y_hat
定义损失函数:
loss:平方误差
创建两个空列表,后面绘图的时候要用:
分别是横轴的w_list和纵轴的mse_list
开始计算(这里没有训练的概念,只是单纯的计算每一个数据对应的预测值,然后让预测值跟真实y值求MSE):
外层循环:
在0.0~4.0之间均匀取点,步长0.1,作为n个横坐标自变量,用w表示;
内层循环:核心计算内容
从数据集中,按数据对取出自变量x_val和真实值y_val;
先调用forward函数,计算y的预测值 w*x
调用loss函数,计算单个数据的平方误差;
累加损失;
打印想要看到的数值;
在外层循环中,把计算的结果放进之前的空列表,用于绘图;
在获得了打印所需的数据列表之后,模式化地打印图像:
运行结果
ps:
visdom库可用于可视化
np.meshgrid()可用于绘制三维图