你有一个单一的功能x房子的大小,你可以预测房子的价格,所以模型是f(x)=wx+b,但现在如果你不仅有房子的大小作为试图预测价格的特征,如果你也知道卧室的数量、楼层数和房子的年龄,这似乎会给你更多的信息来预测价格,引入一点新的符号,我们将X1,X2,X3,X4作为符号特征,n代表特征的总数,我们将使用X上标来表示i训练示例,这里X上标i实际上是一个由四个数字组成的列表,有时我们称之为矢量,这包括i训练示例的所有特性,所以作为一个具体的例子,括号中的X上标p将是特征的向量。数据被写成一排叫做行向量。并引用i训练示例中的一个特定特性,一个矢量会在上边画箭头,你可以把箭头看作是一个可选的,只是为了强调这是一个向量而不是一个数字。
对于f(x)=wx+b,我们就是这样定义模型的,其中x是一个单一的特征,所以一个数字现在有了多种功能,我们将以不同的方式来定义它,一个可能的模型是我们把房子的价格估计为零点。看如下图的式子,让我们考虑如何解释这些参数。
如果模型试图用几千美元来预测房子的价格,你可以认为这个b=a,比如说一套房子的底价起价可能是八万美元,假设它没有大小,没有卧室,无楼层无年龄,你可能想到这个0.1,因为每增加一平方英尺,价格将增加零点1000美元或100美元,因为每平方英尺价格上涨0.1,乘以1000美元,每多一个卫生间就要100美元,价格上涨四千元,每增加4000元,价格可能增加10000美元,房子的年龄每增加一年,由于参数为负数,价格可能会下降2000元,两个和一般,如果你有n个功能,然后模型就会是这样的,接下来引入一些符号来重写这个表达式,以一种更简单但等价的方式,把W定义为一个数字列表,在数学中,它列出了参数W1,W2,W3,一直到Wn,这叫做矢量。有时为了表示这是一个向量,意味着一串数字,可以把箭头看作是一个可选的能指,提醒这是一个矢量,这是一个行向量。b是一个数而不是一个向量,所以这个向量W和这个数b模型的参数,再把X写作一个列表或者一个向量,从3到n,这又是一个向量,所以用这个符号模型现在可以更简洁的重写,当X等于向量W点时,这个点是线性代数x的点积,向量加上数b,两个数列的两个向量的点积,W和x是通过取相应的数对来计算的,总结所有这些产品,把它写出来,这意味着点积W1*1+W2*2+....+Wn*n,最后再加上上面的b。
注意到这给了我们和上面完全相同的表达式,因此,点积表示法可以让您以更紧凑的形式编写模型,用更少的字符,这种线性回归模型的名称具有多输入特征的是多元线性回归,这与单变量回归形成鲜明对比,单变量回归只有一个特征,可能会认为这个算法叫做多元回归,但这个术语实际上指的是我们在这里不会使用的其他东西,所以将这个模型称为多元线性回归,这就是具有多个特征的线性回归,也叫多元线性回归,为了实现这一算法,有一个非常巧妙地技巧叫做矢量化,这将使实现这一点变得简单得多。