上篇介绍如何依照需要的状况决定函式,此篇将介绍如何在点与点间寻找回归线减少偏差值。
Linear RegressionSimple Linear Regression: Finding a relationship between two continuous variables; y = f(x)
基本上DataSet会有N个例子(行),例子中会有M个输入属性(列);
在线性回归中可以使用error function (Mean Squared Error) 去判断一开始假设的h(x)是否準确,
常见的计算方法为:(h(x)-f(x))^2
也就是用平方来去取线与点之间的距离。
取偏差值的公式:
先取距离后全部加总再取平均值,前面的1/2是为了方便计算所做的梯度下降。
最小化偏差值如果只有一个属性: h(x) = b + w1x
b是y的截距,w1是斜率
则计算方法为: