线性回归
2021-09-04

 

一元线性回归

模型定义

模型定义如下所示:

(1)f(x)=y^=wx+bwbx

根据最小二乘法,模型的损失函数为:

(2)E(w,b)=i=1m(yiy^i)2=i=1m(yi(wxi+b))2yiy^im

模型优化目标:找到合适的w,b,使得E(w,b)的值最小

(3)w,b=argminw,bE(w,b)

损失函数凹凸性证明

证明损失函数E(w,b)是关于wb的凸函数。

  1. A=fxx(x,y)

    (4)E(w,b)w=w[i=1m(yiwxib)2]=i=1mw(yiwxib)2=i=1m2(yiwxib)(xi)=2(wi=1mxi2i=1m(yib)xi)
    (5)2E(w,b)w2=w(E(w,b)w)=w[2(wi=1mxi2i=1m(yib)xi)]=w[2wi=1mxi2]=2i=1mxi2

    所以,A=2i=1mxi2

  2. B=fxy(x,y)

    (6)2E(w,b)wb=b(E(w,b)w)=b[2(wi=1mxi2i=1m(yib)xi)]=b[2i=1m(yib)xi]=b(2i=1myixi+2i=1mbxi)=b(2i=1mbxi)=2i=1mxi

    所以,B=2i=1mxi

  3. C=fyy(x,y)

    (7)E(w,b)b=b[i=1m(yiwxib)2]=i=1mb(yiwxib)2=i=1m2(yiwxib)(1)=2(mbi=1m(yiwxi))
    (8)2E(w,b)b2=b(E(w,b)b)=b[2(mbi=1m(yiwxi))]=b(2mb)=2m

     

    以,C=2m

  4. ACB2

(9)ACB2=4mi=1mxi24mx¯i=1mxi=4m(i=1mxi2i=1mxix¯)=4mi=1m(xi2xix¯)

又因为:

(10)i=1mxix¯=x¯i=1mxi=x¯m1mi=1mxi=mx¯2=i=1mx¯2

所以:

(11)ACB2=4mi=1m(xi2xix¯)=4mi=1m(xi2xix¯xix¯+xix¯)=4mi=1m(xi2xix¯xix¯+x¯2)=4mi=1m(xix¯)20

因此,损失函数E(w,b)是关于wb的凸函数,问题得证。

参数求解

求偏置b

对损失函数E(w,b)关于b求一阶偏导数:

(12)E(w,b)b=2(mbi=1m(yiwxi))

令一阶偏导数等于0解出b

(13)E(w,b)b=2(mbi=1m(yiwxi))=0mbi=1m(yiwxi)=0b=1mi=1m(yiwxi)b=1mi=1myiw1mi=1mxi=y¯wx¯

求参数w

令一阶偏导数等于0解出w

(14)E(w,b)w=2(wi=1mxi2i=1m(yib)xi)=0wi=1mxi2i=1m(yib)xi=0wi=1mxi2=i=1myixii=1mbxi

b=y¯wx¯带入得:

(15)wi=1mxi2=i=1myixii=1m(y¯wx¯)xiwi=1mxi2=i=1myixiy¯i=1mxi+wx¯i=1mxiwi=1mxi2wx¯i=1mxi=i=1myixiy¯i=1mxiw(i=1mxi2x¯i=1mxi)=i=1myixiy¯i=1mxi

因为:

(16)y¯i=1mxi=1mi=1myii=1mxi=x¯i=1myix¯i=1mxi=1mi=1mxii=1mxi=1m(i=1mxi)2

所以:

(17)w=i=1myixix¯i=1myii=1mxi21m(i=1mxi)2=i=1myi(xix¯)i=1mxi21m(i=1mxi)2

记下来,对w进行向量化处理。

1m(i=1mxi)2=x¯i=1mxi=i=1mxix¯带入分母可得:

(18)w=i=1myi(xix¯)i=1mxi2i=1mxix¯=i=1m(yixiyix¯)i=1m(xi=12xix¯)

由于:

(19) 由于 {i=1myix¯=x¯i=1myi=1mi=1mxii=1myi=i=1mxi1mi=1myi=i=1mxiy¯i=1myix¯=x¯i=1myi=x¯m1mi=1myi=mx¯y¯=i=1mx¯y¯i=1mxix¯=x¯i=1mxi=x¯m1mi=1mxi=mx¯2=i=1mx¯2

带入可得:

(20)w=i=1m(yixiyix¯)i=1m(xi2xix¯)=i=1m(yixiyix¯yix¯+yix¯)i=1m(xi2xix¯xix¯+xix¯)=i=1m(yixiyix¯xiy¯+x¯y¯)i=1m(xi2xix¯ixix¯+x¯2)=i=1m(xix¯)(yiy¯)i=1m(xix¯)2

定义向量:

(21)x=(x1,x2,,xm)Ty=(y1,y2,,ym)Txd=(x1x¯,x2x¯,,xmx¯)Tyd=(y1y¯,y2y¯,,ymy¯)T

那么:

(22)w=i=1m(xix¯)(yiy¯)i=1m(xix¯)2=xdTydxdTxd

多元线性回归

模型定义

多元线性回归模型定义如下:

(23)f(xi)=w1xi1+w2xi2++wdxid+b=w1xi1+w2xi2++wdxid+wd+11=(w1w2wd+1)(xi1xi2xid1)f(xi^)=w^Txi^w^T=(w1w2wd+1)xi^T=(xi1xi2xid1)

令矩阵X为:

(24)X=(x11x12x1d1x21x22x2d1xm1xm2xmd1)m×d+1=(x1T1x2T1xmT1)m×d+1=(x^1Tx^2Tx^mT)m×d+1

损失函数为:

(25)E(w^)=i=1m(yif(x^i))2=i=1m(yiw^Tx^i)2=(y1w^Tx^1y2w^Tx^2ymw^Tx^m)(y1w^Tx^1y2w^Tx^2ymw^Tx^m)=(yXw^)T(yXw^)

损失函数凹凸性判断

损失函数对变量求一阶偏导:

(26)E(w^)w^=w^[(yXw^)T(yXw^)]=w^[(yTw^TXT)(yXw^)]=w^[yTyyTXw^w^TXTy+w^TXTXw^]=w^[yTXw^w^TXTy+w^TXTXw^]=yTXw^w^w^TXTyw^+w^TXTXw^w^=XTyXTy+(XTX+XTX)w^=2XT(Xw^y)

损失函数对变量求二阶偏导(Hessian矩阵):

(27)2E(w^)w^w^T=w^(Ew^w^)=w^[2XT(Xw^y)]=w^(2XTXw^2XTy)=2XTX

说明:该Hessian矩阵无法保证为正定矩阵,但是,此处直接假设该矩阵为正定矩阵,否则无法继续推导。

w^

一阶偏导数为:

(28)E(w^)w^=2XT(Xw^y)

在Hessian矩阵为正定矩阵的假设下,令一阶偏导数为0,可得:

(29)E(w^)w^=2XT(Xw^y)=02XTXw^2XTy=02XTXw^=2XTyw^=(XTX)1XTy