逻辑回归2021-09-05
广义线性模型
指数族分布
指数族(Exponential Family)分布是一类分布的总称,该类分布的分布律(或概率密度函数)的一般形式为:
各符号含义如下:
为该分布的自然参数,可为向量
为充分统计量,视具体的分布而定,通常等于随机变量本身
为配分函数
为关于随机变量的函数
常见的伯努利分布和正态分布均属于指数族分布。以下证明伯努利分布属于指数族分布:
已知伯努利分布的分布律为:
其中,,为的概率,即 对上式恒等变形得:
对比指数族分布的一般形式 ,可知:
由此说明,伯努利分布为指数族分布。
广义线性模型的假设
- 在给定的条件下,假设随机变量服从某个指数族分布
- 在给定的条件下,我们的目标是得到一个模型能预测出的期望值
- 假设该指数族分布中的自然参数和呈线性关系,即
逻辑回归
模型推导
逻辑回归是对二分类问题进行建模,并且假设被建模的随机变量取值为0或1,因此,可以很自然得假设服从伯努利分布。此时,如果希望构建一个线性模型来预测给定的条件下取值的话,可以考虑使用广义线性模型来进行建模。
已知服从伯努利分布,而伯努利分布属于指数族分布,所以满足广义线性模型的三条假设。根据第二条假设,可以推出模型的表达式为:
注意,只是表示形式,并不影响的计算,即。根据伯努利分布的,所以:
又因为,所以:
根据公式可知,对伯努利分布:
将带入得:
根据广义线性模型的第三条假设 ,最终可化简为:
此即为逻辑回归模型。
极大似然估计
已知随机变量取1和0的概率分别为(考虑偏置项):
令,则可简写为,于是上式可化简为:
将上式合并得:
或者:
根据对数似然函数的定义可知:
因此,逻辑回归的对数似然函数可以表示为:
根据的两种形式(公式和公式),可以得到两种对数似然函数,以下将分别推导。
似然函数形式一
将 带入似然函数(公式)可得:
由于 ,上式可化简为:
由于,所以
当 时,
当时,
综合可得:
似然函数形式二
若,将其带入对数似然可得:
模型求解
对似然函数求极大,或求损失函数的极小。
参考文献
- Andrew Ng. cs229 -notes1