博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
线性模型的概率分析
阅读量:5096 次
发布时间:2019-06-13

本文共 884 字,大约阅读时间需要 2 分钟。

抛出问题:为什么前面的线性回归要用最小二乘法?为什么要用这样的指标?

下面我们会给出一系列的概率假设,从而导出最小二乘法是一个很自然的算法:

 

先设              y^(i) = θTx^(i) + ε(i), 其中ε(i)叫做误差项 error term,这个可以看作是对未建模的效应的捕获,简单的说就是没有考虑到的特征,像预测房子中的这个房子有没有花园,房子的噪音多不多什么的,这些特征我们没有考虑到,但它对预测结果又确实有影响。

又假设这个ε(i)服从某个概率分布   ε(i)~N(0,σ^2),——即它服从正态分布,均值为0,方差为σ^2

于是根据正正态分布的概率密度函数就有:                                                                                                         技术分享    

将现行回归方程代入我们可以得到(因为这个误差值是服从正态分布的,所以房屋的价格也服从正态分布,所以它的概率密度函数也是):

也即:

y(i) | x(i);θ ∼N(θTx^(i),σ^2)

这个表示这是给一个x^(i)以θ为参数的y^(i)的分布。注意θ不能当作条件,因为它不是个随机变量,它是个参数。

 

又假设这个error terms ,误差项之间是彼此独立的

现在定义一个θ参数的函数,似然函数L(θ) (likehood function)

L(θ) = L(θ;X,~y) = p(~y|X;θ),因为那个误差项的独立分布,我们可以把它写成:

技术分享    即高斯密度函数的乘积

L(θ)似然性和概率其实差不多,只是L(θ)强调是个关于θ的函数,所以要注意这个语句的正确,是参数的似然性和数据的概率。

 

接下来就是选择θ的问题了,现在我们要做的是maximize  L(θ),即选择θ使数据出现的可能性尽可能大

为了数学上的便利,现在又定义   ℓ(θ):

技术分享

此时,要maxmize 这个L(θ)也就是要minimizing这个技术分享最小,看着玩意是不是很眼熟!!这就是我们之前的线性回归函数J(θ)!

 

 

其实讲了这么多就是为了证明之前的那个普通最小二乘法的目的实际上是假设误差项满足高斯分布且独立分布的情况下。

转载于:https://www.cnblogs.com/wangshen31/p/6920517.html

你可能感兴趣的文章
javascript 简单实现对两个数组相似度的检验
查看>>
017. ADO.NET Connection和command及DataReader
查看>>
mysql导入导出.sql文件备份还原数据库[mysql导入导出sql命令行] .
查看>>
Rational Rose 2007 安装
查看>>
Coding配合git使用时遇到的问题
查看>>
java 字体+颜色综合使用示例
查看>>
ios开发之级联菜单(两个tableView实现)
查看>>
tft屏图像文字一起显示
查看>>
java 泛型
查看>>
第六章函数和宏定义
查看>>
杨森翔的书法-19
查看>>
css画圆
查看>>
视图时时更新
查看>>
【PMP】财务测量指标ROI、PBP、NPV、IRR、BCR
查看>>
【Shell】Read命令
查看>>
BZOJ1061 NOI2008 志愿者招募 单纯形
查看>>
code forces 996D Suit and Tie
查看>>
PHP操作Mysql
查看>>
win7 64安装msyql
查看>>
vue-cli的webpack使用说明
查看>>