学位论文 > 优秀研究生学位论文题录展示
基于数据的优化删除对几类线性统计模型的研究
作 者: 陈志伟
导 师: 徐文科
学 校: 东北林业大学
专 业: 应用数学
关键词: 线性模型 参数估计 杠杆值 残差平方和 拟合值 偏F检验
分类号: O212.1
类 型: 硕士论文
年 份: 2013年
下 载: 7次
引 用: 0次
阅 读: 论文下载
内容摘要
线性模型在统计学中具有广泛的应用。研究人员在进行实际问题研究时,通常利用数据删除模型或均值漂移模型,通过观察删除第i个观测值前后统计诊断量(如学生化残差s,、Cook距离与似然距离等)的变化情况,来识别该点是否为异常点或强影响点,即是否应将该点从既定的数据集D中删除。利用逐步回归法或向后法的思想,通过观察删除第j个自变量前后回归系数和杠杆值等的变化情况来辨别第j个自变量是否对回归方程有显著意义,即决定删除或保留第j个自变量。而实际上不论是异常点或强影响点的识别还是自变量的选择,都是一个动态的、相互关联的过程。本文在前人研究的基础上,借助均值漂移模型和逐步回归法的思想,对带有非齐性.随机误差项的线性模型,当同时删除观测值和自变量的情形做了详细的分析。其主要目的是想探究每一个观测值对每一个自变量是否有贡献及贡献的大小。本文将线性模型分四种情形进行研究,即全模型、选模型、全均值漂移模型和选均值漂移模型。然后,从第i个观测值的杠杆值、残差平方和、拟合值和偏F检验四方面,对选均值漂移模型进行影响分析。首先,通过对第i个观测值的杠杆值的研究,发现选均值漂移模型第i个观测值(yi xi’[j]的杠杆值等于δωij2。δωij2表示第i个自变量对第i个观测值的杠杆值的贡献。选均值漂移模型投影矩阵的第i个观测值的势pwii(i)[j]表示删除第i个观测值前后拟合值方差的总改变量,且势的大小与ωii密切相关。其次,通过对选均值漂移模型和全模型的残差平方和之差的范数的研究,得到一个n×k阶矩阵DRSSw。矩阵DRSSw的第ij个元素的正负性表示第i个观测值与第j个自变量对既定模型影响的大小,即如果其第ij个元素是负值,则表明对于既定模型,第i个观测值比第j个自变量更具有显著影响。再次,通过对选均值漂移模型拟合值的分析,得出了选均值漂移模型预测仇误差的标准化形式DPRDwij。最后,通过四种模型之间的偏F检验,得出了各种情形的检验统计量。
|
全文目录
摘要 4-5 Abstract 5-9 1 绪论 9-12 1.1 国内外研究进展 9-11 1.2 本文的内容及结构 11-12 2 预备知识 12-26 2.1 矩阵论 12-13 2.1.1 分块矩阵与矩阵的逆 12 2.1.2 对称矩阵的谱分解 12-13 2.1.3 投影阵与二次投影公式 13 2.2 广义最小二乘估计与极大似然估计 13-15 2.2.1 广义最小二乘估计 13-14 2.2.2 极大似然估计 14-15 2.3 异方差性检验 15-25 2.3.1 异常点、高杠杆点与强影响点 15-17 2.3.2 似然比检验统计量 17 2.3.3 Fisher信息阵与score检验统计量 17-18 2.3.4 一个点的异方差性检验 18-21 2.3.5 多个点的异方差性检验 21-25 2.4 本章小结 25-26 3 线性模型的参数估计 26-33 3.1 线性模型的参数估计 26-29 3.1.1 全模型的参数估计 26-27 3.1.2 选模型的参数估计 27 3.1.3 全均值漂移模型的参数估计 27-28 3.1.4 选均值漂移模型的参数估计 28-29 3.2 各参数估计之间的关系 29-32 3.3 本章小结 32-33 4 线性模型中同时删除观测值与自变量的影响分析 33-45 4.1 对杠杆值的影响分析 33-37 4.2 对残差平方和的影响分析 37-38 4.3 对拟合值的影响分析 38-40 4.4 偏F检验 40-43 4.4.1 全模型V.S.选模型 40-41 4.4.2 全模型V.S.全均值漂移模型 41 4.4.3 全模型V.S.选均值漂移模型 41-42 4.4.4 选模型V.S.全均值漂移模型 42 4.4.5 选模型V.S.选均值漂移模型 42 4.4.6 全均值漂移模型V.S.选均值漂移模型 42-43 4.5 本章小结 43-45 结论 45-46 参考文献 46-49 攻读学位期间发表的学术论文 49-50 致谢 50-51
|
相似论文
- 直接序列扩频信号检测与参数估计方法研究,TN914.42
- 地波辐射源的调制类型识别与参数估计,TN957.51
- 硝酸钠制配过程中pH值的预测控制及仿真研究,TP273
- 用户权限管理系统可靠性测试的研究与应用,TP311.53
- 儿童行为的多元重复测量数据分析,O212.1
- 国产508-3钢的疲劳性能研究,TG115.57
- FIR模型辨识及其过程应用研究,N945.14
- 应用回归分析方法预测软件开发时程,TP311.52
- 控制系统的性能评价和诊断问题研究,TP273
- 学校领导影响力与教师组织公民行为关系研究,B849
- 几种情下线性模中误差方差的容许性,O212.1
- 药效仿真支持的心衰治疗模型研究,R312
- 认知无线电的频谱检测优化算法与MAC协议设计,TN925
- 无人机时差频差定位关键技术研究,V279
- 矿区开采沉陷观测数据处理研究,TD325
- 高陡软岩边坡滑坡预报方法的研究,P642.22
- 基于马尔科夫随机场D-S证据理论对人脑图像的分割研究,TP391.41
- HF/VHF通信信号分析关键技术研究与实现,TN911.6
- 短波多载波信号识别与参数估计,TN919.3
- 多极化SAR滤波分类技术研究及SAR图像处理软件系统实现,TN958
- 地波OTH雷达信号调制识别与参数估计技术研究,TN957.51
中图分类: > 数理科学和化学 > 数学 > 概率论与数理统计 > 数理统计 > 一般数理统计
© 2012 www.xueweilunwen.com
|