学位论文 > 优秀研究生学位论文题录展示
复杂抽样小区域估计量的应用分析
作 者: 刘建华
导 师: 金水高
学 校: 中国疾病预防控制中心
专 业: 流行病与卫生统计学
关键词: 复杂抽样 扩展估计量 综合估计量 复合估计量 SSD估计量 HB估计量 小区域
分类号: R195.1
类 型: 博士论文
年 份: 2008年
下 载: 82次
引 用: 1次
阅 读: 论文下载
内容摘要
目的引入一些基于设计和基于模型的小区域估计量;并通过一项精心设计的模拟研究和我国2006年全国人群乙型肝炎血清流行病学调查(NHBSS)数据的实例分析,比较分类数据不同类型小区域估计量的估计效率;以便为今后有效分析类似的复杂抽样小区域数据提供方法学参考。方法文献复习和综述基于设计和基于模型的一些重要小区域估计量。由于NHBSS能利用的辅助信息是按年龄-性别事后分层的总人口数,确定基于设计的间接估计量包括事后分层计数-综合估计量、复合估计量和样本大小依赖(SSD)估计量。研究变量为二分类变量,故基于模型的间接估计量选择等级贝叶斯(HB)估计量。扩展估计量作为基于设计的无偏估计量。基于NHBSS调查进行Monte Carlo模拟试验,重复抽样R=500。以平均绝对相对偏倚(AARB)度量偏倚,平均相对均方误(ARMSE)度量精度,分析比较5种不同类型估计量的估计效率。NHBSS数据实例分析中以相对偏倚(RB),相对标准误(RSE)和相对均方误平方根(RRMSE)评价5种估计量的可靠性。结果模拟研究中,1~59岁年龄组,无论HBsAg或抗-HBs,HB估计量偏倚最大,但估计精度最高。扩展估计量、综合估计量以及复合估计量和SSD估计量的偏倚和精度差异较小。相对于HB估计量而言,这些估计量偏倚较小,估计精度相对较低。总体而言,复合估计量估计效率最好。另外,待估计参数越小,5种估计量偏倚越大,估计精度也越低。除1~4岁年龄组HBsAg流行率HB估计量的ARMSE最大外,其余HB估计量的ARMSE最小。与1~59岁年龄组结果一致,1~4岁,5~14岁和15~59岁年龄组HB估计量偏倚最大。抗-HBs扩展估计量、综合估计量以及复合估计量和SSD估计量的偏倚和精度差异甚微。各年龄组HBsAg复合估计量的ARMSE仅次于HB估计量。总体而言,复合估计量估计效率最高。另外,估计量的偏倚和精度大小与年龄组期望样本和待估计参数大小有关。期望样本和参数越小,估计量偏倚越大,估计精度也越低。抗-HBs中,15~59岁年龄组各估计量偏倚最小,估计精度最高;5~14岁年龄组各估计量偏倚最大,估计精度最低。NHBSS数据实例分析中,无论HBsAg或抗-HBs,各年龄组复合估计量平均均方误平方根(Av.RRMSE)最小,说明复合估计量的可靠性最好。其次为SSD估计量,再其次为综合估计量。1~4岁和5~14岁HBsAg流行率HB估计量以及1~4岁抗-HBs流行率HB估计量的Av.RRMSE小于扩展估计量的Av.RRMSE,说明样本较小或估计参数较小时,HB估计量的可靠性优于扩展估计量。在此情形下,扩展估计量的可靠性最低,如1~4岁和5~14岁HBsAg流行率扩展估计量的Av.RRMSE分别高达56.69%和40.46%。结论本次研究结果虽不能促使小区域估计研究方法有所突破,但有助于进一步深入分析或二次分析大规模调查数据。使用按年龄-性别事后分层总人口数辅助信息时,就NHBSS调查数据而言,复合估计量估计效率最高,其次为SSD估计量。HB估计量的结果不能令人满意,说明所使用模型并不完备。后续研究需要在模型中加入更多的参数或效应,以改进模型的估计,降低估计量的MSE。小区域期望样本较小且待估计参数较小时,扩展估计量估计精度最低,应尽量避免使用;但小区域待估计参数较大或者区域样本大小适中或较大时,可直接选用扩展估计量。
|
全文目录
缩略词表 6-8 中文摘要 8-10 英文摘要 10-13 1 前言 13-20 1.1 研究背景 13-17 1.2 研究目的和内容 17-18 1.3 研究方法和技术路线 18-20 2 基于设计的直接估计量 20-26 2.1 基于设计方法 20-21 2.2 扩展估计量 21-22 2.3 广义回归估计量 22-24 2.4 校正直接估计量 24-26 3 基于设计的间接估计量 26-35 3.1 综合估计量 26-30 3.2 复合估计量 30-32 3.3 JAMES-STEIN估计量 32-35 4 基于模型的间接估计量 35-40 4.1 小区域模型 35-36 4.2 经验最优线性无偏预测估计量 36-37 4.3 经验贝叶斯估计量 37-38 4.4 等级贝叶斯估计量 38-40 5 模拟研究 40-53 5.1 NHBSS调查描述 40-41 5.2 模拟试验设计 41-44 5.3 估计量的偏倚,方差及均方误 44-45 5.4 结果 45-53 6 实例分析 53-72 6.1 数据分析描述 53 6.2 估计结果 53-72 7 讨论 72-76 7.1 小区域估计量的估计效率 72-73 7.2 基于设计和基于模型方法 73-74 7.3 小区域估计的设计和应用分析 74-76 8 结论 76-77 参考文献 77-81 综述 81-89 参考文献 87-89 附录 89-90 致谢 90
|
相似论文
- 云南普通高等教育区域均衡发展研究,G649.2
- 基于多示例学习的用户关注概念区域发现,TP391.41
- 家庭清扫机器人路径覆盖系统的设计与实现,TP242
- 湛江市对虾产业区域品牌建设研究,F326.4
- 中山市区域性推进班主任专业发展的实践与探索,G451.1
- 幼儿混龄区域活动管理研究,G617
- 中国碳排放水平的区域差异及影响因素分析,X502
- 中国区域行政合作的非均衡演进研究,D630
- 中国政府惠农政策实证研究,D422.6
- 环境脆弱区工业主导产业选择及区域布局研究,X321
- 曲靖烟区气候因素的数量特征及区域划分,S572
- 中国区域基础教育资源配置的均等化研究,G521
- 高校科技创新能力与区域经济发展实证研究,G644
- 中国区域性网上社区的舆情研究,G206
- 井下机车区域定位检测系统的设计,TD524.3
- 区域性切除术治疗腮腺浅叶良性肿瘤的回顾性研究,R739.8
- 姬塬油田长6油藏储层评价及开发技术政策研究,P618.13
- 主体功能区管理环境法问题研究,D922.68
- 1979~2006年江苏省棉花品种主要性状遗传改良进展研究,S562
- 日本区域环境外交研究,X321
- 青岛市工业大气污染防治制度研究,X51
中图分类: > 医药、卫生 > 预防医学、卫生学 > 保健组织与事业(卫生事业管理) > 卫生调查与统计 > 卫生统计学
© 2012 www.xueweilunwen.com
|