学位论文 > 优秀研究生学位论文题录展示

复杂抽样小区域估计量的应用分析

作 者: 刘建华
导 师: 金水高
学 校: 中国疾病预防控制中心
专 业: 流行病与卫生统计学
关键词: 复杂抽样 扩展估计量 综合估计量 复合估计量 SSD估计量 HB估计量 小区域
分类号: R195.1
类 型: 博士论文
年 份: 2008年
下 载: 82次
引 用: 1次
阅 读: 论文下载
 

内容摘要


目的引入一些基于设计和基于模型的小区域估计量;并通过一项精心设计的模拟研究和我国2006年全国人群乙型肝炎血清流行病学调查(NHBSS)数据的实例分析,比较分类数据不同类型小区域估计量的估计效率;以便为今后有效分析类似的复杂抽样小区域数据提供方法学参考。方法文献复习和综述基于设计和基于模型的一些重要小区域估计量。由于NHBSS能利用的辅助信息是按年龄-性别事后分层的总人口数,确定基于设计的间接估计量包括事后分层计数-综合估计量、复合估计量和样本大小依赖(SSD)估计量。研究变量为二分类变量,故基于模型的间接估计量选择等级贝叶斯(HB)估计量。扩展估计量作为基于设计的无偏估计量。基于NHBSS调查进行Monte Carlo模拟试验,重复抽样R=500。以平均绝对相对偏倚(AARB)度量偏倚,平均相对均方误(ARMSE)度量精度,分析比较5种不同类型估计量的估计效率。NHBSS数据实例分析中以相对偏倚(RB),相对标准误(RSE)和相对均方误平方根(RRMSE)评价5种估计量的可靠性。结果模拟研究中,1~59岁年龄组,无论HBsAg或抗-HBs,HB估计量偏倚最大,但估计精度最高。扩展估计量、综合估计量以及复合估计量和SSD估计量的偏倚和精度差异较小。相对于HB估计量而言,这些估计量偏倚较小,估计精度相对较低。总体而言,复合估计量估计效率最好。另外,待估计参数越小,5种估计量偏倚越大,估计精度也越低。除1~4岁年龄组HBsAg流行率HB估计量的ARMSE最大外,其余HB估计量的ARMSE最小。与1~59岁年龄组结果一致,1~4岁,5~14岁和15~59岁年龄组HB估计量偏倚最大。抗-HBs扩展估计量、综合估计量以及复合估计量和SSD估计量的偏倚和精度差异甚微。各年龄组HBsAg复合估计量的ARMSE仅次于HB估计量。总体而言,复合估计量估计效率最高。另外,估计量的偏倚和精度大小与年龄组期望样本和待估计参数大小有关。期望样本和参数越小,估计量偏倚越大,估计精度也越低。抗-HBs中,15~59岁年龄组各估计量偏倚最小,估计精度最高;5~14岁年龄组各估计量偏倚最大,估计精度最低。NHBSS数据实例分析中,无论HBsAg或抗-HBs,各年龄组复合估计量平均均方误平方根(Av.RRMSE)最小,说明复合估计量的可靠性最好。其次为SSD估计量,再其次为综合估计量。1~4岁和5~14岁HBsAg流行率HB估计量以及1~4岁抗-HBs流行率HB估计量的Av.RRMSE小于扩展估计量的Av.RRMSE,说明样本较小或估计参数较小时,HB估计量的可靠性优于扩展估计量。在此情形下,扩展估计量的可靠性最低,如1~4岁和5~14岁HBsAg流行率扩展估计量的Av.RRMSE分别高达56.69%和40.46%。结论本次研究结果虽不能促使小区域估计研究方法有所突破,但有助于进一步深入分析或二次分析大规模调查数据。使用按年龄-性别事后分层总人口数辅助信息时,就NHBSS调查数据而言,复合估计量估计效率最高,其次为SSD估计量。HB估计量的结果不能令人满意,说明所使用模型并不完备。后续研究需要在模型中加入更多的参数或效应,以改进模型的估计,降低估计量的MSE。小区域期望样本较小且待估计参数较小时,扩展估计量估计精度最低,应尽量避免使用;但小区域待估计参数较大或者区域样本大小适中或较大时,可直接选用扩展估计量。

全文目录


缩略词表  6-8
中文摘要  8-10
英文摘要  10-13
1 前言  13-20
  1.1 研究背景  13-17
  1.2 研究目的和内容  17-18
  1.3 研究方法和技术路线  18-20
2 基于设计的直接估计量  20-26
  2.1 基于设计方法  20-21
  2.2 扩展估计量  21-22
  2.3 广义回归估计量  22-24
  2.4 校正直接估计量  24-26
3 基于设计的间接估计量  26-35
  3.1 综合估计量  26-30
  3.2 复合估计量  30-32
  3.3 JAMES-STEIN估计量  32-35
4 基于模型的间接估计量  35-40
  4.1 小区域模型  35-36
  4.2 经验最优线性无偏预测估计量  36-37
  4.3 经验贝叶斯估计量  37-38
  4.4 等级贝叶斯估计量  38-40
5 模拟研究  40-53
  5.1 NHBSS调查描述  40-41
  5.2 模拟试验设计  41-44
  5.3 估计量的偏倚,方差及均方误  44-45
  5.4 结果  45-53
6 实例分析  53-72
  6.1 数据分析描述  53
  6.2 估计结果  53-72
7 讨论  72-76
  7.1 小区域估计量的估计效率  72-73
  7.2 基于设计和基于模型方法  73-74
  7.3 小区域估计的设计和应用分析  74-76
8 结论  76-77
参考文献  77-81
综述  81-89
  参考文献  87-89
附录  89-90
致谢  90

相似论文

  1. 云南普通高等教育区域均衡发展研究,G649.2
  2. 基于多示例学习的用户关注概念区域发现,TP391.41
  3. 家庭清扫机器人路径覆盖系统的设计与实现,TP242
  4. 湛江市对虾产业区域品牌建设研究,F326.4
  5. 中山市区域性推进班主任专业发展的实践与探索,G451.1
  6. 幼儿混龄区域活动管理研究,G617
  7. 中国碳排放水平的区域差异及影响因素分析,X502
  8. 中国区域行政合作的非均衡演进研究,D630
  9. 中国政府惠农政策实证研究,D422.6
  10. 环境脆弱区工业主导产业选择及区域布局研究,X321
  11. 曲靖烟区气候因素的数量特征及区域划分,S572
  12. 中国区域基础教育资源配置的均等化研究,G521
  13. 高校科技创新能力与区域经济发展实证研究,G644
  14. 中国区域性网上社区的舆情研究,G206
  15. 井下机车区域定位检测系统的设计,TD524.3
  16. 区域性切除术治疗腮腺浅叶良性肿瘤的回顾性研究,R739.8
  17. 姬塬油田长6油藏储层评价及开发技术政策研究,P618.13
  18. 主体功能区管理环境法问题研究,D922.68
  19. 1979~2006年江苏省棉花品种主要性状遗传改良进展研究,S562
  20. 日本区域环境外交研究,X321
  21. 青岛市工业大气污染防治制度研究,X51

中图分类: > 医药、卫生 > 预防医学、卫生学 > 保健组织与事业(卫生事业管理) > 卫生调查与统计 > 卫生统计学
© 2012 www.xueweilunwen.com