学位论文 > 优秀研究生学位论文题录展示
基于随机森林的制造业上市公司财务预警模型研究
作 者: 黄衍
导 师: 查伟雄
学 校: 华东交通大学
专 业: 统计学
关键词: 财务预警 随机森林 指标筛选 异常样本诊断 投票阈值
分类号: F275
类 型: 硕士论文
年 份: 2013年
下 载: 11次
引 用: 0次
阅 读: 论文下载
内容摘要
随着市场竞争的日趋激烈,公司出现财务危机的风险也逐渐加大。对于公司的经营者、投资者、债权人等利益相关者来说,能否有效地预测财务危机是他们最为关注的问题之一。财务危机预警已有八十多年的历史,大致经历了统计分析和数据挖掘两个阶段。近年来,基于人工智能的支持向量机和人工神经网络在财务预警领域得到了广泛的应用,有效地提高了预警效率。但由于财务预警问题的不平衡性,以及数据噪声和分布的复杂性等问题,使得这些方法难以达到令人满意的结果。此外,这些方法对模型的解释能力不足,使模型的可信度大大降低。鉴于此,本文引入一种组合分类算法——随机森林,该算法具有较好的噪声鲁棒性和泛化能力,且能很好地处理不平衡分类问题;同时该算法计算变量重要性的功能和提供的偏相关函数对于模型的理解有一定的帮助。本文首先回顾并总结了前人的研究成果,接着详细介绍了随机森林算法的原理和它的应用及研究现状。在此基础上本文按照数据挖掘项目流程对制造业上市公司的财务预警问题进行研究,大致分为数据准备和模型构建与评估两个阶段。在数据准备阶段讨论了样本和指标的选取原则,通过描述性的统计分析探索数据的分布,并对指标异常值进行了归约;接着利用随机森林产生的相似度矩阵诊断数据中的异常样本并予以剔除,然后利用随机森林对每个指标进行重要性评估,筛选出对财务预警模型贡献最大的指标组合,并将该组合与传统指标筛选方法得到的指标组合进行比较,实验证明随机森林筛选出来的最优指标组合更有利于模型性能的提高。在模型构建与评估阶段,首先介绍了随机森林两大参数的优选方法,接着就随机森林的容噪性进行了数据实验,结果证明了其良好的噪声鲁棒性;然后针对财务预警问题的不平衡性,介绍了基于数据层面的过采样和欠采样方法与基于算法层面的平衡随机森林和投票阈值调整随机森林,实验比较表明基于投票阈值调整的随机森林表现最优;接着引入误判成本函数,比较了随机森林、支持向量机、BP神经网络三类模型的性能,实验结果表明随机森林的误判成本最低;最后利用偏相关函数对基于随机森林的制造业上市公司财务预警模型进行解释,并给出一个危机预警区间,为企业的利益相关者提供参考。
|
全文目录
摘要 3-4 ABSTRACT 4-6 目录 6-8 第一章 绪论 8-16 1.1 研究背景 8-9 1.2 研究目的及意义 9 1.3 财务预警模型研究现状 9-13 1.3.1 统计分析类 9-12 1.3.2 数据挖掘类 12-13 1.4 研究内容及结构安排 13-14 1.5 可能的创新点 14-16 第二章 随机森林算法介绍 16-26 2.1 分类回归树 16-19 2.1.1 决策树的生长 17-18 2.1.2 决策树的剪枝 18-19 2.2 Bagging 方法 19-20 2.3 随机森林 20-26 2.3.1 随机森林的定义 20 2.3.2 随机森林的泛化误差 20-22 2.3.3 随机森林的 OOB 估计 22 2.3.4 随机森林的优点及其特殊功能 22-24 2.3.5 随机森林研究及应用现状 24-26 第三章 样本及指标的确定 26-43 3.1 数据收集 26-29 3.1.1 样本的初步选取 26-27 3.1.2 指标的初步选取 27-29 3.2 数据探索 29-33 3.2.1 指标分布探索 30-32 3.2.2 均值比较及异常值诊断 32-33 3.3 异常样本诊断 33-35 3.4 指标筛选 35-42 3.4.1 基于 AUC 的随机森林指标筛选原理 35-36 3.4.2 AUC-RF 指标筛选 36-38 3.4.3 显著性和相关性指标筛选 38-42 3.4.4 指标组合性能比较 42 3.5 本章小结 42-43 第四章 财务预警模型的构建与评价 43-54 4.1 随机森林参数优选 43-45 4.1.1 ntree 优选 43-44 4.1.2 mtry 优选 44-45 4.2 随机森林的噪声鲁棒性 45-46 4.3 不平衡问题的处理 46-49 4.3.1 不平衡问题的处理方法 47-48 4.3.2 实验比较 48-49 4.4 财务预警模型的评价 49-51 4.5 财务预警模型的解释 51-53 4.5.1 偏相关函数和预警区间 51-53 4.5.2 财务预警模型应用举例 53 4.6 本章小结 53-54 第五章 总结 54-55 参考文献 55-58 附录A R 软件介绍与相关程序 58-62 附录B 样本企业 62-64 附录C 相关图表 64-68 个人简历 在读期间发表的学术论文 68-69 致谢 69
|
相似论文
- 基于随机森林的植物抗性基因识别方法研究,Q943
- 我国企业财务预警系统研究,F275
- 基于Z-SCORE模型的中国上市公司财务预警研究,F224
- 高校贷款风险及其控制研究,G647.5
- 基于深度图像学习的人体部位识别,TP391.41
- 基于Z-Score模型的通信运营商财务风险管理研究,F626.115
- 基于局部特征的结构模型学习及其在目标检测与定位中的应用,TP391.41
- 基于稀疏编码与机器学习的图像内容识别算法研究,TP391.41
- 随机森林特征选择,TP311.13
- 因子分析模型在上市公司财务预警中的应用,F224
- 我国煤炭行业上市公司财务绩效评价研究,F406.72
- 基于随机森林的外显子剪接增强子识别,Q78
- 基于有监督奇异值分解和类随机森林决策方法的肿瘤特征基因筛选研究,R730.4
- 西瓜抗旱性鉴定指标与方法研究,S651
- 智能分类算法及其在蛋白质相互作用预测中的应用研究,Q51
- 高科技产业上市公司财务困境预警研究,F275
- 上市公司财务预警实证研究,F275
- 基于机器学习的蛋白质折叠预测算法研究,TP181
- 电镀行业清洁生产评价体系研究与应用,TQ153
- 基于企业现金流量的财务预警指标体系研究,F275.3
- 油气田企业财务预警管理研究,F426.22
中图分类: > 经济 > 经济计划与管理 > 企业经济 > 企业财务管理
© 2012 www.xueweilunwen.com
|