学位论文 > 优秀研究生学位论文题录展示
基于粗糙集与支持向量机的票房预测研究
作 者: 赵伟
导 师: 仲崇权
学 校: 大连理工大学
专 业: 控制理论与控制工程
关键词: 粗糙集 支持向量机 数据分类 属性重要度 票房预测
分类号: TP18
类 型: 硕士论文
年 份: 2009年
下 载: 392次
引 用: 1次
阅 读: 论文下载
内容摘要
票房预测在最近几年中已经成为西方电影研究的一个热点。在这些数量众多的研究成果中,鉴于目前中国电影产业研究的简单与粗放的不利局面,我们可以感受到中国电影在产业化转型过程中亟需相应产业理论的引领与支持。如何以一种更科学的态度进行电影产业研究?如何使票房预测真正成为电影产业分析与预测的有力工具?这些都是深化中国电影产业研究所要认真面对的问题。当代电影票房预测研究始于20世纪80年代,综合了电影学、传播学、经济学与管理学等诸多学科的研究方法,通过对影响电影票房成功的相关因素(如创意质量、发行能力、营销能力等方面)进行实证分析,建立电影票房的预测模型,实现对电影票房的成功预测。支持向量机是九十年代中期发展起来的基于统计学习原理的一种高效的分类识别方法,它较好地解决了小样本,非线性和局部极小等问题,成功地应用到模式识别、信号处理、数据挖掘等许多领域,成为国内外机器学习领域研究的一个热点。但当它所处理的数据量较大时,会导致处理速度慢、训练时间过长等缺点,影响分类性能。为此引入粗糙集的方法,粗糙集理论是一种分析不完整、不精确、不一致信息的数据分析理论。它不需要提供问题所需处理的数据集合之外的任何先验知识,可在保持分类能力不变的前提下,通过属性约简,处理大容量高维信息数据,提高效率。本文结合粗糙集数据处理功能和支持向量机分类机理,设计了基于粗糙集的支持向量机分类器,此分类器以粗糙集为前端处理器,通过属性约简来优化输入变量,借以提高分类器的性能。然后,针对国内电影票房预测缺乏科学理论指导的问题,将该分类器用于票房预测,以影响影片票房高低的因素为输入变量,以票房收入高低类别为输出变量,进行数据预处理和训练测试。结果证明,该分类器有效地解决了票房预测问题,其结果优于Ramesh S.和Dursun D.所采用的多层感知器预测方法,且预测误差低于10%,满足了行业要求,显示出强大的分类能力。
|
全文目录
摘要 4-5 Abstract 5-9 1 绪论 9-13 1.1 选题背景和研究意义 9-10 1.2 票房预测研究现状 10-11 1.3 研究目的和组织结构 11-13 2 改进的粗糙集属性约简算法研究 13-29 2.1 数据挖掘概述 13-15 2.1.1 数据挖掘基本概念 13-14 2.1.2 数据挖掘的主要算法 14-15 2.1.3 数据挖掘的处理过程 15 2.2 粗糙集理论基本概念 15-23 2.2.1 知识与信息系统 16-17 2.2.2 不可分辨关系与上下近似集 17-19 2.2.3 决策表 19-20 2.2.4 属性约简与核 20-22 2.2.5 属性的依赖性与重要度 22-23 2.4 改进的基于属性重要度的粗糙集属性约简算法 23-28 2.4.1 连续属性值的离散化 23-26 2.4.2 基于属性重要度的改进启发式约简算法 26-28 2.5 本章小结 28-29 3 支持向量机 29-36 3.1 机器学习 29-31 3.1.1 机器学习问题的一般表述 29-30 3.1.2 经验风险最小化 30-31 3.2 统计学习理论的基本概念 31-33 3.2.1 VC维 31 3.2.2 推广性的界 31-32 3.2.3 结构风险最小化 32-33 3.3 支持向量机用于分类 33-35 3.3.1 线性可分支持向量机 33-34 3.3.2 线性不可分支持向量机 34 3.3.3 非线性支持向量机 34-35 3.4 本章小结 35-36 4 基于粗糙集和支持向量机的票房预测模型 36-53 4.1 票房预测模型的设计 36-38 4.2 模型设计关键步骤的实现 38-50 4.2.1 数据预处理 38-39 4.2.2 变量的选择与规范化处理 39-47 4.2.3 建立决策表 47-48 4.2.4 权值离散化 48 4.2.5 决策表属性约简 48-50 4.3 票房预测结果及性能分析 50-52 4.4 本章小结 52-53 结论 53-55 参考文献 55-57 攻读硕士学位期间发表学术论文情况 57-58 致谢 58-59
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于连锁图的QTL综合分析方法研究,S562
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于粗糙集的城市区域交通绿时控制系统研究,TP18
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 粗糙集的增量式属性约简研究,TP18
- 知识粒度的计算及其在属性约简中的应用研究,TP18
- 基于粗糙集和模糊SVM的车牌识别技术研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|