学位论文 > 优秀研究生学位论文题录展示

时间序列关联规则在IT上市企业股价趋势分析中的应用研究

作 者: 卢锦
导 师: 甘岚;卢春
学 校: 华东交通大学
专 业: 计算机技术
关键词: 数据挖掘 关联规则 时间序列 IT企业 股价趋势
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 121次
引 用: 0次
阅 读: 论文下载
 

内容摘要


关联规则数据挖掘领域中一个非常重要的研究课题,其本质是揭示出隐藏在大量数据中的对象之间的依赖关系,根据这种依赖关系可以从某一对象的信息来推断相关对象的信息。股票时间序列数据如能运用数据挖掘技术对其进行探索性挖掘出潜在的有价值的模式,在理论研究和实践指导上都具有重要的意义。首先对数据挖掘中的关联规则挖掘算法做了分析,然后着重开展了如下两个方面工作:①将时间序列变换到离散(符号)的事务数据后,利用传统经典Apriori算法,对IT股票间连动规则进行关联规则建模,同时详细阐述了模型设计思想和算法的实现。②利用时间序列相似性搜索方法,查找出与选定股票走势相似的历史股票数据。对时间序列进行平滑规范化处理后,使用欧几里德距离进行聚类,找到频繁时间序列片段,并用时间序列片段模式匹配方法,对频繁时间序列片段进行关联规则分析,直接从数据中学习频繁发生的模式,并用此模式来进行趋势预测。基于以上工作,应用原型系统,以沪深A股中IT板块102个股票2007年3月至2009年7月股票收盘价格作为测试集,对IT股价时间序列中频繁片段模式的关联规则进行挖掘预测,在得到的结果中,发现匹配结果相同的字符串所对应的历史数据具有很大程度的相似性,验证了未来的股市变化将是以往某一阶段历史的重现,论证了该方法简单可行,而且是有效的,比传统关联规则算法更适合股票预测,并且对于一些具有延时性的序列能够得出良好的效果。对挖掘原型系统进行设计,并实现了相应的挖掘算法。

全文目录


摘要  4-5
ABSTRACT  5-8
第一章 绪论  8-12
  1.1 研究背景与意义  8-9
  1.2 时间序列数据挖掘的研究现状  9-10
  1.3 本文研究内容  10
  1.4 本文结构  10-12
第二章 数据挖掘理论与关联规则挖掘技术  12-20
  2.1 数据挖掘基本概念  12-14
    2.1.1 数据挖掘处理过程、模式  12-13
    2.1.2 数据挖掘常用分析方法  13-14
    2.1.3 数据挖掘与传统数据分析方法的区别  14
    2.1.4 数据挖掘应用  14
  2.2 关联规则挖掘  14-19
    2.2.1 关联规则简介  14-15
    2.2.2 时间序列关联分析  15-16
    2.2.3 关联规则的基本概念  16-17
    2.2.4 经典Apriori 算法分析  17-19
  2.3 本章小结  19-20
第三章 股市预测理论与技术  20-24
  3.1 股市预测方法  20
  3.2 数据挖掘技术在股票预测领域的适用性  20-21
  3.3 适用于股票预测分析的处理模型  21-22
  3.4 股票预测研究中常用的相关变量  22-23
  3.5 本章小结  23-24
第四章 IT上市公司股价时间序列分析  24-44
  4.1 对股票数据作关联分析  24-32
    4.1.1 数据预处理  24-26
    4.1.2 产生N-项频繁项集 Ln  26-29
    4.1.3 关联规则挖掘的有效性检验  29-30
    4.1.4 实验结果与分析  30-32
  4.2 时间序列相似序列片段的关联规则分析  32-42
    4.2.1 相似性查找基本问题  33-35
    4.2.2 Euclidean 距离相似性度量  35-37
    4.2.3 创建频繁序列模式模板  37-39
    4.2.4 频繁时间序列片段的关联规则分析  39-40
    4.2.5 实验结果与分析  40-42
  4.3 本章小结  42-44
第五章 原型系统的设计与实现  44-62
  5.1 系统需求分析  44
  5.2 原型系统体系结构设计  44-46
  5.3 股票时间序列关联规则分析实现  46-51
    5.3.1 数据预处理  46-47
    5.3.2 Apriori 算法挖掘模型  47
    5.3.3 数据库设计  47-48
    5.3.4 挖掘服务器中关联规则算法引擎及实现  48-51
  5.4 相似序列片段关联挖掘具体实现  51-60
    5.4.1 相似序列片段关联挖掘模型  52-53
    5.4.2 数据预处理  53
    5.4.3 数据库设计  53-54
    5.4.4 时间序列频繁片断模式  54-58
    5.4.5 相似度频繁模式关联分析  58
    5.4.6 用户界面  58-60
  5.5 本章小结  60-62
第六章 总结  62-63
参考文献  63-65
附录 原型系统部分源程序  65-75
个人简历 在读期间发表的学术论文  75-76
致谢  76

相似论文

  1. 异构环境下企业互操作技术及在物资供应链系统中的应用,TP311.52
  2. 基于利益相关者理论的绿色供应链管理研究,F274
  3. 肇庆供电局员工绩效考核结果应用研究,F272.92
  4. XD软体家具公司经营战略研究,F272
  5. 新企业会计准则下财务报告变革的研究,F233
  6. 创新型化工企业的持续创新重大风险分析与应对措施研究,F426.7
  7. 基于数据挖掘技术的保健品营销研究,F426.72
  8. SCXC公司企业文化构建研究,F270
  9. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  10. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  11. 公务员人事管理制度仿企业化研究,D630
  12. 织里童装产业集聚发展研究,F426.86
  13. 云南少数民族地区企业思想政治教育研究,D64
  14. 大连消防安全重点问题研究,D631.6
  15. 创新型生物制药企业的持续创新重大风险动态分析和应对措施研究,F273.1
  16. 医药类上市公司债务融资结构对企业绩效影响的研究,F275
  17. 服装企业营销风险指标体系研究,F426.86
  18. 上市建筑企业资本结构与企业价值关系研究,F426.92
  19. 我国企业档案管理体制的发展与演变,G275.9
  20. YSZY集团企业文化建设研究,F270
  21. 我国体育运动服装企业营销战略研究,F274

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com