学位论文 > 优秀研究生学位论文题录展示

基于信息论的时间序列聚类算法研究及应用

作 者: 张艳昌
导 师: 郭崇慧
学 校: 大连理工大学
专 业: 管理科学与工程
关键词: 时间序列聚类 信息论 时间序列相似性度量 模糊聚类 指数优化复制
分类号: F224
类 型: 硕士论文
年 份: 2011年
下 载: 148次
引 用: 0次
阅 读: 论文下载
 

内容摘要


时间序列是一种重要的高维数据类型,广泛存在于自然界、工程技术、科学观测以及经济管理等领域。对时间序列进行聚类分析在现实中有着很重要的意义。本文从信息论的角度来考虑时间序列聚类问题。一方面将信息离散度函数(FDOD)应用到时间序列的相似性度量中;另一方面运用率失真理论来建立模糊聚类模型。最后将本文提出的时间序列聚类算法应用到指数优化复制研究中,实验结果表明本文的方法有较好的实用价值。本文的主要研究工作如下:(1)时间序列相似性度量是时间序列聚类的基础,本文采用信息离散度函数来度量时间序列的相似性,提出了基于信息离散度函数(FDOD)的时间序列相似性度量方法。数值实验结果表明,与经典的时间序列相似性度量方法相比,本文的方法能处理不等长时间序列的相似性,有较低的时间复杂度,同时还可以度量多变量时间序列的相似性。(2)运用率失真理论建立了模糊聚类模型,与经典的模糊聚类模型相比,模型的目标函数中多了一个描述聚类过程复杂度的指标。同时为了估计聚类数目,还提出了一个新的聚类有效性指标。通过求解优化模型得到基于率失真理论的模糊聚类算法。将本文的方法与经典的模糊C均值算法进行了数值实验比较。结果表明本文提出的聚类算法能自动确定聚类数目,有较少的运行时间,且最终的模糊划分矩阵有较少的模糊性,因而聚类结果更加明确可靠。(3)将本文提出时间序列相似性度量方法和模糊聚类算法相结合得到基于FDOD的FC-RD时间序列聚类算法,并将其应用到指数优化复制研究中。指数优化复制的关键在于构建与标的指数价格波动一致的投资组合。本文首先利用基于FDOD的FC-RD时间序列聚类算法对沪深300指数对应的成分股进行聚类;其次通过优化的方法确定跟踪组合中各样本股票的权重。最后通过实际跟踪沪深300指数发现,基于时间序列聚类的优化策略有较小的跟踪误差,进而能提高指数跟踪的效果。

全文目录


摘要  4-5
Abstract  5-9
1 绪论  9-17
  1.1 研究背景与意义  9-10
  1.2 研究现状与存在的问题  10-15
    1.2.1 国内外研究现状  10-14
    1.2.2 存在的问题  14-15
  1.3 本文的研究内容  15-17
2 基于信息离散度函数的时间序列相似性度量方法  17-30
  2.1 信息离散度函数简介  17-20
    2.1.1 FDOD函数的定义  17-18
    2.1.2 FDOD函数的性质  18-20
  2.2 时间序列相似性度量的一般方法  20-24
    2.2.1 影响序列相似性度量的因素  20-22
    2.2.2 相似性度量的主要方法  22-24
  2.3 基于FDOD的时间序列相似性度量方法  24-26
    2.3.1 单变量时间序列相似性度量  24-25
    2.3.2 多变量时间序列相似性度量  25-26
  2.4 数值实验  26-29
    2.4.1 人工数据  26-27
    2.4.2 股票数据  27-29
  2.5 本章小结  29-30
3 基于率失真理论的模糊聚类分析  30-45
  3.1 率失真理论简介  30-33
    3.1.1 失真测度  30-32
    3.1.2 率失真函数的定义  32
    3.1.3 率失真函数的性质  32-33
  3.2 基于目标函数的模糊聚类分析  33-35
    3.2.1 聚类目标函数  33-34
    3.2.2 模糊C均值算法  34-35
  3.3 基于率失真理论的模糊聚类模型与算法  35-39
    3.3.1 聚类模型的建立  35-37
    3.3.2 模型的求解  37-38
    3.3.3 FC-RD算法设计  38-39
  3.4 数值实验  39-44
    3.4.1 实验数据及环境  39
    3.4.2 参数T的讨论  39-40
    3.4.3 FC-RD算法与FCM算法的比较  40-44
  3.5 本章小结  44-45
4 基于FDOD的FC-RD时间序列聚类算法应用于指数优化复制  45-50
  4.1 背景介绍  45-46
  4.2 基于FDOD的FC-RD时间序列聚类算法  46
  4.3 指数跟踪模型  46-47
  4.4 实证分析  47-49
    4.4.1 实验数据及环境  47
    4.4.2 聚类指标的选取  47
    4.4.3 实验结果及分析  47-49
  4.5 本章小结  49-50
结论  50-51
参考文献  51-54
攻读硕士学位期间发表学术论文情况  54-55
致谢  55-56

相似论文

  1. 土壤环境功能区划研究,X321
  2. 趋向自然:唯信息论世界观下的生态工业系统演化,X321
  3. 演化聚类算法及其应用研究,TP311.13
  4. 电力系统电压无功控制方法研究,TM761.1
  5. 停车诱导在智能移动终端上的设计与实现,TN929.53
  6. 通讯约束下量化估计系统的设计与分析,TP273
  7. 基于物流港口企业业务流程战略转型的岗位优化设置研究,F259.27;F224
  8. 基于粗糙集理论的图像分割研究,TP391.41
  9. 分布式企业协同分销系统研究及应用,F224
  10. 长大客运专线客运量调查与预测研究,F224;U293.13
  11. 基于支持向量机的能源管理系统短期负荷预测,TM715
  12. 基于质量检验原理的CAPP技术的应用研究,TP391.7
  13. 辣椒制品表观辣度的模糊评价方法的研究,S641.3
  14. 基于WEB日志挖掘的用户兴趣模式研究,TP393.092
  15. 视频镜头边界检测算法的研究,TP391.41
  16. 基于马尔科夫随机场D-S证据理论对人脑图像的分割研究,TP391.41
  17. 基于马尔科夫随机场和模糊聚类的脑部图像D-S分割,TP391.41
  18. 腹部CT图像的三维重构与手术规划,TP391.41
  19. 数据挖掘在计算机辅助诊断中的应用研究,TP311.13
  20. 基于WLC理论的项目投资控制方法研究,F284
  21. 模糊聚类中若干问题的研究,O235

中图分类: > 经济 > 经济计划与管理 > 经济计算、经济数学方法 > 经济数学方法
© 2012 www.xueweilunwen.com