学位论文 > 优秀研究生学位论文题录展示

基于信息衰减由时空数据挖掘驱动的预测Agent学习

作 者: MUKWENDE PLACIDE(穆昆)
导 师: 余腊生
学 校: 中南大学
专 业: 计算机应用技术
关键词: 人工智能 Agent 数据挖掘 时空数据 学习 信息衰减 遗忘
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 58次
引 用: 0次
阅 读: 论文下载
 

内容摘要


人工智能(AI)是目前在计算机科学界最令人感兴趣的研究领域之一,它既可以帮助研究者更好的理解人的大脑的决策过程,同时也可以增加组织对决策制定的参与过程。AI的核心是它包含很多智能计算体,简称为智能体,这些智能体以建立可以适应环境和能够从经验中学习的系统为目标。这个目标吸引了很多来自不同学科的研究人员,从而导致当今很多正在改变工业和科学领域的学习方法的产生。这些学习方法已被证明在很多的应用领域都有巨大的实用价值,尤其是在数据挖掘领域,这是人工智能学习方法在从包含有用隐含规律性知识的大型数据库中自动发现并提取有用知识的一个应用。这些方法,也被称为机器学习方法,被认为是结构描述的产物,是从过去的数据中得到的一个模型。这个模型可以用作智能体的知识表示,具备预测、解释及理解等功能。最具预测性的Agent学习方法是基于这样一个假设的,即建设和验证一个模型的相关历史数据是对未来将要发生的事情的最佳估计。然而,从过去到未来的相关性取决于在特定时间内的应用领域。这些静态数据的处理是基于这些学习方法从人类的学习方法抽象成Agent的学习方法的这样一个事实,但是它却忽略了人类的遗忘因子,人类学习之后很可能会忘记学过的知识。因此,必须将遗忘因子整合到现有的Agent学习方法中以接近人类大脑的决策制定过程及提高Agent的学习性能。数据挖掘极大的促进了对时空数据的学习及对其他研究的信任,把数据挖掘整合到Agent系统中大大提高了预测Agent的学习技能,并协助Agent对未来因子或未来事件的预测。我们致力于开发一种新的学习方法,它可以用在数据挖掘中以创建一种知识表示模型用于学习Agent并协助之象人类那样预测未来。我们称之为信息衰变的新技术,正是对人类遗忘因子的抽象。基于信息衰变的学习方法反映了人类是如何通过时间的衰变来预测未来的,以学习过程中积累的信息量来模拟人类遗忘的行为。从最近的数据(数据表示一个因子或一个事件)得到的信息比从较旧的数据(数据表示很久以前的一个因子或一个事件,比如十年之前)得到的信息更有利于对未来的预测。为了揭示信息衰减学习方法的真相,而不仅是理解其背后的理论概念,我们使用数据挖掘试验并提供实际的试验结果。目前已经存在很多数据挖掘的分支领域,我们倾向于使用时空数据挖掘来处理从时空数据库来提取知识,这是由其对信息衰减的计算时间所决定的。本文介绍了一个多Agent系统的体系结构,为了实现遗忘因子的抽象。此体系结构揭示了Agent技术和数据挖掘技术是怎样整合到一个系统中的,作为一个使用信息衰减从大型数据库中发现知识以提高Agent的学习技能的视图。为了给此假设提供充足的证据,使用ID3决策树学习算法来实现信息衰减,利用从Oracle数据库收集到的940个样例数据集来进行测试。两种预测学习Agent的知识表示模型为:一种情况忽略信息数据的衰减特性,另一种情况则考虑信息衰减情况。准确性,Fl-测量和接受者操作特性曲线是衡量Agent学习性能的重要因素。这种概念的相关性是通过比较预测Agent在不同的时间利用以上两种模型在不可见的数据子集上作出决策的学习性能来证明的。

全文目录


Abstract  5-7
摘要  7-9
Dedication  9-12
List of Tables  12-13
List of Figures  13-14
Chapter 1 Introduction  14-21
  1.1 Predictive Learning Overview  14-15
  1.2 Motivation  15-16
  1.3 Research Aim  16-17
  1.4 Contributions  17-19
  1.5 Thesis' Organization  19-21
Chapter 2 Background and Related Works  21-37
  2.1 Predictive Agent Learning  21-26
    2.1.1 Definition of an Agent  21-23
    2.1.2 Definition of Learning  23-26
  2.2 The Junction of Agent Learning and Data Mining  26-28
  2.3 Data Mining  28-31
    2.3.1 Introduction to Data Mining and Temporal databases  28-30
    2.3.2 Challenges of existing predictive data mining leaning techniques  30-31
  2.4 Information Decay  31-35
    2.4.1 Wang, Chen and Yao Theory of Information Decay  32
    2.4.2 Learning Through Forgetting and Pruning  32-33
    2.4.3 Forward Decay  33-35
    2.4.4 Other Discussions on Information Decay  35
  2.5 Summary  35-37
Chapter 3 Information Decay-Based Learning  37-58
  3.1 Comparison between Human Learning and Agent Learning  38-42
    3.1.1 Human's Predictive Learning  38-41
    3.1.2 Software Agent's Learning  41-42
  3.2 Learning Agent Design Choices  42-50
    3.2.1 Choice of training experience  43-45
    3.2.2 Choice of Task and Model Building Algorithm  45-47
    3.2.3 Choice of Performance Measurements  47-50
  3.3 Information Decay-Based Decision Tree Learning  50-56
  3.4 Summary  56-58
Chapter 4 Predictive Agent Learning System Design and Implementation  58-77
  4.1 Agent and Data Mining Technology Integration  58-61
  4.2 System Design  61-73
    4.2.1 System Architecture  61-63
    4.2.2 Agent types  63-65
    4.2.3 Choice of design language  65-66
    4.2.4 System Design Diagrams  66-73
  4.3 System Implementation  73-76
    4.3.1 Agent Infrastructure and Programming language  73-74
    4.3.2 Java Data Mining (JDM)  74-75
    4.3.3 Predictive Model Markup Language (PMML)  75-76
  4.4 Summary  76-77
Chapter 5 Experiment and Results  77-87
  5.1 Problem Understanding  77-78
  5.2 Data Preparation  78-81
  5.3 Knowledge Representation Models Building and Testing  81-83
  5.4 Best Models Selection and Comparison  83
  5.5 Result Discussion  83-85
  5.6 Summary  85-87
Chapter 6 Conclusion and Future Work  87-89
References  89-94
Acknowledgements  94-95
Publications  95

相似论文

  1. 基于多Agent理论的卫星协同定轨技术研究,V474
  2. 基于流形学习的高维流场数据分类研究,V231.3
  3. 英语课堂形成性评估与学生学习态度研究,H319.3
  4. 非智力因素对小凉山地区中学生化学学习的影响,H319
  5. 任务型教学在农村初中英语教学中的应用研究,H319
  6. 中职学生数学学习中的非智力因素研究,G633.6
  7. 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
  8. Q学习在基于内容图像检索技术中的应用,TP391.41
  9. 基于多示例学习的用户关注概念区域发现,TP391.41
  10. 唇读中的特征提取、选择与融合,TP391.41
  11. 多样性密度学习算法的研究与应用,TP181
  12. 美国“写作教室”理论与实践初探,G633.3
  13. 建构主义学习理论指导下的科教电视节目编导策略研究,G222.3
  14. 初中语文小组合作教学探究,G633.3
  15. 高中生物教学中培养学生自主学习能力的尝试,G633.91
  16. 对农村初级中学学生数学学习兴趣的调查与研究,G633.6
  17. 高中男、女生英语词汇学习策略差异及对其英语词汇学习的影响,G633.41
  18. 提高初中生学习化学兴趣的研究,G633.8
  19. 探析初中语文教学文本自主学习能力的培养,G633.3
  20. 广州市高中生物教学中有效学习现状及对策研究,G633.91
  21. 高一学生学习地理困难研究,G633.55

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com