学位论文 > 优秀研究生学位论文题录展示

基于向量空间模型的方面挖掘方法研究

作 者: 周凤玲
导 师: 曲立平
学 校: 哈尔滨工程大学
专 业: 计算机应用技术
关键词: 方面挖掘 向量空间模型 横切关注点 遗产系统
分类号: TP311.13
类 型: 硕士论文
年 份: 2013年
下 载: 31次
引 用: 0次
阅 读: 论文下载
 

内容摘要


传统的编程技术无法模块化实现系统关注点,导致系统关注点的实现代码横切于多个代码模块中,因此这些关注点被命名为横切关注点。面向方面编程技术可以将这些横切关注点单独实现为Aspect,从而解决了采用传统编程技术实现遗产系统难以维护、进化和修改等问题。如何将遗产系统转化为面向方面系统成为当前研究的热点话题。为了实现遗产系统向面向方面系统转化,需要使用方面挖掘技术识别遗产系统中的横切关注点,然后将识别的横切关注点使用重构技术封装成独立的Aspect。本文重点研究了使用向量空间模型标识遗产系统源代码中方法级横切关注点,基于聚类分析技术进行横切关注点识别的自动化方面挖掘方法。本文首先分析了现有的使用向量空间模型的方面挖掘方法的挖掘过程,发现现有的向量空间模型中属性都是基于源代码中类级别的,通过对源代码的进一步分析,依据被调用方法和方法名分解的token字,提出了FIV-class、FIV-method和FIV-method-tokens三个改进的向量空间模型,给出了每个模型的构造算法,描述了使用启发式k-means聚类算法进行方面挖掘的挖掘过程。针对JHotDraw源代码,基于相同的聚类算法,使用现有的向量空间模型和改进的向量空间模型进行方面挖掘,给出了实验过程和实验结果。实验结果表明,相比于现有的向量空间模型,使用本文提出的三个改进向量空间模型进行方面挖掘的挖掘结果在DISP评价指标上有明显的提高。为了进一步提高使用向量空间模型的方面挖掘方法的挖掘效率,本文对现有的两种基于启发式的凝聚聚类算法进行了比较,证明了HAC算法比HACO算法更适合使用向量空间模型的方面挖掘。本文给出了基于HAC算法,使用改进的三个向量空间模型进行方面挖掘的挖掘过程。针对JHotDraw源代码,基于启发式k-means聚类算法和HAC算法,使用现有的向量空间模型和改进的向量空间模型进行方面挖掘,给出了实验过程和实验结果。实验结果表明,相比于现有的使用向量空间的方面挖掘方法,本文提出的基于HAC算法,使用改进向量空间的方面挖掘方法的挖掘结果在DISP和DIV两个评价指标上均有提高,识别横切关注点的准确率和召回率也有明显的提高,同时也证明了基于凝聚的层次聚类比划分式聚类更适合于使用向量空间的方面挖掘。

全文目录


摘要  5-6
Abstract  6-10
第1章 绪论  10-20
  1.1 课题研究的目的和意义  10-12
  1.2 国内外研究现状  12-18
  1.3 论文研究内容  18
  1.4 本文的组织结构  18-20
第2章 相关技术  20-30
  2.1 面向方面技术  20-24
    2.1.1 AOP 产生背景  20-21
    2.1.2 AOP 概述  21-22
    2.1.3 AspectJ 简介  22
    2.1.4 面向方面编程步骤  22-24
    2.1.5 面向方面编程的优点  24
  2.2 R 语言  24-25
  2.3 Fan-in 分析技术  25-28
    2.3.1 Fan-in 度量的计算  26-27
    2.3.2 方法的过滤  27
    2.3.3 种子的分析  27-28
  2.4 聚类分析  28-29
  2.5 本章小结  29-30
第3章 基于改进向量空间模型方面挖掘方法  30-53
  3.1 基于向量的 K 均值聚类的方面挖掘  30-32
    3.1.1 相关定义  30-31
    3.1.2 挖掘步骤  31-32
    3.1.3 存在的问题  32
  3.2 改进的向量空间模型  32-37
    3.2.1 FIV-class 向量空间模型  33-34
    3.2.2 FIV-method 向量空间模型  34-35
    3.2.3 FIV-method-tokens 向量空间模型  35-37
  3.3 评价指标  37-39
  3.4 基于改进向量空间的方面挖掘方法  39-47
    3.4.1 对源代码进行 fan-in 分析  39-40
    3.4.2 分析结果文件  40
    3.4.3 构造向量空间模型  40-46
    3.4.4 运行启发式算法  46-47
    3.4.5 运行 R 进行聚类  47
    3.4.6 聚类结果分析  47
  3.5 实验过程与实验结果  47-51
    3.5.1 对 JHotDraw 进行 fan-in 分析  48-49
    3.5.2 构造向量模型  49
    3.5.3 运行启发式算法选取中心点  49-50
    3.5.4 聚类结果  50-51
  3.6 JHotDraw 评价类比分析  51-52
  3.7 本章小结  52-53
第4章 基于 HAC 聚类算法的方面挖掘  53-62
  4.1 凝聚层次聚类的概述  53-56
    4.1.1 相关定义  54-56
    4.1.2 基于凝聚聚类的方面挖掘方法  56
  4.2 现有方面挖掘中的凝聚聚类算法分析比较  56-59
  4.3 实验过程与实验结果  59-60
  4.4 类比分析  60-61
  4.5 本章小结  61-62
结论  62-64
参考文献  64-70
攻读硕士学位期间发表的论文和取得的科研成果  70-71
致谢  71

相似论文

  1. 基于停用词处理的汉语语音检索方法,TP391.1
  2. 基于视点的面向方面需求工程方法研究,TP311.52
  3. 网络教育新闻文本分类系统的设计与实现,TP391.1
  4. 基于分类模型监测电子商务违禁信息的研究与实现,TP393.09
  5. 遗产系统Web服务化封装工具的研究与实现,TP393.09
  6. 基于SCA的遗产系统移植的研究与实现,TP393.09
  7. 基于改进向量空间模型的网络信息检索研究,TP391.3
  8. 以博客内容为对象的个性化搜索研究,TP391.3
  9. 面向方面重构的研究,TP311.52
  10. 基于图形用户界面的Web服务移植技术研究,TP393.09
  11. 特征选择方法对英文作文自动评分性能影响的研究,TP391.1
  12. 基于角色的访问控制策略的集成研究,TP393.09
  13. 方面挖掘算法及其在程序理解中的应用研究,TP311.52
  14. 中文信息检索系统与文档重排技术研究,TP391.3
  15. 基于扩展的VSM中文文本分类方法,TP391.1
  16. VNC结构多词表达的抽取与分类,TP391.1
  17. AOP在自助游可拓策略生成系统的应用研究,O189
  18. 基于知网文本相似度的文摘自动评测方法研究,TP391.1
  19. 面向对象逆向工程中动态模型的研究与设计,TP311.52
  20. 基于自组织特征映射的海洋文献聚类分析的研究与实现,TP391.1
  21. 基于Web Services的遗产系统重构模型研究,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com