学位论文 > 优秀研究生学位论文题录展示

基于蚁群的文本文档聚类技术研究

作 者: 唐媛
导 师: 刘钊
学 校: 武汉科技大学
专 业: 计算机应用技术
关键词: 数据挖掘 文本聚类 蚁群算法 禁忌搜索算法
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 60次
引 用: 1次
阅 读: 论文下载
 

内容摘要


文本聚类数据挖掘和信息检索领域的一个重要研究方向。随着网络上堆积的数据日益庞大,且大部分数据以文本形式存储,人们对从大量文本中获取信息的需求越来越高。文本聚类方法具有无监督的学习能力,可由计算机自动进行,通过比较文本的相似性,发现文本内在特征及分布规律,它既可对web文档进行有效地组织,还可形成分类模板用来指导web文档分类,以便检索和阅读,所以对文本聚类技术的研究就显得尤为重要。近年来,人们受自然界中蚂蚁堆积尸体等现象的启发,提出了基于蚁群的聚类算法(Ant-colony Text Cluster Algorithm)。蚁群聚类算法与文本聚类技术的结合形成了基于蚁群的文本聚类算法,该算法具有良好的扩充性、并行计算和正反馈,不必预设聚类中心数目,实现自组织聚类过程,具有健壮性、可视化等优点,但仍存在不足。本文将禁忌算法的思想引进蚁群聚类算法中,提出了蚁群禁忌融合的文本聚类算法ATTCA(Ant-Tabu Text Cluster Algorithm)。在蚁群算法生成初始解后,禁忌搜索算法在初始解的基础上进行局部搜索,这样既克服了蚁群算法易陷入局部最优的缺点,同时也克服了禁忌搜索算法对初始解的依赖性,实现二者优势互补。实验结果表明,改进后的算法较基于蚁群的文本聚类算法具有更高的准确率。

全文目录


相似论文

  1. 多导弹协同作战突防效能评估及组合优化算法研究,TJ760.1
  2. 基于蚁群算法的电梯群优化控制研究,TU857
  3. 隐式用户兴趣挖掘的研究与实现,TP311.13
  4. 动态环境下移动对象导航系统相关技术的研究,TP301.6
  5. 基于改进蚁群算法的机器人路径规划研究,TP242
  6. 基于数据挖掘技术的保健品营销研究,F426.72
  7. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  8. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  9. 改进的蚁群算法及其在TSP上的应用研究,TP301.6
  10. Bicluster数据分析软件设计与实现,TP311.52
  11. 基于变异粒子群的聚类算法研究,TP18
  12. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  13. 基于遗传算法和粗糙集的聚类算法研究,TP18
  14. 基于免疫机制蚁群算法的电力系统无功优化研究,TP18
  15. 基于视觉反馈与行为记忆的GPU并行蚁群算法,TP301.6
  16. 演化聚类算法及其应用研究,TP311.13
  17. 基于数据挖掘的税务稽查选案研究,F812.42
  18. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  19. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  20. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  21. 基于Moodle的高职网络教学系统设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com