学位论文 > 优秀研究生学位论文题录展示

网页自动分类算法的设计与实现

作 者: 刘松显
导 师: 周兴斌; 赖献群
学 校: 南昌大学
专 业: 软件工程
关键词: 网页自动分类 网页内容提取 文本自动分类
分类号: TP393.092
类 型: 硕士论文
年 份: 2012年
下 载: 46次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在这个信息数字多元化的年代,人们可以通过Internet、企业内部网和电子图书馆等多种渠道获取丰富的包括数据、文字、声音、图像等信息。我们想简单化、快捷化、有效率的获取有用的讯息有一定难度。因此,自动分类尤其是网页自动分类的重要性日趋显著。自动分类可较大程度减少整理文档的时间,较大程度提高采集信息的效率,极大的方便了用户检索信息,也对文档的有效存档和管理起到重要作用。本文通过探索网页自动分类技术的发展历程和目前的研究现状,了解当前搜索引擎系统的优缺点。通过分析学习系统开发语言Java和开发技术Swing以及TF-IDF算法,试图提出网页自动分类算法新的设计,提出实验方案。经过相关测试,本方法比较符合中文网页自动分类的在大规模分类上的需要,在相关网页的平均分类准确率超过80%。这项研究在应用领域有较大实用价值。

全文目录


相似论文

  1. 基于频繁共现熵的跨语言网页自动分类研究,TP391.1
  2. 网页自动分类和存储管理系统的设计与实现,TP393.092
  3. 基于改进的SVM-KNN算法的中文网页层次式分类,TP391.1
  4. 基于内容的搜索引擎网页去重研究,TP393.092
  5. 基于网页自动分类的搜索引擎研究,TP391.3
  6. 面向领域自然语言的文本自动分类及其在产品设计中的应用,TB472
  7. 基于RBF网络的中文文本自动分类的研究,TP391.1
  8. 中文网页自动分类技术的研究与实现,TP391.1
  9. 基于RBF网络的文本自动分类的研究,TP393.09
  10. 基于SVM的网页分类器的研究,TP393.09
  11. 基于KNN算法的中文文本自动分类,TP311.13
  12. 基于类别的特征选择算法的文本分类系统,TP391.1
  13. 基于神经网络的文本自动分类系统研究,G254.1
  14. 博客空间中的角色扮演现象研究,G206
  15. 基于本体的网络信息检索,TP391.3
  16. 基于本体知识库的教学资源自动采集技术研究,TP274.2
  17. 基于web的藏文文本自动分类研究与实现,H214
  18. 基于机器学习的中文期刊论文自动分类研究,TP391.1
  19. 《计算机网络》课程FAQ系统设计与开发,G642
  20. 基于知识库的多层次文本自动分类研究,G254.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com