学位论文 > 优秀研究生学位论文题录展示
网页自动分类算法的设计与实现
作 者: 刘松显
导 师: 周兴斌; 赖献群
学 校: 南昌大学
专 业: 软件工程
关键词: 网页自动分类 网页内容提取 文本自动分类
分类号: TP393.092
类 型: 硕士论文
年 份: 2012年
下 载: 46次
引 用: 0次
阅 读: 论文下载
内容摘要
在这个信息数字多元化的年代,人们可以通过Internet、企业内部网和电子图书馆等多种渠道获取丰富的包括数据、文字、声音、图像等信息。我们想简单化、快捷化、有效率的获取有用的讯息有一定难度。因此,自动分类尤其是网页自动分类的重要性日趋显著。自动分类可较大程度减少整理文档的时间,较大程度提高采集信息的效率,极大的方便了用户检索信息,也对文档的有效存档和管理起到重要作用。本文通过探索网页自动分类技术的发展历程和目前的研究现状,了解当前搜索引擎系统的优缺点。通过分析学习系统开发语言Java和开发技术Swing以及TF-IDF算法,试图提出网页自动分类算法新的设计,提出实验方案。经过相关测试,本方法比较符合中文网页自动分类的在大规模分类上的需要,在相关网页的平均分类准确率超过80%。这项研究在应用领域有较大实用价值。
|
全文目录
相似论文
- 基于频繁共现熵的跨语言网页自动分类研究,TP391.1
- 网页自动分类和存储管理系统的设计与实现,TP393.092
- 基于改进的SVM-KNN算法的中文网页层次式分类,TP391.1
- 基于内容的搜索引擎网页去重研究,TP393.092
- 基于网页自动分类的搜索引擎研究,TP391.3
- 面向领域自然语言的文本自动分类及其在产品设计中的应用,TB472
- 基于RBF网络的中文文本自动分类的研究,TP391.1
- 中文网页自动分类技术的研究与实现,TP391.1
- 基于RBF网络的文本自动分类的研究,TP393.09
- 基于SVM的网页分类器的研究,TP393.09
- 基于KNN算法的中文文本自动分类,TP311.13
- 基于类别的特征选择算法的文本分类系统,TP391.1
- 基于神经网络的文本自动分类系统研究,G254.1
- 博客空间中的角色扮演现象研究,G206
- 基于本体的网络信息检索,TP391.3
- 基于本体知识库的教学资源自动采集技术研究,TP274.2
- 基于web的藏文文本自动分类研究与实现,H214
- 基于机器学习的中文期刊论文自动分类研究,TP391.1
- 《计算机网络》课程FAQ系统设计与开发,G642
- 基于知识库的多层次文本自动分类研究,G254.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com
|