学位论文 > 优秀研究生学位论文题录展示

Web新闻热点发现系统的设计与实现

作 者: 徐卫
导 师: 吴砥
学 校: 华中科技大学
专 业: 通信与信息系统
关键词: 热点发现 Web新闻 文本聚类 向量空间模型 奇异值分解
分类号: TP393.09
类 型: 硕士论文
年 份: 2011年
下 载: 75次
引 用: 0次
阅 读: 论文下载
 

内容摘要


过去几十年,互联网作为一种新兴事物,发展十分迅速,信息量也急剧增长。随着门户网站、论坛、社区等平台日益成熟,网上短消息、即时通讯、博客、微博等技术应用迅速普及,互联网逐渐成为网民自由发表言论、表达情绪的重要平台,也更容易让网民关注的热点在短时间内发展成舆情。这些引起网民广泛关注的热点在不法分子的推波助澜下很可能对社会造成重大影响。因此,迫切需要在热点形成初期就进行适当的引导。本文设计并实现的Web新闻热点发现系统就是解决这个问题的基础。以Web新闻标题和正文分词结果为基础,本文的亮点是对Web新闻特点进行了深入分析,针对重复转载新闻、热点演化新闻和评论性新闻分别采取了不同处理思路,并选择了文档主题发现效果较好的基于SNN密度文本聚类算法,以Web界面的形式呈现系统自动发现的热点。最后,以样本新闻集人工分类的结果作为参照对系统热点发现的效果进行了准确率和召回率的评估,准确率较高,召回率一般。本文讨论了Web新闻热点发现系统的开发背景和整体需求,紧紧围绕Web新闻的特点,提出了系统的功能层次结构,详细阐述了Web新闻热点发现流程每个环节的具体设计思路和实现步骤,并对系统Web新闻热点发现的效果进行了测试和评估,总体效果较好,也总结了一些经验。

全文目录


摘要  4-5
ABSTRACT  5-8
1 绪论  8-11
  1.1 课题研究背景  8
  1.2 国内外研究情况  8-9
  1.3 研究内容  9-10
  1.4 论文组织结构  10-11
2 系统关键技术综述  11-18
  2.1 文本表示模型  11-12
  2.2 中文分词技术  12-13
  2.3 特征降维  13-15
  2.4 文本聚类算法  15-17
  2.5 本章小结  17-18
3 Web新闻热点发现系统的设计  18-29
  3.1 系统需求分析  18
  3.2 Web新闻特点的分析  18-19
  3.3 系统功能层次总述  19-21
  3.4 系统功能设计  21-28
  3.5 本章小结  28-29
4 Web新闻热点发现系统的实现  29-49
  4.1 系统的数据库结构  29-30
  4.2 系统主要功能点实现  30-36
  4.3 热点发现效果的测试和评估  36-48
  4.4 本章小结  48-49
5 总结与展望  49-51
  5.1 成果总结  49-50
  5.2 未来工作展望  50-51
致谢  51-53
参考文献  53-55

相似论文

  1. 机载导弹的传递对准研究,V249.322
  2. 隐式用户兴趣挖掘的研究与实现,TP311.13
  3. 基于停用词处理的汉语语音检索方法,TP391.1
  4. 基于SVM分类算法的主题爬虫研究,TP391.3
  5. 演化聚类算法及其应用研究,TP311.13
  6. 基于本体的食品投诉文档文本聚类研究,TP391.1
  7. 应用于搜索引擎的人物分类系统设计与实现,TP391.3
  8. 面向汽车行业的主题爬虫研究与实现,TP391.3
  9. 面向短消息文本的聚类技术研究与应用,TP391.1
  10. 教育新闻热点话题发现系统的设计与实现,TP391.1
  11. 基于树型条件随场的特定域事件提取方法研究,TP391.1
  12. 主观题自动评分技术研究,TP391.1
  13. 网络教育新闻文本分类系统的设计与实现,TP391.1
  14. 基于核回归与非局部方法的图像去噪研究,TP391.41
  15. 面向论坛信息文本的有效数据抽取研究,TP391.1
  16. SMBSDD:一种改进的非结构化P2P网络搜索机制,TP393.02
  17. 基于Web的社会网络搜索中人名同一性判断方法研究,TP393.09
  18. 多角色社交网络研究,TP393.09
  19. 基于分类模型监测电子商务违禁信息的研究与实现,TP393.09
  20. 基于子空间分析的扩频通信窄带干扰抑制研究,TN914.42

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com