学位论文 > 优秀研究生学位论文题录展示

基于信息聚合技术的个性化信息门户的研究与实现

作 者: 杨高峰
导 师: 杨岳湘
学 校: 国防科学技术大学
专 业: 计算机技术
关键词: 信息聚合 RSS 个性化信息门户
分类号: TP393.092
类 型: 硕士论文
年 份: 2009年
下 载: 262次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着互联网的发展和广泛应用,网络极大地丰富了人们的信息来源,然而由于缺乏统一的组织和管理,丰富的信息使得人们越来越难以获取自己需要的信息。当前的各种信息服务技术,如搜索引擎、基于RSS信息聚合等,有的精度不高、返回结果过多,有的覆盖范围有限,难以满足人们日益增长的信息需求。针对用户不同的兴趣爱好,为用户提供个性化的信息服务逐渐成为网络信息服务的发展趋势,在网络信息服务中发挥着重要的作用,它是解决“信息过载”和“信息迷航”的有效途径。论文对信息聚合技术特别是RSS的基本原理进行了研究,并分析了RSS的应用特点和个性化信息服务的需求,提出了一种信息聚合技术和门户技术相结合的个性化网络信息服务解决方案。该方案利用Web信息抽取和中文自动文摘技术来抽取散布在网页中的有价值的信息,运用RSS技术重新组织信息,同时结合门户技术将信息聚合和个性化信息服务统一在一个框架内,构建基于信息聚合技术的个性化信息门户(RSS Portal)。RSS Portal实现了信息的个性化订阅、信息的个性化展示、应用集成和统一用户权限管理,它使用户无需关心信息的来源和获取的方式,只要选择定制自己感兴趣的资源就可简单、高效、快速地获得目标信息,从而克服了传统信息服务不足,为人们提供一种高效的信息获取方法。论文对RSS Portal涉及的关键技术进行了研究,提出的一种新的基于LSA的中文自动文摘方法和一种从HTML文件自动生成RSS的方法,并在开源项目Liferay的基础上开发构建了RSS Portal原型系统。结果表明,RSS Portal在信息抽取质量、信息聚合、应用集成、权限管理以及系统扩展性等方面都达到令人满意的结果,从而验证了论文提出的基于信息聚合技术的个性化信息门户框架的有效性。

全文目录


摘要  10-11
ABSTRACT  11-12
第一章 绪论  12-17
  1.1 研究背景  12-13
  1.2 国内外研究现状  13-15
  1.3 研究的目的及意义  15
  1.4 研究内容及论文组织结构  15-16
    1.4.1 论文的研究内容  15-16
    1.4.2 论文组织结构  16
  1.5 本章小结  16-17
第二章 相关技术  17-33
  2.1 信息聚合技术概述  17-22
    2.1.1 XML、DOM  17-18
    2.1.2 信息聚合技术  18-20
    2.1.3 RSS 工作原理  20-21
    2.1.4 RSS 的技术优点  21-22
  2.2 文本挖掘技术  22-24
    2.2.1 Web 信息抽取  22-23
    2.2.2 中文自动文摘  23
    2.2.3 中文分词技术  23-24
  2.3 Portal 相关技术及产品  24-28
    2.3.1 JSR-168 Portlet 标准  24-26
    2.3.2 相关门户产品  26-28
  2.4 信息过滤算法  28-30
    2.4.1 模式匹配原理  28-29
    2.4.2 Wu-Manber 信息过滤算法  29-30
  2.5 个性化信息服务  30-32
    2.5.1 个性化信息服务的概念  30-31
    2.5.2 个性化信息服务的特点  31-32
  2.6 本章小结  32-33
第三章 RSS Portal 的结构设计  33-44
  3.1 传统信息聚合方式  33-35
    3.1.1 传统的信息集成  33-34
    3.1.2 RSS 阅读器聚合  34-35
    3.1.3 Widget 信息聚合  35
  3.2 RSS Portal 的聚合方式  35-36
  3.3 RSS Portal 的层次结构  36-39
    3.3.1 RSS Portal 的设计目标  36-37
    3.3.2 RSS Portal 的设计原则  37-38
    3.3.3 RSS Portal 的系统结构  38-39
  3.4 RSS Portal 的系统设计  39-43
    3.4.1 信息采集和监控模块  39-40
    3.4.2 RSS 动态生成模块  40-41
    3.4.3 个性化信息服务模块  41-42
    3.4.4 用户权限管理模块  42-43
  3.5 本章小结  43-44
第四章 RSS Portal 关键技术及算法研究  44-57
  4.1 基于XPath 的Web 信息抽取  44-46
    4.1.1 基于XPath 的Web 信息抽取  44-46
    4.1.2 基于XPath 的Web 信息抽取流程  46
  4.2 基于LSA 的中文自动文摘算法  46-52
    4.2.1 文本特征的表示和度量  47-48
    4.2.2 基于LSA 的自动文摘算法  48-50
    4.2.3 基于LSA 的自动文摘流程  50-51
    4.2.4 实验及评价  51-52
  4.3 基于ROME 的RSS 生成及解析  52-56
    4.3.1 RSS 生成技术  52-53
    4.3.2 RSS 解析技术  53
    4.3.3 基于ROME 的RSS 生成及解析  53-56
  4.4 本章小结  56-57
第五章 RSS Portal 的实现与部署  57-75
  5.1 二次开发环境的构建  57-58
  5.2 基于Liferay 的portlet 的开发  58-61
    5.2.1 portlet 的基类  58-59
    5.2.2 Liferay 的portlet 的开发  59-61
  5.3 主要功能模块的实现  61-73
    5.3.1 信息的采集和监控  61-64
    5.3.2 RSS 的动态生成  64-65
    5.3.3 个性化信息服务  65-69
    5.3.4 用户权限管理  69-71
    5.3.5 portlet 与Liferay 的集成  71-73
  5.4 部署与性能分析  73-74
  5.5 本章小结  74-75
第六章 结束语  75-76
致谢  76-77
参考文献  77-81
作者在学期间取得的学术成果  81

相似论文

  1. 数据挖掘技术和RSS技术在图书馆个性化服务中的应用,G250.76
  2. 基于Web2.0技术的网络自主学习社区构建,TP391.6
  3. 本体构建与网络交流平台的设计与实现,TP311.52
  4. 高密市民政局电子政务平台部分子系统的设计与实现,TP311.52
  5. 基于RSS的旅游电子商务平台信息发布系统设计,TP311.52
  6. ECFTA环球商业数据资讯采集系统的设计及实现,TP274.2
  7. 基于语义分析的推荐算法在RSS网络信息服务中的研究,TP393.09
  8. 基于RSS技术的图书馆信息发布与订阅系统的设计与实现,TP311.52
  9. Web2.0营销及其在家电企业海外市场的运用与研究,F426.6
  10. RSS个性化信息服务的用户兴趣模型研究及应用,TP393.09
  11. 高校数字图书馆个性化服务的应用研究,G250.76
  12. 个性化RSS新闻检索系统设计与实现,TP391.3
  13. 基于RSS技术的政府绩效信息聚合与推送研究,D630
  14. 基于RSS技术与BLOG平台的机构库信息服务模式研究,G350
  15. 基于.NET技术的RSS新闻阅读器设计与实现,TP393.092
  16. 基于RSS的大学生网络自主学习模式构建与应用研究,TP399-C1
  17. 基于RSS的个性化内容推荐服务系统设计与实现,TP393.09
  18. 推送技术在网络教学平台中的应用研究,TP311.52
  19. RSS技术在图书馆的应用,G250.7
  20. 基于μCLinux的嵌入式RSS阅读器的研究与实现,TP316.81
  21. 商务管理学校图书管理系统设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com