学位论文 > 优秀研究生学位论文题录展示

移动互联网环境下无线垂直搜索引擎的研究与实现

作 者: 李东伟
导 师: 傅彦;姚晨赓
学 校: 电子科技大学
专 业: 软件工程
关键词: 垂直搜索 搜索引擎 移动互联网 BigPipe 博客微博
分类号: TP391.3
类 型: 硕士论文
年 份: 2011年
下 载: 181次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着移动手持设备智能化程度的普及,当今的计算环境已经发生了很大变化。现今时代下,人们手中的手机,已经越来越普及,越来越智能。可以预见,会有很大一批用户将跳过PC时代,直接使用手机进入互联网的世界里。在移动互联网环境下,人们的需求发生了明显变化,在移动终端上,人们可能关心的话题包括新闻资讯、餐饮娱乐、社交等等,这些领域带有明显的领域特征,其中虽然面临着信息检索的巨大需求,但这种需求已经非传统搜索引擎所能解决。事实上,在移动互联网环境下,人们需要一类具备一定领域纵深度的、垂直式的无线搜索引擎,这正是本课题所给予的时代大背景和需求动力。移动垂直搜索引擎,较传统PC上的垂直搜索引擎,具有许多不同点,许多的移动运营商按流程收费,这就要求移动搜索引擎必须尽力为用户节省流量。同时,3G时代的到来,移动互联网的速度倍增,那么移动搜索引擎的响应速度必须跟得上这个时代。另外,本文使用的垂直搜索是用于搜索博客、微博相关的信息,搜索到的信息必须具有简洁明确的特征。在移动互联网这个特定的环境下,对垂直搜索引擎的要求具有更高的要求,因此文章的组织结构是:第一分析了解搜索引擎的底层技术,介绍利用高性能架构来提升搜索引擎的响应速度,同时还介绍了优化系统资源的技术,从基础结构上满足用户对搜索引擎性能上的需求,同时还对垂直搜索引擎的背景和需求进行了更深一步的讨论。第二对垂直搜索引擎进行了详细设计,包括对移动用户的前端技术进行了设计,使用最新的优化技术对搜索引擎进行优化,为移动前端设计了最新的BigPipe技术,提高用户体验,对诸如排序、搜索、索引、缓存等模块进行了设计,提出了相应使用的技术。第三实现了面向博客的垂直搜索引擎,介绍了PageRank算法以及它的具体实现,帮助垂直搜索引擎进行排序,实现了设计部分的设计内容,如使用Lucene进行索引和搜索,使用Memcached进行缓存等,最终达到了完整的搜索引擎要求。第四用实验数据,对搜索引擎的准确性、性能进行评估。最后对本文进行了总结和未来工作的介绍。实验结果表明,基于本文实现的垂直搜索引擎,具有较高的搜索命中率,推荐内容较为合理,同时浏览器端响应速度较快,用户体验良好。

全文目录


摘要  4-5
ABSTRACT  5-10
第一章 绪论  10-19
  1.1 课题背景  10-11
  1.2 移动垂直搜索引擎  11-17
    1.2.1 传统垂直搜索引擎简介  11-12
    1.2.2 移动搜索的发展现状  12-13
    1.2.3 国内外研究现状  13-16
    1.2.4 发展前景  16-17
  1.3 本文的主要工作  17-19
    1.3.1 研究内容  17-18
    1.3.2 本文的组织  18-19
第二章 相关技术简介  19-29
  2.1 本章简介  19
  2.2 核心技术简介  19-21
  2.3 垂直搜索技术  21-24
  2.4 主题相关度判定  24-26
    2.4.1 布尔模型  24-25
    2.4.2 向量空间模型  25-26
  2.5 信息抽取技术  26-28
  2.6 本章小结  28-29
第三章 面向博客的垂直搜索引擎的需求分析  29-35
  3.1 系统需求  29-30
  3.2 爬虫模块  30-31
  3.3 垂直信息提取模块  31
  3.4 结果排序模块  31-32
  3.5 预期垂直搜索引擎的指标  32-34
  3.6 本章小结  34-35
第四章 面向博客的垂直搜索引擎的设计  35-56
  4.1 总体模块设计  35-37
  4.2 基础设施的设计  37-39
  4.3 网页信息抽取技术的设计  39-43
  4.4 网页消重的设计  43-45
  4.5 网页重排序的设计  45
  4.6 检索技术的选取  45-49
  4.7 性能优化设计  49-55
    4.7.1 BigPipe 设计  49-51
    4.7.2 资源优化设计  51-52
    4.7.3 Cache Server 的选取  52-53
    4.7.4 Cache Server 的实现设计  53-55
  4.8 本章小结  55-56
第五章 面向博客的垂直搜索引擎的实现  56-91
  5.1 基础设施的实现  56-63
    5.1.1 高性能服务器  56-58
    5.1.2 存储结构  58-60
    5.1.3 负载均衡服务器  60-63
  5.2 网页信息抽取技术的实现  63-67
  5.3 性能优化的 BigPipe 技术实现  67-76
    5.3.1 单线程BigPipe  69-71
    5.3.2 多线程BigPipe  71-75
    5.3.3 与普通的对比  75-76
  5.4 性能优化的资源优化实施  76-79
  5.5 检索技术的实现  79-87
    5.5.1 分布式存储  79-80
    5.5.2 索引结构与存储  80-84
    5.5.3 主题相关度判定算法  84-85
    5.5.4 检索流程设计  85-87
  5.6 网页重排序的实现  87-90
  5.7 本章小结  90-91
第六章 结果分析与性能测试  91-98
  6.1 结果展示  91-94
  6.2 压力测试  94-95
  6.3 指标测试  95-96
  6.4 稳定性测试  96-97
  6.5 本章小结  97-98
第七章 结束语  98-100
  7.1 本文工作总结  98
  7.2 未来工作展望  98-100
致谢  100-101
参考文献  101-103

相似论文

  1. 网络搜索引擎的相关技术研究,G354
  2. 基于社会网络分析的藏文web链接结构研究,TP393.09
  3. 基于语义网络的智能搜索引擎研究,TP391.3
  4. 基于BP网络的元搜索引擎研究,TP391.3
  5. 搜索引擎服务提供商版权侵权责任认定标准探讨,D923.41
  6. 基于因特网的动态规范词表的系统构建研究,G354
  7. Deep Web接口集成及查询结果排序方法研究,TP274
  8. 基于Struts2框架的安全教育管理信息系统研究,TP311.52
  9. 面向3G网络的企业移动信息服务平台的技术研究,TN929.5
  10. 企业搜索引擎营销研究,TP391.3
  11. 基于Web搜索和网页结构分析的IT相关主题新闻抓取研究,TP393.092
  12. 基于Android的图像特效的设计与实现,TP391.41
  13. 搜索引擎商标侵权及责任认定,D923.43
  14. 垂直搜索引擎关键技术的研究与实现,TP311.52
  15. WEB个性化信息采集与管理关键技术研究,TP393.09
  16. 网络论坛舆情监控系统的研究及设计,G206
  17. 百度搜索引擎营销模式研究,F49
  18. 基于微博社交网络的舆情分析模型及实现,TP311.52
  19. 基于用户行为数据分析的移动互联业务推荐模型,TP311.13
  20. 基于位置的社会化移动电子商务客户端的设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com