学位论文 > 优秀研究生学位论文题录展示

基于自然语言理解的智能检索接口技术的研究及其应用

作 者: 宗宝琴
导 师: 高凯
学 校: 河北科技大学
专 业: 计算机应用技术
关键词: 信息检索 搜索引擎 数据采集 语音识别 自然语言处理
分类号: TP391.3
类 型: 硕士论文
年 份: 2011年
下 载: 44次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网信息量的爆炸式增长,当今的时代已经成为了信息的时代,信息检索技术也在逐步趋向成熟,信息检索工具搜索引擎也层出不穷。但是用搜索引擎检索信息并不总是让用户满意,一方面由于任何一个搜索引擎都不可能覆盖互联网上的所有网页,这样就会致使用户检索不到所需要的信息;另一方面由于搜索引擎自身的因素,没能正确准确的理解用户的语意而导致的不满足用户的检索需求;另外,由于搜索引擎用户逐年增加,人群遍及各行各业,年龄从老到幼,他们使用搜索引擎的方法不当引起没能检索到有用信息。所以近年来研究搜索引擎技术的学者越来越多,最终的目的是使搜索引擎使用起来能够更加的方便。作为河北省教育厅2009年度科学研究计划,本课题研究的是基于自然语言的智能检索接口技术的研究以及在高等艺术教育网中的应用,在课题中主要针对自然语言的处理以及利用语音进行输入进行了研究,重点做了以下工作:1)数据采集,主要在网络上采集艺术类网页,并对网页内容进行分析提取,再将网页标题、正文等有用信息存入数据库。在网页采集过程中,使用了在网页中的去噪方法,将网页信息的标题和内容等有用信息提取出来,为后续的检索打下基础。2)利用语音进行检索输入,语音输入能让用户在检索过程中更加的方便。将语音识别技术引入到搜索引擎,不仅让用户在使用搜索引擎时更加的灵活,同时还能够使一部分特殊人群(如手部伤残者)使用搜索引擎检索信息。在研究过程中,采用了不同的方法进行尝试,语音识别功能实现后通过不断训练使识别准确率达到了一个用户可以接受的效果,并和其他的语音引擎进行了比较评判。3)自然语言处理,课题主要从疑问句的检索和重定向的研究两个方面进行设计,使得系统的搜索引擎有较高的使用价值,并通过实验证明了系统引擎的优劣。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-13
  1.1 课题意义和应用前景  9-11
  1.2 课题的主要工作  11-12
  1.3 章节安排  12-13
第2章 信息检索相关工作综述  13-21
  2.1 信息检索概述  13-15
    2.1.1 全文检索  13-14
    2.1.2 信息检索的评价指标  14-15
  2.2 概念检索  15
  2.3 搜索引擎  15-17
    2.3.1 全文搜索引擎  16
    2.3.2 目录搜索引擎  16-17
    2.3.3 元搜索引擎  17
  2.4 自然语言处理  17-19
    2.4.1 基于句模的技术  18-19
    2.4.2 问答系统  19
  2.5 语音技术概述  19-20
  2.6 本章小结  20-21
第3章 智能信息处理的信息采集  21-31
  3.1 概述  21-22
    3.1.1 网页爬取策略  21
    3.1.2 网络爬虫概述  21-22
  3.2 工作流程  22-23
  3.3 信息的提取  23-25
    3.3.1 去噪  23-24
    3.3.2 有用信息的提取  24-25
  3.4 有用信息的存储  25
  3.5 实验结果与分析  25-30
    3.5.1 WebLech 简介  25-26
    3.5.2 抓取过程  26-28
    3.5.3 实验结果比较  28-30
  3.6 本章小结  30-31
第4章 搜索引擎中对检索输入的研究  31-41
  4.1 所需硬件环境  31
  4.2 语音输入的实现  31-33
  4.3 实验结果与分析  33-40
    4.3.1 微软语音输入法简介  33
    4.3.2 实验过程与结果的比较  33-39
    4.3.3 实验结果的分析  39-40
  4.4 本章小结  40-41
第5章 自然语言处理  41-55
  5.1 重定向  41-43
    5.1.1 重定向的条件  41
    5.1.2 重定向的实现  41-43
  5.2 添加增删概念  43-44
    5.2.1 添加增删概念的意义  43
    5.2.2 添加增删概念的实现原理图  43-44
  5.3 数据字典的扩充  44-46
    5.3.1 数据的准备  45
    5.3.2 扩充的实现  45-46
  5.4 疑问句的检索  46-48
    5.4.1 问答式提问句的分析  46
    5.4.2 疑问句与问答式提问句的处理  46-48
  5.5 实验结果与分析  48-53
    5.5.1 重定向的实验比较  48-49
    5.5.2 问答式提问句的实验结果比较与分析  49-53
  5.6 本章小结  53-55
结论  55-57
参考文献  57-60
攻读硕士学位期间所发表的论文  60-61
致谢  61

相似论文

  1. 基于WinCE平台的故障分析仪应用程序设计与开发,TP311.52
  2. 光探针测量系统中瞄准信号的检测与处理的研究,TH74
  3. 基于LAH032.905标准的汽车点火线圈终检系统研究,U472.9
  4. 基于MODBUS的发电厂数据采集系统的研究,TM621
  5. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  6. 基于DSP的机器人语音命令识别系统研制,TN912.34
  7. 词义消歧语料库自动获取方法研究,TP391.1
  8. 生物医学领域检索系统查询扩展技术研究,TP391.3
  9. 面向海量邮件的检索系统研究与实现,TP393.098
  10. 基于信号完整性分析的高速数采卡设计,TP274.2
  11. 基于DSP的三维测头数据采集处理系统的研制,TP274.2
  12. 基于FPGA的电感传感器数据采集系统的研制,TP274.2
  13. 基于USB2.0的高速数据采集系统,TP274.2
  14. 基于FPGA的高速实时数据采集系统,TP274.2
  15. 节能与新能源汽车数据采集与高原适配技术探索研究,U469.7
  16. 基于DSP的水声信号采集系统研究,TP274.2
  17. 在智能手机环境下健康管理功能设计与研究,TN929.53
  18. 声学计算机键盘原理研究与实现,TP334.23
  19. 井下数据采集与传输方法研究,TE938
  20. 基于DSP的单频激光实时信号解调方法研究,TN911.3
  21. 足球运动数据采集系统设计,TP212.9;TP274.2

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com