学位论文 > 优秀研究生学位论文题录展示

主观题自动评分技术研究

作 者: 郭扉扉
导 师: 尹文生
学 校: 华中科技大学
专 业: 工业工程
关键词: 自然语言理解 中文分词 潜在语义分析 奇异值分解 单向贴近度 动态规划
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 10次
引 用: 0次
阅 读: 论文下载
 

内容摘要


借用狄更斯在《双城记》中的话,“这是最好的时代;这是最坏的时代”。大量的信息充斥着人们的生活,面对浩瀚的互联网,如何选择有价值的信息成为每个人时时刻刻要面对的问题。因此,对人工智能、数据挖掘、自然语言理解等技术的研究越来越受到人们的关注。自然语言处理技术融合了计算机科学技术和人工智能技术,最初普遍地应用在信息搜索技术领域。本文从信息搜索技术领域出发,针对自然语言理解中的若干关键问题进行了研究和讨论分析,并将自然语言处理技术应用到主观题自动评分方法中,期待得到令人满意的结果。首先介绍了知识检索技术的发展以及应用,接着介绍了主观题自动分析技术的研究现状,分析总结了自然语言处理技术的发展方向,作为后续研究的基础。文章主要包括三方面内容:第一个方面是中文分词算法的设计。本文设计了一种基于全字索引结构的词典,该词典通过哈希表这种数据结构以词条中每个字为关键字建立索引,实现了非首字查询和模糊查询,词典构建方式简单并且易于更新维护。以《同义词语林》为数据源构建了全字索引词典,基于该词典的分词算法经实验验证可以正确进行分词。第二个方面是潜在语义分析法的分析和应用。通过实例具体分析了潜在语义分析法的降维去噪、挖掘文本潜在语义的功能。该算法利用线性代数中的奇异值分解方法,依靠统计计算大量训练集来提高算法精度。实验证明将潜在语义分析法用在主观题自动分析中效果并没有理想中好,主要原因是缺少大量的训练数据,仍需进一步实验验证。第三个方面是基于模糊数学中单向贴近度字符串匹配方法,结合动态规划算法思想,设计并实现了基于语义脉络的自动评分算法。该算法与潜在语义分析法不同的是更注重对语义信息的表示和匹配。结合实例分析证明了该算法较潜在语义分析法得到了更令人满意的评分结果。

全文目录


摘要  4-5
Abstract  5-8
1 绪论  8-15
  1.1 课题背景及研究意义  8-10
  1.2 国内外研究现状  10-14
  1.3 本文的主要研究内容与结构  14-15
2 基于全字索引的中文分词技术  15-24
  2.1 全字索引字典的构建  16-20
  2.2 基于全字索引字典的中文分词算法  20-23
  2.3 本章小结  23-24
3 潜在语义分析技术  24-36
  3.1 矩阵奇异值分解  24-29
  3.2 潜在语义分析在信息检索领域的应用  29-32
  3.3 潜在语义分析在主观题自动评分中的应用  32-35
  3.4 本章小结  35-36
4 基于单向贴近度的主观题自动评分算法  36-52
  4.1 算法总体思想  36-37
  4.2 数据结构  37-39
  4.3 算法流程  39-46
  4.4 实例分析  46-51
  4.5 本章小结  51-52
5 全文总结与展望  52-54
  5.1 全文总结  52-53
  5.2 研究展望  53-54
致谢  54-55
参考文献  55-59
攻读学位期间发表学术论文目录  59

相似论文

  1. 机载导弹的传递对准研究,V249.322
  2. 面向领域的数据库问答系统关键技术研究,TP311.13
  3. 基于条件随机场的中文分词技术的研究与实现,TP391.1
  4. 基于参考图像的乳腺肿块诊断方法研究,TP391.41
  5. 电力系统电压无功控制方法研究,TM761.1
  6. 水库多目标优化调度研究,TV697.1
  7. 面向情感的电影背景音乐分类方法研究,TP391.1
  8. 基于WebHarvest的中文财经新闻搜索引擎的设计与实现,TP311.52
  9. 中文XML压缩技术研究,TP311.11
  10. 基于核回归与非局部方法的图像去噪研究,TP391.41
  11. Web新闻热点发现系统的设计与实现,TP393.09
  12. 基于ML_pLSA模型和特征包算法的目标识别方法,TP391.41
  13. 基于子空间分析的扩频通信窄带干扰抑制研究,TN914.42
  14. 企业邮件监管系统的设计与实现,TP393.098
  15. 基于动态规划的房地产多项目开发优化决策,F293.3
  16. 音乐信号节奏信息实时获取技术研究与系统实现,TN912.3
  17. 基于奇异值分解的信号处理方法及其在机械故障诊断中的应用,TH165.3
  18. 软件企业人力资源调度方法研究与实现,TP311.52
  19. 面向学科的文献资源聚类系统研究及应用,TP391.1
  20. 基于WEB的社区智能医疗服务系统的研究,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com