学位论文 > 优秀研究生学位论文题录展示

基于混联电路的复述识别方法研究

作 者: 管益龙
导 师: 张茂元
学 校: 华中师范大学
专 业: 计算机应用技术
关键词: 复述识别 电阻距离 拉普拉斯矩阵 混联电路
分类号: TP391.1
类 型: 硕士论文
年 份: 2014年
下 载: 0次
引 用: 0次
阅 读: 论文下载
 

内容摘要


复述(Paraphrase),国内的研究者有时也称之为“改写”,顾名思义就是对相同意思的不同表达。复述在自然语言中是一种非常普遍的现象,同时也在自然语言处理(NLP)的应用领域中扮演着很重要的角色,是自然语言处理(NLP)中一个研究的难点和热点,因此现在越来越受到广大研究者的关注。本文的主要研究对象是基于混联电路的复述识别技术。复述识别技术可以实时处理机器翻译中遇到的未登录短语,复述识别技术也能识别自动问答系统中多重问句形式从而提高系统性能,复述识别技术还能在多文档自动摘要系统中用于生成、压缩、相似句子识别等等。本文首先提出了一种新的句子之间距离计算的方法,此方法类似于相似度的计算方法,不同之处在于,电阻距离是计算的值越小,两个句子越相似,而相似度是计算的值越大,两个句子越相似。我们首先把两个句子分别用图G (V,E,co)的方法把它们表示出来,然后我们把这两幅图合并,相同的单词节点V合并在一起,不同的单词节点V不合并在一起,与此同时相应的边E和权重ω也合并在一起,权重ω的倒数即是对应的电阻,其中我们引入了英文同义词词典WordNet,来提高两个句子之间的正确率、召回率和F1值。这两个句子之间的电阻距离就是混联电路总电阻除以合并之后图中的节点总个数,最后我们通过公式优化两个句子之间的电阻距离从而判别这两个句子是否是复述句对。对于此种方法,判断两个句子之间是否为复述句的正确率,召回率和F1值还不够高,所以针对这种方法,我们提出了此种方法的改进方法。我们引入了拉普拉斯矩阵L来改进电阻的计算方法,我们首先还是把两个句子分别用图G (V,E,ω)的方法表示出来,然后把这两幅图合并,然后写出合并之后图的邻接矩阵A和度量矩阵D,则可以得到拉普拉斯矩阵L=D-A,我们再求出L的广义逆矩阵L+,再利用公式计算出每两个节点之间的电阻,其中我们也同样引入了英文同义词词典WordNet。这两个句子之间的电阻距离就是混联电路总电阻除以合并之后图中节点的总个数,最后通过公式优化两个句子之间的电阻距离来判别这两个句子是否是复述句对。最后的实验结果证明了该方法的有效性。

全文目录


摘要  5-6
Abstract  6-10
第一章 绪论  10-15
  1.1 课题背景  10-11
  1.2 本文研究的意义  11
  1.3 当前国内外相关技术  11-13
  1.4 本文的主要研究内容  13-14
  1.5 本文的内容安排  14-15
第二章 相关技术研究  15-25
  2.1 引言  15
  2.2 语义相似度介绍  15-18
    2.2.1 《知网》的语义相似度  15
    2.2.2 基于WordNet的英语词语相似度计算  15-17
    2.2.3 基于TFIDF方法的英语句子相似度  17-18
  2.3 基于语义角色标注的新闻领域复述句识别方法  18-20
  2.4 基于文本规范化的复述识别方法  20-22
    2.4.1 文本规范化  20-21
    2.4.2 有监督学习  21-22
  2.5 基于反向转换文法的复述识别及文字蕴含  22-24
    2.5.1 反向转换文法(ITG)  22-23
    2.5.2 评分方法  23-24
    2.5.3 复述识别及实验结果  24
  2.6 本章小结  24-25
第三章 基于混联电路的复述识别  25-37
  3.1 问题的引出  25
  3.2 系统流程  25
  3.3 基于混联电路的复述识别  25-34
    3.3.1 电阻距离的定义  26
    3.3.2 电阻的生成  26-27
    3.3.3 同义词词典的添加  27-28
    3.3.4 电阻距离的计算方法  28-34
    3.3.5 复述识别的判别方法  34
  3.4 实验与分析  34-36
    3.4.1 复述识别参数估计  34-35
    3.4.2 实验结果对比与分析  35-36
  3.5 本章小结  36-37
第四章 基于拉普拉斯矩阵混联电路的复述识别  37-45
  4.1 问题的引出  37
  4.2 系统流程  37-38
  4.3 基于拉普拉斯矩阵混联电路的复述识别方法  38-42
    4.3.1 拉普拉斯矩阵的定义  38
    4.3.2 电阻的生成  38-41
    4.3.3 同义词词典的添加  41
    4.3.4 复述识别的判别方法  41-42
  4.4 实验与分析  42-43
    4.4.1 复述识别参数估计  42-43
    4.4.2 实验结果对比与分析  43
  4.5 本章小结  43-45
第五章 本文总结与未来工作展望  45-47
  5.1 本文总结  45-46
  5.2 未来工作展望  46-47
参考文献  47-51
攻读硕士学位阶段参与的科研项目  51-52
致谢  52-53

相似论文

  1. 图的拉普拉斯谱半径和无号拉普拉斯谱半径,O157.5
  2. 基于三维模型数字水印算法研究,TP309.7
  3. 树的拉普拉斯系数,O157.5
  4. 图的电阻距离和Kirchhoff指标,O157.5
  5. 图的Kirchhoff指标,O157.5
  6. 赋权图的Kirchhoff指标,O157.5
  7. 双圈图的Kirchhoff指标极值,O157.5
  8. 代数图论中的若干问题,O157.5
  9. 关于图的特征值的几个问题的研究,O157.5
  10. 相关图的补图的谱半径,O157.5
  11. 网络数据降维与Kirchhoff电阻,TP301.6
  12. 基于图和网络的学习算法及其在系统生物学中的一些应用,TP391.41
  13. 图的结构参数与特征值,O157.5
  14. 随机图中若干矩阵的谱性质,O157.5
  15. 图的电阻距离法则和Kirchhoff指标研究,O157.5
  16. 图的密度矩阵的可分性,O157.5
  17. 图的最大拉普拉斯特征值,O157.5
  18. 某些图的谱半径与代数连通度,O157.5
  19. 图的电阻距离及基于电阻距离的图的不变量研究,O157.5
  20. 有关组合矩阵论中图谱与符号模式矩阵的研究,O157.5

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com