学位论文 > 优秀研究生学位论文题录展示
基于语义的自动文摘系统
作 者: 江军
导 师: 佘莉
学 校: 电子科技大学
专 业: 软件工程
关键词: 自动文摘 词汇链 句子关系图 分类 聚类
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 56次
引 用: 0次
阅 读: 论文下载
内容摘要
当今社会,电子信息数量呈指数级增长。对信息的筛选和浓缩等问题的研究工作显得尤为重要。自动文摘可以大幅度降低人工文摘的成本,缩短文章加工和处理时间,为用户迅速、准确和廉价的获取信息提供方便。?本文提出了一种基于语义特征的自动摘要方法,方法最初通过对训练集文本进行人工摘要和句子特征标注,训练得到Na?ve‐Bayes分类器。进入摘要阶段后,首先对待处理文本进行句子特征抽取;然后利用Na?ve‐Bayes分类器对句子分类并得到文摘候选句;最后对候选句进行冗余消除,得到最终文摘。?在句子特征抽取方面,方法提出了基于语义的句子特征,包括词汇链和句子关系图特征。词汇链提供了文章词汇衔接结构的表示方法,是一种词汇间语义关系引起的凝聚力,是由围绕文中某主题的许多相关词组成的集合体。方法通过识别文本词汇链,并计算各词汇链权值,最后将该权值作为相应句子的特征权值。句子关系图反应了文章句子间的关联关系。方法通过构建文本的句子关系图,并计算句子在关系图中的复杂网络参数作为该句子的特征。?在摘要句冗余消除方面,方法对文摘候选句进行聚类,并筛选掉多余的候选句以控制摘要的冗余。为了提高聚类的效率,方法将分类的思想引入到聚类过程中,提出了一种基于粗分类的聚类算法。?文章对基于语义的自动摘要进行了研究,并在句子特征抽取和冗余消除方面提出了改进的算法,实验和示例结果显示新的算法具有较好的实用效果。文章的最后给出了本摘要系统的总体设计和主要模块的实现。?
|
全文目录
相似论文
- K公司计划及预测改进对于合理库存配置的研究,F224
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 基于词义及语义分析的问答技术研究,TP391.1
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 多邮件自动文摘的关键技术研究,TP391.1
- 基于串核的蛋白质分类算法的研究与实现,TP301.6
- 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 上下文相关的词汇复述研究,TP391.1
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 互联网上旅游评论的情感分析及其有用性研究,TP391.1
- 图像分割中阴影去除算法的研究,TP391.41
- 基于图分割的文本提取方法研究,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 多样性密度学习算法的研究与应用,TP181
- 运动特征及地形约束的感知网目标跟踪算法及系统研究,TP212.9
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 高血压前期证候特征研究,R259
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- K-均值聚类算法的研究与改进,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|