学位论文 > 优秀研究生学位论文题录展示
教学资源自动文摘系统的研究与设计
作 者: 张瑞玲
导 师: 朱卫东
学 校: 北京交通大学
专 业: 教育技术学
关键词: 自动文摘 教学资源 中文分词 关键词提取
分类号: G434
类 型: 硕士论文
年 份: 2014年
下 载: 21次
引 用: 0次
阅 读: 论文下载
内容摘要
随着教育信息化的迅速发展,网络成为获取教学资源越来越重要的途径,电子格式学习资源的数量也越来越庞大。然而,庞大的资料数目为学习者提供宽广选择范围的同时也降低了筛选效率。从海量信息中快速选择出所需资源变得越来越重要。自动文摘技术能够对文档内容进行压缩和筛选,提炼出原始文档的核心内容,帮助用户快速了解文章主要内容,进而对文章进行筛选。本文在现有自动文摘技术基本概念和方法的基础上,通过对国内外研究成果的分析梳理,对汉语特征词提取算法以及文章主题句抽取多种方法进行了分析研究。在关键词抽取和文摘句提取的算法选择方面,本文主要采用了基于词频的计算方法对文章进行关键词提取,并使用综合词权、位置、句型等多种特征的方法计算文章中每个句子的权重。最后,本文以思源网络教学平台为依托实现了一个实验性质的自动文摘系统,该系统能够生成效果较好的自动文摘。系统首先对获取的教学资源文档进行文本格式转换,提取出其中的纯文本内容以备后续分析使用。对于符合条件且需要生成自动文摘的文档资源,系统会对其篇章结构进行浅层分析。分词是自动文摘技术的重要前提,本文选用分词效果较好的中科院汉语分词系统,并使用人工语料库进行文章关键词和候选文摘句的提取。然后通过基于语义词典的语义相似度计算方法降低同义句造成的冗余,并根据预定义的简单关联词规则对所生成自动文摘进行连贯性处理,提高其可读性。系统最后能够实现关键词和自动文摘的双重呈现。
|
全文目录
致谢 5-6 摘要 6-7 ABSTRACT 7-10 1 绪论 10-15 1.1 课题的研究背景和研究意义 10-11 1.2 国内外研究现状 11-12 1.2.1 国外研究现状 11-12 1.2.2 国内研究现状 12 1.3 本课题的主要研究内容 12-13 1.4 论文组织结构 13-15 2 自动文摘综述 15-28 2.1 自动文摘简介 15-16 2.2 自动文摘方法分类 16-23 2.2.1 基于特征分析方法 16-19 2.2.2 基于篇章结构方法 19-20 2.2.3 基于知识理解方法 20-22 2.2.4 基于框架抽取方法 22-23 2.3 自动文摘评价 23-28 2.3.1 内部评价法(Intrinsic methods) 24-26 2.3.2 外部评价法(Extrinsic methods) 26-27 2.3.3 评价方法的选择 27-28 3 文本预处理及中文分词技术 28-38 3.1 文本获取 28-31 3.2 文本结构分析 31 3.3 中文分词技术 31-38 3.3.1 中文分词算法 31-35 3.3.2 IKAnalyser分词系统 35-36 3.3.3 ICTCLAS汉语分词系统 36-38 4 自动文摘生成技术 38-52 4.1 特征词提取 38-42 4.1.1 去高频无意词 38-39 4.1.2 特征选择算法 39-42 4.2 主题句抽取 42-46 4.2.1 主题句抽取方法 42-44 4.2.2 基于多种因素的句子权重计算方法 44-46 4.3 相似度处理 46-50 4.3.1 相似度计算方法 46-48 4.3.2 常用语义词典 48-50 4.4 关键词及文摘句输出 50-52 5 教学资源自动文摘系统的设计与实现 52-69 5.1 系统总体设计 52-53 5.2 开发环境 53-54 5.3 详细设计和实现 54-60 5.4 实验结果分析 60-69 5.4.1 关键词抽取实验分析 60-63 5.4.2 自动文摘结果实验分析 63-69 6 总结和展望 69-70 参考文献 70-73 作者简历 73-75 学位论文数据集 75
|
相似论文
- 多邮件自动文摘的关键技术研究,TP391.1
- 河源地区中学美术教学资源的本土化开发研究,G633.955
- 农村英语课程信息化教学资源应用现状与对策研究,G434
- 作为中学语文教学资源的校园文化研究,G633.3
- 基于聚焦爬虫技术的教学资源搜集与自动整理方法研究,TP301.6
- 高中历史新课程网络教学资源的合理有效利用研究,G633.51
- 依标施教背景下《历史与社会》教学资源的有效使用,G633.51
- 基于词跨度的中文文本关键词提取及在文本分类中的应用,TP391.1
- 基于Moodle的混合式教学研究与实践,TP391.6
- Web2.0理念下中职学校校本资源库的设计与实现,TP391.6
- 基于LSA和段落聚类的自动文摘系统的研究,TP391.1
- 高校教务子系统—教学资源库管理系统的设计与实现,TP311.52
- 全文检索及相关技术研究,TP391.3
- 基于B/S架构的飞行训练教学资源系统研究与实现,TP311.52
- 沈阳理工大学教学资源管理系统的研究与设计,TP311.52
- LUCENE中文分词在科研文档全文检索系统的应用研究,TP311.52
- 基于条件随机场的中文分词技术的研究与实现,TP391.1
- 网络课程现存问题的探究及对策研究,G434
- 主观题自动评分技术研究,TP391.1
- 基于观点挖掘的产品可用性建模与评价,F274
- 基于汉语口语教学的多媒体教学资源库设计,H195
中图分类: > 文化、科学、教育、体育 > 教育 > 电化教育 > 计算机化教学
© 2012 www.xueweilunwen.com
|