学位论文 > 优秀研究生学位论文题录展示
基于写作风格特征的论文剽窃检查优化方法研究
作 者: 朱牧
导 师: 李银胜
学 校: 复旦大学
专 业: 计算机软件与理论
关键词: 写作风格特征 票窃检查 语义词典
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 46次
引 用: 0次
阅 读: 论文下载
内容摘要
互联网技术日新月异的发展与网络数据库资源的日益丰富,为科研工作带来极大的帮助。学术论文、调研报告、分析数据等等学术论文写作所需要的参考资料得以便捷获取,与此同时论文抄袭也相应地更为容易与常见。寻找并建立有效预防及遏制剽窃行为的手段已经刻不容缓。自2005年以来,作者所在课题组通过产学研合作模式,在论文剽窃检查方面进行了大量的研究和开发,完成了基于词频的论文剽窃检查以及基于相对单元密度的论文剽窃检查的设计与实现。前者对于完全抄袭的情况可以起到很好的判别作用,后者则在此基础上完成了对部分抄袭情况的判断,使得检查结果的召回率得到显著提高。然而,这两种剽窃检查方法在改变原文的剽窃行为判断方面还存在较大的局限。为此,我们在其基础上引入了综合性考量对象——写作风格特征,对现有的剽窃检查方法进行优化。主要工作有如下4个方面:1.本文研究对比了国内外主流的与写作风格特征分析相关的技术以及语义词典技术,从中寻找适合应用于单篇论文的,满足剽窃检查应用需求的技术思路。2.介绍了本课题组的前期工作:设计并实现了基于词频统计的论文剽窃检查算法,以及基于相对单元密度的论文剽窃检查应用。在介绍前期工作取得的具体进展同时,还说明了目前这两个方法存在的问题、局限以及可改进之处。3.在前期工作基础上,借鉴国内外相关技术,提出了基于写作风格特征的论文剽窃检查优化方法,建立初步的写作风格特征语义词典,描述了相应的论文剽窃检查系统的结构与整体流程。4.本文通过具体的应用实例分析,阐述了优化方法的应用场景与效果,验证了新方法的有效性。本文所研究的基于写作风格特征的论文剽窃检查方法是对前期工作的补充优化,对改变原文的论文剽窃情况进行分析检查,为剽窃检查课题引入了新的思路,帮助该课题进一步深入研究奠定基础,从而逐步建立起更准确更完善的剽窃检查方法与系统,对学术剽窃的不正风气起到有效的打击预防作用。
|
全文目录
摘要 4-5 Abstract 5-7 第一章 绪论 7-10 1.1 前言 7 1.2 研究背景 7-8 1.3 本文研究内容与日标 8-9 1.4 论文结构 9-10 第二章 相关技术研究与成果综述 10-15 2.1 写作风格特征分析技术 10-11 2.1.1 基于统计方法的写作风格研究 10 2.1.2 基于HNC理论的写作特征研究 10-11 2.2 论文语义相关技术 11-12 2.3 已有工作基础及局限 12-14 2.4 本章小结 14-15 第三章 基于写作风格特征的论文剽窃检查优化方法设计 15-22 3.1 论文风格特征要素 15-17 3.1.1 领域关键词 15-16 3.1.2 领域关键词的特点 16-17 3.2 论文风格特征分析 17-19 3.2.1 领域关键词词频 17 3.2.2 同义词使用习惯分析 17-19 3.3 剽窃检查评价方法 19-21 3.3.1 论文剽窃界定与分类 19 3.3.2 剽窃检查结果评测指标 19-20 3.3.3 系统性能指标 20-21 3.4 本章小结 21-22 第四章 基于写作风格特征的论文剽窃检查优化方法实现 22-32 4.1 写作风格特征语义词典建模方法 22-23 4.2 领域关键词分析 23-28 4.2.1 领域关键词识别 23-25 4.2.2 词频统计分析 25-26 4.2.3 同义词使用习惯分析 26-28 4.3 风格特征分析流程 28-30 4.4 风格特征分析系统模块组成 30-31 4.5 本章小结 31-32 第五章 应用分析与评价 32-40 5.1 应用场景 32-33 5.2 剽窃检查结果分析 33-34 5.3 系统性能测试与评价 34-39 5.3.1 评测环境及条件 34 5.3.2 时间消耗测试 34-35 5.3.3 空间开销测试 35-36 5.3.4 系统稳定性测试 36-39 5.4 本章小结 39-40 第六章 总结与展望 40-42 6.1 总结 40 6.2 展望 40-42 参考文献 42-44 致谢 44-45
|
相似论文
- 基于语义词典和局部分析的查询扩展研究,TP391.3
- 基于多维语义的互联网药品信息抽取的研究与应用,TP393.09
- 基于WordNet和FrameNet的领域语义词典的构建研究,TP391.1
- 大规模汉语语义词典构建,TP391.1
- 互联网药品信息抽取算法的研究,TP393.01
- 基于关系数据库的专业领域语义词典构建研究,TP311.13
- 基于结构语义熵的互联网商品信息抽取技术研究,TP391.1
- 同义词挖掘及其在概念信息检索系统中的应用研究,TP391.3
- 支持语义的图像检索系统研究与实现,TP391.3
- 城市规划成果规则语义识别及函数化表达研究,P208
- 俄语军事文本的局部语义分析,H35
- 一种基于图元的多级图像检索系统,TP391.3
- 自然语言文本水印技术研究,TP309.7
- “意思—文本”模式的词库理论与词库建设,H0-06
- 基于中文维基百科的语义知识挖掘相关研究,TP391.1
- 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
- 用于检索的人脸特征提取与匹配算法研究,TP391.41
- 基于FPGA的高速图像预处理技术的研究,TP391.41
- 2D人脸模板保护算法研究,TP391.41
- 导弹虚拟试验可视化技术研究,TP391.9
- 基于用户兴趣特征的图像检索研究与实现,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|