学位论文 > 优秀研究生学位论文题录展示
基于论文语义的高效剽窃检查技术与系统研究
作 者: 康方圆
导 师: 李银胜
学 校: 复旦大学
专 业: 计算机软件与理论
关键词: 论文语义 剽窃检查 网络信息抽取
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 32次
引 用: 1次
阅 读: 论文下载
内容摘要
近年来,随着互联网技术的飞速发展和网络数据库资源的日益丰富,论文信息的获取越来越便利。科研人员可以很方便地检索到各种需要的学术论文,协助研究工作。但与此同时,这也方便了论文的抄袭,抄袭者只需进行简单的复制粘贴即可将他人的论文内容占为己有。学术领域的论文剽窃行为愈演愈烈,引起了社会上的强烈关注。找到一种高效的论文剽窃检查技术与方法,不仅能有效地发现有抄袭现象的论文,还能有效遏制论文剽窃现象。为此,作者所在课题组与上海晨鸟信息科技有限公司合作,研制了基于元搜索引擎的论文剽窃检查方法与系统。本论文将在已有成果基础上,对剽窃检查涉及的文本复制监测等相关技术的国内外现状进行调查分析,并且基于已有系统,利用论文语义对剽窃检查算法各个环节进行优化和提高,涉及的主要工作包括:1.调查分析了面向领域语义本体技术的国内外技术现状。2.设计了基于语义的论文剽窃检查系统架构,描述了系统的整体流程及关键技术实现。3.探讨了一般学术论文常见的论文结构,以及各结构内容所包含的语义信息,并提出了论文结构本体的构建方法,设计了基于论文结构语义的预处理方法,有效地对论文进行预分类,以及候选集查找。4.提出了新的相对单元密度模型,并利用该模型设计了相应的候选集过滤方法、相似度计算方法以及剽窃判定方法。5.本文通过典型的测试用例验证了基于语义的论文剽窃检查算法的有效性和高效性。
|
全文目录
中文摘要 3-4 英文摘要 4-8 图目录 8-9 表目录 9-10 第一章 绪论 10-19 1.1 课题背景 10 1.2 前期工作 10-17 1.2.1 基于元搜索引擎的论文剽窃检查算法 11-13 1.2.2 基于词频统计的论文剽窃检查算法 13-17 1.3 本文研究内容与工作 17-18 1.4 本文的结构安排 18-19 第二章 论文剽窃检查相关技术 19-30 2.1 论文剽窃检查知识 19-20 2.1.1 论文剽窃的界定 19 2.1.2 论文剽窃的类型 19-20 2.1.3 论文剽窃的判定方法 20 2.2 文本复制检测技术 20-25 2.2.1 概述 20-21 2.2.2 文本复制检测系统的研究问题 21 2.2.3 文本复制检测中的文本块分块策略 21-22 2.2.4 文本复制检测系统中采用的技术 22-25 2.3 面向领域的语义本体 25-29 2.3.1 本体的定义 25-27 2.3.2 本体的分类 27 2.3.3 本体的描述语言 27-28 2.3.4 本体的查询语言 28-29 2.4 本章小结 29-30 第三章 基于论文语义的剽窃检查系统设计 30-32 3.1 剽窃检查系统整体架构 30-31 3.2 剽窃检查流程与算法 31 3.2.1 论文结构化分析 31 3.2.2 互联网信息抽取 31 3.2.3 候选集查找及过滤 31 3.2.4 相对单元密度计算 31 3.3 本章小结 31-32 第四章 语义剽窃检查系统关键技术实现 32-41 4.1 基于论文结构语义的预处理方法 33-36 4.1.1 论文结构语义分析 33-34 4.1.2 论文结构本体及实例构建 34-36 4.1.3 基于本体的论文分类方法 36 4.1.4 基于本体的候选集查找方法 36 4.2 基于相对单元密度的剽窃检查方法 36-40 4.2.1 相对单元密度 37-38 4.2.2 基于相对单元密度的候选集过滤方法 38-39 4.2.3 基于相对单元密度的相似度计算及剽窃判定方法 39-40 4.3 系统开发环境与技术选型 40 4.4 本章小结 40-41 第五章 性能分析与评价 41-45 5.1 剽窃检查的评测标准 41-43 5.1.1 正确率和召回率 41-42 5.1.2 时间复杂度 42-43 5.2 测试环境 43 5.3 测试用例 43 5.4 测试结果 43-44 5.5 本章小结 44-45 第六章 总结与展望 45-47 6.1 全文总结 45-46 6.2 前景展望 46-47 参考文献 47-51 攻读硕士期间发表论文 51-52 致谢 52-53
|
相似论文
- 语言学论文和物理学论文中模糊限制机制的对比研究,H0
- 基于信息抽取技术的商业社会网络创建研究,TP391.1
- 基于FPGA的数字图像处理基本算法研究与实现,TP391.41
- 用于检索的人脸特征提取与匹配算法研究,TP391.41
- 基于FPGA的高速图像预处理技术的研究,TP391.41
- 2D人脸模板保护算法研究,TP391.41
- 导弹虚拟试验可视化技术研究,TP391.9
- 基于用户兴趣特征的图像检索研究与实现,TP391.41
- 图像拼接技术研究,TP391.41
- 高效精确字符串匹配算法的研究与实现,TP391.41
- 基于词义及语义分析的问答技术研究,TP391.1
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 舌体特征的提取及融合分类方法研究,TP391.41
- 统计机器翻译中结构转换技术的研究,TP391.2
- 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
- 基于句法特征的代词消解方法研究,TP391.1
- 空中目标与背景的红外图像仿真技术研究,TP391.41
- 基于EPC C1G2协议的超高频RFID系统设计及仿真,TP391.44
- 基于智能学习的多传感器目标识别与跟踪系统研究,TP391.41
- 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
- 双传感器图像联合目标检测及系统实现研究,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|