学位论文 > 优秀研究生学位论文题录展示
反抄袭检测系统的研究与实现
作 者: 黄俊花
导 师: 刘勇
学 校: 沈阳理工大学
专 业: 计算机应用技术
关键词: 抄袭检测 模式匹配 相似度算法 APT算法
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 83次
引 用: 1次
阅 读: 论文下载
内容摘要
随着互联网的普及和网络资源的日益丰富,给人们的工作、生活、娱乐带来很大的便利,同时也也引发了一系列负面的影响,比如日益严重的抄袭现象。近年来,学术抄袭现象屡屡发生,给社会以及个人带来了很坏的影响。为了防止信息资源的非法复制、保护知识产权,各国陆续投入到反抄袭检测技术的研制队列中并取得了一定的进步,为遏制日益严重抄袭现象的做出了很大贡献。本文首先介绍了反抄袭技术的发展背景、国内外研究状况以及未来的发展趋势,接着分析现有国内外典型的反抄袭检测工具技术方案、结构原理以及性能的优缺点,并探讨了系统所需的模式匹配算法、相似度算法以及中文分词等相关技术及其特点,在此基础上提出了一款基于中英文的反抄袭检测系统的设计方案。其次,本文分析目前抄袭检测工具的不足,提出了一种基于中英文环境下的反抄袭检测算法APT算法。该算法设计实现了对中英文字符串的合理分割和匹配结构的构建,在匹配过程结合文本跳跃匹配策略,并利用本文设计的相似度度量方法,实现中英文混合环境下的抄袭检测。再次,本文设计了基于B/S三层架构的反抄袭系统的设计构思,并实现了用户注册模块、文档提交模块、文档筛选模块、抄袭检测模块、数据库管理模块的功能。系统设计采用HTML作为系统文件,通过在PHP程序中嵌入SQL语句访问数据库信息,用Apache 2.2.6作为Web服务器,MySQL 5.0.51作为后台数据库支持,并在Unix虚拟环境下采用C语言实现对PHP函数的功能扩展,最后用户可以通过浏览器访问本系统。最后,本文详细介绍了反抄袭检测系统功能模块的实现,包括用户注册、用户登录、文档提交、文档筛选、用户信息维护、文档库的更新等。并设计两组实验验证了文档筛选模块和抄袭检测模块的可行性。
|
全文目录
摘要 6-7 Abstract 7-11 第1章 引言 11-16 1.1 研究背景和意义 11-12 1.2 国内外的研究现状和发展趋势 12-14 1.3 论文组织结构 14-16 第2章 反抄袭检测技术概述 16-22 2.1 抄袭与剽窃 16-17 2.2 现有的反抄袭技术工具 17-20 2.2.1 基于词频统计技术的检测方法 17-19 2.2.2 基于数字指纹技术的检测方法 19-20 2.3 本章小结 20-22 第3章 反抄袭检测系统实现的相关技术 22-38 3.1 反抄袭检测技术的研究 22-23 3.2 模式匹配技术 23-33 3.2.1 单模式匹配算法 23-27 3.2.2 多模式匹配算法 27-33 3.3 相似度算法 33-34 3.4 中文分词技术 34-37 3.4.1 基于字符串匹配的分词方法 34-36 3.4.2 基于统计的分词方法 36 3.4.3 基于知识理解的分词方法 36-37 3.5 本章总结 37-38 第4章 反抄袭检测系统算法 38-49 4.1 算法需求分析 38-39 4.2 算法设计 39-47 4.2.1 文本预处理 39-42 4.2.2 文本检测 42-44 4.2.3 算法的状态跳转和相似度的计算 44-47 4.3 算法性能分析 47-48 4.4 本章小结 48-49 第5章 反抄袭检测系统的设计 49-56 5.1 系统的模块设计 49-52 5.1.1 用户注册模块 50 5.1.2 文档筛选模块 50-51 5.1.3 抄袭检测模块 51-52 5.1.4 后台维护模块 52 5.2 系统流程介绍 52-55 5.2.1 系统界面 52-54 5.2.2 系统流程 54-55 5.3 本章小结 55-56 第6章 实验与系统测评 56-68 6.1 系统的前台实现 56-61 6.2 数据库表的创建和文档库的建立 61-64 6.2.1 管理员登录 61 6.2.2 数据库表 61-63 6.2.3 文档库的建立 63-64 6.3 实验和系统分析 64-67 6.3.1 实验环境 64-67 6.3.2 系统分析 67 6.4 本章小结 67-68 结论 68-70 参考文献 70-74 攻读硕士学位期间发表的论文和获得的科研成果 74-75 致谢 75-76
|
相似论文
- Web环境下基于语义模式匹配的实体关系提取方法的研究,TP391.1
- 云计算中依赖任务动态并行调度机制的研究,TP3
- 基于模式匹配与协议分析的分布式入侵检测研究,TP393.08
- 指纹识别相关算法的改进研究,TP391.41
- 地面多传感器数据融合算法分析与软件实现,TP202
- 层次化的分布式入侵检测系统研究,TP393.08
- DWIIS系统中查询接口集成机制的研究,TP393.09
- 面向Deep Web响应页面的模式识别的研究,TP393.092
- Deep Web下不确定数据处理的研究,TP311.13
- 基于多目红外相机的手术机器人光学跟踪系统相关技术研究,TP242
- 基于半监督聚类的入侵检测防火墙研究,TP393.08
- 源代码抄袭检测系统的研究和实现,TP311.52
- 基于使用信息的数据库模式匹配方法研究,TP311.13
- 面向网络预警的并行模式匹配方法研究,TP393.08
- 硬件防火墙中多模式匹配算法的设计与实现,TP393.08
- 综合网络态势分析技术研究与实现,TP393.07
- 基于抽象语法树的程序代码抄袭检测技术研究,TP274
- 基于snort的入侵检测系统的研究与设计,TP393.08
- 基于BM和BMHS的单模式匹配算法的研究,TP393.08
- 基于字频的模式匹配算法研究,TP393.08
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|