学位论文 > 优秀研究生学位论文题录展示

反抄袭检测系统的研究与实现

作 者: 黄俊花
导 师: 刘勇
学 校: 沈阳理工大学
专 业: 计算机应用技术
关键词: 抄袭检测 模式匹配 相似度算法 APT算法
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 83次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着互联网的普及和网络资源的日益丰富,给人们的工作、生活、娱乐带来很大的便利,同时也也引发了一系列负面的影响,比如日益严重的抄袭现象。近年来,学术抄袭现象屡屡发生,给社会以及个人带来了很坏的影响。为了防止信息资源的非法复制、保护知识产权,各国陆续投入到反抄袭检测技术的研制队列中并取得了一定的进步,为遏制日益严重抄袭现象的做出了很大贡献。本文首先介绍了反抄袭技术的发展背景、国内外研究状况以及未来的发展趋势,接着分析现有国内外典型的反抄袭检测工具技术方案、结构原理以及性能的优缺点,并探讨了系统所需的模式匹配算法、相似度算法以及中文分词等相关技术及其特点,在此基础上提出了一款基于中英文的反抄袭检测系统的设计方案。其次,本文分析目前抄袭检测工具的不足,提出了一种基于中英文环境下的反抄袭检测算法APT算法。该算法设计实现了对中英文字符串的合理分割和匹配结构的构建,在匹配过程结合文本跳跃匹配策略,并利用本文设计的相似度度量方法,实现中英文混合环境下的抄袭检测。再次,本文设计了基于B/S三层架构的反抄袭系统的设计构思,并实现了用户注册模块、文档提交模块、文档筛选模块、抄袭检测模块、数据库管理模块的功能。系统设计采用HTML作为系统文件,通过在PHP程序中嵌入SQL语句访问数据库信息,用Apache 2.2.6作为Web服务器,MySQL 5.0.51作为后台数据库支持,并在Unix虚拟环境下采用C语言实现对PHP函数的功能扩展,最后用户可以通过浏览器访问本系统。最后,本文详细介绍了反抄袭检测系统功能模块的实现,包括用户注册、用户登录、文档提交、文档筛选、用户信息维护、文档库的更新等。并设计两组实验验证了文档筛选模块和抄袭检测模块的可行性。

全文目录


摘要  6-7
Abstract  7-11
第1章 引言  11-16
  1.1 研究背景和意义  11-12
  1.2 国内外的研究现状和发展趋势  12-14
  1.3 论文组织结构  14-16
第2章 反抄袭检测技术概述  16-22
  2.1 抄袭与剽窃  16-17
  2.2 现有的反抄袭技术工具  17-20
    2.2.1 基于词频统计技术的检测方法  17-19
    2.2.2 基于数字指纹技术的检测方法  19-20
  2.3 本章小结  20-22
第3章 反抄袭检测系统实现的相关技术  22-38
  3.1 反抄袭检测技术的研究  22-23
  3.2 模式匹配技术  23-33
    3.2.1 单模式匹配算法  23-27
    3.2.2 多模式匹配算法  27-33
  3.3 相似度算法  33-34
  3.4 中文分词技术  34-37
    3.4.1 基于字符串匹配的分词方法  34-36
    3.4.2 基于统计的分词方法  36
    3.4.3 基于知识理解的分词方法  36-37
  3.5 本章总结  37-38
第4章 反抄袭检测系统算法  38-49
  4.1 算法需求分析  38-39
  4.2 算法设计  39-47
    4.2.1 文本预处理  39-42
    4.2.2 文本检测  42-44
    4.2.3 算法的状态跳转和相似度的计算  44-47
  4.3 算法性能分析  47-48
  4.4 本章小结  48-49
第5章 反抄袭检测系统的设计  49-56
  5.1 系统的模块设计  49-52
    5.1.1 用户注册模块  50
    5.1.2 文档筛选模块  50-51
    5.1.3 抄袭检测模块  51-52
    5.1.4 后台维护模块  52
  5.2 系统流程介绍  52-55
    5.2.1 系统界面  52-54
    5.2.2 系统流程  54-55
  5.3 本章小结  55-56
第6章 实验与系统测评  56-68
  6.1 系统的前台实现  56-61
  6.2 数据库表的创建和文档库的建立  61-64
    6.2.1 管理员登录  61
    6.2.2 数据库表  61-63
    6.2.3 文档库的建立  63-64
  6.3 实验和系统分析  64-67
    6.3.1 实验环境  64-67
    6.3.2 系统分析  67
  6.4 本章小结  67-68
结论  68-70
参考文献  70-74
攻读硕士学位期间发表的论文和获得的科研成果  74-75
致谢  75-76

相似论文

  1. Web环境下基于语义模式匹配的实体关系提取方法的研究,TP391.1
  2. 云计算中依赖任务动态并行调度机制的研究,TP3
  3. 基于模式匹配与协议分析的分布式入侵检测研究,TP393.08
  4. 指纹识别相关算法的改进研究,TP391.41
  5. 地面多传感器数据融合算法分析与软件实现,TP202
  6. 层次化的分布式入侵检测系统研究,TP393.08
  7. DWIIS系统中查询接口集成机制的研究,TP393.09
  8. 面向Deep Web响应页面的模式识别的研究,TP393.092
  9. Deep Web下不确定数据处理的研究,TP311.13
  10. 基于多目红外相机的手术机器人光学跟踪系统相关技术研究,TP242
  11. 基于半监督聚类的入侵检测防火墙研究,TP393.08
  12. 源代码抄袭检测系统的研究和实现,TP311.52
  13. 基于使用信息的数据库模式匹配方法研究,TP311.13
  14. 面向网络预警的并行模式匹配方法研究,TP393.08
  15. 硬件防火墙中多模式匹配算法的设计与实现,TP393.08
  16. 综合网络态势分析技术研究与实现,TP393.07
  17. 基于抽象语法树的程序代码抄袭检测技术研究,TP274
  18. 基于snort的入侵检测系统的研究与设计,TP393.08
  19. 基于BM和BMHS的单模式匹配算法的研究,TP393.08
  20. 基于字频的模式匹配算法研究,TP393.08

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com