学位论文 > 优秀研究生学位论文题录展示
基于句法和语义的中文文本零水印研究
作 者: 江亭
导 师: 刘玉玲
学 校: 湖南大学
专 业: 计算机科学与技术
关键词: 零水印 文本语义 依存句法 词语相关度计算 词汇链
分类号: TP309.7
类 型: 硕士论文
年 份: 2013年
下 载: 0次
引 用: 0次
阅 读: 论文下载
内容摘要
版权认证是一种对载体进行认证版权归属的行为,要求载体经过一定程度的正常修改能识别出其作者,而经过恶意篡改后的载体能检测出不同于原载体的版权归属。目前最常使用的版权认证方法是数字水印技术。数字水印是将一些代表着版权所有者信息的标记嵌入到数字载体中,并由此可判定该数字载体的版权归属。本文分析了文本水印的研究现状,针对传统水印方法存在容易改变文本语义的问题,零水印不改变载体信息的特点可以弥补这个缺陷。目前文本零水印方法主要集中在提取字符、汉字、词语或者语句的各种统计特征,却忽略了文本语义的特征。文本载体信息中最重要的是文本语义,从文本语义上提取的特征能最大程度地抵抗保持文本语义的修改、编辑,适用于版权认证。本文利用现有的自然语言处理技术,从文本语义的角度提取特征构造文本零水印。第三章提出了一种基于依存句法的零水印算法,结合相关语言知识利用依存句法分析器从语法的角度提取表征文本的特征词以接近文本的语义特征。第四章提出了一种新的基于《知网》的词语相关度计算方法,并且利用该方法提出了一种基于词汇链的零水印算法。利用《知网》的词语相关度计算以构造文本的词汇链,从词汇链中提取出表征文本的特征词。本文提取的特征词使用同义词词林编码以增强水印方案的鲁棒性,然后传入第三方进行注册。在进行注册时需要先比较水印相似度,如果有相似文本则不允许注册。注册水印经过Lo gistic混沌映射加密以增强水印方案的安全性,最后加上时间戳和作者信息。实验结果表明本文的算法对常规编辑操作具有鲁棒性,对恶意攻击具有脆弱性,可以满足文本版权认证的需求。
|
全文目录
摘要 5-6 Abstract 6-7 目录 7-9 插图索引 9-10 附表索引 10-11 第1章 绪论 11-17 1.1 课题来源 11 1.2 研究背景及意义 11-12 1.3 国内外研究现状 12-15 1.4 本文的主要工作 15-16 1.5 论文结构 16-17 第2章 相关概念及技术 17-26 2.1 数字水印 17-21 2.2 文本水印 21-23 2.3 自然语言处理技术平台 23-24 2.4 同义词词林 24-25 2.5 Logistic 混沌映射 25-26 第3章 基于依存句法的文本零水印算法 26-40 3.1 引言 26 3.2 依存句法分析 26-28 3.3 算法描述 28-34 3.3.1 文本预处理 29-31 3.3.2 特征提取与特征编码 31-33 3.3.3 相似度计算和特征加密 33-34 3.4 实验结果及分析 34-39 3.4.1 水印隐蔽性及长度 35 3.4.2 水印鲁棒性 35-38 3.4.3 水印脆弱性 38-39 3.5 小结 39-40 第4章 基于词汇链的文本零水印算法 40-55 4.1 引言 40 4.2 相关知识及技术 40-44 4.2.1 《知网》 40-43 4.2.2 词语相关度 43-44 4.2.3 词汇链 44 4.3 算法描述 44-48 4.3.1 文本预处理 45-46 4.3.2 词语相似度计算 46 4.3.3 基于交叉关系的词语关联度 46-47 4.3.4 词汇链构造与特征提取 47-48 4.4 实验结果及分析 48-54 4.4.1 相关度计算结果及分析 48-50 4.4.2 词汇链构造结果及分析 50-51 4.4.3 水印隐蔽性及长度 51 4.4.4 水印鲁棒性 51-53 4.4.5 水印脆弱性 53-54 4.5 小结 54-55 结论 55-57 参考文献 57-62 附录A 攻读硕士学位期间发表论文目录 62-63 附录B 攻读硕士学位期间所参与的科研活动 63-64 致谢 64
|
相似论文
- 基于本体的食品投诉文本危害信息抽取研究,TP391.1
- 三维彩码水印算法研究,TP309.7
- 音频数字水印算法的研究,TP309.7
- 基于特征的中文名词性谓词语义角色标注研究,TP391.1
- 基于语义的文本事件信息抽取方法的研究与实现,TP391.1
- 变换域数字水印算法的研究,TP309.7
- 图像的数字水印算法研究,TP309.7
- 文本数字水印技术在军事通信中的应用研究,TP309.7
- 基于数据库水印的电子商务安全研究,F713.36
- 基于奇异值分解的数字水印技术研究,TP309.7
- 基于语音信号特征的语音零水印,TP309.7
- 基于依存句法分析的语义角色标注,TP391.1
- 基于纽马克文本类型理论的商务教材英译汉研究,H315.9
- 基于语义的自动文摘系统,TP391.1
- 中文维基百科的结构化信息抽取及词语相关度计算,TP391.1
- 基于矢量量化的数字音频水印技术研究,TP309.7
- 融入语义相似度的HITS算法研究及实现,TP391.1
- 基于词平台汉字编码和改进的句法转换文本数字水印算法,TP309.7
- 数据库水印技术研究,TP309.7
- 瑞恰兹的《实用批评》研究,I06
- 静态图像数字水印算法研究,TP309
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 一般性问题 > 安全保密 > 加密与解密
© 2012 www.xueweilunwen.com
|