学位论文 > 优秀研究生学位论文题录展示

外包数据库模型中文本数据完整性检测方案的研究

作 者: 赵春红
导 师: 刘国华
学 校: 燕山大学
专 业: 计算机应用技术
关键词: 外包数据库 文本数据 数据完整性 中文分词 分词词典
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 41次
引 用: 0次
阅 读: 论文下载
 

内容摘要


数据库服务外包是近几年兴起的一种新的数据库应用模式。外包数据库模型中数据的完整性检测是为了防止外包数据库提供商内部和外部人员对数据库内容篡改,保证查询者获得正确查询结果的一种手段。现有的完整性检测方法都是针对关系型数据库中的结构化数据,对于文本这种非结构化数据目前还没有成型的解决方案。为了完善外包数据库模型中数据完整性检测技术,提出了一种基于数字指纹的文本数据的完整性检测方案。首先,介绍了外包数据库模型的基本工作原理,分析了现有的数据完整性检测技术的优缺点和外包数据库中特有的安全机制,并阐述了中文分词的相关技术和主要问题。其次,为了满足提高分词速度的迫切需求,根据汉语成词特点,建立一种新的词典机制,提出了应用分治策略的汉语分词方法,并利用统计技术解决汉语分词中广泛存在的交集型歧义切分问题。再次,通过对文本数据的分析,利用Karp-Rabin算法思想,提出了文本数据的数字指纹抽取方法,在该方法基础上,提出了一种基于数字指纹的文本数据的完整性检测方案,该方案不仅可以检测文本数据的完整性,还可以对被篡改数据的位置进行精确定位。然后给出了客户端和服务器端两种指纹管理方案,同时进行了安全性分析,并分别阐述了上面两种情况下秘密文本数据和公开文本数据的完整性检测方案。最后,对上述分词方法和文本数据完整性检测算法进行了理论分析,并通过实验对所提方法的正确性和有效性进行了验证。

全文目录


相似论文

  1. 基于条件随机场的中文分词技术的研究与实现,TP391.1
  2. 主观题自动评分技术研究,TP391.1
  3. 基于WebHarvest的中文财经新闻搜索引擎的设计与实现,TP311.52
  4. 外包数据库模式下中文文档密文检索研究,TP391.3
  5. 中文XML压缩技术研究,TP311.11
  6. 分布式存储网络中的数据完整性校验与修复,TP333
  7. 企业邮件监管系统的设计与实现,TP393.098
  8. 基于WEB的社区智能医疗服务系统的研究,TP311.52
  9. 基于过滤技术的投诉信息智能分析与实现,TP391.1
  10. 基于词典和概率统计的中文分词算法研究,TP391.1
  11. 车载CAN/FlexRay网关设计技术研究,TP273
  12. 基于Ajax/Lucene的站内搜索技术研究与实现,TP393.092
  13. 中文网页热门主题获取系统的研究与实现,TP393.092
  14. SOM算法的改进及其在中文文本聚类的应用,TP391.1
  15. 中文文本分类方法研究,TP391.1
  16. 一种新的搜索引擎分词词典的研究,TP391.1
  17. 统计全切分中文分词系统的研究与实现,TP391.1
  18. 基于Berkeley DB的图像信息索引机制的设计与实现,TP391.3
  19. 校园网数字资源搜索引擎的技术研究与实现,TP391.3
  20. 基于拼音标注的中文分词算法研究,TP391.1
  21. 一个改进的中文分词算法及其在Lucene中的应用,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com