学位论文 > 优秀研究生学位论文题录展示

基于本体的可伸缩的社会网络抽取算法的研究

作 者: 王囡
导 师: 于戈
学 校: 东北大学
专 业: 计算机软件与理论
关键词: 社会网络 可伸缩性 结点关系 本体 语义Web 搜索引擎
分类号: O157.5
类 型: 硕士论文
年 份: 2008年
下 载: 94次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在对专业领域社会网络的抽取过程中涉及很多大数据集,将社会网络的抽取应用到一个大的组织(用户群)的时候,提交到搜索引擎中的关键字的数目成为了一个关键性的问题。由于需要将所有结点进行完全配对搜索和计算,大数据集和多关键字在时间和空间上开销太大,因此研究人员提出用部分计算的方法确定结点间关系,从而出现了社会网络抽取的可伸缩性问题。对于社会网络抽取可伸缩性问题的研究,虽然许多学者提出了一些能够有效地降低计算时间和存储空间的解决方法,但仍存在结果准确性敏感于阈值设置等客观条件的问题,即运算的准确度随着客观条件的改变而产生很大差异。本文提出一种基于本体的、具有可伸缩的实现社会网络抽取算法Ontology-Scalability,该算法应用本体进行相关领域数据存储并减少搜索引擎中需检索的关键字数目,从而提高网络中结点关系的计算和存储效率。本文首先介绍了社会网络定义及相关概念、社会网络分析在计算机科学领域中的应用,之后对现有的社会网络抽取算法进行了归纳,并对其中的代表算法作了简要的分析。本文重点讨论了本体的构建,给出了支持社会网络分析的本体的构建方法,在此基础上提出了一个基于本体的、具有可伸缩的社会网络抽取算法,文中详细描述了算法的思想、实现过程及性能评价。本文的算法计算时间复杂度由传统算法的O(n2)降低为O(n),实验表明该算法相较于传统算法在时间性能上有很大提高。它具有对大数据集的数据进行社会网络抽取时间短、召回率(准确率)高等优点。更重要的是,算法中构建的本体是通过领域性的数据构建,可以重复利用在不同的系统中。

全文目录


摘要  5-6
ABSTRACT  6-10
第一章 绪论  10-20
  1.1 社会网络概述  10-13
    1.1.1 社会网络概念  10-11
    1.1.2 社会网络划分  11-12
    1.1.3 社会网络表示  12-13
  1.2 社会网络分析与应用  13-17
    1.2.1 社会网络分析概念  13-14
    1.2.2 社会网络分析应用  14-17
  1.3 问题提出  17
  1.4 课题来源  17-18
  1.5 全文组织结构  18-20
第二章 相关技术及研究背景  20-28
  2.1 相关概念  20-24
    2.1.1 语义Web概述  20-22
    2.1.2 本体概述  22-23
    2.1.3 本体在社会网络分析的作用  23-24
  2.2 相关工作  24-25
  2.3 研究背景  25-26
  2.4 本章小结  26-28
第三章 社会网络抽取算法分析  28-32
  3.1 传统算法及分析  28-29
  3.2 改进算法及分析  29-30
  3.3 本文的改进思路  30-31
  3.4 本章小结  31-32
第四章 支持社会网络分析的本体构建  32-42
  4.1 本体简述  32-34
    4.1.1 本体概念  32
    4.1.2 本体分类  32-33
    4.1.3 本体构建原则、步骤和方法  33-34
  4.2 本体构建方法描述  34-37
    4.2.1 本体规划  34
    4.2.2 本体分析、设计  34-36
    4.2.3 本体实现  36
    4.2.4 本体评价  36
    4.2.5 本体建立与维护  36-37
    4.2.6 循环改进与扩展  37
  4.3 本体具体实现  37-40
    4.3.1 实现工具  37
    4.3.2 实现算法  37-38
    4.3.3 本体结构  38-40
  4.4 本章小结  40-42
第五章 社会网络抽取算法实现  42-56
  5.1 算法描述  42
  5.2 社会网络抽取过程中的关键问题  42-43
  5.3 数据库部署  43-45
    5.3.1 Oracle数据库简介  43-44
    5.3.2 数据预处理  44-45
  5.4 算法实现解决方案  45-52
    5.4.1 实现总体设计  45-47
    5.4.2 实现详细设计  47-52
  5.5 算法评价  52-54
  5.6 本章小结  54-56
第六章 实验结果与分析  56-64
  6.1 实验环境及数据集  56
  6.2 实验参数及分析  56-61
    6.2.1 时间性能实验  56-59
    6.2.2 召回率性能实验  59-61
  6.3 本章小结  61-64
第七章 结束语  64-66
  7.1 本文的主要贡献  64-65
  7.2 一些主要结论  65
  7.3 进一步的工作  65-66
参考文献  66-70
致谢  70-71
攻读硕士期间参加的项目及发表的论文  71

相似论文

  1. 基于社会网络视角的台湾文化创意产业研究,G124
  2. 哲学思想在指导中学数学教学中的作用,G633.6
  3. 面向业务过程的服务动态组合方法研究,TP393.09
  4. 基于本体的语义检索研究,TP391.3
  5. 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
  6. 基于语义网络的智能搜索引擎研究,TP391.3
  7. 220kV输电线路除冰机器人机械本体研究,TP242
  8. 从虚拟到现实—试析虚拟社区之传播明星地位对现实生活中人脉的影响,G206
  9. 基于本体的食品投诉文档文本聚类研究,TP391.1
  10. 搜索引擎服务提供商版权侵权责任认定标准探讨,D923.41
  11. 关系数据库到RDF(S)映射方法的研究,TP311.13
  12. 基于语义的Web服务发现研究,TP393.09
  13. G公司技术产品的动态扩散过程研究,F273.1;F407.672
  14. 基于领域本体的海洋环境数据仓库设计,TP311.13
  15. 数据空间中数据资源之间关联关系发现模型研究,TP311.13
  16. 企业级软件组件质量保障与快速部团策略的研究,TP311.53
  17. 情景应对模式下数字化应急预案的语义模型研究,TP391.1
  18. 蛋白质关系网络复合物发现与可视化研究,TP391.41
  19. 上市公司TMT构成对组织绩效影响研究,F832.51;F224
  20. 集群中小企业协同创新模式研究,F276.3
  21. 基于本体的打印机操作语义查询系统研究与实现,TP391.1

中图分类: > 数理科学和化学 > 数学 > 代数、数论、组合理论 > 组合数学(组合学) > 图论
© 2012 www.xueweilunwen.com