学位论文 > 优秀研究生学位论文题录展示

异构社会网络挖掘方法研究

作 者: 郑楠
导 师: 周春光
学 校: 吉林大学
专 业: 计算机应用技术
关键词: 社会网络分析 异构社会网络 关系链 社区挖掘 关系抽取
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 203次
引 用: 0次
阅 读: 论文下载
 

内容摘要


社会网络分析作为数据挖掘研究领域的一个热点,近几年发展迅速,研究内容主要集中在通过对网络中存在的关系进行分析,得到我们需要的重要的信息。随着计算机技术和互联网的普及和发展,单一的网络关系结构已经不足以应对解决现实中的问题,所以人们进一步提出了异构社会网络(Heterogeneous Social Networks)的概念。这是一个复杂的网络抽象结构,在网络的描述中通常包含多种关系和多种实体,这些不同的关系和实体组合形成了网络的不同结构。如何来处理这些复杂的结构,获取有用的网络信息,是对传统的社会网络分析方法的一个新的挑战。目前对于异构社会网络的研究主要集中在两个方面,一个是通过对多关系的处理,结合传统的社区挖掘算法发现符合条件的社区结构。另一个方面是通过对网络中复杂的关系链进行分析,得到网络中隐藏的重要信息。本文主要在原有的异构社会网络分析算法思想基础上提出了两个新的算法:1.基于关系链的信息发现算法。该算法主要通过对网络中关系链的分析,实现重要信息的非监督挖掘,算法引入了稀有路径的思想,为重要信息的发现提供基础;同时,为了提高算法的质量和效率,利用相关性规则对数据集进行预处理,缩减分析子集的规模。2.异构社会网络中结合关系抽取与聚类融合思想的社区挖掘算法。该算法首先通过给定的标记信息对网络中的关系进行抽取,利用多种关系的相关系数向量,通过协同矩阵建立共识函数,进而对多种关系组成的聚类成员进行融合,获取相应的社区划分结构。文中通过与传统的算法在模拟数据集和典型的真实数据集上的比较实验,证明了本文所提出算法的有效性和优越性。随着信息化的不断加强,各个领域的数据量和数据之间的关系量大大增多。这给异构社会网络分析带来了广泛的应用前景和技术上的新挑战。本文提出的两个算法对解决实际的问题起到了一定的作用,如利用对关系链的分析,可以在学术网络中依据指定研究主题寻找权威作者、在商务网络中针对特定产品查找营销群体等;利用异构网络的社区挖掘算法,可以在复杂的学术网络中划分出关系紧密的作者群体,在多种人际关系中分析出志同道合的朋友圈等。比较之前的一些算法,这两个算法在效率和质量上有了一定的提高,但是并没有完全成熟,还需要进一步的优化和改进。目前存在的异构网络方面的算法并不能完全满足各种情况下的网络分析,总体来说,这个领域的理论和算法仍有较大的发展空间,需要更多的关注和研究。

全文目录


摘要  4-6
Abstract  6-11
第1章 绪论  11-17
  1.1 社会网络概述  11-12
  1.2 国内外研究现状  12-15
  1.3 研究背景及意义  15
  1.4 本文主要工作  15-16
  1.5 本文组织结构  16-17
第2章 异构社会网络理论研究  17-27
  2.1 异构社会网络简介  17-18
  2.2 异构社会网络关系处理方法  18-21
    2.2.1 关系抽取算法  18-21
    2.2.2 关系链分析  21
  2.3 经典社区挖掘方法  21
  2.3.1 分裂算法  21-23
    2.3.2 凝聚算法  22
    2.3.3 NORMALIZED CUT算法  22-23
    2.3.4 KERNIGHAN-LIN算法  23
  2.4 聚类融合方法  23-25
    2.4.1 聚类成员生成方法  24-25
    2.4.2 共识函数的设计  25
  2.5 存在的问题与挑战  25-27
第3章 基于关系链的信息发现  27-33
  3.1 问题的描述  27-29
  3.2 基本概念定义  29
  3.3 算法描述  29-32
    3.3.1 算法基本步骤  29-30
    3.3.2 相关子图的确定  30-31
    3.3.3 稀有路径分析  31-32
  3.4 算法总结  32-33
第4章 异构网络社区挖掘算法  33-38
  4.1 问题的描述  33-34
  4.2 基本概念定义  34-35
  4.3 算法描述  35-37
    4.3.1 算法基本步骤  35-36
    4.3.2 系数向量的确定  36
    4.3.3 Co-assoeiation矩阵  36-37
  4.4 算法总结  37-38
第5章 实验结果及分析  38-49
  5.1 实验环境  38
  5.2 关系链分析算法实验结果评估  38-42
    5.2.1 模拟数据集  38-40
    5.2.2 高能物理数据库(HEP-Th)  40-42
  5.3 异构网络社区挖掘试验结果评估  42-49
    5.3.1 经典数据集“IRIS”  42-46
    5.3.2 经典数据集“WINE”  46-49
第6章 总结  49-50
参考文献  50-53
作者简介及在学期间所取得的科研成果  53-54
致谢  54

相似论文

  1. 基于社会网络分析法的大学生网络意见领袖研究,G206
  2. 英文文本中命名实体识别及关系抽取技术研究,TP391.1
  3. 基于微博客的社区挖掘研究,TP393.092
  4. 基于CRF的命名实体和关系的联合抽取,TP391.4
  5. 针对链接语料的主题社区挖掘,TP391.1
  6. 基于自学习的社会关系抽取的研究,TP391.1
  7. 基于丰富特征和多核学习的蛋白质关系抽取,Q51
  8. 汽车网络广告的竞争情报价值研究,F713.8
  9. 互联网舆情信息挖掘与群体行为分析,F49
  10. 异质网络中的社区挖掘技术研究,TP393.09
  11. 多关系社会网络社区挖掘方法研究,TP393.09
  12. 网络社区挖掘技术的研究与应用,TP393.09
  13. 基于社会网络分析的网络舆情研究,TP393.09
  14. 基于文本的茶学本体学习方法研究,TP391.1
  15. CIKP B/S架构实现及知识社区挖掘,TP391.1
  16. 基于社会网络分析的减灾社区建设研究,D632.5
  17. 共调控基因挖掘算法研究,TP391.41
  18. 社会网络分析法运用于科研团队发现和评价的实证研究,G311
  19. 音乐论坛社会网络挖掘系统设计与实现,TP311.52
  20. 实体关系自动抽取技术的比较研究,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com