学位论文 > 优秀研究生学位论文题录展示
有向赋权邮件社团结构发现研究
作 者: 黄胜宇
导 师: 徐汀荣
学 校: 苏州大学
专 业: 计算机应用技术
关键词: 有向赋权图 社团发现 社团结构类型
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 59次
引 用: 2次
阅 读: 论文下载
内容摘要
社会网络分析是数据挖掘的新热点,社会网络是由个人或组织以及相互之间的联系所构成的集合,通过对社会网络的理论研究,尝试挖掘隐藏在表面关系之下的隐性关系,可以进行电子商务,信息推荐等有益的应用。随着因特网的发展,电子邮件已成为一种重要的、流行的通讯手段。电子邮件,作为社会网络中的重要组成部分,已经成为相互协作与知识交流的有力平台。而邮件挖掘是数据挖掘领域中一项新兴的技术,它的出现源于电子邮件在人们生活中的广泛使用以及数据挖掘技术的日益成熟。然而,当我们面对大量电子邮件时,如何从中精确快速的发现社团并查找社团的核心人物,存在着很大的难度和挑战。本文以电子邮件为对象,在有向赋权邮件网络的基础上,针对广播型邮件的特征,分析邮件发送者和接收者的关系,通过社团密度这一度量函数,对有向赋权邮件网络进行社团结构分析,以准确确定广播型社团结构,该算法另一优势是可发现重叠社团。接下来,在总结和分析上述广播型社团的基础上,提出了一种基于重要节点的组织结构发现方法。我们详细介绍了经典的链接分析算法(HITS算法),并在对其改进的基础上提出了领导值的计算方法,再通过发现邮件网络中的上下级关系,构建组织结构图。最后,对算法在安然邮件语料库上进行实验,结果表明,该算法对邮件网络中发现特定社团结构是有效的。
|
全文目录
中文摘要 4-5 Abstract 5-6 目录 6-8 第一章 引言 8-13 1.1 研究背景 8-9 1.2 研究现状 9-10 1.3 研究意义 10-11 1.4 实验数据介绍 11 1.5 本文的组织结构 11-13 第二章 社团发现概述 13-29 2.1 社会网络分析 13-16 2.1.1 社会网络分析的原理及特征 13-14 2.1.2 社会网络分析的研究方法 14-16 2.2 社会网络中的社团结构 16-17 2.3 计算机科学中的图形分割问题 17-20 2.3.1 Kernighan-Lin 算法 18 2.3.2 谱平分法 18-20 2.4 社会学中的分级聚类方法 20-26 2.4.1 GN 算法 20-22 2.4.2 快速分裂算法 22-23 2.4.3 Newman 快速算法 23-24 2.4.4 派系过滤算法 24-26 2.5 社团评价函数 26-28 2.5.1 模块度 26-27 2.5.2 社团有效直径与社团密度 27-28 2.6 小结 28-29 第三章 邮件网络的建模 29-37 3.1 邮件网络社团 29-30 3.2 邮件网络形式化表达 30-33 3.2.1 邮件提供的信息 30 3.2.2 邮箱账号关联关系建模 30-32 3.2.3 基本概念 32-33 3.3 数据集预处理 33-36 3.3.1 数据集表结构 34-35 3.3.2 数据集表关系 35-36 3.4 小结 36-37 第四章 广播型社团结构 37-45 4.1 广播型社团结构发现 37-39 4.1.1 广播型社团结构 37-38 4.1.2 广播型社团发现算法 38-39 4.2 实验数据预分析 39-41 4.2.1 实验语料集 39-40 4.2.2 实验条件 40 4.2.3 数据集预处理 40 4.2.4 回复邮件的统计方式 40-41 4.3 实验结果分析 41-44 4.4 小结 44-45 第五章 组织型社团结构 45-55 5.1 组织结构的研究意义 45 5.2 相关内容介绍 45-47 5.2.1 PageRank 算法 46-47 5.2.2 HITS 算法 47 5.3 组织型社团结构发现 47-50 5.3.1 广播型社团结构发现 47-48 5.3.2 领导值计算方法 48-49 5.3.3 组织型社团结构发现算法 49-50 5.4 实验与结果分析 50-54 5.5 小结 54-55 第六章 总结与展望 55-57 6.1 本文创新点 55-56 6.2 工作展望 56-57 参考文献 57-61 攻读学位期间发表(录用)论文 61-62 致谢 62-63
|
相似论文
- 基于社团结构发现的数据仓库主题抽取的研究,TP311.13
- 邮件通联关系网络中重要节点及社团发现技术研究,TP393.098
- 基于多目标优化的社团发现及系统实现,N941.4
- 基于复杂网络的社团发现算法研究,O157.5
- 基于复杂网络理论的产业网络研究,F270
- 复杂网络中的社团结构检测算法研究,O157.5
- 无标度网络及其应用研究,TN929.5
- 基于复杂网络理论的投入产出关联分析,F223
- 大规模网络的社团发现与多层次可视化分析,O157.5
- 交通系统中最优路径选择算法的研究,TP301.6
- 聚类算法在Web挖掘中的应用,TP311.13
- DNA计算在NP问题中的应用及程序模拟,TP301.6
- 复杂网络中的层次社团发现与应用,O157.5
- 大规模社区网络的社团发现及特征分析,O157.5
- 复杂网络与互联网个性化信息服务的研究,TP311.10
- 基于复杂网络的产品销售网CGCP分析流程,F274
- 基于MapReduce计算模型的大规模电信数据社团发现与模式挖掘,TN915.09
- 海量多数据库集成系统的查询处理研究,TP311.13
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 不完备信息系统的完备化及其上的知识获取,TP311.13
- 演化聚类算法及其应用研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|