学位论文 > 优秀研究生学位论文题录展示

面向Web社会网络的分析工具

作 者: 谢婧璘
导 师: 汪卫
学 校: 复旦大学
专 业: 软件工程
关键词: 社会网络分析 Web结构挖掘 关系图
分类号: TP393.09
类 型: 硕士论文
年 份: 2011年
下 载: 432次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,互联网上出现一批新型网络交流平台。网民们参与其中,相互关注,网民与网民之间形成一个有影响力的巨大的隐含的社会网络。通过分析工具挖掘潜在的社会网络,可以理解网民的行为特征,研究网民的兴趣传播,从而进行网络舆情检测、市场营销推广;参照六度分割理论,结合使用数据挖掘方法,分析网络结构的特点,可以帮助网民找到更多共同志趣的朋友,形成更大的社会网络;进一步还可以改进网站结构,改善用户体验,提高社会生产率。本文首先分析Web环境下社会网络的现状和遇到的问题。然后介绍使用网络爬虫程序提取Web中的社会网络关系数据的实现方式;讨论采用数据挖掘技术分析数据的实现方法;分析通过实验方式验证本文提出的分析工具的有效性和实用性。最后总结全文的研究工作,并对今后进一步工作做出展望。利用建立的开发平台,针对各种社区论坛(百度贴吧、天涯社区)、社交网站(Facebook、开心网)、微博(Twitter、新浪微博),采用自己用C/C++编程实现的面向Web社会网络分析工具,抓取关注者(节点)与被关注者(节点)以及之间的关系(边)的数据集,研究Web环境下社会网络的特征和应用。

全文目录


摘要  4-5
ABSTRACT  5-6
第一章 绪论  6-11
  1.1 论文的选题背景  6-7
  1.2 论文的研究意义和目的  7-8
  1.3 论文的主要工作  8-10
    1.3.1 论文的命题依据  8
    1.3.2 论文的研究范围  8-9
    1.3.3 论文的目标与创新  9
    1.3.4 论文的主要内容  9-10
  1.4 论文的章节安排  10-11
第二章 背景知识介绍  11-22
  2.1 社会网络  11
  2.2 社会网络分析  11
  2.3 图相关知识介绍  11-13
    2.3.1 顶点和边  11-12
    2.3.2 关系图  12
    2.3.3 社会网络社团  12
    2.3.4 平均路径长度  12-13
    2.3.5 聚类系数  13
  2.4 Web挖掘  13-14
    2.4.1 Web挖掘的定义  13-14
    2.4.2 Web数据的复杂性  14
    2.4.3 Web挖掘的分类  14
  2.5 Web结构挖掘  14-17
    2.5.1 宏观结构挖掘  14-16
    2.5.2 超链接挖掘  16
    2.5.3 网页内部结构挖掘  16-17
  2.6 主要技术知识介绍  17-22
    2.6.1 栈和队列  17
    2.6.2 广度优先搜索  17-18
    2.6.3 深度优先搜索  18
    2.6.4 URL  18-19
    2.6.5 WWW网页  19-20
    2.6.6 网页分块  20-22
第三章 系统分析与设计  22-31
  3.1 社会网络关系图需求分析  22-25
    3.1.1 邻接点问题  24
    3.1.2 边丢失问题  24-25
  3.2 总体框架  25-27
  3.3 工作流程  27-29
    3.3.1 系统总体流程  27-28
    3.3.2 在线采集模块  28-29
  3.4 开发环境  29
  3.5 本章小结  29-31
第四章 详细设计与实现  31-49
  4.1 社会网络关系图种子选取  31-32
  4.2 网页解析  32-37
    4.2.1 网页中抽取URL的策略  32-34
    4.2.2 过滤不属于社会网络分析所需URL的算法  34-35
    4.2.3.去掉重复URL的策略  35-37
  4.3 URL管理与调度  37-41
    4.3.1 普通URL调度方法分析  38-39
    4.3.2 采集Web社会网络关系的URL管理与调度策略  39-40
    4.3.3 效率讨论  40-41
  4.4 Web中的社会网络关系信息保存  41-44
  4.5 离线提取用户信息  44-45
    4.5.1 提取社会网络关系中的用户  44-45
    4.5.2 离线提取与在线解析的比较  45
  4.6 离线重构社会网络关系图  45-46
  4.7 通信处理  46-47
  4.8 用户自定义配置  47
  4.9 本章小结  47-49
第五章 面向Web社会网络分析  49-64
  5.1 实验目标  49
  5.2 实验设置  49-50
  5.3 工具有效性验证  50-56
    5.3.1 正确性验证  50-53
    5.3.2 高效性验证  53-54
    5.3.3 真实网站与数据集的一致性验证  54-56
  5.4 社会网络分析  56-59
    5.4.1 粉丝关系  57
    5.4.2 关注关系  57-58
    5.4.3 粉丝与关注关系  58-59
  5.5 工具的应用价值  59-63
    5.5.1 划分社团  59-62
    5.5.2 发现网络意见领袖  62-63
  5.6 本章小结  63-64
第六章 结论  64-66
  6.1 全文的成果  64-65
  6.2 进一步工作  65-66
参考文献  66-69
致谢  69-70

相似论文

  1. 基于社会网络分析法的大学生网络意见领袖研究,G206
  2. 从虚拟到现实—试析虚拟社区之传播明星地位对现实生活中人脉的影响,G206
  3. 网络实体及其关系信息的组织和搜索,TP391.3
  4. 汽车网络广告的竞争情报价值研究,F713.8
  5. “教育大发现”学习村落社会网络分析研究,G434
  6. 互联网舆情信息挖掘与群体行为分析,F49
  7. 社会因素与专利产出相关性研究及对策,G306
  8. 社会网络和SPC分析,O157.5
  9. 社会关系网络紧密性测度研究,O157.5
  10. 基于社会网络理论的恐怖组织隐蔽网络研究,D815.5
  11. 基于社团发现的Blog信息收集原型系统的研究,TP393.092
  12. Deep Web环境下查询松弛技术的研究,TP393.09
  13. 一种新的Web结构挖掘算法的研究,TP311.13
  14. 基于社会网络分析的产业集群隐性知识共享研究,F270
  15. 基于MongoDB的关系网络分析技术研究与应用,TP311.13
  16. 基于社会网络分析的用户研究方法及其应用,J50
  17. 网络“圈子”的群体交往特点研究,C912
  18. 基于社会网络的知识生态系统中的知识共享研究,G253
  19. 基于云计算的Web结构挖掘算法研究,TP311.13
  20. 力学课程网上作业系统相关技术的研究与开发,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com