学位论文 > 优秀研究生学位论文题录展示
面向Web社会网络的分析工具
作 者: 谢婧璘
导 师: 汪卫
学 校: 复旦大学
专 业: 软件工程
关键词: 社会网络分析 Web结构挖掘 关系图
分类号: TP393.09
类 型: 硕士论文
年 份: 2011年
下 载: 432次
引 用: 0次
阅 读: 论文下载
内容摘要
近年来,互联网上出现一批新型网络交流平台。网民们参与其中,相互关注,网民与网民之间形成一个有影响力的巨大的隐含的社会网络。通过分析工具挖掘潜在的社会网络,可以理解网民的行为特征,研究网民的兴趣传播,从而进行网络舆情检测、市场营销推广;参照六度分割理论,结合使用数据挖掘方法,分析网络结构的特点,可以帮助网民找到更多共同志趣的朋友,形成更大的社会网络;进一步还可以改进网站结构,改善用户体验,提高社会生产率。本文首先分析Web环境下社会网络的现状和遇到的问题。然后介绍使用网络爬虫程序提取Web中的社会网络关系数据的实现方式;讨论采用数据挖掘技术分析数据的实现方法;分析通过实验方式验证本文提出的分析工具的有效性和实用性。最后总结全文的研究工作,并对今后进一步工作做出展望。利用建立的开发平台,针对各种社区论坛(百度贴吧、天涯社区)、社交网站(Facebook、开心网)、微博(Twitter、新浪微博),采用自己用C/C++编程实现的面向Web社会网络分析工具,抓取关注者(节点)与被关注者(节点)以及之间的关系(边)的数据集,研究Web环境下社会网络的特征和应用。
|
全文目录
摘要 4-5 ABSTRACT 5-6 第一章 绪论 6-11 1.1 论文的选题背景 6-7 1.2 论文的研究意义和目的 7-8 1.3 论文的主要工作 8-10 1.3.1 论文的命题依据 8 1.3.2 论文的研究范围 8-9 1.3.3 论文的目标与创新 9 1.3.4 论文的主要内容 9-10 1.4 论文的章节安排 10-11 第二章 背景知识介绍 11-22 2.1 社会网络 11 2.2 社会网络分析 11 2.3 图相关知识介绍 11-13 2.3.1 顶点和边 11-12 2.3.2 关系图 12 2.3.3 社会网络社团 12 2.3.4 平均路径长度 12-13 2.3.5 聚类系数 13 2.4 Web挖掘 13-14 2.4.1 Web挖掘的定义 13-14 2.4.2 Web数据的复杂性 14 2.4.3 Web挖掘的分类 14 2.5 Web结构挖掘 14-17 2.5.1 宏观结构挖掘 14-16 2.5.2 超链接挖掘 16 2.5.3 网页内部结构挖掘 16-17 2.6 主要技术知识介绍 17-22 2.6.1 栈和队列 17 2.6.2 广度优先搜索 17-18 2.6.3 深度优先搜索 18 2.6.4 URL 18-19 2.6.5 WWW网页 19-20 2.6.6 网页分块 20-22 第三章 系统分析与设计 22-31 3.1 社会网络关系图需求分析 22-25 3.1.1 邻接点问题 24 3.1.2 边丢失问题 24-25 3.2 总体框架 25-27 3.3 工作流程 27-29 3.3.1 系统总体流程 27-28 3.3.2 在线采集模块 28-29 3.4 开发环境 29 3.5 本章小结 29-31 第四章 详细设计与实现 31-49 4.1 社会网络关系图种子选取 31-32 4.2 网页解析 32-37 4.2.1 网页中抽取URL的策略 32-34 4.2.2 过滤不属于社会网络分析所需URL的算法 34-35 4.2.3.去掉重复URL的策略 35-37 4.3 URL管理与调度 37-41 4.3.1 普通URL调度方法分析 38-39 4.3.2 采集Web社会网络关系的URL管理与调度策略 39-40 4.3.3 效率讨论 40-41 4.4 Web中的社会网络关系信息保存 41-44 4.5 离线提取用户信息 44-45 4.5.1 提取社会网络关系中的用户 44-45 4.5.2 离线提取与在线解析的比较 45 4.6 离线重构社会网络关系图 45-46 4.7 通信处理 46-47 4.8 用户自定义配置 47 4.9 本章小结 47-49 第五章 面向Web社会网络分析 49-64 5.1 实验目标 49 5.2 实验设置 49-50 5.3 工具有效性验证 50-56 5.3.1 正确性验证 50-53 5.3.2 高效性验证 53-54 5.3.3 真实网站与数据集的一致性验证 54-56 5.4 社会网络分析 56-59 5.4.1 粉丝关系 57 5.4.2 关注关系 57-58 5.4.3 粉丝与关注关系 58-59 5.5 工具的应用价值 59-63 5.5.1 划分社团 59-62 5.5.2 发现网络意见领袖 62-63 5.6 本章小结 63-64 第六章 结论 64-66 6.1 全文的成果 64-65 6.2 进一步工作 65-66 参考文献 66-69 致谢 69-70
|
相似论文
- 基于社会网络分析法的大学生网络意见领袖研究,G206
- 从虚拟到现实—试析虚拟社区之传播明星地位对现实生活中人脉的影响,G206
- 网络实体及其关系信息的组织和搜索,TP391.3
- 汽车网络广告的竞争情报价值研究,F713.8
- “教育大发现”学习村落社会网络分析研究,G434
- 互联网舆情信息挖掘与群体行为分析,F49
- 社会因素与专利产出相关性研究及对策,G306
- 社会网络和SPC分析,O157.5
- 社会关系网络紧密性测度研究,O157.5
- 基于社会网络理论的恐怖组织隐蔽网络研究,D815.5
- 基于社团发现的Blog信息收集原型系统的研究,TP393.092
- Deep Web环境下查询松弛技术的研究,TP393.09
- 一种新的Web结构挖掘算法的研究,TP311.13
- 基于社会网络分析的产业集群隐性知识共享研究,F270
- 基于MongoDB的关系网络分析技术研究与应用,TP311.13
- 基于社会网络分析的用户研究方法及其应用,J50
- 网络“圈子”的群体交往特点研究,C912
- 基于社会网络的知识生态系统中的知识共享研究,G253
- 基于云计算的Web结构挖掘算法研究,TP311.13
- 力学课程网上作业系统相关技术的研究与开发,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com
|