学位论文 > 优秀研究生学位论文题录展示
网络社区舆情引导技术研究与实现
作 者: 邸文晨
导 师: 张伟哲
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 网络舆情 舆情引导 信息采集 话语复述 验证码识别
分类号: TP393.092
类 型: 硕士论文
年 份: 2012年
下 载: 86次
引 用: 0次
阅 读: 论文下载
内容摘要
随着计算机的普及,网络进入了高速发展的阶段,逐步成为了人们生活中的一部分。人们获取信息的方式也逐渐从广播、电视、报纸转移到了网络。通过网络社区,民众可以表达情绪、态度、意见、要求,这样众多舆论的汇总形成了网络社区的舆情,网络已经成为舆论活动的主要阵地。目前采用人工发布信息的手段来对网络社区进行舆情的引导,需要大量的人力物力,已经不能够满足现实的需要。因此网络舆情引导,已经成为了学术界研究的热点。论文从网络舆情引导中用到的技术角度出发,提出了针对网络社区舆情引导的技术解决方案,设计了一个舆情引导系统。论文中,将对网络社区舆情引导中涉及到的主要关键技术:多通道信息采集、话语复述及网络社区信息自动发布展开详细的讨论。首先,多通道信息采集部分针对不同类型的网站进行信息采集,分为四个采集通道:主流媒体网站通道、博客通道、论坛BBS通道以及微博通道。前三个在尽量保证底层爬虫架构不变动的情况下,通过配置不同的通道,达到信息采集的目的。微博通道则单独采用了开放API的接口来采集信息,保证了程序的稳定性。其次,文中利用同义词替换方法。先将在网络上抓取的语料进行分词,然后利用同义词词库,对分词后的语料进行同义词替换,得到意思相同的句子,构成新的语料库。再次,论文针对两类网络社区:论坛和微博,进行信息的自动发布。研究和实现了Windows平台下的网络社区信息发布系统,系统实现中采用了基于神经网络识别的图形验证码技术,利用WebBrowser控件解决了论坛的信息自动发布,利用微博开放API解决了微博的信息自动发布。最后,通过对系统的测试,根据研究结论所得出的方案,在一定程度上可以解决网络社区舆情引导的问题,具有一定的可行性,系统有一定的应用价值。
|
全文目录
摘要 4-5 Abstract 5-7 目录 7-10 第1章 绪论 10-19 1.1 课题研究的背景和意义 10-13 1.1.1 课题研究的背景 10-12 1.1.2 课题简介 12 1.1.3 课题研究的意义 12-13 1.2 本文的主要研究内容 13-15 1.2.1 多通道信息采集技术运用 13-14 1.2.2 图形验证码识别 14 1.2.3 话语复述 14-15 1.2.4 网络社区发布技术运用 15 1.3 国内外研究现状 15-18 1.3.1 网页正文提取 15-16 1.3.2 话语复述研究现状 16-17 1.3.3 图形验证码识别的研究发展 17-18 1.4 论文结构安排 18-19 第2章 多通道信息采集技术研究 19-34 2.1 爬虫设计 19-22 2.1.1 爬虫框架设计 19-20 2.1.2 爬虫主要模块设计 20-22 2.1.3 多通道爬虫设计 22 2.2 网站通道内容采集 22-24 2.3 博客通道内容采集 24-27 2.4 BBS 通道内容采集 27-29 2.5 微博通道内容采集 29-33 2.5.1 OAUTH 认证 30-31 2.5.2 微博通道信息采集设计 31-33 2.6 本章小结 33-34 第3章 网络社区信息发布技术研究 34-52 3.1 图形验证码识别技术 34-46 3.1.1 预处理 34-40 3.1.2 字符分割 40-42 3.1.3 验证码识别 42-46 3.2 话语复述技术 46-49 3.2.1 逆向最大匹配算法 46-48 3.2.2 同义词替换 48-49 3.3 网络社区信息发布 49-51 3.4 本章小结 51-52 第4章 网络社区舆情引导系统设计与实现 52-68 4.1 系统总体结构设计 52-53 4.2 模块实现 53-59 4.2.1 精品语料采集模块 53-54 4.2.2 小号语料采集模块 54-56 4.2.3 虚拟人物培养模块 56-57 4.2.4 话语复述模块 57 4.2.5 虚拟人物舆论引导模块 57-58 4.2.6 账号管理模块 58-59 4.2.7 配置文件管理模块 59 4.3 模块测试 59-64 4.3.1 信息采集单机吞吐量实验 59-63 4.3.2 图形验证码识别 63-64 4.4 系统功能测试 64-67 4.4.1 网络社区中帖子人工置顶测试 64-66 4.4.2 人物影响力比较 66-67 4.5 本章小结 67-68 结论 68-70 参考文献 70-75 攻读硕士学位期间发表的学术论文 75-77 致谢 77
|
相似论文
- 路面平整度检测系统中的数据采集和定位技术研究,U416.2
- 中国区域性网上社区的舆情研究,G206
- 网络舆情的形成机制研究,G206
- 网络新闻发言人制度构建,G219.2
- 网络群体性事件及应对策略研究,D630
- 网络舆情对刑事司法的影响及其应对,G206
- 网络舆情对政治生态环境的影响研究,G206
- 基于系统动力学的网络舆情应对问题分析,G206
- 用电信息采集一体化建设研究,F426.61
- 南涧县政府门户网站管理中心信息管理系统设计与实现,TP311.52
- 酒店无线数据信息采集管理系统的研究与开发,TP311.52
- 基于Agent的分布式元搜索引擎架构研究与实现,TP391.3
- WEB主题信息采集系统的设计与实现,TP274.2
- 基于网络舆情的企业危机管理研究,G206
- 微藻养殖信息采集与调控系统研究,S968.49
- 蓝牙技术在抄表系统中的应用,TM76
- 上市公司网络舆情管控研究,F276.6
- 社会焦点事件网络舆情演变研究,G206
- 网络舆情热点事件中的网民行为研究,G206
- 结直肠癌转化医学信息库构建与应用探索,R735.3
- 用电信息采集系统在智能电网发展中的建设应用,TM76
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com
|