学位论文 > 优秀研究生学位论文题录展示
基于语义分析的文本情感分类研究
作 者: 高金莉
导 师: 王素格
学 校: 山西大学
专 业: 模式识别与智能系统
关键词: 信息增益 潜在语义分析 概率潜在语义分析 信息管理系统 文本分类
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 221次
引 用: 0次
阅 读: 论文下载
内容摘要
随着Internet的日益普及,互联网媒体已经成为一种不可缺少的信息传播媒介。不同于传统的媒体,互联网媒体具有信息传播的开放性、广泛性和快速性等特点。然而,信息内容安全问题也日益突出,这也给互联网信息安全管理带来了前所未有的困难。互联网在提供丰富信息资源的同时,也带来了不良信息的泛滥。网络上的不良信息包括色情、暴力、邪教、赌博等违反国家政策的内容,有些类型的信息可以通过关键词匹配的方法,分析得到信息的主题内容,比如暴力、色情等不良信息;有的信息则无法使用简单的关键字匹配法判断它是否为不良信息,比如宣言邪教和批判邪教的信息。在对这些信息进行分析的时候,不仅要分析信息包含的主题内容(topic),而且要判断它们的观点和态度,即倾向性(polarity)。本文结合信息增益和潜在语义分析方法,提出了一种基于信息增益和潜在语义分析混合的文本降维方法,该方法基于所有训练数据和测试数据,对信息增益和潜在语义分析进行统一建模。实验结果表明,该方法是可行的。本文针对潜在语义分析存在的缺陷,采用概率潜在语义分析的方法构造文本——词语的同现矩阵,使用EM算法进行迭代求解。实验结果表明,在相同的测试集上,基于概率潜在语义分析的文本情感分类方法取得了较好的分类结果.互联网中存在着太多的风险和网络违规现象,严重影响企业网络安全,常常造成难以弥补的损失。信息安全的重要性正在不断提升,信息内容的安全管理也成为网络安全的新要求。本文设计了信息内容安全管理系统,实验表明,该系统可以避免人为的网络安全隐患,提升互联网使用率,使网络环境更加安全,从而利用网络创造更多的价值。
|
全文目录
中文摘要 8-9 ABSTRACT 9-11 第一章 引言 11-16 1.1 研究背景、目的及意义 11 1.2 国内外研究现状 11-14 1.3 论文的组织结构 14-16 第二章 基于潜在语义分析的文本情感分类 16-22 2.1 基于信息增益和潜在语义分析混合的文本降维 16-18 2.1.1 潜在语义分析 16-17 2.1.2 信息增益 17 2.1.3 基于信息增益与潜在语义分析混合的文本降维 17-18 2.2 基于剩余度ENSu(T)的权重计算 18 2.3 语料库选取与分类性能评价指标 18-19 2.3.1 语料库的选取 18-19 2.3.2 文本情感分类的性能评价指标 19 2.4 实验结果与分析 19-20 2.5 本章小结 20-22 第三章 基于概率潜在语义分析的文本情感分类 22-27 3.1 概率潜在语义分析 22-23 3.2 模型描述 23-24 3.2.1 构造"文档一词"索引矩阵 23 3.2.2 构造语义空间Z,确定映射初始值 23 3.2.3 采用EM迭代算法求解 23-24 3.3 文本情感分类 24-25 3.3.1 数据预处理 24 3.3.2 权重计算 24 3.3.3 文本情感分类的步骤 24 3.3.4 实验结果与分析 24-25 3.4 本章小结 25-27 第四章 面向内容安全的实验系统 27-38 4.1 系统概述 27-28 4.1.1 系统结构 27-28 4.1.2 系统功能 28 4.2 系统开发环境 28-30 4.2.1 SQL Server简介 29 4.2.2 C#与.NET简介 29 4.2.3 Windows应用程序和ADO.NET简介 29-30 4.3 系统的设计与实现 30-34 4.3.1 设计步骤 30 4.3.2 数据库表的设计 30 4.3.3 界面设计与系统辅助类 30-31 4.3.4 ADO.NET数据库连接模块的设计 31-33 4.3.5 数据显示与WinForms控件 33-34 4.4 系统运行结果 34-37 4.4.1 登陆界面 34-35 4.4.2 倾向性分析界面 35 4.4.3 信息提取界面 35 4.4.4 主题跟踪界面 35-36 4.4.5 热门话题界面 36-37 4.4.6 详细信息界面 37 4.5 本章小结 37-38 第五章 结论与展望 38-40 5.1 结论 38 5.2 展望 38-40 参考文献 40-44 攻读学位期间的研究成果 44-45 致谢 45-46 个人简介 46-48
|
相似论文
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 互联网上旅游评论的情感分析及其有用性研究,TP391.1
- 武器装备信息管理系统的设计与实现,TP311.52
- 西藏边防作战训练信息管理系统设计与实现研究,TP311.52
- 基于Web技术军车驾驶员信息管理系统的设计与实现,TP311.52
- 基于数据分布特征的文本分类研究,TP391.1
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 高新技术考试站信息管理系统设计与实现,TP311.52
- 高职院校毕业生信息管理系统的设计与实现,TP311.52
- 公安机关剧毒化学品治安管理信息系统的设计与实现,TP311.52
- 基于Web的国际管理学会中国总部信息管理系统设计与实现,TP311.52
- 基于SaaS临床路径管理系统的设计与实现,TP311.52
- 基于改进遗传算法的神经网络输入约简,TP18
- 基于树型条件随场的特定域事件提取方法研究,TP391.1
- 主观题自动评分技术研究,TP391.1
- 面向情感的电影背景音乐分类方法研究,TP391.1
- 射洪县国税局出勤信息管理系统的设计与实现,TP311.52
- 网络教育新闻文本分类系统的设计与实现,TP391.1
- 一种于经验数据的软件缺陷修复工作量预测模型研究,TP311.53
- 企业信息管理系统的设计与实现,TP311.52
- 跨语言文本分类的研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|