学位论文 > 优秀研究生学位论文题录展示

基于语义分析的文本情感分类研究

作 者: 高金莉
导 师: 王素格
学 校: 山西大学
专 业: 模式识别与智能系统
关键词: 信息增益 潜在语义分析 概率潜在语义分析 信息管理系统 文本分类
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 221次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着Internet的日益普及,互联网媒体已经成为一种不可缺少的信息传播媒介。不同于传统的媒体,互联网媒体具有信息传播的开放性、广泛性和快速性等特点。然而,信息内容安全问题也日益突出,这也给互联网信息安全管理带来了前所未有的困难。互联网在提供丰富信息资源的同时,也带来了不良信息的泛滥。网络上的不良信息包括色情、暴力、邪教、赌博等违反国家政策的内容,有些类型的信息可以通过关键词匹配的方法,分析得到信息的主题内容,比如暴力、色情等不良信息;有的信息则无法使用简单的关键字匹配法判断它是否为不良信息,比如宣言邪教和批判邪教的信息。在对这些信息进行分析的时候,不仅要分析信息包含的主题内容(topic),而且要判断它们的观点和态度,即倾向性(polarity)。本文结合信息增益潜在语义分析方法,提出了一种基于信息增益和潜在语义分析混合的文本降维方法,该方法基于所有训练数据和测试数据,对信息增益和潜在语义分析进行统一建模。实验结果表明,该方法是可行的。本文针对潜在语义分析存在的缺陷,采用概率潜在语义分析的方法构造文本——词语的同现矩阵,使用EM算法进行迭代求解。实验结果表明,在相同的测试集上,基于概率潜在语义分析的文本情感分类方法取得了较好的分类结果.互联网中存在着太多的风险和网络违规现象,严重影响企业网络安全,常常造成难以弥补的损失。信息安全的重要性正在不断提升,信息内容的安全管理也成为网络安全的新要求。本文设计了信息内容安全管理系统,实验表明,该系统可以避免人为的网络安全隐患,提升互联网使用率,使网络环境更加安全,从而利用网络创造更多的价值。

全文目录


中文摘要  8-9
ABSTRACT  9-11
第一章 引言  11-16
  1.1 研究背景、目的及意义  11
  1.2 国内外研究现状  11-14
  1.3 论文的组织结构  14-16
第二章 基于潜在语义分析的文本情感分类  16-22
  2.1 基于信息增益和潜在语义分析混合的文本降维  16-18
    2.1.1 潜在语义分析  16-17
    2.1.2 信息增益  17
    2.1.3 基于信息增益与潜在语义分析混合的文本降维  17-18
  2.2 基于剩余度ENSu(T)的权重计算  18
  2.3 语料库选取与分类性能评价指标  18-19
    2.3.1 语料库的选取  18-19
    2.3.2 文本情感分类的性能评价指标  19
  2.4 实验结果与分析  19-20
  2.5 本章小结  20-22
第三章 基于概率潜在语义分析的文本情感分类  22-27
  3.1 概率潜在语义分析  22-23
  3.2 模型描述  23-24
    3.2.1 构造"文档一词"索引矩阵  23
    3.2.2 构造语义空间Z,确定映射初始值  23
    3.2.3 采用EM迭代算法求解  23-24
  3.3 文本情感分类  24-25
    3.3.1 数据预处理  24
    3.3.2 权重计算  24
    3.3.3 文本情感分类的步骤  24
    3.3.4 实验结果与分析  24-25
  3.4 本章小结  25-27
第四章 面向内容安全的实验系统  27-38
  4.1 系统概述  27-28
    4.1.1 系统结构  27-28
    4.1.2 系统功能  28
  4.2 系统开发环境  28-30
    4.2.1 SQL Server简介  29
    4.2.2 C#与.NET简介  29
    4.2.3 Windows应用程序和ADO.NET简介  29-30
  4.3 系统的设计与实现  30-34
    4.3.1 设计步骤  30
    4.3.2 数据库表的设计  30
    4.3.3 界面设计与系统辅助类  30-31
    4.3.4 ADO.NET数据库连接模块的设计  31-33
    4.3.5 数据显示与WinForms控件  33-34
  4.4 系统运行结果  34-37
    4.4.1 登陆界面  34-35
    4.4.2 倾向性分析界面  35
    4.4.3 信息提取界面  35
    4.4.4 主题跟踪界面  35-36
    4.4.5 热门话题界面  36-37
    4.4.6 详细信息界面  37
  4.5 本章小结  37-38
第五章 结论与展望  38-40
  5.1 结论  38
  5.2 展望  38-40
参考文献  40-44
攻读学位期间的研究成果  44-45
致谢  45-46
个人简介  46-48

相似论文

  1. 基于仿生模式识别的文本分类技术研究,TP391.1
  2. 互联网上旅游评论的情感分析及其有用性研究,TP391.1
  3. 武器装备信息管理系统的设计与实现,TP311.52
  4. 西藏边防作战训练信息管理系统设计与实现研究,TP311.52
  5. 基于Web技术军车驾驶员信息管理系统的设计与实现,TP311.52
  6. 基于数据分布特征的文本分类研究,TP391.1
  7. 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
  8. 高新技术考试站信息管理系统设计与实现,TP311.52
  9. 高职院校毕业生信息管理系统的设计与实现,TP311.52
  10. 公安机关剧毒化学品治安管理信息系统的设计与实现,TP311.52
  11. 基于Web的国际管理学会中国总部信息管理系统设计与实现,TP311.52
  12. 基于SaaS临床路径管理系统的设计与实现,TP311.52
  13. 基于改进遗传算法的神经网络输入约简,TP18
  14. 基于树型条件随场的特定域事件提取方法研究,TP391.1
  15. 主观题自动评分技术研究,TP391.1
  16. 面向情感的电影背景音乐分类方法研究,TP391.1
  17. 射洪县国税局出勤信息管理系统的设计与实现,TP311.52
  18. 网络教育新闻文本分类系统的设计与实现,TP391.1
  19. 一种于经验数据的软件缺陷修复工作量预测模型研究,TP311.53
  20. 企业信息管理系统的设计与实现,TP311.52
  21. 跨语言文本分类的研究,TP391.1

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com