学位论文 > 优秀研究生学位论文题录展示
知识管理系统中的知识树的自动构建技术研究
作 者: 刘杰
导 师: 钟将
学 校: 重庆大学
专 业: 计算机软件与理论
关键词: 知识管理 知识树构建 文本特征选择 PLSA 文本分类
分类号: G301
类 型: 硕士论文
年 份: 2009年
下 载: 163次
引 用: 2次
阅 读: 论文下载
内容摘要
我们正处于一个知识经济的时代,知识正取代传统的土地、自然资源、资本和劳动力成为推动社会进步与发展的主要力量。知识经济在客观上要求有与之相适应的管理模式和理论,以及有效的技术手段。基于这个背景,本文着重研究和探讨了文本知识管理中知识树的自动构建,文本特征选择方法,并设计和实现了一个知识管理原型系统。具体来说有以下几个方面:(1)基于文本聚类方法设计了一种新的知识树构建方法。针对当前知识管理系统中知识树的创建和维护问题,设计了一种新的基于文本聚类的知识树构建方法。由于从传统的K-means和SOM等文本聚类的结果中难以提取知识树中节点对应的概念和词汇列表,本文选取概率潜在语义分析(Probabilistic Latent Semantic Analysis,简称PLSA)方法进行聚类和知识层次树构建。实验表明,新方法除了在聚类精确度上优于传统方法,聚类结果还包含文档的主题与词汇之间的概率关系,因此新方法在聚类的同时,可以方便的提取知识树上每个节点对应的概念或概念集合。(2)基于潜在语义信息提出了一种新的特征词选取方法。特征选择在文本分类中起着重要的作用。文档频率(document frequency,简称DF)、信息增益(information gain,简称IG)和CHI以及类别区分词(category - discriminating word,简称CDW)等特征选择方法在文本分类中广泛应用。上述特征选择方法基于概率统计和信息论的理论提取对分类贡献值大的词,而没有考虑词的语义信息。为此,基于词的潜在语义信息提出了一种新的文本特征选择方法。实验结果表明,新方法能有效的提高文本分类的性能。(3)基于以上工作,设计和实现了一个基于文本知识的组织知识管理系统,系统中集合了知识获取模块,知识管理模块,知识共享模块。同时,系统中提供丰富的接口供特定的组织和个人对其进行定制开发。
|
全文目录
摘要 3-4 ABSTRACT 4-9 1 绪论 9-14 1.1 选题的背景 9-10 1.2 国内外的研究现状 10-11 1.2.1 国内研究现状 10 1.2.2 国外研究现状 10-11 1.3 本文的研究目的和意义 11-12 1.4 本文研究内容,方法与文章结构 12-14 1.4.1 研究内容与方法 12 1.4.2 文章结构 12-14 2 知识管理和知识管理系统 14-20 2.1 知识与知识管理 14-18 2.1.1 知识的概念 14 2.1.2 知识的分类和特点 14-15 2.1.3 知识管理的概念 15-16 2.1.4 知识管理的目标和原则 16-18 2.2 知识树概论 18-20 2.2.1 知识树的概念 18-19 2.2.3 知识树构建存在的问题 19-20 3 概率潜在语义分析 20-26 3.1 文本聚类的简介 20-22 3.1.1 什么是文本聚类 20 3.1.2 常用的文本聚类及介绍 20-22 3.1.3 现有方法中存在的问题 22 3.2 PLSA 方法简介 22-23 3.3 PLSA 算法 23-26 4 基于文本聚类的知识树自动构建方法 26-33 4.1 知识层次树自动构建方法 26-28 4.2 算法比较和分析 28-33 4.2.1 实验数据集 28-29 4.2.2 评价标准 29 4.2.3 结果及分析 29-33 5 基于潜在语义信息的特征词选择方法 33-43 5.1 特征词选择方法概论 33-35 5.1.1 什么是特征词选择 33 5.1.2 现有特征词选择方法及简介 33-35 5.1.3 现有方法的优缺点 35 5.2 基于潜在语义信息的特征词选择方法 35-37 5.2.1 方法简介 35-36 5.2.2 方法详述 36-37 5.3 常用的文本分类的模型及算法简介 37-40 5.3.1 朴素贝叶斯方法 37 5.3.2 k-NN 方法 37-38 5.3.3 支持向量机方法 38 5.3.4 决策树方法 38-39 5.3.5 神经网络方法 39-40 5.4 算法比较和分析 40-43 5.4.1 测试环境介绍 40 5.4.2 实验数据集 40 5.4.3 评价标准 40 5.4.4 结果及分析 40-43 6 知识管理原型系统的设计和实现 43-55 6.1 系统总体分析和设计 43-45 6.1.1 系统框架 43-44 6.1.2 技术路线 44-45 6.2 系统模块实现 45-52 6.2.1 知识获取接口 45-46 6.2.2 文本预处理模块 46-48 6.2.3 知识树构建模块 48-49 6.2.4 新增文档处理模块 49-50 6.2.5 用户接口 50-52 6.3 系统运行效果图 52-55 7 总结和展望 55-57 7.1 本文主要贡献和创新 55 7.2 下一步研究工作 55-57 致谢 57-58 参考文献 58-60 附录 60
|
相似论文
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 基于知识管理的网络课程设计与应用研究,G434
- 知识管理视角下的教学反思研究,G420
- 后现代主义视角下研究型大学隐性知识管理的研究,G647
- DL市政府办公厅流程知识管理方法研究,D630
- 基于维基的政府知识管理研究,G351
- 知识管理在工业企业中的应用研究,F425
- 基于Hadoop的文本分类研究,TP391.1
- 基于ML_pLSA模型和特征包算法的目标识别方法,TP391.41
- 软件企业知识管理绩效评价研究,F426.672
- 基于NMF垃圾邮件过滤系统研究,TP393.098
- 网络舆情预警辅助决策支持系统模型及关键技术研究,TP393.09
- Web2.0环境下的研究生个人知识管理研究,TP393.02
- 基于客户知识管理的学术期刊信息化研究,G230
- 大学图书馆知识管理研究,G251
- H大学图书馆知识管理体系研究,G258.6
- 知识地图构建研究,G642
- 高校教师个人知识管理与应用策略的研究,G645.1
- 衡钢国贸公司客户知识管理策略研究,F426.31
- 基于知识管理的企业技术创新研究,F273.1
- 辰州矿业公司知识管理战略研究,F426.1
中图分类: > 文化、科学、教育、体育 > 科学、科学研究 > 科学研究理论 > 科学学
© 2012 www.xueweilunwen.com
|