学位论文 > 优秀研究生学位论文题录展示
基于社团结构发现的数据仓库主题抽取的研究
作 者: 孔波
导 师: 邵峰晶
学 校: 青岛大学
专 业: 计算机软件与理论
关键词: 复杂网络 社团发现 数据仓库 主题抽取
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 29次
引 用: 0次
阅 读: 论文下载
内容摘要
面向主题是数据仓库的特征之一,面向主题是指数据仓库中的数据是按照主题进行组织的,合理地选取主题是数据仓库设计成功的前提条件。没有正确、合理的主题,就无法合理地组织数据,数据仓库建设也将失去其实际意义,因此如何确定数据仓库中的主题,对于数据仓库的建设显得十分重要。目前的数据仓库设计一般都是通过需求分析来确定主题,然而这种方法过多地依赖于设计者的经验和需求分析的准确性,往往难以保证主题要素选取的合理性。基于此,本文研究了数据仓库主题的抽取问题。基于复杂网络相关理论和社团结构发现算法,本文提出了一种从大量文献中抽取数据仓库主题的方法。通过提取文献中与某一领域相关的词,将词构建成一个复杂网络,发现网络中的社团,从而实现主题的抽取。对于加权网络中的社团发现问题,本文基于信息传播的思想,提出了一种基于信息传播的加权网络社团发现算法,该算法通过节点间的信息传播,将加权网络中的每个节点转换成具有信息的向量形式,从而将网络聚类转化为向量聚类,有效的解决了加权网络中的社团发现问题。运用本文提出的主题抽取方法,通过提取海冰文献中的与海洋领域相关的词,构建了一个加权的词关联网络,并对该词关联网络进行特征分析。将基于信息传播的社团发现算法运用到加权的词语关联网络中,发现网络中的社团结构,由节点与词的对应关系,实现了对数据仓库主题的抽取,为数据仓库的主题选取提供了辅助参考。
|
全文目录
相似论文
- 复杂网络的建模分析及其应用,O157.5
- 基于复杂网络特征的SNS社交网站传播特征研究,G206
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 家校互动教育平台中数据仓库的研究与应用,TP311.13
- 高校毕业生就业状况监测系统研究,G647.38
- 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
- 基于数据挖掘技术的电信客户维系挽留系统分析及应用,TP311.13
- 基于复杂网络的疾病基因预测的研究,R346
- PG炼钢厂MES系统数据挖掘的设计与开发,TP311.13
- 六盘水市烟草公司人力资源管理系统信息集成设计实现,TP311.52
- 基于领域本体的海洋环境数据仓库设计,TP311.13
- 纺织品服装出口的TBT风险监测与预警机理研究,TP311.13
- 税务数据仓库系统的设计与应用,TP311.13
- 电网分析计算中的可视化技术研究,TM769
- 基于复杂网络的供应链建模与网络效率研究,O157.5
- 基于数据挖掘技术的客户消费行为分析系统的开发与应用,TP311.13
- 复杂网络可靠性评价指标研究,O157.5
- 基于软件影响网络的软件度量研究,TP311.52
- 遇袭有向复杂网络抗毁性修复策略研究,O157.5
- 品牌服装企划系统中的产品预测系统架构设计,TS941.8
- 乌鲁木齐市公交网络结构特性分析研究,U491.17
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|