学位论文 > 优秀研究生学位论文题录展示

基于社团结构发现的数据仓库主题抽取的研究

作 者: 孔波
导 师: 邵峰晶
学 校: 青岛大学
专 业: 计算机软件与理论
关键词: 复杂网络 社团发现 数据仓库 主题抽取
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 29次
引 用: 0次
阅 读: 论文下载
 

内容摘要


面向主题是数据仓库的特征之一,面向主题是指数据仓库中的数据是按照主题进行组织的,合理地选取主题是数据仓库设计成功的前提条件。没有正确、合理的主题,就无法合理地组织数据,数据仓库建设也将失去其实际意义,因此如何确定数据仓库中的主题,对于数据仓库的建设显得十分重要。目前的数据仓库设计一般都是通过需求分析来确定主题,然而这种方法过多地依赖于设计者的经验和需求分析的准确性,往往难以保证主题要素选取的合理性。基于此,本文研究了数据仓库主题的抽取问题。基于复杂网络相关理论和社团结构发现算法,本文提出了一种从大量文献中抽取数据仓库主题的方法。通过提取文献中与某一领域相关的词,将词构建成一个复杂网络,发现网络中的社团,从而实现主题的抽取。对于加权网络中的社团发现问题,本文基于信息传播的思想,提出了一种基于信息传播的加权网络社团发现算法,该算法通过节点间的信息传播,将加权网络中的每个节点转换成具有信息的向量形式,从而将网络聚类转化为向量聚类,有效的解决了加权网络中的社团发现问题。运用本文提出的主题抽取方法,通过提取海冰文献中的与海洋领域相关的词,构建了一个加权的词关联网络,并对该词关联网络进行特征分析。将基于信息传播的社团发现算法运用到加权的词语关联网络中,发现网络中的社团结构,由节点与词的对应关系,实现了对数据仓库主题的抽取,为数据仓库的主题选取提供了辅助参考。

全文目录


相似论文

  1. 复杂网络的建模分析及其应用,O157.5
  2. 基于复杂网络特征的SNS社交网站传播特征研究,G206
  3. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  4. 家校互动教育平台中数据仓库的研究与应用,TP311.13
  5. 高校毕业生就业状况监测系统研究,G647.38
  6. 基于数据仓库的药品监管辅助决策支持系统的设计与实现,TP311.13
  7. 基于数据挖掘技术的电信客户维系挽留系统分析及应用,TP311.13
  8. 基于复杂网络的疾病基因预测的研究,R346
  9. PG炼钢厂MES系统数据挖掘的设计与开发,TP311.13
  10. 六盘水市烟草公司人力资源管理系统信息集成设计实现,TP311.52
  11. 基于领域本体的海洋环境数据仓库设计,TP311.13
  12. 纺织品服装出口的TBT风险监测与预警机理研究,TP311.13
  13. 税务数据仓库系统的设计与应用,TP311.13
  14. 电网分析计算中的可视化技术研究,TM769
  15. 基于复杂网络的供应链建模与网络效率研究,O157.5
  16. 基于数据挖掘技术的客户消费行为分析系统的开发与应用,TP311.13
  17. 复杂网络可靠性评价指标研究,O157.5
  18. 基于软件影响网络的软件度量研究,TP311.52
  19. 遇袭有向复杂网络抗毁性修复策略研究,O157.5
  20. 品牌服装企划系统中的产品预测系统架构设计,TS941.8
  21. 乌鲁木齐市公交网络结构特性分析研究,U491.17

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com