学位论文 > 优秀研究生学位论文题录展示
数据挖掘算法的加权及其在商业智能中的实现与应用
作 者: 张晓玲
导 师: 文军
学 校: 电子科技大学
专 业: 计算机系统结构
关键词: 商业智能 连环替代法 层次分析法
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 107次
引 用: 0次
阅 读: 论文下载
内容摘要
随着计算机技术的发展,企业已经进入信息化时代并且积累了大量日常数据,由于数据量的日益增长而出现海量数据贫乏知识的现象。数据挖掘的出现解决了这个问题,数据挖掘可以发现数据中隐含的信息,这些隐含的信息可以辅助企业管理者决策。商业智能是数据挖掘在企业中的具体应用,因此本文研究商业智能。商业智能主要由数据仓库、ETL(Extraction Transformation Loading)、OLAP(On-Line Transaction Processing)、数据挖掘组成。由于在实际应用中各因素对结果的影响程度不同,因此首先采用连环替代法确定各因素的重要程度,然后采用层次分析法对各因素赋以权值,在此权值的基础之上实施数据挖掘算法。使用本文提出的加权算法,通过加权可以减少规则数目,着重挖掘用户感兴趣的规则。构建包含正负关联规则的频繁模式树,实现可以挖掘出正负关联规则的加权频繁模式树算法。加权最小二乘法通过对因变量和自变量进行准确建模实现预测功能,本文提出使用由连环替代法和层次分析法确定加权最小二乘法的权值,实验证明此种确定权值的方法具有很好的拟合度。为了克服朴素贝叶斯的缺陷,本文对加权混合贝叶斯算法进行改进,使用本文的算法进行加权。加权混合贝叶斯算法把属性分为相互独立的属性子集,在属相子集之间使用加权朴素贝叶斯算法,属性集内部使用加权TAN算法。混合贝叶斯分类模型,即克服朴素贝叶斯的缺点又具有良好的准确度。本文针对以上算法进行实验,验证算法的准确性和有效性。实验证明,以上加权算法不仅可以良好的体现权值的影响,还可以有效的进行数据挖掘工作。企业使用ERP软件进行日常工作的管理,ERP系统的数据库中包含大量数据为商业智能提供数据源,本文提出商业智能和ERP集成的体系架构。本文结合现有的ERP软件,对ERP软件进行二次开发,在ERP软件之上构建商业智能。本文通过以下步骤实现商业智能整个流程,采用数据平滑处理、数据标准变化和极差归一化进行数据预处理、实现数据挖掘算法、在ERP软件上实现商业智能模块。本文分别实施上述三个数据挖掘算法,验证商业智能模块可以有效的运行并挖掘出正确结果。
|
全文目录
摘要 4-5 ABSTRACT 5-9 第一章 绪论 9-21 1.1 研究背景及意义 9-10 1.2 研究内容 10-11 1.3 国内外研究现状 11-20 1.3.1 商业智能现状 11-16 1.3.2 数据挖掘的研究现状 16-20 1.3.2.1 关联规则 16-17 1.3.2.2 时间序列 17-18 1.3.2.3 贝叶斯 18-20 1.4 本文工作和组织结构 20-21 第二章 商业智能和ERP 集成架构设计 21-33 2.1 商业智能与ERP 集成架构必要性 21-22 2.2 商业智能和ERP 集成架构总体设计 22-28 2.3 针对企业信息的数据挖掘算法 28-32 2.3.1 企业效益指标 28-30 2.3.2 数据挖掘算法的加权 30-32 2.4 小结 32-33 第三章 针对企业经济指标的数据挖掘算法设计 33-58 3.1 采用层次分析法进行加权 33-35 3.2 基于频繁模式树的加权正负关联规则 35-42 3.2.1 正负关联规则的加权 35-38 3.2.2 基于频繁模式树的加权正负关联规则挖掘算法设计 38-41 3.2.3 实验及结果分析 41-42 3.3 加权最小二乘估计 42-50 3.3.1 加权最二乘法 43-46 3.3.2 回归预测的显著性校验 46-47 3.3.3 实验及结果分析 47-50 3.4 加权混合贝叶斯分类 50-56 3.4.1 朴素贝叶斯的加权 51-53 3.4.2 TAN 算法的加权 53-54 3.4.3 加权混合贝叶斯分类器 54-55 3.4.4 实验及结果分析 55-56 3.5 小结 56-58 第四章 数据挖掘算法的实现与应用 58-78 4.1 商业智能集成架构的详细设计 58-63 4.1.1 数据源 59-61 4.1.2 数据处理 61-62 4.1.3 结果显示与分析 62-63 4.2 商业智能集成架构的实现 63-70 4.2.1 集成架构的软件平台 63-64 4.2.2 商业智能模块的开发 64-70 4.3 基于频繁模式树的加权正负关联规则的实现 70-73 4.4 加权最小二乘估计的实现 73-75 4.5 加权混合贝叶斯分类的实现 75-77 4.6 小结 77-78 第五章 总结和展望 78-80 5.1 总结 78-79 5.2 展望 79-80 致谢 80-81 参考文献 81-87 攻硕期间取得的研究成果 87-88
|
相似论文
- 高校绿色办公指标体系的设计与评价研究,G647
- 高原湖泊湖区可持续发展评价体系及模式研究,X22
- 公路生态系统健康评价方法研究,X826
- 环境脆弱区工业主导产业选择及区域布局研究,X321
- 土壤环境功能区划研究,X321
- 古树名木综合价值评价研究,S788
- HS公司安全管理质量问题与对策研究,F426.21
- 乳制品企业竞争力评价体系研究,F224
- 西南山区铁路路堑地段风险评估与决策,U213.12
- 供应商评价体系在LG公司的应用研究,F416.6;F224
- 商业智能中模型运行关键技术的研究与实现,TP274.2
- 保险公估企业核心竞争力评价研究,F842
- 基于QFD的A银行信用卡数据集市软件项目的应用与评估,F830.49
- 基于核心竞争力的中小房地产企业人力资源管理研究,F293.3
- 环境学科在绿色大学建设中技术支持作用研究,TU201.5
- 电信商业智能系统的项目需求管理研究,TP311.52
- 大连海域消防力量部署方案研究,U698.4
- 基于信息融合的转基因食品安全评估,TS201.6
- 基于商业模式创新的资源整合研究,F224
- 科技企业孵化器绩效评价指标的研究,F276.44
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|