学位论文 > 优秀研究生学位论文题录展示
电子商务环境中分布式数据挖掘的研究
作 者: 余小高
导 师: 熊前兴
学 校: 武汉理工大学
专 业: 计算机应用技术
关键词: k最近邻 模糊簇 阈值 稀有数据 架构
分类号: TP311.13
类 型: 博士论文
年 份: 2007年
下 载: 1551次
引 用: 5次
阅 读: 论文下载
内容摘要
现代新兴商业模式的电子商务的蓬勃发展,使得Internet上的资源和服务更加丰富多彩,这些丰富的资源和服务每天都会产生许多新的、蕴涵着大量重要信息的海量数据,这些数据往往是异构的、不确定性的和非结构化的,其复杂程度已远远超出了人类目前己有的分析和理解能力。因此,研究有效利用这些复杂资源的新技术,数据挖掘具有重要的现实意义。就信息处理而言,数据挖掘是致力于数据分析和理解数据内部蕴藏知识的技术,它成为未来信息技术应用的重要目标之一。本文在对分布式数据挖掘、Web服务及Agent相关技术进行了分析的基础上,为解决电子商务环境中分布式数据挖掘的核心问题,从关键算法和架构两个方面进行了深入研究。针对k最近邻搜索算法存在的问题,提出了电子商务环境中一种自适应的基于P2P的k最近邻搜索算法P2PAKNNS。探讨了度量空间、相似性查询和GHT~*规则,自定义了高维数据的相似度函数HDSF(X,Y),论述了GHT~*中插入算法及范围查找算法和搜索算法。在此基础上,具体给出了P2PAKNNS算法的实现方法,并通过实验,验证了其正确性。同时本文对DENCLUE算法进行了研究,为使其适合电子商务环境、解决其存在问题,结合P2PAKNNS算法的优点,提出了电子商务环境中基于距离和密度的无监督聚类算法KNDC。论述了模糊簇的划分及参数k,讨论了参数σ和ξ的设置,给出了KNDC算法的具体实现方法,并予以验证。本文还针对电子商务环境中分布式数据挖掘的关联规则,在研究Apriori关联规则算法、多重最小支持度Apriori算法、相关支持度Apriori算法RSAA、平均项目集合分割法的基础上,改进了阈值的制定方法;为提高挖掘有价值的稀有数据的效率和精确度,根据RSAA和基于无向项集图算法BOUIGA提出了RSAA-BOUIGA算法,分析了其正确性。在此基础上,结合业界和学术界对Web服务和移动Agent的研究成果,将Web服务和Agent最新技术引入了电子商务环境中分布式数据挖掘,提出了电子商务环境下基于Web服务和移动Agent技术的数据挖掘架构BWADM,并论述了组合服务规范与组合服务的执行,具体阐述了此架构的数据预处理组件、算法管理组件、控制中心组件、算法库组件和模型表示组件。最后建立了BWADM原型,结合Web服务技术,给出了基于Web服务的数据挖掘系统逻辑结构,设计并实现了该系统,验证了BWADM的合理性和上述算法在效率、精确度等方面的优越性。
|
全文目录
摘要 4-6 Abstract 6-12 第1章 绪论 12-22 1.1 研究背景及意义 12-13 1.2 国内外研究现状与分析 13-18 1.2.1 研究现状简述 13-16 1.2.2 研究现状分析 16-18 1.3 本文主要研究内容 18-19 1.4 本文主要研究成果 19-20 1.5 本文的组织结构 20-22 第2章 分布式数据挖掘、Web服务与Agent相关技术 22-37 2.1 分布式数据挖掘概述 22-26 2.1.1 分布式数据挖掘的特点 23-25 2.1.2 分布式数据挖掘策略 25-26 2.2 电子商务环境与数据挖掘 26-27 2.2.1 电子商务环境 26 2.2.2 电子商务中挖掘数据分类 26-27 2.2.3 电子商务环境中分布式数据挖掘的特点 27 2.3 Web服务技术 27-34 2.3.1 Web服务的基本概念 28-29 2.3.2 Web Services核心技术 29-32 2.3.3 P2P环境中的Web服务 32-33 2.3.4 Web服务和网格计算 33-34 2.4 移动Agent概述 34-36 2.4.1 移动Agent的体系结构 34-35 2.4.2 移动Agent技术应用于电子商务的优势 35-36 2.5 本章小结 36-37 第3章 基于P2P的k最近邻自适应搜索算法的研究 37-56 3.1 问题提出 37-38 3.2 KNNs简介 38-40 3.3 相关研究 40-44 3.3.1 度量空间 40-42 3.3.2 相似性度量 42 3.3.3 GHT~*规则 42-44 3.4 P2PAKNNS算法 44-55 3.4.1 高维数据的相似度函数HDSF(X,Y) 44 3.4.2 GHT~*中插入和范围查找算法 44-47 3.4.3 搜索算法 47-53 3.4.4 实验分析 53-55 3.5 本章小结 55-56 第4章 基于距离和密度的无监督聚类算法的研究 56-72 4.1 问题提出 56-57 4.2 聚类简介 57-61 4.2.1 概述 57-59 4.2.2 数据挖掘对聚类算法的要求 59-60 4.2.3 相似性度量方法 60-61 4.2.4 聚类的质心、半径、直径 61 4.3 DENCLUE算法分析 61-63 4.4 KNDC聚类算法 63-71 4.4.1 分析 63-64 4.4.2 模糊簇的划分 64-67 4.4.3 参数k的讨论 67-68 4.4.4 参数σ和ξ的估计 68-69 4.4.5 KNDC算法描述 69-71 4.5 本章小结 71-72 第5章 电子商务环境下关联规则算法的研究 72-90 5.1 问题提出 72-73 5.2 关联规则算法分析 73-82 5.2.1 基本概念 73-74 5.2.2 Apriori关联规则算法 74-76 5.2.3 多重最小支持度Apriori算法 76-78 5.2.4 相关支持度Apriori算法 78-81 5.2.5 平均项目集分割法 81-82 5.3 RSAA-BOUIGA关联规则算法 82-86 5.3.1 无向项集图UISG的构造 82-83 5.3.2 BOUIGA算法 83-85 5.3.3 RSAA-BOUIGA算法 85-86 5.4 双阈值法 86-89 5.5 本章小结 89-90 第6章 电子商务环境中分布式数据挖掘架构研究 90-131 6.1 问题提出 90-91 6.2 分布式数据挖掘系统分析 91-92 6.3 BWADM研究 92-98 6.4 服务组合规范与执行 98-101 6.5 BWADM关键组件研究 101-109 6.5.1 数据预处理组件 101-105 6.5.2 算法管理组件 105-106 6.5.3 控制中心组件 106-107 6.5.4 算法库组件 107-108 6.5.5 模型表示组件 108-109 6.6 BWADM原型 109-124 6.6.1 数据挖掘系统实现方案 109-110 6.6.2 原型系统的数据流程图 110 6.6.3 系统模块设计与实现 110-124 6.7 原型系统的运行实例 124-129 6.7.1 数据源信息和结果数据库信息设定 124-125 6.7.2 数据预处理设定 125-126 6.7.3 挖掘任务设定 126-127 6.7.4 挖掘结果 127-129 6.8 系统架构的优点 129 6.9 本章小结 129-131 第7章 全文总结 131-134 7.1 研究工作总结 131-132 7.2 进一步的研究工作 132-134 参考文献 134-144 致谢 144-145 附录A 攻读博士学位期间主要参与的项目和发表的论文 145-146
|
相似论文
- 多厅影院空间架构研究,TU242.2
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 基于小波变换的语音信号去噪及其DSP算法实现,TN912.3
- 我国服务型政府建设的现状及构建途径研究,D630
- 基于遗传算法的柑橘图像分割,TP391.41
- 畜产品质量安全保障监管RFID系统,TS201.6
- 全球化背景下当代中国发展道路研究,D616
- 大型底栖无脊椎动物在水环境管理中的应用,X824
- 数字电视互动应用交互系统设计与实现,TP311.52
- 高职院校教学案例库的创建探究,TP311.53-4
- 面向服务的Web报表的研究与设计,TP393.09
- 基于windows xp嵌入式系统的心电检测分析仪,R197.39
- 移动WSN基于虚拟簇头数据收集策略的研究,TP212.9
- JD水泥集中采购和供应系统优化研究,F426.71
- 广州动车检修基地工程项目管理研究,F532
- 基于云模型的软件可信性评估模型,TP311.53
- 游戏公司计费系统的设计与实现,TP311.52
- 基于电网转型升级的甘肃省电力公司组织架构研究,F426.61
- C公司信息安全管理研究,F270.7
- 基于肤色分割与AdaBoost算法的人脸检测研究,TP391.41
- 基于不确定数据的轮廓查询处理技术研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|