学位论文 > 优秀研究生学位论文题录展示

电子商务环境中分布式数据挖掘的研究

作 者: 余小高
导 师: 熊前兴
学 校: 武汉理工大学
专 业: 计算机应用技术
关键词: k最近邻 模糊簇 阈值 稀有数据 架构
分类号: TP311.13
类 型: 博士论文
年 份: 2007年
下 载: 1551次
引 用: 5次
阅 读: 论文下载
 

内容摘要


现代新兴商业模式的电子商务的蓬勃发展,使得Internet上的资源和服务更加丰富多彩,这些丰富的资源和服务每天都会产生许多新的、蕴涵着大量重要信息的海量数据,这些数据往往是异构的、不确定性的和非结构化的,其复杂程度已远远超出了人类目前己有的分析和理解能力。因此,研究有效利用这些复杂资源的新技术,数据挖掘具有重要的现实意义。就信息处理而言,数据挖掘是致力于数据分析和理解数据内部蕴藏知识的技术,它成为未来信息技术应用的重要目标之一。本文在对分布式数据挖掘、Web服务及Agent相关技术进行了分析的基础上,为解决电子商务环境中分布式数据挖掘的核心问题,从关键算法和架构两个方面进行了深入研究。针对k最近邻搜索算法存在的问题,提出了电子商务环境中一种自适应的基于P2P的k最近邻搜索算法P2PAKNNS。探讨了度量空间、相似性查询和GHT~*规则,自定义了高维数据的相似度函数HDSF(X,Y),论述了GHT~*中插入算法及范围查找算法和搜索算法。在此基础上,具体给出了P2PAKNNS算法的实现方法,并通过实验,验证了其正确性。同时本文对DENCLUE算法进行了研究,为使其适合电子商务环境、解决其存在问题,结合P2PAKNNS算法的优点,提出了电子商务环境中基于距离和密度的无监督聚类算法KNDC。论述了模糊簇的划分及参数k,讨论了参数σ和ξ的设置,给出了KNDC算法的具体实现方法,并予以验证。本文还针对电子商务环境中分布式数据挖掘的关联规则,在研究Apriori关联规则算法、多重最小支持度Apriori算法、相关支持度Apriori算法RSAA、平均项目集合分割法的基础上,改进了阈值的制定方法;为提高挖掘有价值的稀有数据的效率和精确度,根据RSAA和基于无向项集图算法BOUIGA提出了RSAA-BOUIGA算法,分析了其正确性。在此基础上,结合业界和学术界对Web服务和移动Agent的研究成果,将Web服务和Agent最新技术引入了电子商务环境中分布式数据挖掘,提出了电子商务环境下基于Web服务和移动Agent技术的数据挖掘架构BWADM,并论述了组合服务规范与组合服务的执行,具体阐述了此架构的数据预处理组件、算法管理组件、控制中心组件、算法库组件和模型表示组件。最后建立了BWADM原型,结合Web服务技术,给出了基于Web服务的数据挖掘系统逻辑结构,设计并实现了该系统,验证了BWADM的合理性和上述算法在效率、精确度等方面的优越性。

全文目录


摘要  4-6
Abstract  6-12
第1章 绪论  12-22
  1.1 研究背景及意义  12-13
  1.2 国内外研究现状与分析  13-18
    1.2.1 研究现状简述  13-16
    1.2.2 研究现状分析  16-18
  1.3 本文主要研究内容  18-19
  1.4 本文主要研究成果  19-20
  1.5 本文的组织结构  20-22
第2章 分布式数据挖掘、Web服务与Agent相关技术  22-37
  2.1 分布式数据挖掘概述  22-26
    2.1.1 分布式数据挖掘的特点  23-25
    2.1.2 分布式数据挖掘策略  25-26
  2.2 电子商务环境与数据挖掘  26-27
    2.2.1 电子商务环境  26
    2.2.2 电子商务中挖掘数据分类  26-27
    2.2.3 电子商务环境中分布式数据挖掘的特点  27
  2.3 Web服务技术  27-34
    2.3.1 Web服务的基本概念  28-29
    2.3.2 Web Services核心技术  29-32
    2.3.3 P2P环境中的Web服务  32-33
    2.3.4 Web服务和网格计算  33-34
  2.4 移动Agent概述  34-36
    2.4.1 移动Agent的体系结构  34-35
    2.4.2 移动Agent技术应用于电子商务的优势  35-36
  2.5 本章小结  36-37
第3章 基于P2P的k最近邻自适应搜索算法的研究  37-56
  3.1 问题提出  37-38
  3.2 KNNs简介  38-40
  3.3 相关研究  40-44
    3.3.1 度量空间  40-42
    3.3.2 相似性度量  42
    3.3.3 GHT~*规则  42-44
  3.4 P2PAKNNS算法  44-55
    3.4.1 高维数据的相似度函数HDSF(X,Y)  44
    3.4.2 GHT~*中插入和范围查找算法  44-47
    3.4.3 搜索算法  47-53
    3.4.4 实验分析  53-55
  3.5 本章小结  55-56
第4章 基于距离和密度的无监督聚类算法的研究  56-72
  4.1 问题提出  56-57
  4.2 聚类简介  57-61
    4.2.1 概述  57-59
    4.2.2 数据挖掘对聚类算法的要求  59-60
    4.2.3 相似性度量方法  60-61
    4.2.4 聚类的质心、半径、直径  61
  4.3 DENCLUE算法分析  61-63
  4.4 KNDC聚类算法  63-71
    4.4.1 分析  63-64
    4.4.2 模糊簇的划分  64-67
    4.4.3 参数k的讨论  67-68
    4.4.4 参数σ和ξ的估计  68-69
    4.4.5 KNDC算法描述  69-71
  4.5 本章小结  71-72
第5章 电子商务环境下关联规则算法的研究  72-90
  5.1 问题提出  72-73
  5.2 关联规则算法分析  73-82
    5.2.1 基本概念  73-74
    5.2.2 Apriori关联规则算法  74-76
    5.2.3 多重最小支持度Apriori算法  76-78
    5.2.4 相关支持度Apriori算法  78-81
    5.2.5 平均项目集分割法  81-82
  5.3 RSAA-BOUIGA关联规则算法  82-86
    5.3.1 无向项集图UISG的构造  82-83
    5.3.2 BOUIGA算法  83-85
    5.3.3 RSAA-BOUIGA算法  85-86
  5.4 双阈值法  86-89
  5.5 本章小结  89-90
第6章 电子商务环境中分布式数据挖掘架构研究  90-131
  6.1 问题提出  90-91
  6.2 分布式数据挖掘系统分析  91-92
  6.3 BWADM研究  92-98
  6.4 服务组合规范与执行  98-101
  6.5 BWADM关键组件研究  101-109
    6.5.1 数据预处理组件  101-105
    6.5.2 算法管理组件  105-106
    6.5.3 控制中心组件  106-107
    6.5.4 算法库组件  107-108
    6.5.5 模型表示组件  108-109
  6.6 BWADM原型  109-124
    6.6.1 数据挖掘系统实现方案  109-110
    6.6.2 原型系统的数据流程图  110
    6.6.3 系统模块设计与实现  110-124
  6.7 原型系统的运行实例  124-129
    6.7.1 数据源信息和结果数据库信息设定  124-125
    6.7.2 数据预处理设定  125-126
    6.7.3 挖掘任务设定  126-127
    6.7.4 挖掘结果  127-129
  6.8 系统架构的优点  129
  6.9 本章小结  129-131
第7章 全文总结  131-134
  7.1 研究工作总结  131-132
  7.2 进一步的研究工作  132-134
参考文献  134-144
致谢  144-145
附录A 攻读博士学位期间主要参与的项目和发表的论文  145-146

相似论文

  1. 多厅影院空间架构研究,TU242.2
  2. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  3. 基于小波变换的语音信号去噪及其DSP算法实现,TN912.3
  4. 我国服务型政府建设的现状及构建途径研究,D630
  5. 基于遗传算法的柑橘图像分割,TP391.41
  6. 畜产品质量安全保障监管RFID系统,TS201.6
  7. 全球化背景下当代中国发展道路研究,D616
  8. 大型底栖无脊椎动物在水环境管理中的应用,X824
  9. 数字电视互动应用交互系统设计与实现,TP311.52
  10. 高职院校教学案例库的创建探究,TP311.53-4
  11. 面向服务的Web报表的研究与设计,TP393.09
  12. 基于windows xp嵌入式系统的心电检测分析仪,R197.39
  13. 移动WSN基于虚拟簇头数据收集策略的研究,TP212.9
  14. JD水泥集中采购和供应系统优化研究,F426.71
  15. 广州动车检修基地工程项目管理研究,F532
  16. 基于云模型的软件可信性评估模型,TP311.53
  17. 游戏公司计费系统的设计与实现,TP311.52
  18. 基于电网转型升级的甘肃省电力公司组织架构研究,F426.61
  19. C公司信息安全管理研究,F270.7
  20. 基于肤色分割与AdaBoost算法的人脸检测研究,TP391.41
  21. 基于不确定数据的轮廓查询处理技术研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com