学位论文 > 优秀研究生学位论文题录展示
面向农业信息服务平台的挖掘技术研究
作 者: 张晓艳
导 师: 方逵
学 校: 湖南工业大学
专 业: 计算机软件与理论
关键词: 数据挖掘 聚类分析 向量空间模型 关键词参照库
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 47次
引 用: 0次
阅 读: 论文下载
内容摘要
随着计算机网络技术和信息技术的迅速发展,人们生产和搜集数据的能力得到了大幅度提高,同时也推动了数据库技术的极大发展。如何从海量的数据中提取有用的信息和知识为人类服务是数据挖掘需要解决的问题。数据挖掘是面向应用的多学科交叉领域,它的应用能够推动数据挖掘技术理论的研究。如何将现有的算法与特定的领域相结合,获取能被各种层次的用户所接受的数据挖掘知识,是数据挖掘研究需要迫切解决的问题之一。面向农业信息服务平台的挖掘技术的研究旨在将数据挖掘技术与现代农业信息相结合,解决农业用户需求数据的搜集、整理的时效性差和信息不完整的问题。本文根据农业信息季节性和地域性的特点,从服务平台中用户的访问信息数据的来源考虑,对数据的特点分析,设计数据挖掘的方法和知识获取方式。针对传统的基于向量空间模型算法中向量维度的空间浪费问题,从数据挖掘的知识入手研究,通过分析采用分频关键词和关键词参照库的方法对数据进行聚类挖掘研究。在向量空间模型转化过程中使用构建关键词参照库的方法对数据进行转化,降低向量维度和减少信息量损失。同时在数据处理过程中可以通过对数据的上卷,下钻,旋转和切片等方式获取不同层次的知识。通过对结果的分析,为技术人员提供方便,为决策人员提供参考,同时优化平台的设计。实验表明,分频关键词挖掘能够根据需要获取不同层次的数据知识,采用基于构建的领域关键词参照库方法,解决了向量空间的高维度低密度问题,聚类结果的准确率提高。
|
全文目录
摘要 4-5 ABSTRACT 5-8 第一章 绪论 8-13 1.1 研究背景和研究意义 8-10 1.1.1 研究背景 8-9 1.1.2 研究意义 9-10 1.2 农业信息服务平台简介 10-11 1.3 研究内容 11-13 第二章 数据挖掘相关理论 13-28 2.1 数据挖掘综述 13-20 2.1.1 数据挖掘定义 13-14 2.1.2 数据挖掘对象 14 2.1.3 数据挖掘过程 14-16 2.1.4 数据挖掘分类 16-19 2.1.5 数据挖掘常用技术 19-20 2.2 聚类分析 20-27 2.2.1 聚类分析定义 20 2.2.2 聚类分析数据类型 20-23 2.2.3 常用聚类分析算法 23-27 2.3 本章小结 27-28 第三章 用户访问信息预处理功能分析与设计 28-36 3.1 农业数据信息特点 28-29 3.2 数据源 29-31 3.3 数据清理与数据集成 31 3.4 数据分析与归约 31-35 3.5 本章小结 35-36 第四章 用户访问信息聚类功能分析与设计 36-48 4.1 向量空间模型算法 36-39 4.1.1 基础知识 36-37 4.1.2 特征项的选取与权重计算 37-39 4.2 聚类功能设计实现 39-44 4.2.1 分频关键词挖掘 40-42 4.2.2 关键词参照库聚类 42-44 4.3 实验 44-47 4.4 本章小结 47-48 第五章 用户访问信息挖掘的增值服务 48-50 5.1 辅助决策 48-49 5.2 其它增值服务 49-50 第六章 结论与展望 50-52 6.1 工作总结 50 6.2 下一步工作 50-52 参考文献 52-55 附录 55-62 攻读硕士期间发表的论文 62-63 致谢 63
|
相似论文
- 基于停用词处理的汉语语音检索方法,TP391.1
- 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
- 高血压前期证候特征研究,R259
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 大学生综合素质测评研究,G645.5
- 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
- 21个荷花品种遗传多样性的ISSR分析,S682.32
- 基于聚类分析的P2P流量识别算法的研究,TP393.02
- 桃杂交后代(F1)幼苗光合效能评价,S662.1
- 基于SVM分类算法的主题爬虫研究,TP391.3
- 南通市农业面源污染负荷研究与综合评价,X592
- 土壤环境功能区划研究,X321
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
- 大豆杂种优势及其遗传基础研究,S565.1
- 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|