学位论文 > 优秀研究生学位论文题录展示
学位论文预审分配管理系统研究
作 者: 吕斐斐
导 师: 钱国明
学 校: 哈尔滨工业大学
专 业: 管理科学与工程
关键词: 论文预审 文本分类 支持向量机 特征选择
分类号: G311
类 型: 硕士论文
年 份: 2010年
下 载: 38次
引 用: 0次
阅 读: 论文下载
内容摘要
随着计算机技术的飞速发展,人类每天接触到的信息爆炸式的增长,人类的生活节奏越来越快。在这种情况下,人类渴望能够用机器代替大脑的某些功能,帮助他们工作的更加有效率,甚至能够让他们从繁琐的工作中解放出来。本文研究的学位论文预审分配管理系统正是针对管理类研究生论文预审工作,利用人工智能领域中的文本分类技术实现学位论文预审分配管理的自动化、智能化,从而将负责此项工作的老师从繁琐的工作中解放出来,同时也为申请答辩的学员提供网上申请的便利。研究中将经济与管理学院所有老师的研究方向进行了汇总、分类,并以此为关键词从“维普资讯”中文期刊网上获得了8720篇文本作为数据集(包括训练集和测试集),数据集包含9个类别,营造与房地产、信息管理与信息系统、系统工程、国际贸易、会计学、技术经济、金融学、企业管理、行政管理,包含181个小类,分别为这9大类别下的细分方向。本文在构建系统之前,首先在收集的数据集上,通过实验比较、分析了不同的特征选择算法、分类算法、特征空间维度构建的分类器的分类结果,从中选择准确率最高的算法组合应用于本文研究的系统当中。在研究的初期,通过实地调研,从实际的业务流程中提炼出了系统应满足的基本业务需求及分类、分配原则。从系统的基本业务需求中,选择预审论文自动分类中涉及的文本分类问题作为本文研究的核心问题,并对预审论文自动分类模型中的文本预处理模块所涉及的词条抽取、特征选择、文本表示三个子模块给出了详细设计。在词条抽取过程中采用正则表达式代替传统的停用词典用于初降维。文本预处理过程中采用数据库存储各类中间数据,并将存储过程应用于特征选择中对词频信息的统计。本文最终实现了一个基于B/S架构的学位论文预审分配管理系统,此系统现已交由负责此项工作的老师进行测试,系统运行基本稳定、分配结果令人满意,能够满足此项工作的各项要求。
|
全文目录
摘要 4-5 Abstract 5-8 第1章 绪论 8-12 1.1 问题的提出 8-9 1.2 国内外研究现状及分析 9-11 1.3 论文主要研究内容及结构 11-12 第2章 学位论文预审分配管理系统核心问题分析 12-28 2.1 学位论文预审分配管理系统的业务描述 12-13 2.2 学位论文预审自动分配原则确定 13-15 2.3 学位论文预审分配管理系统需解决的核心问题 15-18 2.3.1 文本分类的定义 15-16 2.3.2 自动文本分类的实现途径 16-17 2.3.3 基于学习的自动文本分类的实现步骤 17-18 2.4 预审论文自动分类的相关算法 18-27 2.4.1 贝叶斯方法 18-20 2.4.2 KNN方法 20-22 2.4.3 SVM方法 22-27 2.5 本章小结 27-28 第3章 预审论文自动分类模型建立与功能模块设计 28-38 3.1 预审论文自动分类模型构建 28-29 3.2 词条抽取模块的设计 29-32 3.2.1 中文文本分词 29-31 3.2.2 基于词性的词条抽取模块的设计 31-32 3.3 特征选择模块的设计 32-36 3.3.1 常用的特征选择方法 33-35 3.3.2 特征选择模块的设计 35-36 3.4 文本表示模块的设计 36-37 3.4.1 向量空间模型 36 3.4.2 文本表示模块设计 36-37 3.5 本章小结 37-38 第4章 学位论文预审分配管理系统适用算法选择 38-48 4.1 系统所用数据集 38-40 4.2 性能评价指标 40-42 4.3 不同算法性能对比分析 42-47 4.3.1 不同特征选择算法对比分析 42-45 4.3.2 不同分类算法对比分析 45-46 4.3.3 不同特征空间维数对比分析 46-47 4.4 本章小结 47-48 第5章 学位论文预审分配管理系统的开发 48-60 5.1 系统实现中的关键技术 48-53 5.1.1 正则表达式用于词条抽取 48-50 5.1.2 存储过程用于特征选择 50-53 5.2 系统中间数据的表示 53-55 5.2.1 文本特征表示 53 5.2.2 文本向量表示 53-54 5.2.3 分类器的模型表示 54-55 5.3 系统实现 55-59 5.3.1 预审论文自动分配的实现 55-58 5.3.2 其它功能模块的实现 58-59 5.4 系统运行 59 5.5 本章小结 59-60 结论 60-61 参考文献 61-65 附录1 65-68 致谢 68
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 互联网上旅游评论的情感分析及其有用性研究,TP391.1
- 唇读中的特征提取、选择与融合,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 语音情感识别的特征选择与特征产生,TP18
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于数据分布特征的文本分类研究,TP391.1
- 基于机器学习的入侵检测系统研究,TP393.08
中图分类: > 文化、科学、教育、体育 > 科学、科学研究 > 科学研究工作 > 组织和管理
© 2012 www.xueweilunwen.com
|