学位论文 > 优秀研究生学位论文题录展示
基于相似度计算的编程题自动评判方法研究
作 者: 孙鸿伟
导 师: 刘杰
学 校: 哈尔滨工程大学
专 业: 计算机应用技术
关键词: 自动评判 相似度计算 程序特征向量 模式定义
分类号: TP312.1
类 型: 硕士论文
年 份: 2011年
下 载: 9次
引 用: 0次
阅 读: 论文下载
内容摘要
近年来C语言编程题的自动评判没有较好的解决办法,编程题的阅卷往往采用一种单凭输出结果给定成绩这种方法虽然简便,但不科学,完全忽略了考生的源代码,有些基于源代码的自动阅卷方法也存在不足之处。要想得到较好的阅卷效果,必须对考生源代码的结构进行深入处理。针对这个问题,通过对C语言编程题自动评判方法的国内外现状以及相关技术的研究,本文提出一种基于相似度计算的自动评判方法,并通过以此建立的编程题自动评判方法框架模型对考生的源代码的结构进行控制分析和相似度计算。首先,为了实现C程序的解析,本文细化了的C语言结构的XML模式定义,设计并实现了C程序到XML文档的解析算法,通过解析算法将C程序转换为XML文档。同时,为了提高评判的时间效率,本文提出了程序特征向量的概念,设计并实现了程序特征向量的提取及其相似度计算的算法;之后,对考生程序进行测试用例测试,将测试用例全对的考生程序和标准答案的XML文档及特征向量录入答案库,根据答案的采分点,对答案库中标准答案的XML文档的节点进行加权,实现智能的自动评分;最后,通过计算提取的程序特征向量的相似度找到与考生答案最相似的标准答案,本文根据课题需求设计并实现了XML文档相似度计算算法,通过此算法计算两者XML文档的相似度,获得考生答案的成绩。实验结果表明,本文提出的评判方法具有一定的可执行性和有效性,但也存在一些影响评分准确率的问题,通过对实验数据的分析提出了相应的解决方案。
|
全文目录
摘要 5-6Abstract 6-9第1章 绪论 9-17 1.1 研究背景及目的 9-10 1.2 国内外研究现状 10-14 1.2.1 国外研究现状 10-12 1.2.2 国内研究现状 12-14 1.3 论文研究内容及组织 14-17 1.3.1 论文研究内容 14-15 1.3.2 论文的组织结构 15-17第2章 相关知识及理论 17-26 2.1 引言 17 2.2 XML简述 17-22 2.2.1 由SGML,HTML到XML 17-18 2.2.2 XML的特点及分类 18-19 2.2.3 XML模式语言介绍 19-20 2.2.4 XML文档对象模型介绍 20-21 2.2.5 XML解析器 21-22 2.3 基于文档结构的相似度计算 22-25 2.3.1 元素比较法 23 2.3.2 边与路径比较法 23-24 2.3.3 编辑距离法 24 2.3.4 傅里叶变换法 24-25 2.3.5 文档元素的比较问题 25 2.4 本章小结 25-26第3章 编程题自动评判方法研究 26-42 3.1 编程题自动评判方法框架模型 26-28 3.2 C程序解析 28-35 3.2.1 C程序结构的XML模式定义 28-35 3.2.2 C程序到XML文档的解析算法 35 3.3 程序特征向量及其提取 35-37 3.4 程序特征向量的相似度计算 37-38 3.5 XML文档的相似度计算 38-41 3.6 本章小结 41-42第4章 实验结果与实验分析 42-50 4.1 实验环境与测试数据集 42 4.2 实验设计 42-48 4.3 实验结果及分析 48-49 4.4 本章小结 49-50结论 50-51参考文献 51-55攻读硕士学位期间发表的论文和取得的科研成果 55-56致谢 56
|
相似论文
- 多邮件自动文摘的关键技术研究,TP391.1
- Web环境下基于语义模式匹配的实体关系提取方法的研究,TP391.1
- 面向论坛信息文本的有效数据抽取研究,TP391.1
- 面向概念查询的生物医学多文档摘要技术研究,TP391.1
- 基于本体和SWRL推理的知识检索方法研究,TP391.3
- 基于JEE的科技项目管理系统设计与实现,TP311.52
- 计算机辅助夹具结构设计关键技术研究,TG75
- 编程题自动评判中相关技术的研究与实现,TP391.6
- 本体在医疗信息整合中的应用与研究,TP391.1
- 中文文本倾向性分类系统研究,TP391.1
- 基于多Agent及元搜索技术的中文问答系统的研究和应用,TP391.1
- 段落检索系统及其应用的研究,TP391.3
- 复杂多组分体系指纹图谱差异性分析系统设计与实现,O657
- 基于综合概念相似度的异构本体合并技术的研究,TP391.1
- 基于区域的图像检索相关技术研究,TP391.41
- 基于网络的CAD图形自动判别系统的研究,TP391.72
- 基于内容分析的专利挖掘技术研究,TP391.1
- 基于本体的语义检索在数字图书馆中的应用研究,G250.76
- 基于内容的钢琴音乐检索研究,TP391.3
- 基于语义的主题搜索引擎研究,TP391.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序语言、算法语言
© 2012 www.xueweilunwen.com
|