学位论文 > 优秀研究生学位论文题录展示
基于贝叶斯均衡和搜索算法的博弈模型研究
作 者: 张彦革
导 师: 张雪峰
学 校: 东北大学
专 业: 运筹学与控制论
关键词: 博弈论 机器博弈 博弈模型 贝叶斯均衡 搜索算法 苏拉卡尔塔棋
分类号: O212.8
类 型: 硕士论文
年 份: 2010年
下 载: 92次
引 用: 0次
阅 读: 论文下载
内容摘要
博弈论从诞生至今,对经济学乃至整个社会科学产生了极其重要的影响。目前,博弈论已经成为主流经济学的重要组成部分,同时,博弈论作为现代经济学的前沿领域,已成为占据主流的基本决策分析工具之一。而下棋是人类智慧的典型表现,机器博弈是运筹学与控制论和人工智能学科的重要研究对象。随着计算机软件和硬件技术的快速发展。计算机已经可以在象棋领域与人类天才较量。苏拉卡尔塔棋机器博弈系统开发属于离散事件动态过程,它为机器智能的开发与研究提供了新的方向与工具,它也是人工智能学科极富挑战性的研究课题。本文以高校学生贷款还贷问题博弈模型和苏拉卡尔塔棋机器博弈系统作为研究课题,在阅读了大量的相关文献基础上,首先根据实际现象建立了模型,然后按照人工智能和计算机博弈的一般原理设计了苏拉卡尔塔棋计算机博弈的模型,所做的工作包括以下几部分:首先,以高校学生贷款还贷问题为引例,研究了不完全信息动态模型,通过海萨尼转换转化为完全信息博弈模型,应用贝叶斯动态博弈理论,分析了学生贷款不还的问题。其次,研究了博弈树的搜索算法。在负极大值和alpha-beta搜索算法的基础上,采用极小窗口、历史启发等算法,有效的提高了搜索的效率。然后,以苏拉卡尔塔棋机器博弈系统开发设计为研究载体,通过对计算机博弈技术的研究,结合一般棋类软件的开发思路,阐述了一个可以达到人类高手水平的计算机博弈程序的设计和实现原理。通过利用离散事件对策的七元组模型,设计了苏拉卡塔尔棋计算机博弈软件的数据结构,包括棋盘、棋子编码。将苏拉卡塔尔棋的着法生成分为吃子着法生成和非吃子着法生成。最后,利用VC++语言编程,对以上各种算法编程实现,展示了苏拉卡尔塔棋的计算机博弈系统的开发实现过程。实践结果表明了算法的可行性,并表现出了很好的性能。
|
全文目录
摘要 5-6 Abstract 6-11 第1章 绪论 11-19 1.1 博弈论的起源与发展历程 11-12 1.2 博弈论的研究意义和目的 12-13 1.3 机器博弈的发展 13-15 1.4 机器博弈的研究意义 15-16 1.5 本文的内容安排 16-19 第2章 预备知识 19-29 2.1 博弈论的基础知识 19-22 2.1.1 博弈论的基本概念 19-20 2.1.2 博弈问题的分类 20-21 2.1.3 几种纳什均衡的概念 21-22 2.2 机器博弈的基础知识 22-28 2.2.1 机器博弈的分类 23 2.2.2 棋类游戏的基本特点 23-24 2.2.3 评估函数 24-28 2.3 小结 28-29 第3章 一个贝叶斯纳什均衡的博弈模型分析 29-35 3.1 博弈模型的分析与建立 29-31 3.1.1 博弈的简单分析 29-30 3.1.2 博弈中的基本假设 30 3.1.3 博弈的行动顺序 30-31 3.2 博弈模型的完美贝叶斯均衡分析 31-32 3.3 基于模型给出的解决问题方案 32-33 3.4 小结 33-35 第4章 博弈搜索算法研究 35-47 4.1 博弈树 35-36 4.2 基本搜索算法 36-42 4.2.1 极大极小算法 37-38 4.2.2 负极大值算法 38-40 4.2.3 Alpha-Beta剪枝搜索算法 40-42 4.3 改进的Alpha-Beta算法 42-44 4.3.1 Fail-soft alpha-beta搜索 42 4.3.2 迭代深化算法 42-43 4.3.3 渴望窗口搜索 43-44 4.3.4 PVS搜索算法 44 4.4 历史启发搜索算法 44-45 4.5 算法实现 45 4.6 小结 45-47 第5章 苏拉卡尔塔棋的研究与系统实现 47-67 5.1 苏拉卡尔塔棋的描述和建模 47-53 5.1.1 苏拉卡尔塔棋的描述 47-48 5.1.2 基本概念 48-49 5.1.3 苏拉卡尔塔棋的棋局分析 49-52 5.1.4 博弈建模过程 52-53 5.2 苏拉卡尔塔棋的关键技术分析 53-61 5.2.1 棋子和棋盘的数字表示 53-56 5.2.2 着法生成 56-59 5.2.3 棋局评估 59-61 5.3 苏拉卡尔塔棋的系统实现 61-64 5.3.1 程序流程图 61 5.3.2 数据结构定义 61-62 5.3.3 程序设计中的主要函数 62-64 5.4 人机界面 64-66 5.5 小结 66-67 第6章 总结与展望 67-69 6.1 总结 67 6.2 展望 67-69 参考文献 69-73 致谢 73-75 攻读硕士学位期间的研究成果 75
|
相似论文
- 风光互补并网发电系统及最大功率点追踪,TM61
- 政府和谐处置群体性事件的博弈分析,D630
- 宗族制度与徽商典当业中的委托代理关系研究,K248
- 基于有限自动机的机器博弈系统建模与搜索算法的研究,O225
- 基于Moore自动机的机器博弈系统建模与研究,TP18
- 面向工业无线网络的数据采集系统的设计及应用,TP274.2
- 贵州矿产资源开发生态补偿机制研究,F205;F224.32
- 内部控制信息披露监管问题研究,F233;F832.51
- 改进和声搜索算法在车辆路径问题中的应用研究,TP301.6
- 博弈论在税收征收管理中的应用,F812.42
- 基于轴辐式网络的应急物资调度问题研究,F252
- 基于博弈论的物联网频谱资源管理方法分析,TN929.5
- 组织间隐性知识转移动力机制研究,F224
- 产业技术创新联盟组建中的政府行为研究,F224.32
- 民间金融与中小企业融资问题,F832.4
- 3PL参与下供应链最优决策及收益分配研究,F274
- 基于博弈论的认知无线电频谱共享算法研究,TN925
- 同轴等离子体发生器电弧运动轨迹的数值分析和计算,TM501.2
- 直驱式永磁风力发电系统若干问题研究,TM614
- 电磁场逆问题鲁棒优化设计技术研究,TP319
- 一个汽车内饰件的批量生产模型及其算法研究,F426.8
中图分类: > 数理科学和化学 > 数学 > 概率论与数理统计 > 数理统计 > 贝叶斯统计
© 2012 www.xueweilunwen.com
|