`
mabusyao
  • 浏览: 252711 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

动态规划算法

阅读更多
多阶段决策过程,是指这样的一类特殊的活动过程,问题可以按时间顺序分解成若干相互联系的阶段,在每一个阶段都要做出决策,全部过程的决策是一个决策序列。要使整个活动的总体效果达到最优的问题,称为多阶段决策问题。

一个多阶段决策过程最优化问题的动态规划模型通常包含以下要素:

1.阶段

阶段(step)是对整个过程的自然划分。通常根据时间顺序或空间特征来划分阶段,以便按阶段的次序解优化问题。阶段变量一般用k=1,2,..,n表示。


2.状态

状态(state)表示每个阶段开始时过程所处的自然状况。它应该能够描述过程的特征并且具有无后向性,即当某阶段的状态给定时,这个阶段以后过程的演变与该阶段以前各阶段的状态无关,即每个状态都是过去历史的一个完整总结。通常还要求状态是直接或间接可以观测的。


3.决策

当一个阶段的状态确定后,可以作出各种选择从而演变到下一阶段的某个状态,这种选择手段称为决策(decision),在最优控制问题中也称为控制(control)。

描述决策的变量称决策变量(decision variable)。变量允许取值的范围称允许决策集合(set of admissible decisions)。


4.策略

决策组成的序列称为策略(policy)。


5.状态转移方程

在确定性过程中,一旦某阶段的状态和决策为已知,下阶段的状态便完全确定。



动态规划的适用条件

任何思想方法都有一定的局限性,超出了特定条件,它就失去了作用。同样,动态规划也并不是万能的。适用动态规划的问题必须满足最优化原理和无后效性。

1.最优化原理(最优子结构性质)

最优化原理可这样阐述:一个最优化策略具有这样的性质,不论过去状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。简而言之,一个最优化策略的子策略总是最优的。一个问题满足最优化原理又称其具有最优子结构性质。

最优化原理是动态规划的基础,任何问题,如果失去了最优化原理的支持,就不可能用动态规划方法计算。

2.无后向性

将各阶段按照一定的次序排列好之后,对于某个给定的阶段状态,它以前各阶段的状态无法直接影响它未来的决策,而只能通过当前的这个状态。换句话说,每个状态都是过去历史的一个完整总结。这就是无后向性,又称为无后效性。

3.子问题的重叠性

动态规划将原来具有指数级复杂度的搜索算法改进成了具有多项式时间的算法。其中的关键在于解决冗余,这是动态规划算法的根本目的。动态规划实质上是一种以空间换时间的技术,它在实现的过程中,不得不存储产生过程中的各种状态,所以它的空间复杂度要大于其它的算法。


动态规划的实质是分治思想和解决冗余,因此,动态规划是一种将问题实例分解为更小的、相似的子问题,并存储子问题的解而避免计算重复的子问题,以解决最优化问题的算法策略。



设计一个标准的动态规划算法,通常可按以下几个步骤进行:

划分阶段:按照问题的时间或空间特征,把问题分为若干个阶段。注意这若干个阶段一定要是有序的或者是可排序的(即无后向性),否则问题就无法用动态规划求解。
选择状态:将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。当然,状态的选择要满足无后效性。
确定决策并写出状态转移方程:之所以把这两步放在一起,是因为决策和状态转移有着天然的联系,状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。所以,如果我们确定了决策,状态转移方程也就写出来了。但事实上,我们常常是反过来做,根据相邻两段的各状态之间的关系来确定决策。
写出规划方程(包括边界条件):动态规划的基本方程是规划方程的通用形式化表达式。一般说来,只要阶段、状态、决策和状态转移确定了,这一步还是比较简单的。



动态规划思想设计的算法从整体上来看基本都是按照得出的递推关系式进行递推,这种递推相对于计算机来说,只要设计得当,效率往往是比较高的,这样在时间上溢出的可能性不大,而相反地,动态规划需要很大的空间以存储中间产生的结果,这样可以使包含同一个子问题的所有问题共用一个子问题解,从而体现动态规划的优越性,但这是以牺牲空间为代价的,为了有效地访问已有结果,数据也不易压缩存储,因而空间矛盾是比较突出的。另一方面,动态规划的高时效性往往要通过大的测试数据体现出来(以与搜索作比较),因而,对于大规模的问题如何在基本不影响运行速度的条件下,解决空间溢出的问题,是动态规划解决问题时一个普遍会遇到的问题。

对于这个问题,可以考虑从以下一些方面去尝试:

一个思考方向是尽可能少占用空间。如从结点的数据结构上考虑,仅仅存储必不可少的内容,以及数据存储范围上精打细算(按位存储、压缩存储等)。当然这要因问题而异,进行分析。另外,在实现动态规划时,一个我们经常采用的方法是用一个与结点数一样多的数组来存储每一步的决策,这对于倒推求得一种实现最优解的方法是十分方便的,而且处理速度也有一些提高。但是在内存空间紧张的情况下,我们就应该抓住问题的主要矛盾。省去这个存储决策的数组,而改成在从最优解逐级倒推时,再计算一次,选择某个可能达到这个值的上一阶段的状态,直到推出结果为止。这样做,在程序编写上比上一种做法稍微多花一点时间,运行的时效也可能会有一些(但往往很小)的下降,但却换来了很多的空间。因而这种思想在处理某些问题时,是很有意义的。

但有时,即使采用这样的方法也会发现空间溢出的问题。这时就要分析,这些保留下来的数据是否有必要同时存在于内存之中。因为有很多问题,动态规划递推在处理后面的内容时,前面比较远处的内容实际上是用不着的。对于这类问题,在已经确信不会再被使用的数据上覆盖数据,从而使空间得以重复利用,如果能有效地使用这一手段,对于相当大规模的问题,空间也不至于溢出(为了求出最优方案,保留每一步的决策仍是必要的,这同样需要空间)。

一般地说,这种方法可以通过两种思路来实现:一种是递推结果仅使用Data1和Data2这样两个数组,每次将Data1作为上一阶段,推得Data2数组,然后,将Data2通过复制覆盖到Data1之上,如此反复,即可推得最终结果。这种做法有一个局限性,就是对于递推与前面若干阶段相关的问题,这种做法就比较麻烦;而且,每递推一级,就需要复制很多的内容,与前面多个阶段相关的问题影响更大。另外一种实现方法是,对于一个可能与前N个阶段相关的问题,建立数组Data[0..N],其中各项为最近N各阶段的保存数据。这样不采用这种内存节约方式时对于阶段k的访问只要对应成对数组Data中下标为k mod (N+1)的单元的访问就可以了。这种处理方法对于程序修改的代码很少,速度几乎不受影响,而且需要保留不同的阶段数也都能很容易实现。

当采用以上方法仍无法解决内存问题时,也可以采用对内存的动态申请来使绝大多数情况能有效出解。而且,使用动态内存还有一点好处,就是在重复使用内存而进行交换时,可以只对指针进行交换,而不复制数据,这在实践中也是十分有效的。
分享到:
评论

相关推荐

    动态规划算法的应用

    "动态规划算法的应用" 动态规划算法是一种非常强大且广泛应用的算法思想,它可以解决许多复杂的问题。动态规划算法的核心思想是将问题分解成小问题,然后使用Memoization技术将中间结果存储起来,以便后续问题的...

    动态规划算法经典题目

    动态规划算法经典题目分析 动态规划是一种非常经典的算法思想,解决的问题领域非常广泛。动态规划的基本思想是将一个复杂的问题分解成多个小问题,通过解决这些小问题来解决整个问题。今天,我们将要探讨动态规划的...

    动态规划算法课件PPT

    动态规划算法课件PPT 动态规划算法是解决问题的有效方法,它将问题分解成多个子问题,然后通过解决这些子问题来解决原问题。动态规划算法与分治法类似,但不同的是,动态规划算法中子问题之间存在相互依赖关系,...

    多阶段决策过程问题的动态规划算法

    动态规划算法是一种强大的工具,主要用于解决多阶段决策过程中的最优化问题。在计算机科学和算法设计中,动态规划提供了一种系统化的方法来处理复杂问题,尤其在那些问题的最优解可以通过组合子问题的最优解来得出的...

    北京工业大学--算法作业2--动态规划算法实现0-1背包问题---Java

    北京工业大学--算法作业2--动态规划算法实现0-1背包问题---Java代码 利用动态规划算法实现0-1背包问题或装配线调度问题。(二选一) 要求测试数据以文本文件的形式存储, 即所有的数据由文本文件读入。 利用动态...

    动态规划算法实现投资问题

    "动态规划算法实现投资问题" 资源分配问题是指在给定的总资源下,如何将其分配给多个工程项目,以获得最大利润的问题。这种问题可以使用动态规划算法来解决。 在动态规划算法中,我们首先需要定义状态变量,例如...

    背包问题动态规划算法模拟设计与实现

    【背包问题动态规划算法模拟设计与实现】 背包问题是一类经典的优化问题,在计算机科学和运筹学中广泛应用。它的核心是通过有限的资源(背包的容量)来最大化收益(子物品的价值)。0-1背包问题是最基础的形式,...

    动态规划算法原理与应用

    "动态规划算法原理与应用" 动态规划是一种解决最优化问题的基本方法,它可以分解为多个互相联系的阶段,每个阶段都需要进行决策,以达到目标函数的极大或极小。动态规划的主要思想是将问题实例分解为更小的、相似的...

    《动态规划算法实验》实验报告.docx

    《动态规划算法实验》实验报告主要探讨了两个经典动态规划问题——0-1背包问题和合唱队形安排问题。这两个问题都是在优化决策过程中寻找最优解的经典实例。 **一、0-1背包问题** 0-1背包问题是一个经典的约束优化...

    动态规划算法简介 很详细

    子问题重叠是动态规划算法效率的关键,即在解决问题的过程中,某些子问题会被多次求解。通过存储子问题的解,我们可以避免重复计算,提高效率。这也是动态规划与分治法的主要区别,后者通常处理独立的子问题。 设计...

    动态规划算法比对蛋白质序列

    动态规划算法是一种在计算机科学和生物学领域广泛应用的解决复杂问题的方法。在本场景中,它被用来比对蛋白质序列,这是生物信息学中的一个核心任务。蛋白质序列比对旨在寻找两个或多个蛋白质序列之间的相似性,这...

    水库调度程序包含12个动态规划算法的程序代码

    这12个动态规划算法的程序代码是解决此类问题的实例,使用了C++编程语言,适用于后端开发。 动态规划的基本思想是将一个复杂问题分解为若干个子问题,通过求解子问题的最优解来得到原问题的最优解。在水库调度问题...

    matlab实现动态规划算法 程序源码.zip

    【达摩老生出品,必属...资源名:matlab实现动态规划算法 程序源码.zip 资源类型:程序源代码 源码说明: 基于matlab实现动态规划的程序,包含完整源码和注释,非常适合借鉴学习 适合人群:新手及有一定经验的开发人员

    数据结构动态规划算法总结

    数据结构动态规划算法总结 动态规划是一种重要的算法思想,广泛应用于经济管理、生产调度、工程技术和最优控制等方面。动态规划是解决多阶段决策过程的优化问题的数学方法,由美国数学家R.E.Bellman等人在20世纪50...

    动态规划算法的应用实验报告.doc

    动态规划算法是一种强大的工具,常用于解决复杂的问题,如寻找最优化解。在这个实验报告中,我们关注的是如何运用动态规划解决数塔问题。数塔问题是一个典型的动态规划实例,它要求从一个下三角矩阵的顶部出发,找到...

    第三讲:动态规划算法详解.pptx

    动态规划算法详解 动态规划算法是解决多阶段决策问题的一种方法,它可以将问题分解成多个阶段,每个阶段都需要做出决策,整个过程的决策序列是一个最优的解决方案。动态规划算法的基本思想是对整个过程的最优策略...

    动态规划算法与贪心算法

    ### 动态规划算法与贪心算法 #### 最优化原理 最优化原理是解决多阶段决策问题的关键。这一原理最早由美国数学家R. Bellman等人于1951年提出,他们指出:一个最优策略的子策略对于它的初态和终态而言也必须是最优...

    图像压缩动态规划算法Java代码

    利用动态规划算法解决图形图像处理问题,用Java编写,代码经过调试健壮性良好

    动态规划算法的优化技巧

    动态规划算法作为一种强大的编程策略,尤其在解决具有重叠子问题和最优子结构特性的问题时,展现出了其独特的魅力。然而,在实际应用中,尤其是在ACM等编程竞赛中,动态规划算法的时间效率优化成为了参赛选手关注的...

    C++ 动态规划算法实现0-1背包问题

    总的来说,这个C++实现的0-1背包问题动态规划算法不仅展示了如何利用动态规划解决问题,还提供了代码调试和测试的方法,是学习和理解动态规划算法的一个优秀实例。通过深入研究和实践,我们可以掌握这一重要的算法...

Global site tag (gtag.js) - Google Analytics