今年九月二十三日,Google、T-Mobile 和 HTC 宣布了第一款基于开源操作系统 Android 的 3G 手机,其中一个重要的功能是利用全球卫星定位系统实现全球导航。这个功能在其它手机中早已使用,并且早在五六年前就已经有实现这一功能的车载设备出售。其中的关键技术只有两个:第一是利用卫星定位;第二根据用户输入的起终点,在地图上规划最短路线或者最快路线。后者的关键算法是计算机科学图论中的动态规划(Dynamic Programming)的算法。
在图论(请见拙著《图论和网络爬虫》)中,一个抽象的图包括一些节点和连接他们的弧。比如说中国公路网就是一个很好的“图”的例子:每个城市一是个节点,每一条公路是一个弧。图的弧可以有权重,权重对应于地图上的距离或者是行车时间、过路费金额等等。图论中很常见的一个问题是要找一个图中给定两个点之间的最短路径(shortest path)。比如,我们想找到从北京到广州的最短行车路线或者最快行车路线。当然,最直接的笨办法是把所有可能的路线看一遍,然后找到最优的。这种办法只有在节点数是个位数的图中还行得通,当图的节点数(城市数目)有几十个的时候,计算的复杂度就已经让人甚至计算机难以接受了,因为所有可能路径的个数随着节点数的增长而成呈指数增长(或者说几何级数),也就是说每增加一个城市,复杂度要大一倍。显然我们的导航系统中不会用这种笨办法。
所有的导航系统采用的都是动态规划的办法(Dynamic Programming),这里面的规划(programming)一词在数学上的含义是“优化”的意思,不是计算机里面编程的意思。它的原理其实很简单。以上面的问题为例,当我们要找从北京到广州的最短路线时,我们先不妨倒过来想这个问题:假如我们找到了所要的最短路线(称为路线一),如果它经过郑州,那么从北京到郑州的这条子路线(比如是北京-> 保定->石家庄->郑州,称为子路线一),必然也是所有从北京到郑州的路线中最短的。否则的话,我们可以假定还存在从北京到郑州更短的路线(比如北京->济南->徐州->郑州,称为子路线二),那么只要用这第二条子路线代替第一条,我们就可以找到一条从北京到广州的全程更短的路线(称为路线二),这就和我们讲的路线一是北京到广州最短的路线相矛盾。其矛盾的根源在于,我们假设的子路线二或者不存在,或者比子路线一还来得长。
在实际实现算法时,我们又正过来解决这个问题,也就是说,要想找到从北京到广州的最短路线,先要找到从北京到郑州的最短路线。当然,聪明的读者可能已经发现其中的一个“漏洞”,就是我们在还没有找到全程最短路线前,不能肯定它一定经过郑州。不过没有关系,只要我们在图上横切一刀,这一刀要保证将任何从北京到广州的路一截二,如下图。
那么从广州到北京的最短路径必须经过这一条线上的某个城市(图中蓝色的菱形)。我们可以先找到从北京出发到这条线上所有城市的最短路径,最后得到的全程最短路线一定包括这些局部最短路线中的一条,这样,我们就可以将一个“寻找全程最短路线”的问题,分解成一个个小的寻找局部最短路线的问题。只要我们将这条横切线从北京向广州推移,直到广州为止,我们的全程最短路线就找到了。这便是动态规划的原理。采用动态规划可以大大降低最短路径的计算复杂度。在我们上面的例子中,每加入一条横截线,线上平均有十个城市,从广州到北京最多经过十五个城市,那么采用动态规划的计算量是 10×10×15,而采用穷举路径的笨办法是 10 的 15 次方,前后差了万亿倍。
那么动态规划和我们的拼音输入法又有什么关系呢?其实我们可以将汉语输入看成一个通信问题,而输入法则是一个将拼音串到汉字串的转换器。每一个拼音可以对应多个汉字,一个拼音串就可以对应图论中的一张图,如下:
其中,Y1,Y2,Y3,……,YN 是使用者输入的拼音串,W11,W12,W13 是第一个音 Y1 的候选汉字,W21,W22,W23,W24 是对应于 Y2 的候选汉字,以此类推。从第一个字到最后一个字可以组成很多很多句子,我们的拼音输入法就是要根据上下文找到一个最优的句子。如果我们再将上下文的相关性量化,作为从前一个汉字到后一个汉字的距离,那么,寻找给定拼音条件下最合理句子的问题就变成了一个典型的“最短路径”问题,我们的算法就是动态规划。
上面这两个例子导航系统和拼音输入法看似没什么关系,但是其背后的数学模型却是完全一样的。数学的妙处在于它的每一个工具都具有相当的普遍性,在不同的应用中都可以发挥很大的作用。
我们在下一个系列将详细介绍专门针对拼音输入法的“维特比算法”。
分享到:
相关推荐
首先,我们来详细了解一下三种类型的锁——中文锁、字母锁和数字锁。中文锁是一种以汉字为单位的密码构建方式,每个汉字可能代表一个或者多个密码字符,通过特定的组合规则形成复杂的密码串,这使得破解者需要对汉字...
中国人工智能产业发展联盟金融大模型落地路线图研究报告2024年56页.pdf
USB运动控制开源系统揭秘:五轴雕刻机核心技术全开源,支持RTCP算法,PCB生产便捷,C++源码可复制,USB运动控制五轴雕刻机系统完全开源资料,含PCB生产支持及多版本C++源码,USB运动控制 (五轴雕刻机系统)全部开源 不保留任何关键技术,PCB可直接生产,C++6.0源码,从13.7-18.2所有版本,本产品为可复制资料,支持五轴联动,支持RTCP算法,全部开源。 1、为电子资料 2、PCB底板+原理图+源码 ,核心关键词:USB运动控制; 五轴雕刻机系统; 开源技术; 不保留关键技术; C++6.0源码; 版本范围(13.7-18.2); 可复制资料; 五轴联动; RTCP算法; PCB底板; 原理图。,开源五轴雕刻机系统:USB运动控制全解析
系统选用B/S模式,后端应用springboot框架,前端应用vue框架, MySQL为后台数据库。 本系统基于java设计的各项功能,数据库服务器端采用了Mysql作为后台数据库,使Web与数据库紧密联系起来。 在设计过程中,充分保证了系统代码的良好可读性、实用性、易扩展性、通用性、便于后期维护、操作方便以及页面简洁等特点。
基于16QAM的SIMULINK与MATLAB联合仿真系统:调制解调波形分析与应用拓展,基于MATLAB和SIMULINK平台的16QAM调制与解调仿真研究及波形分析,16QAM SIMULINK 基于SIMULINK和MATLAB的16QAM调制和解调。 采用SIMULINK搭建框图,MATLAB调用模型得出波形图。 (可自行简单修改在SIMULINK中加scope,无须MATLAB调用) ,核心关键词: 16QAM; SIMULINK; MATLAB; 调制; 解调; 波形图; 框图; Scope,基于SIMULINK的16QAM调制解调系统研究
基于PMSM模型的四种控制策略对比研究:传统滑膜控制与扰动观测器的优化与应用,基于滑膜控制扰动观测器的PMSM模型:四控制策略对比分析与实践应用研究 [附带视频与出图程序],基于滑膜控制扰动观测器的永磁同步电机PMSM模型 四个控制对比: 1、PID控制器 2、传统滑模控制器 3、最优滑模控制器 4、改进补偿滑膜控制器 [1]附带简单讲解视频 如下图 [2]附带出图程序,四个控制对比的说明文档(2篇,非次品) ,核心关键词:滑膜控制; 扰动观测器; 永磁同步电机PMSM模型; PID控制器; 传统滑模控制器; 最优滑模控制器; 改进补偿滑膜控制器; 简单讲解视频; 出图程序; 对比说明文档。,PMSM模型下的滑膜控制:四法比拼,解析与可视化
Abaqus USDFLD子程序:实现积分点间材料弹性连续变化仿真的高效方法,Abaqus USDFLD子程序:实现积分点间材料弹性连续变化仿真的高效方法,Abaqus USDFLD子程序实现积分点间材料弹性连续变化仿真 ,Abaqus; USDFLD子程序; 积分点; 材料弹性; 连续变化仿真;,Abaqus USDFLD实现材料弹性连续变化仿真
内容概要:本文档为《早中期复习—数字信号处理》的学习指南,详细介绍了数字信号处理的相关概念和方法,旨在梳理并巩固相关领域的知识点。文档内容涵盖数字信号处理基本概念及时域离散信号和系统的分析方法;重点探讨时域离散信号、离散傅里叶变换及其快速算法(FFT);详细介绍了基于离散信号变换方法的不同类型滤波器的设计;此外还列举了部分经典的面试题目及其解答方向,以辅助备考者准备面试。文档有助于深入理解和掌握这一学科,提高对信号分析技能的认知和应用。 适合人群:本指南主要面向正在备战考试或从事相关工作的初学者,尤其是需要系统性复习并加强理论理解和实际操作技巧的学生和工程师。 使用场景及目标:可用于准备研究生入学面试或者作为工程师日常工作中处理复杂工程问题时的参考手册。目标是帮助使用者加深对数字信号处理的认识,掌握关键技术和应用场景,以便更好地应对学术和工业挑战。 其他说明:文档结构清晰、条理性强,配合大量例题和图示,有利于读者理解和记忆。同时,提供了实用的小贴士和思考题,引导读者积极思考,拓展视野,培养独立解决问题的能力。
题目2.5(模拟浏览器操作程序):标准Web浏览器具有在最近访问的网页间后退和前进的功能。实现这些功能的个方法是:使用两个栈,追踪可以后退和前进而能够到达的网页。
SensorTower2024年AI应用市场洞察报告31页.pdf
chromedriver-win32-136.0.7055.0.zip
COMSOL热流耦合拓扑优化:最大化放热量与功率耗散策略解析,Comsol热流耦合拓扑优化技术:以最大化放热量与功率耗散为目标函数的优化策略,Comsol热流耦合拓扑优化。 目标函数采用最大化放热量和功率耗散。 ,Comsol;热流耦合;拓扑优化;目标函数;最大化放热量;功率耗散,Comsol热流耦合优化:最大化放热与功率耗散
内容概要:本文介绍了将假肢测试与实时混合子结构(RTHS)方法相结合的技术背景。RTHS方法用于将完整的动态系统分解为数值部分(numerical part)和实验部分(experimental part),并在Simulink中进行建模。数值部分包括模拟截肢者的模型,而实验部分则涉及真实的机械臂和假肢。两者通过传输系统耦合,实现了步行阶段的动态交互。文章具体描述了不同步态阶段的动力学模拟流程,包括飞行阶段(抬脚离地)和接触阶段(脚触地)。为了实现有效的仿线,提出了对机械臂的四个关键要求:能够执行接口运动、承受界面力、低延迟高精度以及实现实时通信。 适合人群:从事生物力学、医疗器械和机器人技术研究的专业人士及科研人员。 使用场景及目标:适用于需要对假肢进行动态性能测试的研发机构或企业,目标是选择合适的机械臂并构建完整的假肢测试平台,提高仿线的准确性和可靠性。 阅读建议:重点理解和掌握RTHS方法的工作原理以及机械臂在仿真实验中的角色,在实践中注意验证机械臂是否符合所列出的各项要求。
FLUENT与MATLAB协同:基于UDP的复杂数据联合仿真计算与交互处理方案,FLUENT与MATLAB协同:基于UDP的复杂数据联合仿真处理系统,FLUENT与MATLAB联合仿真计算,基于UDP,可在MATLAB实现复杂数据计算处理。 提供两个软件数据交互方法和接口,FLUENT数据传递给MATLAB后,可以用任意方法处理,最后再回传给FLUENT处理后的数据。 本案例只是简单演示效果,可以实现复杂功能。 ,联合仿真计算; UDP接口通信; 数据处理; 交互方法; 回传数据; 复杂功能演示。,FLUENT与MATLAB协同:UDP接口数据交互与复杂处理
postgresql安装教程.md
IPMSM数学模型深度解析:双环模拟技术,预测电机对多样输入的响应,精准输出电流、转速与转矩,IPMSM模型分析电机响应,IPMSM数学模型,模拟电机对不同输入的响应,包含速度环和电流环,输出电流转速和转矩。 ,IPMSM数学模型; 电机响应模拟; 速度环和电流环; 输出电流转速和转矩; 电机控制,IPMSM模型模拟电机响应:双环控制下电流转速与转矩输出
基于CNN-RBF神经网络的优化数据分类预测模型——以交叉验证防止过拟合的Matlab代码实现,Matlab结合CNN-RBF进行数据分类优化,基于卷积神经网络结合径向基函数神经网络(CNN-RBF)的数据分类预测 CNN-RBF数据分类 优化参数为扩散速度,采用交叉验证防止过拟合 matlab代码 注:要求 Matlab 2019A 及以上版本 ,核心关键词: 卷积神经网络(CNN); 径向基函数神经网络(RBF); 数据分类预测; 优化参数; 扩散速度; 交叉验证; 过拟合; MATLAB代码 2019A以上版本,基于CNN-RBF的优化参数数据分类预测Matlab代码实现
多变量模式分析在脑电数据中的深度应用:从磁共振到时频域的神经表征研究,多变量模式分析在脑电数据中的深度应用:从磁共振到时频域的神经表征研究,多变量模式分析最早应用在磁共振数据中,用来考察某些脑区在编码不同条件的刺激时是否存在表征上的显著不同。 后来逐渐运用到脑电数据中,虽然脑电数据的空间分辨率较低,但时间分辨率很高,因此可以帮助确定在哪一段时间内,个体对不同条件刺激的表征有显著差异。 目前已经有很多工具箱支持脑电数据MVPA的分析,例如matlab中ADAM,python中的NeuroRA等(这两个相对来说比较好上手)。 方法共包括基础的时间序列解码,以及衍生方法跨时域解码与权重投射等。 MVPA不仅可以应用在原始时域数据上,也可以应用在时频域数据上,来观察不同频段的能量对于编码不同刺激过程中的贡献。 ,多变量模式分析(MVPA);磁共振数据;脑电数据;时间分辨率;工具箱支持;ADAM;NeuroRA;时间序列解码;跨时域解码;权重投射;时频域分析。,多变量模式分析在脑电数据中的应用:从磁共振到时频域的表征研究
更多毕业设计https://cv2022.blog.csdn.net/article/details/124463185
系统选用B/S模式,后端应用springboot框架,前端应用vue框架, MySQL为后台数据库。 本系统基于java设计的各项功能,数据库服务器端采用了Mysql作为后台数据库,使Web与数据库紧密联系起来。 在设计过程中,充分保证了系统代码的良好可读性、实用性、易扩展性、通用性、便于后期维护、操作方便以及页面简洁等特点。