无意中又浏览了一篇《数学之美》的章节
里面一段话很有共鸣
1. 一个正确的数学模型应当在形式上是简单的。(托勒密的模型显然太复杂。)
2. 一个正确的模型在它开始的时候可能还不如一个精雕细琢过的错误的模型来的准确,但是,如果我们认定大方向是对的,就应该坚持下去。(日心说开始并没有地心说准确。)
3. 大量准确的数据对研发很重要。
4. 正确的模型也可能受噪音干扰,而显得不准确;这时我们不应该用一种凑合的修正方法来弥补它,而是要找到噪音的根源,这也许能通往重大发现。
想起了以前看过的这篇文章
http://grunt1223.iteye.com/blog/994816
道理浅显明了,难度在于实践
正确的模型也许是简单的,但简单的未必正确,比如链接所给的例子
上面的2和4其实认知上存在悖论
我们如果能确定模型的正确性就表示已经接近真理
可对于不可知模型,我们判断自己是否接近真理往往是依赖数据
可我们在没绝对确认模型的正确性之前,我们其实无法绝对判断出模式外的数据是否为噪音数据
而根据2,即使对匹配的数据我们也仍然不能确定模型的准确性
这就导致我们无法用模型来验证数据的准确性
也无法用数据的阶段准确性来确认模型的正确性
大量准确的数据这其实是有些虚幻的条件
一些实际的问题,我们并不能严格判断它们是否能看作“准确”或者“错误”
因为这个数据可能不是独立无关的,必须结合上下文中才能判断
而更复杂的情况是,我们对于上下文的判断可能也不准确,从而导致对数据的“准确”或者“错误”的判断也有问题
比如股票操作
你在某个点位买了股票挣钱了却不能证明你的操作方式是对的
相反亏钱了,却不能证明操作是错的
即使拉开时间区间,你的操作方式被验证是高盈利的
但如何确定你的方式不是一个范围的阶段拟合的错误模型
在遇到条件A或条件B可能利润会全部吐出
那些被可能阶段低盈利的操作模型可能在更大范围是盈利更高的
而一旦A,B这种对结果冲击的拐点很多,那么理论上即使凭借大量数据也是很难覆盖所有的数据空间
举个例子,对于分段函数:
f(x)=x x>1
f(x)=0 x<=1
即使给你天量的(1,n)的验证数据,你永远只能部分逼近这个函数的全貌
所以除了能理论上去确认模型,靠数据其实永远是只能接近而无法达到真理
我们怎么用有限的数据确定模型,从而预测其他数据?
只有3个采样2,4,8,后面一个数字应该是16,还是14?
我们怎么能确定数据是噪声而不是模型
我们怎么确定模型是需要修正而不是需要推翻
人工智能的难度应该也在于此,我们既不能确认数据集的合理性,也不能确认模型的合理性
所以我们多数时候只能盲人摸象,领域内实现部分拟合,但其实模型一开始也许就已经偏了
即使我们努力修正也只是粉饰
数据与模型,我们至少必须确定一端的正确性,才有能力追求另一端的准确性
分享到:
相关推荐
贝叶斯认知跟踪模型可以捕捉学生知识掌握的不确定性,通过概率推理来预测学生未来的学习表现。该模型主要关注学生在不同知识点上的掌握情况,能够提供关于学生学习过程的洞察,帮助教育者了解学生在学习过程中的进步...
综上所述,该研究为理解回收质量不确定条件下的再制造利润模型提供了重要的理论基础和实证分析方法,不仅对相关企业和政策制定者具有指导意义,也为学术界提供了宝贵的研究资料。通过对回收质量的定量分析和利润模型...
RSM的分析步骤包括两个部分:首先是Q矩阵理论,该理论旨在确定测验项目所测量的不可观察的认知属性,并将其转化为可观察的项目反应模式;其次是规则空间的构建及判别,即在空间中将被试的作答反应模式与期望反应模式...
本文“双不确定相依竞争失效模型的可靠性评估”由师海燕、魏淳、张志强等人发表于《控制与决策》期刊,他们引入了不确定理论来处理这种由人为认知引发的不确定性。在该理论框架下,专家的经验数据被表示为不确定变量...
具体的工作流程可以分为以下八个步骤:确定诊断目标、评估机构/组织认知属性及其阶层关系的确定、确定适当的认知诊断测量学模型、认知诊断测验正式编制、不合理学科专家、认知心理学专家、教育测量学专家的小范围试...
本视频课程“大模型SFT微调训练基础认知”应该会涵盖这些内容,并深入讲解如何有效地进行微调,以优化大模型在特定任务上的表现。通过学习,你可以理解大模型的潜力,掌握微调技巧,从而在自己的项目中利用这些强大...
【胜任力模型认知】基于胜任力模型的人才发展体系是一个重要的概念,它涉及到企业如何通过构建和应用胜任力模型来优化人才的评价、培养和选拔。胜任力模型是一种描述和预测个体在特定职位上成功所需的关键能力和特质...
《不确定性人工智能》课程中提到的云模型是一种模拟不确定性和模糊性的数学工具,特别是高斯云模型,它在理解和处理不确定信息方面具有重要意义。云模型基于概率理论和模糊理论,通过数学方式来描述和转化定性与定量...
在模型检测中,研究者将多智体系统建模为适当的模型,并用逻辑公式表示要验证的规范,进而提出模型检测问题,以确定多智体系统是否满足该规范。该技术在硬件检测、通信协议以及控制系统的验证中得到了广泛应用。然而...
此外,模型的目标是控制并减少不真实数据的影响,确保对学生认知能力的评价更加合理。通过这种方式,系统可以更准确地描绘学生的真实认知状态,为因材施教提供支持。实验结果显示,这种方法是可行的,能够取得良好的...
总之,分布轮廓与局部特征融合的云模型不确定性相似度量是针对不确定性处理的一个进步,它试图模拟人类的认知过程,考虑整体和局部特征,以实现更准确的知识表示和处理。这一方法对于提升决策分析的准确性、智能控制...
分形的无标度性质和无限细节使得它们成为了不确定性研究的理想模型。通过分析分形的熵和超熵,可以揭示隐藏在其复杂结构背后的秩序和规律。 ### 5. 复杂网络与不确定性 复杂网络是由大量节点和边组成的非规则网络...
本视频系列专注于大模型的基础认知,特别是其中的关键环节——提示词工程。 提示词工程是训练和应用大模型时一个至关重要的步骤。提示词,也称为prompt,是用来引导模型生成响应的一段输入文本。它们是人与大模型...