谈基于机器智能(知识)的机器翻译
摘要
目前机器翻译路线有基于规则的传统技术,基于统计的目前技术。我的思路是基于机器智能的。我们人类翻译一篇外文时,是否需要相关方面的知识呢?答案是 “肯定的,需要的”。那么,同理,机器翻译时,是否需要呢?我想,也是需要的。什么是机器知识,或者叫人工智能?就是计算机拥有人类的知识,比如知道星球类可以升起,而河水可以上涨,而且知道太阳是星球,可以说太阳升起,而不是太阳上涨,其实,升起和上涨差不多意思。机器拥有了知识,就可以自动推理,解决翻译中的歧义问题。那么,构建基于机器知识的机器翻译系统,需要哪些过程呢?首先,机器需要存储自己的知识,能够理解某个领域内的知识,包括理解语法,拥有常规知识(如衣食住行等)和某些行业知识。其次,能够人机交互,交流知识,这样,机器的知识才能越来越丰富,机器从人类学到越来越多的知识。再次,翻译的过程就是理解一种语言,将其转化为内部知识,再以另一种语言表达出来。文本试图从这几方面提供解决若干思考。
l # 知识存储
1) 借助人工语言如java语言。目前主流的计算机编程语言已经能够实现某些智能,但需要人工编制程序。编程语言总结下来,
实现的执行顺序有:顺序、分支判断、循环、并行。
实现的对象特性有:继承、多态、抽象。
2) 如何表达智慧?
a)有类和对象的概念,根据类生成对象。
类之间关系:
可以继承,
可以将类抽象出概念(相当java里的抽象类或接口)。
可以包含。如人类可以含有手脚头类
维或叫向量、属性、成员,维是不相交的,如时间和长度这2个维。
维的度量或测量。如时间的测量可以有年、月、日、时分秒(定量)或一会,很快(定性)。测量含测量的数量、测量单位。
维也是对象,所以通过 包含几个维,可以生成新的维。如用电量的千瓦时就是由千瓦和时组成的维。
导出维:dest = f(src1,src2...)。由若干个维计算出来的一个维,可以为对象引用关系或值引用关系(相当c的指针和值传递)。引用关系时,当src1发生变化,dest也要跟着变化;值引用关系时,dest是脱离原来维的,不发生变化。当变量为一个时,导出维还是变量那个维;变量多于一个时,导出维为一个新的维。如 高=(身高测量值>170cm),也是属于原来的身高维。千瓦时=(千瓦*时)属于一个不同于千瓦和小时的新的维。
b)句型分为形式句型和逻辑句型,如主+谓+直接宾+间接宾语这种形式句型,其中隐含了直接宾语和间接宾语 构成的逻辑主谓关系;这种逻辑句型就是一种知识结构(映射到java语言上的类)。所以,知识的存储就是存储一种逻辑句型的结构。
注意,一句话可能含有多个知识,如“我打球等车时候,看见556路车来了”这句话,知识点有“我去打球了”,“我看见556车的时间是...(打球等车那时间点)”
c)知识的检索。如sun rises的知识检索过程:识别出主谓结构,sun的中文解释有“太阳”,rise的中文解释有“升”,那么就命中“太阳升起”这个知识(假设这个知识已经被机器存储)。
知识结构的各部分都可能要建立索引,如对主语建立索引,就是建立<key=主语,value=知识>这样的索引。
另外,可能会涉及到别名,别名不同于实例,如太阳是天体的实例,而日头是太阳的别名。
d)知识的表达。如用英语表达 run rises,用中文 太阳升起,用河北方言 日头出来
机器翻译需要有关知识:
语法知识。
语义单元:如主+谓+直接宾+间接宾语。
He bought me a pen. he bougth a pen, pen of me
He asked us to do the work. he asked us,us to do the work
常识知识
(人)吃饭、(人)穿衣、(人)睡觉、日出日落等。
l # 向人类学习(人机知识交流)
这里的学习,不是目前流行的’机器学习‘技术。机器学习一般是基于统计的语料库,发现关联的东西。这里的学习,指机器向人类学习知识,将人类已经知道的知识消化,据为己有,比如‘填鸭式教学’这样的知识教授机制。
a)人类辅助翻译
就是人类辅助机器翻译,帮助机器消除歧义。过程:
i. 人类源语言(如英语)形式(语法)识别
ii. 将理解的结构表达出来,用人类目标语言(如汉语),这时候可以不通顺的,歧义的,如对 run rises的表达为 “[太阳,日] [升,上涨,拉]"
iii. 人类歧义消除
iv. 机器记住知识(分别用人类源语言和目标语言)
b)机人学习,就是人预先传授知识给机器。如告诉机器 "太阳升起","戴帽子","穿衣服"(尽管英语中都是wear)。这样,机器翻译 sun rises时候,就会自动消除歧义,找到"太阳升起”这个知识。
l # 进行翻译
l # 机器智能的延伸思考
一旦机器可以将知识存储、检索、关联,并不断向人类学习新知识,那么,就意味着真正的人工智能。如果有足够的知识,甚至可以自己做题,自己编程呢!
声明:转载就注明出处。邢立军,邮件15367481@qq.com。
相关推荐
本文主要探讨的是基于机器学习的人工智能的理解。人工智能(Artificial Intelligence, AI)自1956年诞生以来,一直是计算机科学的重要研究领域。尽管公众对AI的认知常因缺乏规范定义和影视作品的渲染而产生误解,但...
智能视频监控中基于机器学习的自动人数统计 本文提出了一种智能视频监控中基于机器学习的自动人数统计系统。该系统通过机器学习的方法对视频序列中的头肩部位进行准确的检测,从而克服了传统检测方法如连通域分析和...
"基于机器学习的智能TWAP和VWAP算法的研究及应用" 本文研究的主要目的是基于机器学习的TWAP和VWAP算法的改进和应用。TWAP和VWAP是一种常见的经典交易算法,传统的VWAP算法是在TWAP算法的基础上,使用预测日内成交量...
本文提出了一种基于知识库的智能客服机器人问答系统设计,这一系统在自然语言处理、知识库管理和深度学习方面都有着广泛的应用。 一、智能客服机器人现状分析 智能客服机器人通过模拟人类服务人员进行交互,旨在...
机器翻译是应用计算机技术和人工智能算法将一种自然语言翻译成另一种自然语言的过程。在2018年的研究报告中,清华大学详细介绍了机器翻译的概念、发展历程、技术原理、相关领域专家以及实际应用和未来趋势。 首先,...
书评者花有清,任职于金华职业技术学院信息工程学院,他认为该书是对机器人学及机器视觉相关知识的系统整理,尤其强调了基于机器视觉的智能手语识别翻译器设计与实现的重要性。 机器视觉是机器人学的重要分支,它...
《网络游戏-基于智能知识库的网络化人工智能翻译系统及其翻译方法》 在当前全球化背景下,网络游戏作为娱乐产业的重要部分,其跨语言交流的需求日益增长。为了解决这一问题,基于智能知识库的网络化人工智能翻译...
基于人工智能与机器学习技术在智慧城市的应用.pdf 智慧城市是基于物联网、云计算、人工智能等技术而形成的一种新型智能化、信息化的城市形态。人工智能与机器学习技术在智慧城市中的应用是智慧城市建设的重要组成...
- **基于规则的方法**:早期的机器翻译主要依赖于人工编写的规则,这种方法需要大量的人工语言知识,但灵活性较差。 - **统计机器翻译**:统计机器翻译通过分析大量的平行语料库来学习翻译模式,其性能通常优于基于...
本文将从机器学习角度,介绍基于机器学习的智能故障诊断系统的架构设计、知识序数据采集、数据预处理、业务实例模型、因变量筛选、敞障识别库建立与流程自动化等方面。 2.1 机器学习在故障诊断中的应用 机器学习...
《基于单片机的智能机器人在农业大棚环境监控中的应用》 智能机器人技术近年来发展迅速,尤其在农业领域的应用越来越广泛。本课件主要探讨了如何利用基于单片机的智能机器人来管理农业大棚,实现对大棚内环境的实时...
以下是基于文章内容的详细知识点: 1. **机器学习在农业的应用**: - 机器学习技术在农业领域的应用日益广泛,特别是在农业信息化和精准农业背景下,对数据分析和决策支持的需求大幅增加。 - 农业问题的复杂性...
"机器学习与知识发现在高校公共突发事件智能预警系统中的应用" 机器学习与知识发现是当前人工智能领域的热点话题,而在高校公共突发事件智能预警系统中,其应用前景广阔。本文将对机器学习与知识发现在高校公共突发...
机器翻译(machine translation)简单来说就是使用计算机将文本从一种语言翻译成另外种语言。它是计算机语言学的一个分支,已经有几年的研究历史。目前在美国,翻译是一个价值400亿美元的产业,而同时在欧洲和亚洲,翻译的...
基于人工智能的深度神经网络语法知识融合的神经机器翻译实现
在当前信息化迅速发展的大背景下,运维工作正在经历着从传统基于规则的运维向基于机器学习的智能运维转变。传统的运维工作依赖于固定规则和人为经验,以解决问题和预防故障,但随着业务复杂度的提升,传统运维已难以...
在这篇论文中,作者们介绍了一个基于人工智能的患者智能问诊服务应用平台,旨在通过高科技手段提升医疗服务质量和效率,优化患者的就医体验。以下是论文所涉及的关键知识点: 1. 智能问诊服务的背景与需求 - 人工...
文章标题“基于机器学习算法人工智能技术的发展与应用.pdf”和描述“基于机器学习算法人工智能技术的发展与应用.pdf”虽然相同,但根据提供的部分内容,可以推测文章围绕着机器学习算法对人工智能技术发展和应用所...
基于机器学习的智能化运维系统(AIOps)应运而生,它通过运用大数据分析、预测模型以及自动化决策来提升运维效率,降低故障率,实现IT系统的自我修复和优化。本文将深入探讨这一领域的核心概念、关键技术及其在实际...