原文链接:
http://click.aliyun.com/m/22129/
摘要: 机器学习已经渗透到了人类活动的所有领域,它不仅在语音识别、手势识别、手写识别和图像识别上起着关键的作用,这些领域如果没有机器学习在现代医学、银行、生物信息和存在任何质量控制的行业中都是一个灾难。
0?wx_fmt=gif
机器学习已经渗透到了人类活动的所有领域,它不仅在语音识别、手势识别、手写识别和图像识别上起着关键的作用,这些领域如果没有机器学习在现代医学、银行、生物信息和存在任何质量控制的行业中都是一个灾难。甚至机器没有学习和生成的能力,连天气预报都无法做出。但是此时我想澄清一些问题——关于机器学习在网络安全领域的使用中存在的一些误解。
误解一 网络安全中的机器学习是新鲜玩意
由于某种原因,在网络安全中的人工智能技术变成了过去流行的东西。如果你没有长期关注过这个主题,你可能会认为这是新的东西。
一些场景:第一个机器学习算法,人工神经网络在上个世纪50年代就被发明了。有趣的是,在当时人们都认为该算法将很快导致“强”人工智能的出现。即,智能的思考能力、独立思考并可以解决那些默认编程程式外任务的人工智能。可随后就是“弱”人工智能的时代,它可以解决一些创造性的任务,比如识别图片、预测天气、玩象棋等。六十年后,我们会对一些基本事实有更多的理解,那时真正的人工智能也许已经出现了,而我们现在提起的人工智能其实更准确的说是机器学习。
当谈到网络安全领域时,机器学习也不是什么新鲜事。这类算法在十年前左右就提出了,那时候新的恶意软件数量每两年翻一番。
但是简单的自动化对病毒分析师来说是不够的,它需要一个质的飞跃。这个飞跃出现在处理病毒家族样本时,可以用机器学习来搜索和已经判别完成的样本相似的文件。最终一个文件是否是恶意的以前要由人来判断,但是这个工作快速地转移给了机器。换句话说,在网络安全行业,机器学习没什么新奇的。
误解二 网络安全中的机器学习简单明了——一切都有现成的
在某些领域,机器学习有一些早就准备好的算法,这确实是事实。这些领域包括面部、情感识别或者从狗中区分猫。在这种情况下,通常是有一些人做了大量的思考、确定必要的标识、选取适当的数学工具、设置必要的计算资源然后公布他们的研究结果。现在,每个做这些工作的人都可以利用这些算法。
0?wx_fmt=png
这导致了一个错误的印象,好像把恶意软件检出的算法也已经存在了。实际情况并非如此,我们在卡巴斯基实验室花了超过十年的时间来开发这项技术,并申请了许多专利。我们持续进行研究、提出新的想法也与下一个误解有关。
误解三 机器学习——做一次就够了
恶意软件检测和人脸识别在概念上的区别,脸永远是脸,在这方面永远也不会有什么改变。在机器学习被应用的大多数领域中,目的不随时间变化,但是在恶意软件检出这个范畴内,事情在不断且快速地变化着。因为网络罪犯往往是高动机的人,为了钱、间谍活动、恐怖主义等。他们的智力不受人工的局限,他们积极出击、故意修改恶意程序好摆脱已有的成熟模型的检测。
这就是为什么这些模型需要不断学习、不断修正,甚至推倒从来。显然,面对快速变化的恶意软件,基于没有反病毒数据库模型的安全解决方案是毫无价值的。当必要的时候,网络犯罪分子可以以创造性的思考来应对。
误解四 你可以让安全软件在客户端进行学习
比方说,在处理客户端文件的时候,绝大多数文件都是安全的,只有少部分是恶意的。后者是会变异的,但是你设计的模型可以自己学会应对。
然而事情却不是这样的。因为通过客户端的恶意样本的平均数量要比反病毒实验室收集到的恶意样本数量小得多。客户端会因为没有收集到样本进行学习而丧失应对能力。对病毒作者的“创造性”的检测就一定会失败,模型此时把恶意软件识别为安全的文件,将会学到“错误”的东西。
0?wx_fmt=png
误解五 开发一个基于机器学习的模型就够了
为什么要使用基于不同技术的多层次保护?如果那个篮子是如此的聪明和先进,为什么不把所有的鸡蛋都放在同一个篮子里?这样一种算法就可以解决所有问题了。
问题是大多数同家族的恶意软件都是由一个恶意程序修改而来的。例如 Trojan-Ransom.Win32.Shade 是一个拥有超过三万个恶意样本的家族。一个模型可以通过大量的样本训练,来获得检测未来威胁的能力(在一定限度内,见误解三)。在这些情况下,机器学习的效果很好。
但是,通常的情况是一个家族只包括了几个样本,甚至只有一个样本。也许是作者不想其心血的恶意程序由于恶意行为被检出后陷入和安全软件的长期斗争。相反,他选择去攻击那些没有安装安全软件或者没有行为检测的人(即那些曾把所有鸡蛋都放在一个篮子里的人)。
这些各式各样的只有一两个样本的“小家族”不能应用于“训练-推广”这个传统的机器学习模式。在这种情况下,用久经考验的哈希、掩码可能会更好的检出威胁。
另一个例子是有针对性的攻击,这些攻击的幕后黑手不打算制造越来越多的新样本,一个受害者就只用一个样本,此时你可以肯定这个样本不会被保护方案检出(除非这是一个转为此目的开发的平台,例如卡巴斯基的反针对攻击平台),又一次是基于哈希的检测胜出了。
结论
不同的工具要在不同的情况下使用,多层次的保护要比单层保护更有效,不要因为它们不“时髦”就忽略了那些有效的工具。
原文链接:
http://click.aliyun.com/m/22129/
分享到:
相关推荐
机器学习在网络安全入侵检测中的应用.pdf
机器学习在网络安全中的应用 (1).pdf
机器学习在网络空间安全研究中的应用 机器学习在网络空间安全研究中的应用是近年来备受关注的一个热点话题。随着网络空间中的数据量不断增加,传统的网络空间安全处理方式已经无法满足海量数据需求。这时,机器学习...
机器学习在网络安全领域的应用已经成为现代信息技术安全的重要组成部分。随着网络攻击手段的日益复杂化和多样化,传统的...同时,随着数据集的不断丰富和算法的持续改进,机器学习将在未来的网络安全中发挥更大的作用。
机器学习在网络安全保障中还涉及到深度学习、数据挖掘等技术。深度学习能够自动提取数据特征,用于高级别的数据表示和分析。数据挖掘则是从大量数据中发现未知的、有价值的信息,它在网络安全中用于挖掘潜在的安全...
网络安全与机器学习是当前信息技术领域的两大重要组成部分,它们在维护数字化世界的秩序和推动智能化发展方面发挥着关键作用。本文将围绕这两个主题展开讨论,详细解析它们的关联与应用。 网络安全是指保护网络系统...
根据提供的文档内容,以下是关于“基于机器学习的网络安全态势感知”的详细知识点: 1. 引言:文档开篇即指出信息技术飞速发展与互联网普及带来的利与弊,用户在享受到新信息技术带来的便捷与高效之时,也面临着...
机器学习在网络安全中的应用.pdf
【机器学习在网络隐私安全中的应用研究】 随着信息技术的飞速发展,网络隐私安全问题日益凸显。机器学习,作为人工智能领域的重要分支,正逐渐成为解决这一问题的关键技术。本文旨在探讨机器学习在网络隐私安全中的...
本文提出了一种基于机器学习算法的网络安全评估方法,具体来说是利用了支持向量机(SVM)的非线性拟合能力以及果蝇优化算法(FOA)的全局优化能力,在时间序列的基础上建立了网络安全态势评估模型。 首先,支持向量...
由数据科学家张佳彦,趋势科技的研究成果,该文档主要分为三个部分:网络威胁的演化与机器学习、应用机器学习防卫网络安全以及机器学习在具体安全场景中的应用。 网络威胁的演变经历了三个阶段:初期的爆发型威胁,...
综上所述,无论是通过人工智能来填补网络安全人才缺口,还是利用机器学习来强化安全网络分析能力,或是构建网络安全行为模型,这些技术和方法都将在未来的网络安全人才培养和实战应用中发挥重要作用。随着技术的不断...
模型安全是指机器学习模型在部署和使用过程中的安全性。 数据污染攻击是机器学习系统面临的一种常见攻击形式。攻击者可以通过各种手段污染机器学习系统的训练数据,使得机器学习模型出现错误或偏差。为了防御数据...
未来,机器学习在网络空间安全的研究中需要面对的主要挑战包括提升模型的鲁棒性、应对动态变化的网络环境、以及开发更高效的算法来处理大规模数据。 总的来说,机器学习已经成为网络空间安全研究的核心技术,通过...
基于机器学习的网络入侵检测方法研究 概述: 随着网络应用的普及,网络安全问题也随之而来。网络入侵的频率越来越高,已严重危害...机器学习方法在网络安全中的应用前景非常广泛,将为提高网络安全水平做出重要贡献。
【标题】: 机器学习在网络空间安全研究中的应用探究 【描述】: 本文深入探讨了机器学习在解决网络空间安全问题中的应用方法和作用,分析了从安全问题抽象、数据采集、预处理、模型构建到模型验证的全过程,并探讨了...
机器学习自动化平台的出现,实际上是为了解决数据科学家在机器学习项目中的繁琐工作,例如模型选择、特征工程、模型评估和参数调优等。这些平台的目标是让那些非机器学习领域的专家也能够利用先进的机器学习技术来...
【机器学习技术在网络中的典型应用】 随着深度学习和其他先进的机器学习技术在近年来的显著进步,它们对网络领域的革新产生了深远影响。这些技术已渗透到网络的各个关键领域,提升了网络性能、安全性和效率。本文将...
首先,机器学习在网络安全中的应用主要包括入侵检测、恶意软件分析、网络流量分析、身份验证和行为异常检测等方面。通过学习大量数据,机器学习模型可以识别出潜在的威胁模式,并在实际攻击发生前做出预测。 在入侵...
本文主要探讨了机器学习在网络空间安全研究中的应用步骤、作用以及具体的应用实践,旨在为维护网络安全提供支持。 【关键词】机器学习,网络空间安全,应用 在【部分内容】中,文章详细阐述了机器学习在网络空间...