`
熊likecocoa
  • 浏览: 18392 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

用机器学习来降低风险,这真是极好的

 
阅读更多
如今企业开始部署机器学习。企业希望员工使用机器学习的三个主要原因包括:节省成本、更快处理海量数据以及更快发现新的漏洞。

大型零售商使用机器学习应用来发现电子商务中的欺诈性交易,同时防止合法交易被阻止。他们利用机器学习来分析客户对产品的态度,并找出冒充长期客户的攻击者。

金融机构利用机器学习应用或系统来预测贷款违约以及欺诈和洗钱行为;医院可通过机器学习预测可节省的急诊室等候时间、可预测的中风和癫痫发作以及浪费式的再次住院;大型律师事务所则可利用机器学习帮助律师更快决定选择处理哪些案件,法律机器人被训练用以确定企业合同是否包含所有必备条款。

机器学习的其他应用包括预测健康状况和股票价格,以及电力负荷与太阳能发电。

机器学习自带风险

即便是最好的机器学习模型也存在着风险,这包括因糟糕学习算法导致的误报,这可能被攻击者利用。同时,机器学习模型还可能获取来自最近被攻击主机的受感染数据,没有误报并不意味着没有任何风险,攻击者可以利用运行机器学习应用平台系统中的漏洞。

机器学习面临的风险之一是攻击者可利用伪造的生物识别指纹和虹膜以及面部特征来冒充合法用户。另一个风险是攻击者在测试或执行期间可以骗过机器学习模型将恶意训练样本分至合法类别。这可能导致机器学习模型产生与预期完全不同的结果。

机器学习风险管理

下面是降低机器学习应用风险的五种方法:

1. 执行道德攻击

道德攻击是指值得信赖的安全专家入侵系统以发现被防火墙、入侵检测系统或其他任何安全工具忽视的机器学习漏洞。在获取访问权限方面,道德攻击者利用的是合法用户在设备上遗留的指纹所重构的伪造​指纹。在进入系统后,道德攻击者可潜入指纹数据库,获取另一位合法用户的生物特征模板,再重建一个假的指纹。为了应对这种风险,设备读取器必须在每次使用后进行清理,数据库应被加密。

2.加密安全日志

系统管理员拥有超级用户权限来分析机器学习日志文件,这样做的原因包括:检查是否遵守安全政策、对系统进行故障排查以及取证。加密日志文件是防止日志文件被攻击的一种方法。更改日志内容所需要的加密密钥不会暴露给恶意攻击者,如果攻击者试图删除日志文件,管理员会立即收到警报。

3. 清理训练数据

当提供良好的训练数据时,机器学习模型可良好地运作。该模型开发人员必须知道这些数据从何而来,这些数据必须是干净的数据,而不是异常或受感染的数据。如果数据来源主机受到攻击,则应该停止使用这些数据。糟糕的数据可能导致机器模型无法良好运作,最终导致系统关闭。当使用机器学习工具来为特定目的评估数据时,模型开发人员应该将所有数据转换为通用格式。

4. 对模型生命周期采用DevOps

攻击者可利用来自机器学习平台的误报信息。对于这种风险,我们可对机器学习模型生命周期应用DevOps,DevOps让开发和训练、质量保证及生产团队相互协作。

DevOps会从开发和训练阶段开始,然后进入到质量保障阶段来看看模型的训练情况。不满意的测试结果意味着需要返回到开发阶段,为模型提供更好的数据。如果测试结果很好,模型则会进入生产阶段,处理真实世界的数据。如果结果不符合预期,DevOps应该从开发或质量保障阶段再次重复。

5. 部署安全政策

最后,我们还应该部署安全政策。在简单的情况下,安全政策应该包括五个部分:目的、范围、背景、行动和限制。范围会确定涵盖哪些内容:机器学习模型类型、训练数据和数据挖掘算法(回归、聚类或神经网络)。背景部分则会查看政策背后的原因,行动部分介绍如何利用DevOps来降低风险,而限制部分则会查看机器学习的限制以及测试数据的可用性。(作者:Judith M. Myerson 翻译:邹铮来源:TechTarget中国)
分享到:
评论

相关推荐

    机器学习算法基础资料.rar

    在压缩包中的“集成学习”文件可能包含了关于这些方法的详细说明、实现代码和实例,这对于初学者来说是极好的学习材料。通过阅读源代码,你可以了解这些算法如何在实际中工作,而视频教程则可以提供直观的理解和操作...

    机器学习在商业银行个人信用评价中的应用.pdf

    总的来说,机器学习在商业银行个人信用评价中的应用极大地提高了风险评估的效率和准确性。通过智能分析大量数据,银行能够更精确地识别潜在的风险,优化信贷决策,同时降低了不良资产的风险,推动了银行业的数字化...

    机器学习在角膜相关疾病辅助诊断中的应用.pdf

    总结起来,机器学习在角膜相关疾病的辅助诊断中扮演着日益重要的角色,通过自动化分析和预测,它极大地提高了眼科医生的工作效率,降低了误诊率,为患者提供了更优质的医疗服务。然而,如何优化模型、统一数据标准、...

    大数据环境下的机器学习研究.pdf

    4. 代价敏感性:在实际应用中,算法需要对错误预测带来的损失敏感,并能通过调整优化损失函数来降低风险。 大数据环境下的机器学习研究不仅要探索新的算法和理论,还需要结合大数据处理技术,如数据挖掘、数据清洗...

    AI人工智能课程 机器学习算法班第9讲:机器学习调优与模型融合 共32页.pdf

    ### AI人工智能课程 机器学习算法班第9讲:机器学习调优与模型融合 #### 课程概述 在《AI人工智能课程》系列讲座中,《机器学习算法班第9讲:机器学习调优与模型融合》主要关注如何对已构建的机器学习模型进行优化...

    机器学习算法总结21

    【机器学习算法总结21】 本文将探讨一种基础的机器学习算法——K近邻(K-Nearest Neighbors,简称KNN)。KNN是一种监督学习方法,用于分类和回归问题。其基本思想是:给定一个新的未知实例,通过查找训练集中与其最...

    云计算和机器学习在精算行业中的应用.pdf

    云计算和机器学习等新兴技术的应用正在深刻地影响着保险行业的各个方面,包括产品设计、风险评估、客户服务等。精算师作为保险行业中的关键角色,也在积极探索这些新技术所带来的可能性。本报告将深入探讨云计算和...

    《10种流行的机器学习算法进行泰坦尼克幸存者分析》脚本与数据

    对于初学者,这是一个极好的起点,可以深入了解各种机器学习算法的运作方式,并了解如何在实际问题中应用它们。同时,它也提醒我们,机器学习不仅仅是关于模型,而是包括数据理解、特征工程和模型验证在内的整体流程...

    全球-量化策略-自动化机器学习:让机器为你工作-2019.12.5-38页.rar

    自动化机器学习(AutoML)是近年来信息技术与金融投资相结合的重要成果,它极大地提高了量化策略的效率和准确性。 1. 自动化机器学习简介 自动化机器学习是一种先进的数据分析方法,通过自动化地完成特征工程、模型...

    机器学习文本多分类.zip

    《机器学习文本多分类》 在信息技术飞速发展的今天,机器学习已经成为数据处理与分析领域的重要工具,尤其在文本分类方面展现出了强大的潜力。本文将深入探讨机器学习如何应用于文本的多分类问题,以及相关的核心...

    如何确保人工智能和机器学习项目的安全性.pdf

    首先,企业需要了解AI 和 ML 系统的风险,并采取措施来降低风险。 其次,企业需要遵循基本的安全做法,例如对所有 AI 和 ML 项目进行完整的审计和测试。 第三,企业需要保护数据,包括训练数据、测试数据和运营...

    机器学习基于多客群的高维特征数据和表现数据实现客户信用风险预测python源码+项目说明.zip

    运用统计和机器学习模型对客户信用风险进行预测是金融机构风险管理关注的重要问题。本任务基于多客群的高维特征数据和表现数据(部分有标签,部分无标签)对客户的信用风险进行预测。详细信息参照 ...

    机器学习-回归算法1

    回归算法是机器学习中基础且重要的预测模型技术,主要用于连续数值型数据的预测。线性回归是最基础的回归算法之一,其目标是找到一条直线(在一元线性回归中)或超平面(在多元线性回归中)来最好地拟合数据点。线性...

    1.机器学习、深度学习面试笔试题300+1

    【机器学习面试题】 1. **支持向量机(SVM)** SVM 是一种监督学习算法,主要用于分类和回归分析。其核心思想是找到一个最优的超平面,以最大化类别间的间隔。支持向量是距离超平面最近的点,它们决定了超平面的位置...

    「勒索软件」基于机器学习的Web入侵检测模型应用分析 - 端点安全.zip

    首先,基于机器学习的Web入侵检测模型能够通过学习和识别网络流量中的异常模式,来区分正常行为和潜在的恶意活动。这种模型通常采用监督学习或无监督学习方法,如决策树、随机森林、支持向量机、神经网络等,通过...

    2014斯坦福大学机器学习mkv视频 Lecture7.pdf

    在机器学习领域,过拟合(Overfitting)是一个常见的问题,它指的是模型在训练集上表现极好,但在未见过的新数据上表现不佳。斯坦福大学2014年的机器学习课程,由Andrew Ng教授讲解,特别提到了这个问题以及如何解决...

    wine-quality:该项目使用机器学习来分析葡萄酒质量数据

    Jupyter Notebook是这个项目的主要工具,它是数据分析和机器学习领域广泛使用的交互式环境。用户可以在同一个环境中编写代码、运行实验、展示结果,极大地提高了工作效率。在"wine-quality-master"文件夹中,我们...

Global site tag (gtag.js) - Google Analytics