`
熊likecocoa
  • 浏览: 19031 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

用机器学习来降低风险,这真是极好的

 
阅读更多
如今企业开始部署机器学习。企业希望员工使用机器学习的三个主要原因包括:节省成本、更快处理海量数据以及更快发现新的漏洞。

大型零售商使用机器学习应用来发现电子商务中的欺诈性交易,同时防止合法交易被阻止。他们利用机器学习来分析客户对产品的态度,并找出冒充长期客户的攻击者。

金融机构利用机器学习应用或系统来预测贷款违约以及欺诈和洗钱行为;医院可通过机器学习预测可节省的急诊室等候时间、可预测的中风和癫痫发作以及浪费式的再次住院;大型律师事务所则可利用机器学习帮助律师更快决定选择处理哪些案件,法律机器人被训练用以确定企业合同是否包含所有必备条款。

机器学习的其他应用包括预测健康状况和股票价格,以及电力负荷与太阳能发电。

机器学习自带风险

即便是最好的机器学习模型也存在着风险,这包括因糟糕学习算法导致的误报,这可能被攻击者利用。同时,机器学习模型还可能获取来自最近被攻击主机的受感染数据,没有误报并不意味着没有任何风险,攻击者可以利用运行机器学习应用平台系统中的漏洞。

机器学习面临的风险之一是攻击者可利用伪造的生物识别指纹和虹膜以及面部特征来冒充合法用户。另一个风险是攻击者在测试或执行期间可以骗过机器学习模型将恶意训练样本分至合法类别。这可能导致机器学习模型产生与预期完全不同的结果。

机器学习风险管理

下面是降低机器学习应用风险的五种方法:

1. 执行道德攻击

道德攻击是指值得信赖的安全专家入侵系统以发现被防火墙、入侵检测系统或其他任何安全工具忽视的机器学习漏洞。在获取访问权限方面,道德攻击者利用的是合法用户在设备上遗留的指纹所重构的伪造​指纹。在进入系统后,道德攻击者可潜入指纹数据库,获取另一位合法用户的生物特征模板,再重建一个假的指纹。为了应对这种风险,设备读取器必须在每次使用后进行清理,数据库应被加密。

2.加密安全日志

系统管理员拥有超级用户权限来分析机器学习日志文件,这样做的原因包括:检查是否遵守安全政策、对系统进行故障排查以及取证。加密日志文件是防止日志文件被攻击的一种方法。更改日志内容所需要的加密密钥不会暴露给恶意攻击者,如果攻击者试图删除日志文件,管理员会立即收到警报。

3. 清理训练数据

当提供良好的训练数据时,机器学习模型可良好地运作。该模型开发人员必须知道这些数据从何而来,这些数据必须是干净的数据,而不是异常或受感染的数据。如果数据来源主机受到攻击,则应该停止使用这些数据。糟糕的数据可能导致机器模型无法良好运作,最终导致系统关闭。当使用机器学习工具来为特定目的评估数据时,模型开发人员应该将所有数据转换为通用格式。

4. 对模型生命周期采用DevOps

攻击者可利用来自机器学习平台的误报信息。对于这种风险,我们可对机器学习模型生命周期应用DevOps,DevOps让开发和训练、质量保证及生产团队相互协作。

DevOps会从开发和训练阶段开始,然后进入到质量保障阶段来看看模型的训练情况。不满意的测试结果意味着需要返回到开发阶段,为模型提供更好的数据。如果测试结果很好,模型则会进入生产阶段,处理真实世界的数据。如果结果不符合预期,DevOps应该从开发或质量保障阶段再次重复。

5. 部署安全政策

最后,我们还应该部署安全政策。在简单的情况下,安全政策应该包括五个部分:目的、范围、背景、行动和限制。范围会确定涵盖哪些内容:机器学习模型类型、训练数据和数据挖掘算法(回归、聚类或神经网络)。背景部分则会查看政策背后的原因,行动部分介绍如何利用DevOps来降低风险,而限制部分则会查看机器学习的限制以及测试数据的可用性。(作者:Judith M. Myerson 翻译:邹铮来源:TechTarget中国)
分享到:
评论

相关推荐

    机器学习研究现状与发展趋势

    自动化机器学习(AutoML)技术将逐渐成熟,降低机器学习的门槛,让更多非专业人员也能利用机器学习解决问题。 ##### 3. 解释性增强 随着机器学习在社会中的应用越来越广泛,对其决策过程的解释性需求也在增加。因此...

    机器学习算法基础资料.rar

    在压缩包中的“集成学习”文件可能包含了关于这些方法的详细说明、实现代码和实例,这对于初学者来说是极好的学习材料。通过阅读源代码,你可以了解这些算法如何在实际中工作,而视频教程则可以提供直观的理解和操作...

    机器学习在商业银行个人信用评价中的应用.pdf

    总的来说,机器学习在商业银行个人信用评价中的应用极大地提高了风险评估的效率和准确性。通过智能分析大量数据,银行能够更精确地识别潜在的风险,优化信贷决策,同时降低了不良资产的风险,推动了银行业的数字化...

    基于机器学习的短临预报方法及其在空气质量保障中的应用.pdf

    通过结合多种数值模式的预测结果与实际观测数据,机器学习模型有能力提供更加及时和准确的预报信息,这对环境管理决策的质量提升和降低空气污染风险具有重要意义。 展望未来,基于机器学习的短临预报技术有望在城市...

    机器学习在角膜相关疾病辅助诊断中的应用.pdf

    总结起来,机器学习在角膜相关疾病的辅助诊断中扮演着日益重要的角色,通过自动化分析和预测,它极大地提高了眼科医生的工作效率,降低了误诊率,为患者提供了更优质的医疗服务。然而,如何优化模型、统一数据标准、...

    Python机器学习项目开发实战_预测股票市场_编程案例解析实例详解课程教程.pdf

    Python机器学习项目开发实战中,预测股票市场不但是一个极具挑战性的任务,也是一个极富吸引力的领域,它吸引着数据科学家、交易者、甚至是机器学习爱好者们,他们企图利用机器学习算法来捕捉市场的规律并尝试进行...

    awesome-Geosciences-机器学习开发资源

    在此基础上,机器学习算法可以被用来解决传统数学物理方法难以处理的非线性、高维度问题,极大地提升了模型的准确性和预测能力。 对于“数据可视化”方面,机器学习不仅可以帮助科学家们从海量数据中提取有价值的...

    用python实现机器学习各种经典算法.zip

    Python作为一门强大的编程语言,已经成为实现机器学习算法的首选语言之一,其丰富的库和框架极大地简化了机器学习算法的开发过程。 本压缩包中所包含的内容是“用python实现机器学习各种经典算法”的资料。这些资料...

    R语言机器学习 - R语言

    这些功能极大地降低了机器学习的入门门槛,使得初学者能够快速上手。 在R语言中实现机器学习,首先需要安装R语言环境及其开发工具,如RStudio。然后,通过R的包管理工具install.packages()安装所需的机器学习相关包...

    大数据环境下的机器学习研究.pdf

    4. 代价敏感性:在实际应用中,算法需要对错误预测带来的损失敏感,并能通过调整优化损失函数来降低风险。 大数据环境下的机器学习研究不仅要探索新的算法和理论,还需要结合大数据处理技术,如数据挖掘、数据清洗...

    【Python】使用机器学习进行金融证券趋势研究.zip

    机器学习作为一种强大的数据分析工具...由于研究的深度和广度,涉及的每个步骤都有许多细节和技术要点需要深入探讨和掌握,对于有志于在金融领域应用机器学习技术的从业者来说,这是一条充满挑战且极具价值的学习之路。

    用机器学习建立贷款用户风控模型.zip

    本压缩包文件名为“用机器学习建立贷款用户风控模型.zip”,揭示了通过现代数据科学方法来建立更加精准、高效的风险评估模型。 首先,要建立一个有效的贷款用户风控模型,我们需要对贷款用户的历史数据进行深入分析...

    AI人工智能课程 机器学习算法班第9讲:机器学习调优与模型融合 共32页.pdf

    ### AI人工智能课程 机器学习算法班第9讲:机器学习调优与模型融合 #### 课程概述 在《AI人工智能课程》系列讲座中,《机器学习算法班第9讲:机器学习调优与模型融合》主要关注如何对已构建的机器学习模型进行优化...

    机器学习算法总结21

    【机器学习算法总结21】 本文将探讨一种基础的机器学习算法——K近邻(K-Nearest Neighbors,简称KNN)。KNN是一种监督学习方法,用于分类和回归问题。其基本思想是:给定一个新的未知实例,通过查找训练集中与其最...

    云计算和机器学习在精算行业中的应用.pdf

    云计算和机器学习等新兴技术的应用正在深刻地影响着保险行业的各个方面,包括产品设计、风险评估、客户服务等。精算师作为保险行业中的关键角色,也在积极探索这些新技术所带来的可能性。本报告将深入探讨云计算和...

    《10种流行的机器学习算法进行泰坦尼克幸存者分析》脚本与数据

    对于初学者,这是一个极好的起点,可以深入了解各种机器学习算法的运作方式,并了解如何在实际问题中应用它们。同时,它也提醒我们,机器学习不仅仅是关于模型,而是包括数据理解、特征工程和模型验证在内的整体流程...

    全球-量化策略-自动化机器学习:让机器为你工作-2019.12.5-38页.rar

    自动化机器学习(AutoML)是近年来信息技术与金融投资相结合的重要成果,它极大地提高了量化策略的效率和准确性。 1. 自动化机器学习简介 自动化机器学习是一种先进的数据分析方法,通过自动化地完成特征工程、模型...

    机器学习文本多分类.zip

    《机器学习文本多分类》 在信息技术飞速发展的今天,机器学习已经成为数据处理与分析领域的重要工具,尤其在文本分类方面展现出了强大的潜力。本文将深入探讨机器学习如何应用于文本的多分类问题,以及相关的核心...

    CPPC++_OpenMLDB是一个开源的机器学习数据库,它提供了一个特征平台来计算用于训练和推理的一致特征.zip

    此外,OpenMLDB支持多种编程语言,如C++,这使得它能够更好地与其他系统集成,尤其是那些使用C++作为主要开发语言的企业应用系统。它的灵活性和兼容性让它成为一个多面手,能够适应不同的技术栈和开发环境。 CPPC++...

Global site tag (gtag.js) - Google Analytics