发布于: Oct 10, 2022

金融和云计算已经成为金融行业的蓝海领域,在最近发布的白皮书《金融服务中的机器学习最佳实践( Machine Learning Best Practices in Financial Services)》中,我们概述了在构建机器学习工作流的过程中,金融机构需要关注的安全性与模型治理注意事项。这份白皮书还涵盖了常见的安全性与合规性要素,旨在配合上手演示与研习班共同为您介绍端到端的示例。虽然这份白皮书主要着眼于金融服务行业,但其中涉及的身份验证与访问管理、数据与模型安全以及 ML 实施(MLOps)最佳实践等内容,也同样适用于医疗保健等其他受到严格监管的行业。

如下图所示,典型的机器学习工作流中往往涉及多个利益相关方。为了成功管理并运营这类工作流,我们需要推动跨团队协作,将业务相关方、系统运营管理员、数据工程师以及软件 /DevOps 工程师纳入这套体系中来。

在白皮书中,我们还探讨了各个团队需要关注的核心事项,并通过示例与说明阐述如何使用 Amazon SageMaker 及其他 Amazon Web Services 服务实现机器学习工作负载的构建、训练与部署。具体来讲,结合高监管要求背景下客户们提供的真实反馈,我们着重分析了以下主题:

  • 置备一套安全的机器学习环境——具体包括:
    · 计算与网络隔离——如何在不连接互联网的前提下,将 Amazon SageMaker 部署在客户的专用网络当中。
    · 身份验证与授权——如何以可控方式对用户进行身份验证,并在非多租户场景下根据其 Amazon Web Services 身份与访问管理( Amazon Identity and Access Management ,简称 IAM)权限对各用户进行授权。
    · 数据保护——如何使用客户提供的加密密钥对传输中的数据及静态数据进行加密。
    · 可审计性——如何在给定的时间点审计、阻止并检测谁做过什么,借此帮助识别并抵御恶意行为。
  • 建立机器学习治理机制——具体包括:
    · 可追溯性——从数据准备、模型开发以及训练迭代中跟踪机器学习模型的沿袭方法,并考虑如何审计任何人在任意时间点上曾经做过什么。
    · 可解释性与可理解性——有助于解释经过训练的模型如何建立起对各项特征的重要性判断与区分方法。
    · 模型监控——如何对生产环境下的模型进行监控,借此防止数据漂移问题,并自动对您定义的规则做出反应。
    · 可重现性——如何根据模型沿袭与存储的工件进行机器学习模型重现。
  • 实现机器学习工作负载的可操作化——具体包括:
    · 模型开发工作负载——如何在开发环境中构建起自动与手动审查流程。
    · 预生产工作负载——如何使用 Amazon CodeStar 套件与 Amazon Step Functions 构建起自动化 CI/CD 管道。
    · 生产与持续监控工作负载——如何将持续部署与自动化模型监控结合起来。
    · 跟踪与警报——如何跟踪模型指标(运营与统计指标),并在检测到异常时向相关用户发出警报。
     

相关文章