机器学习操作(MLOps)是数据科学领域的一个相对较新的事物. 才五岁, 它已经被视为几乎每个行业和业务部门的组织的关键需求,这些组织希望通过将数据科学模型编织到其业务的核心结构中来成为模型驱动的组织.
然而, 组织发现,在企业级实现mlop比仅仅为几个模型或单个团队实现mlop要复杂得多. 快速扩展数据科学和MLOps实践, 安全, 成功地跨企业需要更广泛的mlop版本,它包含整个数据科学生命周期,并满足现在和未来各种团队的需求. 企业mlop是解决这个问题的一种新的、健壮的mlop类别.
什么是MLOps?
MLOps是一个用于大规模端到端数据科学生命周期的流程系统. 它为数据科学家提供了一个场所, 工程师, 及其他资讯科技专业人士, 在开发过程中有效地与支持技术协同工作, 部署, 监控, 以及机器学习(ML)模型的持续管理.
它允许组织在整个组织中快速有效地扩展数据科学和MLOps实践, 在不牺牲安全或质量的前提下. 企业mlop是专门为大规模生产环境而设计的,在这种环境中,安全性, 治理, 遵守是至关重要的.
澳门网站电子游戏大全-apple app store-排行榜是如何走到这里的:今天的企业MLOps之旅
直到十年前, 由于计算能力的限制,机器学习(ML)的大部分工作都是实验性的. 因为处理大量数据变得可行, 那些能够将实验性机器学习模型转化为生产的公司获得了巨大的回报——但这些成功都是例外, 不是常态.
当模型从数据科学家转移到生产工程师时,由于各种各样的原因,大多数项目都会出现问题,包括需要将模型重新编码为不同的语言以进行部署.g. Python/R vs Java), 无法重新创建用于生产培训的数据, 在部署过程中没有标准化.
这是因为大多数公司仍在使用什么 德勤 描述为ML开发和部署的“手工”方法. 缺乏可扩展模式和实践延迟了数据科学的价值. DataIQ最近的一项调查结果证实了这一点,三分之一的受访者表示他们会这样做 花了好几个月才把模型投入生产. 项目项目的可见性也很有限, 超过45%的受访者不提供或定期更新. 在另一项调查中, 47%的机器学习项目 永远不要离开测试阶段. 在这些人中,还有一个 28%的人失败了.
为了克服这些挑战,数据科学社区从软件工程领域的DevOps(或开发运维)中寻找灵感. 许多概念都着眼于缩短开发时间, 采用提高速度和质量的方法. 然而, 因为数据科学和应用程序开发产生非常不同的澳门网站电子游戏大全-apple app store-排行榜, 新做法, MLOps, 出生.
企业MLOps的好处是什么?
企业mlop的主要好处之一是能够通过重复部署不同的模型和对这些模型的相关连续监视,在您的组织中快速生成业务价值. 这在实践中产生了以下具体的例子:
业务集成
成功的机器学习项目的特点是,所有负责任的员工从项目开始就意识到机器学习技术的好处. 此外,应该知道与模型实现相关的挑战. 通过mlop的结构化集成, 从长远来看,机器学习模型是可以成功使用的, 现有的应用程序可以随时更新和交换.
技术集成
使用MLOps流程流, 短的开发周期和质量保证,由于技术的发展, 测试, 集成步骤在很大程度上是自动化的. 因此,从每个项目的开始,所有的过程都得到了有效的监控.
可伸缩性
经验表明,在ML应用程序中使用可扩展平台在实践中是值得的. 它们的优点是它们映射了模型的整个生命周期,并提供了从开发到实现的持续改进的可能性.
mlop的其他好处
除了业务集成、技术集成和可扩展性之外的其他好处如下:
- 通过自动化过程快速部署多个模型
- 通过更快地构建和部署模型来加速实现价值的时间
- 由于改进了协作和模型的重用,提高了生产力
- 减少使用非生产性模型的风险
使用企业mlop, 从数据分析和数据处理到可扩展性和跟踪,一切都可以变得更高效.
MLOps vs. DevOps: ML模型不是软件应用程序
要理解DevOps为什么不能满足数据科学的需求,理解以下几点是很重要的 关键的不同点 在模型和软件应用程序之间. 两者都涉及代码并以文件的形式保存, 但是软件的行为是预先确定的,而模型的行为会随着时间而变化.
用于开发它们的材料是不同的
它们涉及代码,但是它们使用不同于软件工程的技术和工具. 与软件不同,它们以数据为关键输入. 他们使用更多的计算密集型算法, 所以他们受益于可扩展的计算和gpu等专用硬件. 他们利用来自充满活力的开源生态系统的软件包,这些生态系统每天都在创新.
构建它们的过程是不同的
数据科学是一项研究——它是实验性的、反复的、探索性的. 你可能会尝试几十个或几百个想法,然后才得到一个有效的想法. 通常情况下,你会从另一个团队离开的地方继续前进, 他们的工作是发现和创新的起点. 促进突破, 数据科学团队需要工具来测试许多想法, 组织和保存这些工作, 然后再去寻找和发现它.
他们的行为是不同的
模型根据输入的数据做出预测. 他们没有先天的正确行为——当他们生活在现实世界中时,他们会有更好或更坏的行为. 不像软件,除非业务流程发生变化,否则永远不需要重新培训或更新, 模型做的. 模型的性能会随着周围环境的变化而变化, 由于意外的或退化的行为而产生风险. 所以组织需要不同的评估方式, 质量控制, 并持续监控以控制风险.
企业MLOps团队中的角色
如果范围适当,企业MLOps平台可以支持数据科学生命周期中涉及的每个人的需求. 而任何企业MLOps团队的组成将因组织而异, 大多数成员接受 七种角色中的任何一种:
数据科学家在任何MLOps队伍中,他都是核心球员, 数据科学家负责分析和处理数据. 他们构建和测试ML模型,然后将模型发送到生产单元. 在一些企业中, 他们还负责监控模型投入生产后的性能.
数据分析师数据分析师与澳门网站电子游戏大全-apple app store-排行榜经理和业务部门协调工作,从用户数据中发现洞察力. 他们通常专注于不同类型的任务, 比如市场分析, 财务分析, 或者风险分析. 许多人拥有与数据科学家相当的定量技能,而其他人则可以归类为公民数据科学家,他们知道需要做什么, 但缺乏编码技能和统计背景,无法像数据科学家那样单独工作.
数据工程师:数据工程师管理数据的收集方式, 加工过的, 并可可靠地从软件中导入和导出存储. 他们可能在特定领域有专长, 比如SQL数据库, 云平台, 以及特定的分配系统, 数据结构, 或算法. 它们通常对数据科学结果的操作至关重要.
DevOps工程师DevOps工程师为数据科学家和其他角色提供访问专用工具和基础设施的权限.g.、存储、分布式计算、gpu等.在整个数据科学生命周期中所需要的. 他们开发方法来平衡独特的数据科学需求和其他业务的需求,以提供与现有流程和CI/CD管道的集成.
毫升建筑师ML架构师开发策略, 蓝图, 以及要使用的mlop的流程, 同时识别生命周期中固有的任何风险. 他们识别和评估最好的工具,并组建一个工程师和开发人员团队来开发这些工具. 在整个项目生命周期中,他们监督MLOps过程. 它们统一了数据科学家、数据工程师和软件开发人员的工作.
软件开发人员软件开发人员与数据工程师和数据科学家一起工作, 专注于ML模型的澳门网站电子游戏大全-apple app store-排行榜化和支持基础设施. 他们根据机器学习架构师的蓝图开发解决方案, 选择和建立必要的工具并实施风险缓解战略
领域专家/商务翻译领域专家/业务翻译对业务领域和流程有深入的了解. 它们帮助技术团队了解什么是可能的,以及如何将业务问题构建为ML问题. 它们帮助业务团队理解模型提供的价值以及如何使用它们. 在对数据有更深入的了解是至关重要的任何阶段,它们都可以发挥作用.
mlop和数据科学生命周期
在数据科学生命周期中有四个阶段:
- 管理这个阶段的重点是理解项目的目标和需求,并确定工作的优先级.
- 开发这是数据科学家基于各种不同的建模技术构建和评估各种模型的地方.
- 部署:此阶段是模型进入可以在业务流程中用于决策制定的状态.
- 监控:这是生命周期的操作阶段,组织在此阶段确保模型交付预期的业务价值和性能.

今天, 大多数MLOps平台只是为数据科学提供了一个稳定的平台, 数据工程通常关注数据科学生命周期的生产端. 它们有助于防止模型由于计划外或不一致的刷新周期而降级, 没有模型通常需要的持续监控. 它们还用于测试和验证模型. 下图概述了MLOps在数据科学生命周期中的工作方式.
制定MLOps战略
一个成功的MLOps战略由多个组成部分组成,例如:
统一实验管理
如前所述,mlop通常涉及几个不同的角色一起工作. 因此,机器学习团队需要一个集中的平台来进行模型训练和评估. 这为整个团队提供了一个访问的中心枢纽, 促进更好的跨团队沟通和快速提出彼此工作的能力.
自动化训练与比较
自动化是mlop的关键元素,因为ML模型的数量, 实验, 而且测试是如此之大,使得手工管理变得困难. 建立一个自动化的 管道 培训, 优化, ML模型的测试有助于减少迭代的时间,并加快模型到生产的部署时间.
自动部署
在成功训练和验证了ML模型之后,需要将其部署到生产环境中. 在ML项目的整个生命周期中,这个步骤可以重复多次. 每次对模型进行改进(eg 以超参数优化或新数据再训练的形式), 必须重新部署模型. 在可以部署模型之前, 这个过程可能会涉及到对模型性能的“人在循环”审查.
然而, 加快部署进程, 可以建立模型的自动测试,检查模型的新版本是否满足验收标准. 一旦模型通过了测试,新模型就会自动部署到生产环境中.
自动监控
即使在将ML模型部署到生产环境之后,MLOps也不会就此结束. 生产中的模型需要持续监控. 监视服务运行状况在mlop中比在DevOps中更为重要,因为模型的性能会随着时间的推移而下降. 这种退化是由模型接收到的输入数据的自然变化引起的,这些变化与模型在开发过程中先前训练的数据不同.
扩展企业的mlop
组织已经意识到,即使他们已经实现了某种程度的mlop, 在安全、普遍地扩展数据科学的道路上,仍然存在一些障碍.
- 的基础设施. 如果没有强大的计算能力,数据科学家是没有生产力的, 高价值的数据, 还有最新的开源工具. 更糟糕的是,花在使用定制工具和硬件的DevOps任务上的时间减少了创新. 许多调查都证实了这一点 数据科学家80%的时间都在处理数据和基础设施留给分析和见解的空间很小.
- 浪费了工作. 数据科学家通常独立工作,使用许多不同的工具. 工作的低标准化和可见性会造成重复的工作, 协作障碍, 可重复性差. A 最近的Forrester调查 在467家企业中,39%的受访者表示,IT和开发人员“在人工智能之旅的关键阶段,即使他们曾经合作过,也不会合作”.”
- 生产缺陷. 高德纳最近的研究 只有53%的项目从人工智能原型到生产. 由于数据漂移等问题,许多数据科学模型在生产环境中表现不佳. 缺乏从部署到监控的可重复流程增加了隐性成本和不必要的复杂性, 延迟和合规风险.
解决这三个挑战需要一门超越数据科学生命周期部署部分的学科, 到目前为止,MLOps平台关注的重点是什么. 它需要企业级的功能,允许项目在端到端数据科学生命周期中更快地进展,并提供具有必要安全性的安全且普遍扩展的数据科学, 治理, 合规, 再现性, 以及可审核特性. 出于这些原因, 领先的组织正在采用企业MLOps实践和启用平台.
企业MLOps平台的功能
An 企业MLOps平台 需要满足MLOps团队中所有不同成员的需求, 组织的管理, 它的工作流和生命周期, 以及整个组织的持续发展. 企业MLOps功能可以从两种方式考虑:工具增强和流程转换.
工具增强功能包括:
- 按需访问数据和可扩展的计算
- 按需访问集中式工具
- 用户访问控制和安全
- 版本控制和可重复性研究
这些功能极大地提高了数据科学和IT团队的生产力,并提供了包括数据源在内的所有数据科学工件的存储和组织, 数据集, 以及可重复性和可重用性的算法. 它们允许IT管理基础设施和成本, 管理和保护技术和数据, 同时使数据科学家能够为他们所需的工具和基础设施提供自助服务.
过程转换能力包括:
- 协作
- 数据科学生命周期的端到端编排
- 项目管理
- 知识管理和治理.
这些功能允许组织通过最有效地利用资源来安全、普遍地扩展数据科学, 在先前工作的基础上, 提供上下文, 加强学习循环. 每个人都使用一致的模式和实践,而不管模型是如何或在哪里开发的. 它们一起消除了手动操作, 跨数据科学生命周期的所有活动的低效工作流创造了提高模型质量的动力, 将部署成功模型所需的时间从几个月减少到几周, 或几天, 并立即通知模型性能的变化,以便模型可以快速重新训练或替换.
每个人都从成功和失败中学习. 协作还包括以非技术方式参与业务,以便他们能够理解项目和结果. 最后, 数据科学领导者可以轻松管理工作负载并跟踪项目进度, 影响和成本.
当这些工具和过程转换功能都可用时, 企业MLOps平台优化了整个数据科学生命周期的吞吐量, 使更多的模型更快地从开发阶段进入生产阶段, 同时保持他们的最佳表现,并提供重复循环所需的工具和知识.
Domino企业MLOps平台的核心组件
Domino Enterprise MLOps平台功能丰富,旨在使用最先进的数据科学工具和算法处理模型驱动组织的需求. 该平台为现代数据科学团队提供了三个关键功能:
作为一个 记录制度, Domino在中央存储库中捕获所有数据科学工作, 这样你的团队就很容易找到, 复制和重用工作. 数据科学家从零开始项目的日子一去不复返了,结果发现另一个团队成员也在研究同样的问题. 而不是, 知识与可重用代码相结合, 工件, 从以前的实验中学习, 综合项目管理能力, 以及复制开发环境的能力.
作为一个 综合模型厂, Domino支持从构思到生产的端到端数据科学生命周期:探索数据, 训练机器学习模型, 验证, 部署, 和监控. 然后清洗,重复——都在一个地方. 启用可重复的流程和工作流,使模型更快地进入生产, 启用自动监控, 更频繁地重新培训和重新发布模型, 还有更多——所有这些都是为了减少摩擦,增加 模型速度 在你成为模型驱动型企业的道路上.
最后,作为 自助服务基础设施门户, Domino自动化了大规模数据科学工作所需的耗时的DevOps任务. 只需点击几下,您就可以启动一个预先加载了您喜欢的工具的开发沙盒, 语言, 和计算, 包括流行的分布式计算框架. 在不同环境之间跳转, 引入更多的数据, 比较实验, 在模型上部署和迭代, 使用为代码优先的数据科学团队优化的平台可以提高工作效率.
达美乐企业MLOps平台的优势
采用Domino Enterprise MLOps平台的客户一致指出了三个主要原因,使他们能够有效地扩展数据科学:
开放 & 灵活的
Domino支持 广泛的生态系统 开源和商业工具和基础设施. 不像SageMaker是aws特有的, 或者绑定到Spark的Databricks, Domino是一个开放的系统. Domino的独特架构支持内部部署, 云和混合环境提供最大的灵活性. Domino支持最新的工具、包和计算框架,如Spark、Ray和Dask.
为团队打造
Domino是为大规模数据科学而设计的. 使用不同工具的团队可以在项目上无缝协作,并依靠Domino自动跟踪所有数据科学工件. Domino建立完全可见性, 可重复性, 以及任何时候对每个用例的再现性. 仪表板允许管理人员设定项目目标并检查正在进行的工作.
集成的工作流
Domino集成了工作流,以加速从实验到生产的端到端数据科学生命周期. 例如, Domino自动为已部署的模型设置预测数据捕获管道和模型监视,以确保模型性能达到峰值. Domino的集成方法确保参与数据科学的每个人都能最大限度地提高他们的生产力和影响力.
使用Domino Data Lab Enterprise MLOps实现模型驱动的未来
在短短的几年里, 数据科学为澳门网站电子游戏大全-apple app store-排行榜带来了自动驾驶汽车, 风险分析引擎, α去, 电影推荐引擎, 甚至还有 逼真的绘画应用. 每个人都在猜测数据科学将把澳门网站电子游戏大全-apple app store-排行榜带向何方(具体来说, 一个创新的,经过充分研究的猜测).
在未来十年中,那些能够扩展机器学习创新的公司将是那些模型驱动的公司, 从他们的项目中赚钱, 建立在每一个后续成功的基础上, 学习更快, 更有效地开发, 降低成本, 将不良结果最小化.
你的公司是否努力成为模型驱动的公司? 与Domino Data Lab合作,确保您的公司取得成功. 要查看Domino Enterprise MLOps平台的实际情况,可以执行以下操作 观看演示.