发布于: Aug 9, 2022
构建和管理您自己的 ML 基础设施可能成本高昂,而 Amazon SageMaker 是一个很好的替代选项。事实上,我们发现,与其他选项相比,Amazon SageMaker 的 3 年总体拥有成本 (TCO) 要低 54% 以上,并且最高可以将开发人员的工作效率提高 10 倍。这是因为 Amazon SageMaker 会管理 ML 通常需要的所有训练和预测基础设施,使团队能够专注于研究和解决手头的 ML 问题。
此外,Amazon SageMaker 还包含很多可帮助尽快、尽量经济高效地运行训练作业的功能:最常见的机器学习库的优化版本、网络最高达 100GB 的各种 CPU 和 GPU 实例 ,当然还有让您可以在训练作业上最高节省 90% 费用的托管 Spot 训练。最后但同样重要的一点是,Amazon SageMaker Debugger 可自动确定 ML 训练作业中出现的复杂问题。非生产性作业会提前终止,您可以使用训练期间捕获的模型信息来确定根本原因。
Amazon SageMaker 还可以帮助您削减预测成本。凭借多模型终端节点,您可以在单个预测终端节点上部署多个模型,从而避免运行许多低流量终端节点所需的额外工作和成本。对于需要一些硬件加速而不需要成熟 GPU 的模型,Amazon Elastic Inference 可让您最高节省 90% 的预测成本。另一方面,大规模预测工作负载可以依靠 Amazon Web Services 设计的自定义芯片 Amazon Web Services Inferentia,实现比 GPU 实例最多高 30% 的吞吐量,最高降低 45% 的成本。
人工智能作为计算机科学的一个分支出现于 20 世纪 50 年代。它的两个主要目标是:1) 通过在计算机上建模和模拟来研究人类智能,以及 2) 通过像人类一样解决复杂问题来使计算机更有用。
从出现到 20 世纪 80 年代,大多数 AI 系统都是人工编程的,通常使用功能性、声明性或其他高级语言(例如 LISP 或 Prolog)。在特定领域,也创建了几种自定义语言(例如,用于规划的 STRIPS)。语言中的符号代表了现实世界中的概念或抽象概念,构成了大多数知识表示的基础。
尽管 AI 从业人员过去使用标准的计算机科学技术,例如搜索算法,图形数据结构和语法,但是由于问题的复杂性,大量的 AI 编程是启发式的(使用经验规则),而不是算法式的。当时产生 AI 解决方案的部分困难在于,要使系统成功,所有的条件、规则、场景和异常都需要以编程方式添加到代码中。
当初,研究人员感兴趣的是通用 AI,或创造出很难和人类区分、可作为系统运行的机器,但由于它的复杂性,大多数人专注于解决某一具体领域的问题,如感知、推理、记忆、语音、运动等。下表列出了当时的主要 AI 领域。
表 1:符号 AI 领域(20 世纪 50 年代至 80 年代)
领域 |
描述 |
问题解决 |
广泛、通用的领域,用于解决问题、制定决策、满足约束和其他类型推理。 |
机器学习 |
通过死记硬背、基于经验或接受建议自动生成新的事实、概念或真相。 |
自然语言 |
通过解析句子,将其转换为语义网络等知识表示形式,然后返回结果,作为 |
语音识别 |
将声波转换成音素、单词和最终的句子,传递给自然语言理解系统,还进行语音合成,将文本响应转换成用户的自然发音。 |
视觉 |
将图像中的像素转换为边缘、区域、纹理和几何对象,从而能够理解场景, |
机器人 |
规划和控制执行器移动或操纵现实世界中的物体。 |
在下图中,下面几层提供了用于在每个领域构建解决方案的工具和基础。例如,主域下面是对当时常用的许多推理机制和知识表示的采样。
图 1:符号人工智能概述
样本知识表示存储了系统用于推理的知识和信息。知识表示的常见类别包括结构化(例如,可以与对象和语义网络进行比较的框架,如知识图)和基于逻辑(例如,命题和谓词逻辑、模态逻辑和语法)的表示。相对于其他类型的模型,这些符号知识表示的优势在于它们是透明的、可解释的、可组合和可修改的。它们支持多种类型的推理机制,这些机制可以操纵知识表示来解决问题,理解句子并在每个领域中提供解决方案。
AI 语言样式和基础设施层显示了当前用于开发 AI 系统的某些类型的语言和基础设施。两者都倾向于专业化,并且不容易与外部数据或企业系统集成。
当时提出的一个问题是“哪一个问题更难解决:是接听电话还是在跟国际象棋大师博弈?”答案与大多数人的直觉相反。尽管孩子们都能正确接听电话,但很少有人下棋能达到大师级别。然而,对于传统的 AI 来说,国际象棋是一个完美的问题,它具有明确边界,并且具有有限的易于理解的走法,可以通过启发式搜索游戏状态空间来解决。另一方面,接听电话却非常困难。正确接听电话需要多种复杂的技能,这对于符号 AI 来说是困难的,包括语音识别与合成、自然语言处理、问题解决、智能信息检索、规划以及可能采取的复杂操作。
人们普遍认为上述结果令人失望,至少从设定的高期望值来看是这样,但符号 AI 确实也有成功之处。今天,大多数被认为有用的软件都已转化为软件开发中使用的算法和数据结构。现在常用的业务规则引擎来自人工智能的专家系统推理引擎和 shell。AI 实验室认可或开发的其他常见计算概念包括时间共享、快速迭代开发、鼠标和图形用户界面 (GUI)。下表列出了这种人工智能方法的一些优势和局限性。
表 2:符号 AI 的优势和局限
优势 |
局限性 |
模拟人类对许多问题的高级推理 |
系统往往不是自主学习或获取新的知识或能力,而是依赖于开发人员的定期维护 |
问题解决领域在专家系统、规划和约束传播等方面取得了一些成功。 |
包括机器学习、自然语言、语音和视觉的大多数领域都没有产生明显、普遍的成果。 |
可以从启发式知识捕获和工作,而不是分步指令 |
解决问题领域,特别是基于专家或知识的系统,都要求通过知识工程技术提取和完善明确的人类专业知识 |
为具体、已知的逻辑轻松编码,例如,强制执行合规性规则 |
系统在其范围边界上往往是脆弱和不可预测的,它们不知道范围边界以外的东西 |
直接回顾内部数据结构、启发方式和算法 |
基于隔离的基础设施构建,无法与外部数据或系统集成 |
根据请求提供解释答案 |
要求更多上下文和常识性信息来解决许多现实情况 |
不需要创建大量数据 |
许多方法不是分布式,也不易于扩展,当然分布也有硬件、网络和软件限制 |
需要更少用于开发的计算资源 |
系统难于创建和维护 |
许多工具和算法已纳入主流系统开发 |
|
随着与符号 AI 相关的研究资金的日益减少,许多研究人员和从业人员将注意力转向了更为实用的信息搜索和检索、数据挖掘,以及各种形式的机器学习领域。
相关文章