发布于: Aug 11, 2022
机器学习的兴起
从 20 世纪 80 年代末到 21 世纪,人们研究了多种机器学习方法,包括神经网络、生物学和进化技术以及数学建模。早期最成功的结果是通过机器学习的统计方法获得的。线性和逻辑回归、分类、决策树、基于内核的方法(即支持向量机)等算法大受欢迎。
后来,深度学习被证明是构建和训练神经网络以解决复杂问题的有效方法。其基本训练方法与之前相似,但是有一些改进推动了深度学习的成功,包括:
- 有很多层并大得多的网络;
- 庞大的数据集,包含数千到数百万个训练示例;
- 神经网络性能、泛化能力和跨服务器分布训练能力的算法改进;
- 更快的硬件(如 GPU 和 Tensor 核心),可以处理更多数量级的计算,这要求使用大型数据集来训练复杂的网络结构。
AI 有了新的基础
今天的人工智能主要依赖的不再是符号知识表示和程序推理机制,现代 AI 而是建立在新的基础上,即机器学习。无论是传统的基于数学的机器学习模型或决策树,还是深度学习的神经网络架构,当今人工智能领域的大多数 AI 应用程序都是基于机器学习技术。
这一新的人工智能结构如下图所示。该图的结构与符号 AI 图类似,显示了人工智能系统的基础和性质是如何改变的。尽管该图顶层的有些领域(自然语言、语音识别和视觉)保持不变,但有些领域已发生改变。与符号 AI 的广泛“解决问题”类别不同,预测和推荐系统有两个更具针对性的类别,这两个类别是当今开发的解决问题系统的主要形式。此外,除了较为传统的机器人技术,该领域现在还包括自动化设备,以突出自动驾驶汽车和无人机领域的最新项目。最后,由于机器学习现在是 AI 领域的基础,因此不再包含在顶层领域中。
图 1:机器学习是人工智能的基础
机器学习仍面临许多问题和挑战。下表列出了基于机器学习的人工智能的一些优势和局限性。
表 3:基于机器学习的人工智能的优势和局限性
优势 | 局限性 |
借助数据和工具,轻松训练新的解决方案 | 有炒作之嫌,研究者和从业者需要设定合理预期 |
有大量不同算法来解决许多类型的问题 | 需要大量干净的、可能有标签的数据 |
解决所有 AI 领域的问题,经常接近或超过人类的能力水平 | 数据存在的问题(如过时、不完整或恶意注入不良数据)可能会使结果产生偏差 |
无需人类专业知识或复杂的知识工程,解决方案来自于实例 | 有些算法,特别是基于统计的机器学习算法,依赖于手动特征工程 |
深度学习可自动提取特征,形成具有复杂感知和理解能力的解决方案 | 系统逻辑未经编程,必须进行学习。这可能会导致较为主观的结果,例如相互竞争的激活级别,而这需要精确的答案(例如,合规性或验证问题的特定正确或错误答案)。 |
经过训练的机器学习模型可以在其他解决方案的组合体或组件中进行复制和重用 | 尽管现在有超参数优化工具,选择最好的算法、网络架构和超参数仍然需要专业知识,并且需要迭代。 |
作出预测或产生结果通常比传统的推断或算法快 | 训练包含大型数据集的复杂问题需要大量的时间和计算资源 |
训练机器学习模型的算法可设计为分布式和一次通过式方法,从而提高可伸缩性并缩短训练时间 | 通常很难通过观察模型结构和训练结果来解释模型是如何得出结果的。 |
可以在可扩展的高性能基础设施上进行训练和部署 | 尽管输出可以反映数值“置信度”,但是大多数算法是一步解决问题,因此没有推理链或部分结果可用。 |
使用常见机制(如微服务/API)部署,以便于与其他系统集成 |
表 2 和表 3 的一个重要优点是它们有一定的互补性。基于机器学习的人工智能可以受益于符号人工智能的优势。一些机器学习方法(包括自动学习决策树)已经有效地融合了这两种方法。人们还在继续进行积极的研究,结合这两种方法的优点来探索其他方法,以及许多开放性问题。
相关文章