发布于: Aug 4, 2022
近日,赛迪顾问发布了《2021-2022 年中国 PaaS 市场研究年度报告》(以下简称“报告”),其中指出 2021 年全球 PaaS 市场增速回升至25.4%,销售额达到了 796.5 亿美元。其中美国 PaaS 市场拥有全球领先的云厂商,PaaS 的供给和需求高效适配,其市场规模和头部企业的数量均远领先于其他国家和地区,2021 年美国 PaaS 的市场规模为 547.2 亿美元,占全球 PaaS 市场规模的 68.7%。
在中国市场,应用和业务加快云化,2021 年中国 PaaS 市场的增长速度高位回升,达到了 56.4%,市场规模为 34.1 亿美元。
亚马逊云科技作为全球云服务领域的头部厂商,能够为全球大部分的国家和地区提供全面的 PaaS 服务,占全球 PaaS 市场规模的 18.7%,排名第一。
在国内 PaaS 市场,公有云占比超过 60%,同时,亚马逊云科技在国内云市场也展现出惊人竞争力。
在报告的《2021 年中国 PaaS 市场厂商竞争力象限分析图》中,亚马逊云科技位于领导者象限,在发展能力方面名列第一、市场地位名列前三。亚马逊云科技提供广泛而深入的 PaaS 服务能力,同时不断的进行技术创新,为 PaaS 产品更好服务广大用户提供了全面支持。
01 回顾 PaaS 的发展
< 1 > 宏观上,PaaS 是处于 IaaS 和 SaaS 间的平台层。
PaaS,Platform as a Service,平台即服务。它是一种云计算服务,向使用者提供云上应用程序所需的编程语言、库、服务、工具和解决方案。使用者无需管理或控制底层云基础设施(包括网络、服务器、操作系统或存储),但需管理已部署的应用程序,并负责配置应用程序托管环境。在云计算的典型层级中,PaaS层介于IaaS层和SaaS层之间。
< 2 > PaaS 服务的三大类划分
基于《报告》,我们根据以下维度进行 PaaS 服务划分:
🔹 aPaaS,Cloud Application Platform Service,云上应用的开发、部署和运行平台
🔹 数据类 PaaS,进行更深度云上应用开发所需要的 BDPaaS(大数据平台即服务)、DBPaaS(DataBase PaaS,数据库平台即服务)、IoTPaaS(物联网平台即服务)、AIPaaS(人工智能平台即服务)、安全及运维平台即服务等
🔹 其他 PaaS,在某些特定场景下发挥价值的平台即服务。
PaaS 的发展史,用两句话就可高度概况:PaaS 的发展与云计算的发展相伴相随;数据类 PaaS 将成为未来。
02 展望 PaaS 的未来,数据类 PaaS 将快速崛起
报告指出“人工智能、物联网、大数据等新一代企业级应用加快迭代和创新也将充分释放 PaaS 的价值并增加对 PaaS 的需求,将带动 AIPaaS、IoTPaaS、DBPaaS 在整个 PaaS 市场的份额进一步扩大。”这种现象是源自用户对产品的更高要求,他们已经不满足于仅使用基础设施与开发工具。激烈的市场竞争与客户需求变化需要PaaS的使用者们借助更强大的工具完成自己的业务创新与应用云上应用部署,快速的场景创新需要更加敏捷、可扩展、智能的 PaaS 工具来实现”。
亚马逊云科技数据类 PaaS 服务大家族
- 第一类是云数据库服务,包括关系型数据库和非关系型数据库,统称为 dbPaaS(即 Database platform as a service)
亚马逊云科技提供了八大类十余种数据库服务,如图所示。
- 第二类是数据分析即服务,BDPaaS(即 Big Data Platform as a Service)
亚马逊云科技提供了交互式查询、大数据处理、日志分析和搜索分析、实时分析、数据仓库和可视化等数据分析类服务。其中,Amazon EMR 用于大规模数据处理,支持 Hadoop、Spark 等开源处理项目。Amazon MSK 用于实时数据接入与数据管道。Amazon Kinesis 用于实时数据流收集与分析。Amazon OpenSearch Service 用于日志分析与搜索分析,QuickSight 用于数据可视化。Athena 使用标准 SQL 即时分析存储在 Amazon S3 数据湖中的数据。Amazon Redshift 数据仓库服务,可以对PB甚至EB级结构化数据集合执行复杂查询。
- 第三类是人工智能即服务,称为 AI PaaS(即 Artificial intelligence Platform as a Service)
亚马逊云科技提供了品类丰富的AI服务比如文本、图像、视频等处理类服务,Amazon SageMaker 通过完全托管的基础设施、工具和工作流程为任何用例构建、训练和部署机器学习 (ML) 模型。
这些服务构成了公有云数据类 PaaS 服务可能是最齐全的大家族。
03 数据类 PaaS 快速崛起的原因,为什么 PaaS 的
未来,是数据类 PaaS?
< 1 >先做应用建设,再增加数据服务,是几十年来的普遍 IT 规律。
过去还没有出现云服务的年代,应用都是传统式的。企业往往是先自己开发或购买应用,随后开始支撑业务。随着时间的推移,用户越来越多,数据库中就有了越来越多的数据。此时,企业往往会购买专业的数据分析类软件用于数据分析,那时候主要是制作给领导看的各种报表。但这种数据分析软件,往往都庞大而笨重,成本非常高,价格动辄千万级别。
有了公有云服务后,企业首先在公有云上建设一个应用。搭建过程中,可利用到云上各种服务,实现应用的快速构建。使用亚马逊云科技服务,企业的工作就是利用专门构建的服务进行搭建(Build)。应用投产并得到验证后,企业会继续对应用做改造和扩充。此时用户越来越多,数据也越来越多,因此需要数据治理平台,可能是 Amazon S3 数据库,也可能是 Amazon Redshift 云原生数仓,执行简单的命令,就可以立即得到业务洞察,直接反哺业务。要进行预测的话,还可以利用人工智能服务。可见,从大处着眼设计,从小处着手创新,以非常小的起点,就可以获取之前上千万美金才能获取的能力,这就是公有云上的优势。
因此,无论是过去还是以前,先搭建应用,再做数据分析,直到人工智能,这是IT业务的基本旅程。PaaS 的主要使命是为了开发者更便捷地搭建、发布和运行应用,而各种数据类 PaaS 则服务于数据分析和人工智能。
< 2 >业务持续数字化转型,数据量越来越大,对数据服务的要求越来越多,也越来越高。
业务数字化的核心是数据驱动。业务数字化,带来数据量指数型增长,企业对数据存储和计算分析的能力要求不断提升。
一方面,云原始数据库高速发展。云上数据库性能和便捷性越来越高,而成本却越来越低。以 Amazon Aurora 为例,它是与 MySQL 和 PostgreSQL 兼容的关系数据库。性能和可用性与商用数据库相当,成本只有其 1/10,还大大减轻运维负担,节省运维成本。
另一方面,由于大数据、物联网、机器学习等应用场景的兴起,非关系型数据的数据量和处理需求增长速度高。Gartner数据显示,2021 年非关系型数据库的市场收入达到 148 亿美元,占总体数据库市场的 19%。2017 年时,这一比例仅为 8%。
从图可以看出,云上数据库在整个数据库市场的比例逐年快速上升。本地数据库和云上数据库的市场份额已经非常接近,到 2021 年,已经达到 49%。
< 3 >新一代数字应用的出现,催生了数据类 PaaS 服务的需求。
人工智能、物联网、大数据、区块链等新一代企业级应用的加速迭代和创新,将充分释放 PaaS 的价值并增加对 PaaS 的需求,尤其是将带动 AIPaaS、IoTPaaS 等数据类PaaS服务在整个 PaaS 市场的份额进一步扩大。
这种现象,一方面是源自用户对产品的更高要求,他们已经不满足于仅使用基础设施与开发工具。另一方面是面对激烈的市场竞争与客户需求变化,他们需要借助更强大的工具来完成自己的业务创新与应用云上应用部署,这都需要更加敏捷、可扩展、智能的、数据驱动的 PaaS 服务来实现。
数据分析类服务和人工智能服务,两者之间不是孤立的,而是存在紧密的联系。主要有两种关系:
- 一种是数据分析与人工智能联动
此类场景中,数据分析服务对源数据进行收集、筛选和清洗,并将处理后的数据作为人工智能服务的训练数据,最后产生推荐模型和部署为推荐服务。
- 另一种是人工智能与数据分析集成
多数的数据分析服务都集成了人工智能服务,比如 Redshift ML、Athena ML、Quicksight ML 等服务。以发布于 2021 年 5 月的 Amazon Redshift ML 服务为例,它底层基于 Amazon SageMaker 服务,让用户能够用 SQL 命令创建、训练、部署和使用机器学习(ML)模型。
如上图所示,数据进入 Redshift 数仓以后,用户可直接在 SQL 语句中使用‘create model’命令来创建机器学习模型。然后,Amazon Sagemake r自动创建和训练出 ML 模型并进行部署,然后用户可以使用 SQL 语句来进行预测性查询。
04 数据类 PaaS 服务的两个发展趋势
趋势一:端到端一体化数据战略
所谓一体化趋势,是指数据库服务、数据分析服务和人工智能服务构成了一个完整闭环。如图所示,人、应用程序和 IoT 设备作为数据源产生数据,原始数据进入数据湖,作为机器学习类服务和数据分析类服务的数据源,它们处理后的数据被保存进关系或非关系型数据库中。此类数据再反哺人、应用程序和设备,比如提供数据报表、画像标签、分析预测等能力,从而促进业务数字化水平,并完成数据处理闭环。
这种闭环模式,需要公有云平台服务具备极强的“可组装性”。云上构建者不能孤立地对待这些服务,而需要打通服务边界,建立数据自由流通的渠道,这反过来又要求打通企业的部门墙,实现数据服务一盘棋。
趋势二:无服务器化(Serverless)
领域 |
Serverless 服务 |
计算 |
Amazon Lambda,Amazon Fargate |
程序集成 |
Amazon EventBridge, Amazon SNS, Amazon Step Functions, Amazon SQS, Amazon API Gateway, Amazon AppSync |
数据库 |
Amazon DynamoDB, Amazon Aurora Serverless v2,Amazon Timestream(时序数据库),Amazon QLDB(分类账数据库),Amazon Keyspace(宽列数据库) |
数据分析 |
Amazon Redshift Serverless,Amazon EMR Serverless,Amazon MSK Serverless,Amazon Glue,Amazon Athena,Amazon Kinesis |
人工智能 |
Amazon SageMaker Serverless Inference(无服务器机器学习模型推理) |
关于大数据分析的无服务器架构(Serverless),值得一提的是,在 7 月 12 日 Amazon Redshift Serverless 正式上线,之前已上线的数据分析服务包括了 Amazon MSK Serverless 上线(2022 年 4 月),Amazon EMR Serverless 上线(2022 年 6 月),和原本就是 serverless 架构的 Amazon Kinesis(流式数据分析),Amazon Glue(数据集成工具),Amazon Athena(数据湖查询工具)。亚马逊云科技已经先在数据分析 PaaS 服务领域实现了数据仓库、大数据平台、流式数据分析的无服务器化。趋势是不可逆的!
关于服务 Serverless 化的有三个直接好处:节省成本、降低技术和管理负担,以及加快应用交付速度。
05PaaS 再进化之背景下,国内企业的发展建议
在 PaaS 这种进化背景下,各类企业需要执行适合自己的数据战略。
- 大中型企业 -
国内大中型传统企业,很大部分都已完成 IaaS 云平台的建设,企业上云(应用从小机搬到 x86 或信创虚拟机上)业已完成过半甚至更多。往往都设立了大数据部门,建设了大数据平台。但是,大数据平台和云平台无论在组织结构上还是基础设施上都是分离的。大数据平台基本上都是池化的,买几千台服务器搞个大池子,提供的基本上是人机交互式接口。
很显然,这种模式很难满足这些企业未来的数字化要求。我们可以做如下改变:
- 将大数据平台和云平台合并,由合并后新云平台提供服务化的数据分析服务,从而实现大数据平台由池化和工具化,向云化和服务化的转变。
- 将大数据部门和云计算部门合并,大数据团队成为云计算团队的一部分,即大数据团队成为云计算部门中的数据 PaaS 团队。
- 中小企业 -
上公有云是中小企业的最佳选择。企业创立之初,就能利用到业界最新最领先的云服务,包括 PaaS 服务,聚焦业务发展,这在没有公有云的年代是难以想象的。
根据前面提到的旅程,由应用创建开始,到数据分析,到人工智能,充分利用云上的各种服务,打造先进的云原生应用系统,为业务发展提供灵活而强大的支撑力和驱动力。
小结
综上所述,PaaS 现阶段的进化路径,正在走向数据类 PaaS 服务。这种进化趋势,和时下流行的数字化转型密不可分。数字化转型以业务模式转型和业务流程效率提升为目标,以 IT 技术作为支撑,是 IT 技术的综合运用,“数字转型,数据先行”,即以云为体系和基座,以人工智能、大数据、区块链等 IT 技术的综合运用来解决系统化问题。借助亚马逊云科技的服务,能够更好帮助企业进行应用开发、部署和管理。
*本文为转载内容
声明:亚马逊云科技向全球数百万活跃客户和成千上万个合作伙伴供提超过 200 项功能齐全的服务。我们并未把我们的服务分类为“IaaS”, “SaaS”, 或者 “PaaS”。