数据并行的原理
数据并行的原理是将一个数据分解成多个部分,对被分解的数据执行相同的操作,获得多个结果,再通过对数据结果的汇总,获得最终结果,最大化发挥数据处理的性能。数据并行主要用于大型和复杂的计算问题,通过多线程,充分高效利用多核计算资源,解决传统数据处理方法无法完成的高精度大数据处理需求。数据并行化处理,是使用处理器为每个处理单元分配数据块,为其下达执行并行操作的指令。数据并行过程中要重点考虑数据和任务协调性,通过问题的分解或组合,提高操作性能、减少任务开销。
数据并行的过程

输入数据切分
数据并行运行过程中,会通过两种方式切分输入数据。第一种方式,根据并行进程数进行划分,无需进行数据通信,每个进程只读取自身划分到的数据;第二种方式,数据读取由进程负责,数据读取后根据并行进程数切分,再发送到对应进程中。

模型参数同步
数据并行过程中,需要在处理数据时保持模型参数同步。模型参数同步可以在初始时使用相同随机种子完成,以相同的顺序进行初始化来实现。也可以通过某一进程初始化全部模型参数后,向其他进程广播模型参数,实现同步。

参数更新
数据并行的参数更新是在输入数据切分和模型参数同步的步骤完成后进行的。更新前,每个进程的参数相同;更新时,基于所有进程上的梯度同步得到的全局梯度也相同,所以实现在更新后每个进程得到的参数也是相同的。
数据并行和模型并行的区别
数据并行是将数据划分为多个小数据,发送到不同处理节点上,使用相同的模型参数进行计算,将计算的不同结果进行汇总后通过加权平均获得最终结果。模型并行的本质是对计算机资源进行分配,当模型过大时,无法将模型直接载入处理机中,将整个模型按层分解为多个模型,载入不同的处理节点中分别进行计算。不同节点按照模型顺序进行排序,以流水线形式先后执行节点计算。此外,模型并行并非 100% 以并行方式完成,有时会以串行方式完成的。
数据并行的优化技巧
数据并行的目标是提高数据计算的执行效率,通过深度学习训练提升吞吐量。并行计算程序优化的主要难点包括数据的划分、并发访问控制以及资源划分。如果数据并行性能表现不佳,可以通过优化划分方式,避免过多的控制流集中在同一个处理机上工作。此外,数据并行可以通过协调对资源的访问,将访问分为读和写,减少出现读写冲突导致资源互斥的问题。而资源划分的优化方式通常采用向量法或并行化处理,尽可能降低通信使用的资源,保持负载均衡。
欢迎加入亚马逊云科技培训中心
欢迎加入亚马逊云科技培训中心
-
快速上手训练营
-
账单设置与查看
-
动手实操
-
快速上手训练营
-
第一课:亚马逊云科技简介
本课程帮助您初步了解云平台与本地环境的差异,以及亚马逊云科技平台的基础设施和部分核心服务,包括亚马逊云科技平台上的弹性高可用架构,架构设计准则和本地架构迁移上云的基本知识。
亚马逊云科技技术讲师:李锦鸿第二课:存储与数据库服务
您将在本课程中学习到亚马逊云科技上的三个存储服务分别是什么。我们也将在这个模块中为您介绍亚马逊云科技上的关系型数据库服务 Amazon Relational Database Service (RDS)。
亚马逊云科技资深技术讲师:周一川第三课:安全、身份和访问管理
在这个模块,您将学习到保护您在亚马逊云科技上构建的应用的安全相关知识,责任共担模型以及身份和访问管理服务, Identity and Access Management (IAM) 。同时,通过讲师演示,您将学会如何授权给 EC2 实例,允许其访问 S3 上的资源。
亚马逊云科技技术讲师:马仲凯 -
账单设置与查看
-
-
动手实操
-
立即注册,免费试用 Amazon EC2 T4g 实例
新老用户现可享受每月 750 小时的免费 t4g.small 实例使用时长,优惠期至 2025 年 12 月 31 日!
打开中国区账号注册页面
01 填写您 注册账号的邮箱,点击“继续”
02 查看您的 注册账号邮箱
注: 发件箱 no-reply@register.signin.amazonaws.com.cn
03 输入 邮箱中收到的验证码,点击“继续”
注: 该链接中的内容显示语言是与您的网页浏览器设置相一致的,您可以根据需要自行调整语言栏。

填写用户名密码
.04e59cc081d6b1b4de2e80dca972273ad0cd7ace.jpg)
填写账号联系人以及公司信息
01 填写公司联系人 姓名全称
02 填写公司联系人的 联系电话
03 填写 公司名称
注: 公司名称请务必与您所提供的营业执照公司名称保持一致
04 填写 公司办公地址
注: 省份/自治区/直辖市 - 城市 - 区 - 街道门牌号以及楼层信息 - 邮政编码
05 请选择 是否需要发票
注: *附件-申请发票流程 供您参考
06 点击查看 客户协议 勾选方框表示您已阅读,并同意客户协议的条款
.dcb511571e7913a6581f0ae803797a01c918ac61.jpg)
企业信息验证
01 在此上传 企业注册执照
02 请填写网络安全负责人的 姓名
注: 该字段务必与您下方提供的身份证号匹配或与证件上的姓名保持一致
03 请填写网络安全负责人的 联系方式
注: 有效的电子邮件地址 - 有效的中国内地 手机号码 - 座机号码(如无座机,请填写正确有效的手机号码)
04 在此上传网络安全负责人的 身份证件
注: 当您选择证件类型为“身份证”时,您需要填写正确的身份证号码,选择其他证件类型时,您需要上传证件扫描稿
.8252245bf937985f0b90aaa376899e8932e71a49.jpg)
手机验证与支持计划
.7122fd576282aebfbd9ed8927a918a378c59550d.jpg)