使用 亚马逊云科技 机器学习跟踪体育广播视频中的球轨迹
在过去的几年中,职业体育应用了机器学习 (ML),彻底改变了游戏分析、加速创新和改善球迷体验。例如,
在球类运动方面,球轨迹分析是评估球员表现和增强比赛策略分析的最有用技术之一。但是,识别球的位置具有挑战性,尤其是在网球、羽毛球和棒球等运动中,那些涉及小球高速运动的位置,在这些运动中,球的图像相对较小、模糊,有时会有残像痕迹甚至不可见。应用于计算机视觉的深度学习在跟踪体育广播视频中的微小物体方面显示出可喜的结果。受名为
在这篇博客文章中,我们描述了一种基于深度学习的端到端解决方案,该解决方案无需使用昂贵的摄像设备即可对广播体育视频进行球类跟踪。我们专注于使用亚马逊网络服务 (亚马逊云科技) 的托管服务来开发解决方案。该解决方案包括机器学习工作流程,首先是将标签应用于广播视频,然后对带注释的标签执行数据转换,向模型训练提供数据,然后将模型部署到允许应用程序根据提供的输入创建球轨迹视频的端点。
我们提供了一个
架构

图 1:端到端架构图
该解决方案架构描绘了球轨迹跟踪 ML 工作流程中涉及的关键组件,这些组件按前面显示的特定顺序编排。这些步骤可以分为以下几步:
- 用户将体育广播视频文件上传到
Amazon S3 存储桶 - 为视频帧执行标签任务
- 执行数据转换以处理带注释的视频帧
- 使用上一步的功能来训练深度学习模型
- 将经过训练的模型部署到实时 HTTPS 端点
- 通过部署的端点制作球轨迹视频
为视频帧添加标签
TrackNet 是一种在计算机视觉中使用深度学习的监督式机器学习模型。该模型要求将球在 2D 平面中的位置作为标签,以便准确地学习球的轨迹。为了获得高质量的训练数据集,在帧级别上应用标签。根据视频的时长和帧速率,可能会有大量数据需要标记。为了简化贴标流程,我们创建了一个

图 2:SageMaker 基本真相标签门户
功能工程
如本

图 3:处理任务流程
SageMaker 处理任务完成后,要素和标签数据集都将上传到给定的 Amazon S3 可供培训的地点。
模型训练
在较高的层面上,TrackNet 结合了 2 个深度神经网络,形成了模型架构。设计的目标是让第一个网络 (VGG-16) 从连续的输入帧中学习压缩要素,然后将其馈送到第二个网络 (DeconvNet) 进行向上采样以重建最终图像。下图更详细地说明了网络架构。鉴于该模型是在 Tensorflow 2 中实现的,我们可以使用 SageMaker 训练作业训练 TrackNet 模型,而无需构建任何自定义容器。本

图 4:TrackNet 架构
部署球追踪模型
在 Amazon SageMaker 训练任务完成后,经过训练的模型工件将存储在指定的 Amazon S3 位置。此时,有几种方法可以将您的应用程序与经过训练的模型集成。首先,您可以托管一个 HTTPS 端点,该端点提供根据输入帧识别球位置的推论。另一种方法是从本地的 Amazon S3 位置下载模型工件,然后构建一个应用程序,将指定的深度学习库与相关的依赖项耦合在一起,以便在离线环境中处理输入帧。第一种模式是首选选项,因为它可以将应用程序代码与机器学习模型的生命周期分离,并允许推理请求独立扩展。SageMaker 推理支持各种用例场景,包括低延迟(几毫秒)和高吞吐量(每秒数十万个请求)以及长时间运行的推理。对于我们的用例,我们部署了一个支持 GPU 的实时 SageMaker 端点,允许应用程序创建球轨迹视频。通常,深度学习应用程序可以受益于支持多次同步计算的 GPU。我们观察到,使用 GPU 端点执行相同任务时,延迟比 CPU 低 5 倍。
把所有东西放在一起
有了实时推理端点,我们可以利用 TrackNet 模型开始跟踪给定视频的球轨迹。
结论
体育行业正在使用机器学习来预测比赛结果、制定游戏策略并获得竞争优势。在这篇博客文章中,我们展示了一个端到端的机器学习工作流程,该工作流程使用 Amazon SageMaker 功能在球类运动中提供球轨迹跟踪。该解决方案使用深度学习模型在广播体育视频中实现高精度的球跟踪,无需使用昂贵的摄像设备。我们从使用亚马逊 SageMaker Ground Truth 标签作业的视频标签工作流程开始,然后使用 SageMaker 处理作业进行特征工程。为了构建深度学习模型,我们描述了如何启动 SageMaker 训练作业来大规模训练模型。最后,我们描述了一款与推理端点集成的应用程序,可通过 Amazon SageMaker Inference 托管服务生成球类追踪视频。