Amazon Transcribe

自动将语音转换为文本

创建免费账户

概述

Amazon Transcribe 是一项自动语音识别 (ASR) 服务，让开发人员能够轻松地为其应用程序添加语音转文本功能。通过使用 Amazon Transcribe API，您可以分析 Amazon S3 中存储的音频文件，并让该服务返回一个转录的语音文本文件。您还可以将实时音频流发送到 Amazon Transcribe，并实时接收转录流。

Amazon Transcribe 可用于多种常见应用，包括客户服务通话转录，以及为音频和视频内容生成字幕。该服务可以转录以常见格式（例如 WAV 和 MP3）存储的音频文件，并为每个词附加时间戳，以便您可以通过搜索文本轻松找到原始源中的音频。Amazon Transcribe 在不断学习和改进，以跟上语言发展的步伐。

主要功能

方便阅读的转录
大多数语音识别系统输出的文本都没有标点符号。Amazon Transcribe 利用深度学习技术自动添加标点符号和格式，从而使输出内容更容易理解，无需进一步编辑即可直接使用。

识别多个讲话者
Amazon Transcribe 能够识别讲话者的变化，并相应地确定转录文本的归属。从而显著减少转录具有多个讲话者的音频（例如电话、会议和电视节目）所需的工作量。

自定义词汇表
Amazon Transcribe 允许您扩展和自定义语音识别词汇表。您可以将新词添加到基本词汇表中，并生成使用场景特定的高度准确的转录，例如产品名称、领域特定术语或个人姓名。

声道识别
Amazon Transcribe 能够处理通过不同声道来记录每个讲话者的音频和视频。通过将单个音频文件提交到 Amazon Transcribe，由其会识别每个声道，然后生成使用声道标记标注的单个转录，将给联系中心带来显著的效益。

支持多种使用场景
Amazon Transcribe 可为各种质量的音频提供准确的自动转录。您可以为任何视频或音频文件生成字幕，甚至可以转录低质量的电话录音，例如客户服务电话。

流式转录
借助 Amazon Transcribe，您可以实时将音频转录为文本。借助通过 HTTP 2 协议的安全连接，您可以将实时音频流发送到该服务，并且可以实时接收文本流。

时间戳生成
Amazon Transcribe 会为每个词返回一个时间戳，以便您可以通过搜索文本轻松找到原始录音中的音频。

使用案例

借助 Amazon Transcribe 将音频输入转换成文本，您可以构建能够搜索和分析语音输入的文本分析应用程序。客户联系中心可以使用 Amazon Transcribe 来转录语音通话，并借助其他亚马逊云科技服务（例如 Amazon Comprehend）挖掘数据以提取对话中的含义和意图，从而获取洞察。

借助该服务，您可以将音频和视频资产转录成完全可搜索的归档文件，以支持合规性监控和风险管理。客户可以使用 Amazon Transcribe 将音频转换成文本，使用 Amazon Elasticsearch Service 为其音频/视频库编写索引并执行基于文本的搜索。

Amazon Transcribe 可以自动生成带时间戳的字幕（可随视频内容一起显示），从而帮助内容生成和媒体发行者提高覆盖率和访问量。

优势

通过将音频输入转换成文本，Amazon Transcribe 可帮助您构建能够搜索和分析语音输入的文本分析应用程序。客户联络中心可以使用 Amazon Transcribe 转录语音通话，并借助其他亚马逊云科技服务（例如 Amazon Comprehend）挖掘数据以提取对话中的含义和意图，从而获取见解。

Transcribe 使用一种称为自动语音识别 (ASR) 的深度学习过程来提供高度准确的转录。定义词汇表单词，从而领域特定的单词和短语（如名称或技术术语）生成更准确的转录。

您可以使用 Transcribe 针对通话转录、实时视频字幕制作和临床文档记录的优化模型，提升客户体验。

Amazon Transcribe

概述

主要功能

使用案例

优势

关于我们

产品与解决方案

资源与支持

管理账户

Amazon Transcribe

概述

主要功能

使用案例

改善客户服务

音频归档分类

字幕制作工作流

优势

解锁音频和视频内容的价值

利用准确的转录节省时间和资金

提升客户体验

关于我们

产品与解决方案

资源与支持

管理账户