Amazon Transcribe 是一项自动语音识别 (ASR) 服务,让开发人员能够轻松地为其应用程序添加语音转文本功能。通过使用 Amazon Transcribe API,您可以分析 Amazon S3 中存储的音频文件,并让该服务返回一个转录的语音文本文件。您还可以将实时音频流发送到 Amazon Transcribe,并实时接收转录流。
Amazon Transcribe 可用于多种常见应用,包括客户服务通话转录,以及为音频和视频内容生成字幕。该服务可以转录以常见格式(例如 WAV 和 MP3)存储的音频文件,并为每个词附加时间戳,以便您可以通过搜索文本轻松找到原始源中的音频。Amazon Transcribe 在不断学习和改进,以跟上语言发展的步伐。
Amazon Transcribe 是一项自动语音识别 (ASR) 服务,让开发人员能够轻松地为其应用程序添加语音转文本功能。通过使用 Amazon Transcribe API,您可以分析 Amazon S3 中存储的音频文件,并让该服务返回一个转录的语音文本文件。您还可以将实时音频流发送到 Amazon Transcribe,并实时接收转录流。
Amazon Transcribe 可用于多种常见应用,包括客户服务通话转录,以及为音频和视频内容生成字幕。该服务可以转录以常见格式(例如 WAV 和 MP3)存储的音频文件,并为每个词附加时间戳,以便您可以通过搜索文本轻松找到原始源中的音频。Amazon Transcribe 在不断学习和改进,以跟上语言发展的步伐。
主要功能
方便阅读的转录
识别多个讲话者
自定义词汇表
声道识别
支持多种使用场景
Amazon Transcribe 可为各种质量的音频提供准确的自动转录。您可以为任何视频或音频文件生成字幕,甚至可以转录低质量的电话录音,例如客户服务电话。
流式转录
时间戳生成
主要功能
方便阅读的转录
大多数语音识别系统输出的文本都没有标点符号。Amazon Transcribe 利用深度学习技术自动添加标点符号和格式,从而使输出内容更容易理解,无需进一步编辑即可直接使用。
识别多个讲话者
Amazon Transcribe 能够识别讲话者的变化,并相应地确定转录文本的归属。从而显著减少转录具有多个讲话者的音频(例如电话、会议和电视节目)所需的工作量。
自定义词汇表
Amazon Transcribe 允许您扩展和自定义语音识别词汇表。您可以将新词添加到基本词汇表中,并生成使用场景特定的高度准确的转录,例如产品名称、领域特定术语或个人姓名。
声道识别
Amazon Transcribe 能够处理通过不同声道来记录每个讲话者的音频和视频。通过将单个音频文件提交到 Amazon Transcribe,由其会识别每个声道,然后生成使用声道标记标注的单个转录,将给联系中心带来显著的效益。
支持多种使用场景
Amazon Transcribe 可为各种质量的音频提供准确的自动转录。您可以为任何视频或音频文件生成字幕,甚至可以转录低质量的电话录音,例如客户服务电话。
流式转录
借助 Amazon Transcribe,您可以实时将音频转录为文本。借助通过 HTTP 2 协议的安全连接,您可以将实时音频流发送到该服务,并且可以实时接收文本流。
时间戳生成
Amazon Transcribe 会为每个词返回一个时间戳,以便您可以通过搜索文本轻松找到原始录音中的音频。
使用场景
改善客户服务
音频归档分类
字幕制作工作流
使用场景
改善客户服务
音频归档分类
字幕制作工作流
优势
解锁音频和视频内容的价值
利用准确的转录节省时间和资金
Transcribe 使用一种称为自动语音识别 (ASR) 的深度学习过程来提供高度准确的转录。定义词汇表单词,从而领域特定的单词和短语(如名称或技术术语)生成更准确的转录。
提升客户体验
优势
解锁音频和视频内容的价值
利用准确的转录节省时间和资金
Transcribe 使用一种称为自动语音识别 (ASR) 的深度学习过程来提供高度准确的转录。定义词汇表单词,从而领域特定的单词和短语(如名称或技术术语)生成更准确的转录。