重温 2024 年亚马逊云科技 re:Invent 的精彩瞬间,一键查看主题演讲及创新讲座的精彩回放

 ✕

首页  »  产品  »  Amazon Transcribe

Amazon Transcribe

自动将语音转换为文本

Amazon Transcribe 是一项自动语音识别 (ASR) 服务,让开发人员能够轻松地为其应用程序添加语音转文本功能。通过使用 Amazon Transcribe API,您可以分析 Amazon S3 中存储的音频文件,并让该服务返回一个转录的语音文本文件。您还可以将实时音频流发送到 Amazon Transcribe,并实时接收转录流。

Amazon Transcribe 可用于多种常见应用,包括客户服务通话转录,以及为音频和视频内容生成字幕。该服务可以转录以常见格式(例如 WAV 和 MP3)存储的音频文件,并为每个词附加时间戳,以便您可以通过搜索文本轻松找到原始源中的音频。Amazon Transcribe 在不断学习和改进,以跟上语言发展的步伐。

Amazon Transcribe 是一项自动语音识别 (ASR) 服务,让开发人员能够轻松地为其应用程序添加语音转文本功能。通过使用 Amazon Transcribe API,您可以分析 Amazon S3 中存储的音频文件,并让该服务返回一个转录的语音文本文件。您还可以将实时音频流发送到 Amazon Transcribe,并实时接收转录流。

Amazon Transcribe 可用于多种常见应用,包括客户服务通话转录,以及为音频和视频内容生成字幕。该服务可以转录以常见格式(例如 WAV 和 MP3)存储的音频文件,并为每个词附加时间戳,以便您可以通过搜索文本轻松找到原始源中的音频。Amazon Transcribe 在不断学习和改进,以跟上语言发展的步伐。

主要功能

方便阅读的转录
大多数语音识别系统输出的文本都没有标点符号。Amazon Transcribe 利用深度学习技术自动添加标点符号和格式,从而使输出内容更容易理解,无需进一步编辑即可直接使用。
识别多个讲话者
Amazon Transcribe 能够识别讲话者的变化,并相应地确定转录文本的归属。从而显著减少转录具有多个讲话者的音频(例如电话、会议和电视节目)所需的工作量。
自定义词汇表
Amazon Transcribe 允许您扩展和自定义语音识别词汇表。您可以将新词添加到基本词汇表中,并生成使用场景特定的高度准确的转录,例如产品名称、领域特定术语或个人姓名。
声道识别
Amazon Transcribe 能够处理通过不同声道来记录每个讲话者的音频和视频。通过将单个音频文件提交到 Amazon Transcribe,由其会识别每个声道,然后生成使用声道标记标注的单个转录,将给联系中心带来显著的效益。
支持多种使用场景

Amazon Transcribe 可为各种质量的音频提供准确的自动转录。您可以为任何视频或音频文件生成字幕,甚至可以转录低质量的电话录音,例如客户服务电话。

流式转录
借助 Amazon Transcribe,您可以实时将音频转录为文本。借助通过 HTTP 2 协议的安全连接,您可以将实时音频流发送到该服务,并且可以实时接收文本流。
时间戳生成
Amazon Transcribe 会为每个词返回一个时间戳,以便您可以通过搜索文本轻松找到原始录音中的音频。

主要功能

方便阅读的转录

大多数语音识别系统输出的文本都没有标点符号。Amazon Transcribe 利用深度学习技术自动添加标点符号和格式,从而使输出内容更容易理解,无需进一步编辑即可直接使用。

识别多个讲话者

Amazon Transcribe 能够识别讲话者的变化,并相应地确定转录文本的归属。从而显著减少转录具有多个讲话者的音频(例如电话、会议和电视节目)所需的工作量。

自定义词汇表

Amazon Transcribe 允许您扩展和自定义语音识别词汇表。您可以将新词添加到基本词汇表中,并生成使用场景特定的高度准确的转录,例如产品名称、领域特定术语或个人姓名。

声道识别

Amazon Transcribe 能够处理通过不同声道来记录每个讲话者的音频和视频。通过将单个音频文件提交到 Amazon Transcribe,由其会识别每个声道,然后生成使用声道标记标注的单个转录,将给联系中心带来显著的效益。

支持多种使用场景

Amazon Transcribe 可为各种质量的音频提供准确的自动转录。您可以为任何视频或音频文件生成字幕,甚至可以转录低质量的电话录音,例如客户服务电话。

流式转录

借助 Amazon Transcribe,您可以实时将音频转录为文本。借助通过 HTTP 2 协议的安全连接,您可以将实时音频流发送到该服务,并且可以实时接收文本流。

时间戳生成

Amazon Transcribe 会为每个词返回一个时间戳,以便您可以通过搜索文本轻松找到原始录音中的音频。

使用场景

改善客户服务
借助 Amazon Transcribe 将音频输入转换成文本,您可以构建能够搜索和分析语音输入的文本分析应用程序。客户联系中心可以使用 Amazon Transcribe 来转录语音通话,并借助其他亚马逊云科技服务(例如 Amazon Comprehend)挖掘数据以提取对话中的含义和意图,从而获取洞察。
音频归档分类
借助该服务,您可以将音频和视频资产转录成完全可搜索的归档文件,以支持合规性监控和风险管理。客户可以使用 Amazon Transcribe 将音频转换成文本,使用 Amazon Elasticsearch Service 为其音频/视频库编写索引并执行基于文本的搜索。
字幕制作工作流
Amazon Transcribe 可以自动生成带时间戳的字幕(可随视频内容一起显示),从而帮助内容生成和媒体发行者提高覆盖率和访问量。

使用场景

改善客户服务

借助 Amazon Transcribe 将音频输入转换成文本,您可以构建能够搜索和分析语音输入的文本分析应用程序。客户联系中心可以使用 Amazon Transcribe 来转录语音通话,并借助其他亚马逊云科技服务(例如 Amazon Comprehend)挖掘数据以提取对话中的含义和意图,从而获取洞察。

音频归档分类

借助该服务,您可以将音频和视频资产转录成完全可搜索的归档文件,以支持合规性监控和风险管理。客户可以使用 Amazon Transcribe 将音频转换成文本,使用 Amazon Elasticsearch Service 为其音频/视频库编写索引并执行基于文本的搜索。

字幕制作工作流

Amazon Transcribe 可以自动生成带时间戳的字幕(可随视频内容一起显示),从而帮助内容生成和媒体发行者提高覆盖率和访问量。

优势

解锁音频和视频内容的价值
通过将音频输入转换成文本,Amazon Transcribe 可帮助您构建能够搜索和分析语音输入的文本分析应用程序。客户联络中心可以使用 Amazon Transcribe 转录语音通话,并借助其他亚马逊云科技服务(例如 Amazon Comprehend)挖掘数据以提取对话中的含义和意图,从而获取见解。
利用准确的转录节省时间和资金

Transcribe 使用一种称为自动语音识别 (ASR) 的深度学习过程来提供高度准确的转录。定义词汇表单词,从而领域特定的单词和短语(如名称或技术术语)生成更准确的转录。

提升客户体验
您可以使用 Transcribe 针对通话转录、实时视频字幕制作和临床文档记录的优化模型,提升客户体验。

优势

解锁音频和视频内容的价值

通过将音频输入转换成文本,Amazon Transcribe 可帮助您构建能够搜索和分析语音输入的文本分析应用程序。客户联络中心可以使用 Amazon Transcribe 转录语音通话,并借助其他亚马逊云科技服务(例如 Amazon Comprehend)挖掘数据以提取对话中的含义和意图,从而获取见解。

利用准确的转录节省时间和资金

Transcribe 使用一种称为自动语音识别 (ASR) 的深度学习过程来提供高度准确的转录。定义词汇表单词,从而领域特定的单词和短语(如名称或技术术语)生成更准确的转录。

提升客户体验

您可以使用 Transcribe 针对通话转录、实时视频字幕制作和临床文档记录的优化模型,提升客户体验。
关闭
1010 0766
由光环新网运营的
北京区域
1010 0966
由西云数据运营的
宁夏区域
关闭
由光环新网运营的
北京区域
由西云数据运营的
宁夏区域