文本到语音转换是指文本合成语音的生成过程。该技术用于与用户沟通时不可能或不方便阅读屏幕的情况。这不仅开创了使用应用程序和信息的新方式,还能让那些无法阅读屏幕文本的人更轻松地了解和融入世界。
在过去几十年间,文本到语音转换的技术实现了长足发展。使用深度学习,它现在可以产生发音非常自然的语音,其中包括音高、速度、发音和转调的变化。如今,计算机生成的语音被用于各种各样的使用案例,并逐步成为用户界面中无处不在的元素。新闻主播、游戏、公共广播系统、在线学习、电话、物联网应用程序和设备以及个人助手只是一些起点。
语音合成提高应用程序的可访问性,使人们无需紧盯屏幕就能够消费和理解信息。下面简要介绍了使用文本到语音转换的一些关键优势。
使用语音进行通信的应用程序会日益普遍。借助文本到语音转换的解决方案,网站、移动应用程序、电子书、在线学习工具和在线文档都可以拥有自己的正确语音。
Amazon Polly 是一种 AI 驱动的服务,它使用高级深度学习技术来合成很像人声的语音。它可以跨广泛的多种语言种类提供几十种栩栩如生的声音。