目录:
定义-语音合成是什么意思?
语音合成是通过计算机或其他设备对人的语音进行人工仿真。 与语音识别相对应的是,语音合成主要用于将文本信息转换为音频信息,并用于诸如启用语音的服务和移动应用程序之类的应用中。 除此之外,它还用于辅助技术中,以帮助有视力障碍的人阅读文本内容。
技术百科解释语音合成
荷马·达德利的VODER基于贝尔实验室的声码器,被认为是第一款全功能的语音合成器。 语音合成中使用的计算机称为语音合成器或语音计算机。 语音计算机的质量通常由其与人声的相似性来判断。 自1990年代初以来,大多数计算机操作系统都集成了语音合成器。 合成语音通常是通过将录制的语音片段连接在一起而生成的,该片段包含在数据库中。
语音合成的初始阶段是预处理,它消除了需要阅读特定单词的方式所带来的歧义,并且还包括处理同形异义词。 在语音合成的下一个阶段,计算机将利用音素将文本转换为声音序列。 最后阶段涉及使用人类录音或基本的声音生成技术来模仿人类的语音机制并读出整个文本。 语音合成的流行分支之一是视听语音合成或多模式语音合成,它利用紧密同步的动画面孔来补充合成语音。 多峰语音合成还将语音的非语言提示等其他功能结合在一起,以帮助更准确地传达用户的单词。 许多语音合成系统允许用户选择语音类型,例如男性或女性语音。
尽管语音有时可能很沉闷,但大多数语音合成系统都能够以非常智能的方式读取文本并将其输出。 然而,语音合成还没有发展出完全模仿广泛的人类语调和节奏的能力。
