【IT168 信息化】
日立(中国)研究开发有限公司(总经理:田边 史朗)与日立制作所(社长:古川 一夫/以下简称,日立)开发出了只要在PC上输入中文文本,便能生成接近于真人发音的“中文语音合成技术”。此项技术是在日本国内已被采用的日立的“高音质智能化日语语音合成技术”的基础上,实现了适合于中文语音合成的处理技术的开发。12月2日-3日,此次开发出的中文语音合成技术将在中国武汉市举办的[日立展]信息都市展区的广播中使用。
如今,语音合成技术除了在汽车语音导航、车站内的广播系统中应用外,还在电话自动应答系统、电脑和手机的网络邮件文本阅读、以及电脑游戏中人物台词的阅读等各种领域都开始得到应用。日立的语音合成技术一直以来以其高自然度、高准确性和声音种类的多样性为特点,其在日本国内的使用一直在增长。这次,日立和日立(中国)研究开发有限公司合作,共同开发了以日立的语音合成技术为基础的中文语音合成技术。在中文里,高低抑扬顿挫的音节变化被称为声调(四声),一般的文章均由4种声调的文字组成。此次开发过程中,针对于中文声调的特点开发了新的处理技术,从而实现了高音质的中文语音合成。
现在,此中文语音合成技术,只要在PC上输入中文文本,便能生成发音正确、自然流畅的接近于真人发音的中文合成语音。今后,将针对中国国内的使用需求,开发种类多样并且具有更高音质的中文合成语音。
此项技术的特点如下:
(1)具有正确发音和声调的语音合成
为了正确读出中文文章,在正确分析单词分割、词性的种类、汉字发音和声调等语言信息基础上,还需要提炼出文章意思所依循的意杨顿挫、节奏。现在,日立通过将单词分割、词性的种类、汉字发音等统筹处理,开发出综合统计的语言解析处理技术,从而得到最适合的解析结果。按照以往的做法,此类语言解析是首先分析单词分割和词性种类,然后根据分析结果决定发音,与此相比,通过日立的解析方法使具有正确发音和声调的中文语音合成成为可能。
(2)具有自然韵律和节奏感的语音合成
在得到正确发音和声调之后,需要对一个短语的整体韵律(抑扬顿挫和语言节奏)进行处理。而中文语言的韵律随着各个音节发音的种类和声调的前后关系产生各种变化,这将给韵律模型的建立、输入文本的韵律模式的预测造成困难。此次开发通过从录音语料中正确分割出音节节奏的变化点(声调的核心部分),并对大量文语例句统计分析,利用声调核心部分,最终形成将韵律模式模型化的研究方法。根据此项技术,通过正确预测输入文本的韵律模式,实现了具有自然韵律和节奏感的合成语音。