1 早期歌声合成
最早知名的歌声合成是日本VOCALOID(ボーカロイド,下简称V)系列(在此之前应该也有用变速变调器的,但我未知),7年历史(04年出的V1)。韩国一看VOCALOID火了,就在V2前后也出了一个模仿的VOCALINA(보칼리나)。唉,他们还是爱模仿、抄袭(不过VOCALINA音质很差)。“两V”都不允许自制音源,所以天朝众用日语+参数凑合汉语,或者用一段视频文件+变速变调器(称为人力V)。日本自己也做了任意添加音源的UTAU(下简称U,据说本来便是用于人力V的),虽然效果比不上V,但这下所有人便都可以创出自己的音库了。
2 中文U音库与袅袅
U虽然做出来了,但是还是太“狭隘”,只以日语音节结构作为标准:一个WAV分为声+韵头+韵腹,完全没有考虑到世界上大部分语言都有韵尾。最初大家都不知道,兴高采烈地把中文音库录制进去(a ai an ang ao ba bai……),这就是“中文整音库”。整音库韵尾过长先不提(如天——津——=帖—嗯—即—嗯—),先说一字多音的问题。
遇到连音怎么办?难道就成“花非|唉花|啊,雾非|唉雾|呜”?那“去似朝云”怎么办?“去似|日朝云”还是“去似|一朝云”?于是便出现了扩张整音,就是添加23个韵尾(子日啊噢额咦唔于哎诶奥偶业二暗烟恩隐蕴昂鞥英东,均取尾音)的wav,打入母音结合,如此就成了“夜(半安)来,天(明英)去”,已经很自然了。U怎么解决尾音过长先不说,看看袅袅(下简称N)。N把音分成声、头、腹、尾,符合大多数语言(日语看做kya=k+y+a+a),解决了尾音过长,而且用类似V的- [ - ],解决了连音。
(未完待续)作者: 帅气 时间: 2013/3/7 21:21