歌声ライブラリ(Singer Library)ヤマハからライセンス供与を受けた各社の担当部分で、人間の声からサンプリングした音声素片(歌声の断片)を含むデータベース。音声素片は、VOCALOID2では、2つの音(音素)が変化する際の移り変わりの部分(二音素連鎖、diphone)と、母音や鼻音の伸ばし音が収録されている。例えば「さーいーたー」([sa i ta])という歌詞を合成する場合は二音素連鎖「#-s,s-a,a-i,i-t,t-a,a-#」(#は無音を示す)と母音の伸ばし音「a,i」を用い、これらを接続して歌声が作られる。これら音声素片は合成する際に入力されたメロディに合うピッチ(音高)に変換されるがより自然な合成を得られるよう歌手ライブラリには異なるピッチのものを複数用意している[注 2][23]。1ピッチあたりの二音素連鎖は日本語用ライブラリでは約500個、英語では約2500個収録している[24]。この違いは言語の特性の違いによるもので日本語の二音素連鎖が少ないのは日本語の音素の数が少ないことと、音節がほとんどの場合開音節(母音で終わる音節)であるためである。日本語の子音を含む二音素連鎖では基本的に「無音-子音」「母音-子音」「子音-母音」という組み合わせのパターンとなるが英語の場合は閉音節(子音で終わる音節)も多く存在し、「子音-子音」や「子音-無音」といったように組み合わせのパターンも多くなるため日本語用ライブラリに比べ収録しなければならない二音素連鎖の数も多くなる。またこのような違いがあるため、日本語用ライブラリで英語の歌詞を発音させるといったような使用は適さない。なお、VOCALOID3では、2までと同様の2音素連鎖だけでなく3音素連鎖(triphone)も扱えるようになっている[25]。
欢迎光临 iVocaloid论坛 (http://bbs.ivocaloid.com/) | Powered by Discuz! X2 |