搜索

iVocaloid论坛

查看: 8544|回复: 43
打印 上一主题 下一主题

[其他] 汉语,中国语,中文歌唱的过来看yo!(各方案比较)   [复制链接]

钢琴研究圆

Lv.6-章鱼之目

Rank: 6Rank: 6

0
87
0


UID: 86793
权限: 50
发帖: 624 (7精)
积分: 2063
章鱼: 26
大葱: 97
茄子: 5007
注册:2011/7/20
存在感:756

创作者

跳转到指定楼层
[1L]楼主
jerrkiy 发表于 2011/9/25 21:06:41 |只看该作者 |正序浏览
本帖最后由 jerrkiy 于 2011/9/25 21:10 编辑

咳咳,我说。。。
已经有足够多的汉歌唱法了,那么汉utau发展的理论基础其实也差不多了吧。
我试着说一下各种拼法的感受吧。



*外语凑合耳空版
录:不用录
用:找技术宅吧
优点:点燃汉语歌唱的世界,
缺点:复杂,普通话实在,闽南语勉强,粤语很捞。。
代表:V家


*整音版
录:麻烦
用:方便。。。?
优点:字内部过度连贯
缺点:

1,不擅长长乐句,音色会吃不消;
2,录起来工程巨大,设置也是;
3,无法控制韵母转换的速度;
4,闽南语粤语的入音不是很自然,增加长度便会破坏音质。
代表:十月绪子,袅袅歌唱(国产歌唱),百草日(粤)

*王芳梅连续音版
录:方便
用:方便。。。但不适合
优点:

1,利用同口型自然过度,实现连续音(字内)!
2,降低录音量和原音设置量
3,把汉语拼音音法分解为音素,十分有意义的一步!!
缺点:

1,缺失或累赘的普通话没有的音节
2,自制拼音列表不符合华人使用方式
代表:王芳梅


*B-ハン版(Bhiham)
录:方便
用:谁能开放个拆字插件吧。。
优点:

1,拆字较全,适合大多数人
2,利用音量来过度
3,录音工程量降低几倍
4,支撑方言和外语
5,利用不同拼法产生不同音色,拼法自由
6,有闽南语和粤语版方案,基本通杀国内流行歌
7,结构为子母音+韵母,可灵活控制转韵母的速度
缺点:
1,拼字太自由,没有固定拼法,可一字拆两半以上
2,使用方法未定型
3,音内过度不够整音版自然(结合王梅芳连续音原理解决!见升级版)
4,人工拼字较麻烦
5,待补充

【B-ハン升级版】
1,按浅色酱的作法结合王梅芳的连续音原理来设置oto.ini让歌唱过度最自然化!!
2,混搭整音音源和↑↓ 音来自然化音源和加入外来语音唱好外语
3,开发出插件实现输入方便化(未实现)

4,待补充
代表:荟音(+浅色设置oto),芦音(出现又消失),


*KRR式(待其完善后再正式评价)
录:方便
用:和B-ハン差不多
优点:和B-ハン初代原理一样,或许未来的港台方案版符合非大陆的使用方式吧
缺点:

1,缺音
2,和B-ハン未升级版一样
3,这个。。。没定型不好评价。。

*OTHER
有国际音标设想的,通过完整来变调的,未知的。。。

题外:看好袅袅为国人的量身定做,期待其越来越完善!

大家继续为汉音源歌唱努力吧!
1

查看全部评分


知识共享许可协议 除非另有声明,本帖内容采用 署名-非商业-相同方式共享 3.0 许可协议 授权,且需注明出处,所有权利归发帖人。
音乐,美食,钢琴。。。。。。。请大家试试用bhiham瘦身技术制作汉音源吧。。。

使用道具 举报

Rank: 4Rank: 4

0
12
1


UID: 86421
权限: 30
发帖: 74 (1精)
积分: 278
章鱼: 3
大葱: 18
茄子: 264
注册:2011/7/15
存在感:192

创作者

44#
xiphiaz 发表于 2011/11/2 01:35:35 |只看该作者
回复 42# hqy123


    其实是有的,只不过貌似没有整理完,找J要吧

使用道具 举报

Rank: 2Rank: 2

0
0
0


UID: 93939
权限: 10
发帖: 10 (0精)
积分: 13
章鱼: 0
大葱: 1
茄子: 15
注册:2011/11/1
存在感:15
43#
wdxwchw 发表于 2011/11/2 00:18:17 |只看该作者
新人路过帮顶........

使用道具 举报

Rank: 6Rank: 6

0
97
0


UID: 93150
权限: 50
属性: 受性
发帖: 612 (0精)
积分: 1628
章鱼: 27
大葱: 50
茄子: 4155
注册:2011/10/17
存在感:389
42#
hqy123 发表于 2011/11/1 20:26:49 |只看该作者
啊!我一直在找得东西,出现啦~~但是那个那啥B的升级版哪里有录制教程呢。。

使用道具 举报

Rank: 4Rank: 4

0
12
1


UID: 86421
权限: 30
发帖: 74 (1精)
积分: 278
章鱼: 3
大葱: 18
茄子: 264
注册:2011/7/15
存在感:192

创作者

41#
xiphiaz 发表于 2011/10/3 04:29:15 |只看该作者
回复 40# 1274084726


    呵呵。。论坛等级嘛。。浮云啦

使用道具 举报

↗頂級'B貨↘

Lv.6-章鱼之目

Rank: 6Rank: 6

5
99
7


UID: 84614
权限: 50
发帖: 1452 (0精)
积分: 1862
章鱼: 19
大葱: 56
茄子: 5057
注册:2011/6/16
存在感:1162

创作者 已经合不上嘴了... 我是loli控 茄子饲养者 水王 发帖达人

40#
1274084726 发表于 2011/10/2 19:45:14 |只看该作者
回复 33# xiphiaz

= =
    论坛真是卧虎藏龙啊…………
而且都是LV.3或以下的童鞋……………

使用道具 举报

Rank: 4Rank: 4

0
12
1


UID: 86421
权限: 30
发帖: 74 (1精)
积分: 278
章鱼: 3
大葱: 18
茄子: 264
注册:2011/7/15
存在感:192

创作者

39#
xiphiaz 发表于 2011/10/2 13:06:59 |只看该作者
回复 35# chiri流歌


    某妹纸是谁啊0 0
1

查看全部评分

使用道具 举报

Rank: 4Rank: 4

0
12
1


UID: 86421
权限: 30
发帖: 74 (1精)
积分: 278
章鱼: 3
大葱: 18
茄子: 264
注册:2011/7/15
存在感:192

创作者

38#
xiphiaz 发表于 2011/10/2 13:05:46 |只看该作者
回复 35# chiri流歌


    和J君测试了一下,目前程序有几处地方需要修改,并且等J君完善pst之后就上传论坛 >w<

使用道具 举报

七喜P(大雾

~音乐版主~

Rank: 11Rank: 11Rank: 11

0
271
29


UID: 71787
权限: 100
属性: 不明
发帖: 1042 (0精)
积分: 3112
章鱼: 47
大葱: 131
茄子: 5683
注册:2010/10/19
存在感:1107

创作者 已经合不上嘴了... 茄子饲养者 创作达人

37#
VII 发表于 2011/10/2 12:08:29 |只看该作者
回复 35# chiri流歌


    还有不对啊为什么是“他”啊喂
1

查看全部评分

http://3158495.5sing.com
欢迎兜兜俺的叶子

使用道具 举报

七喜P(大雾

~音乐版主~

Rank: 11Rank: 11Rank: 11

0
271
29


UID: 71787
权限: 100
属性: 不明
发帖: 1042 (0精)
积分: 3112
章鱼: 47
大葱: 131
茄子: 5683
注册:2010/10/19
存在感:1107

创作者 已经合不上嘴了... 茄子饲养者 创作达人

36#
VII 发表于 2011/10/2 12:07:59 |只看该作者
回复 35# chiri流歌


    不对某妹纸是谁啊XSK
1

查看全部评分

http://3158495.5sing.com
欢迎兜兜俺的叶子

使用道具 举报

Rank: 6Rank: 6

3
88
0


UID: 85092
权限: 50
属性: 2.5次元
发帖: 355 (0精)
积分: 1838
章鱼: 30
大葱: 111
茄子: 686
注册:2011/6/25
存在感:567

创作者 莲の爱 已经合不上嘴了... 创作达人

35#
chiri流歌 发表于 2011/10/2 09:23:32 |只看该作者
回复 33# xiphiaz


    技术宅!!!你让咱们这些小白情可以堪啊!!!
嘛回正题,这个还真的不好理解……【蹲墙脚画圈圈诅咒某妹纸以及他带来的一群技术宅【不对
球公开测试www【死
写作chiri流歌读作lukachan or 废物
窝全废,窝骄傲,窝为祖国省粮食233
-----------------------------------------------------
欢迎逛逛:http://www.nicovideo.jp/mylist/23246314

艹微博签名居然跟【TC某XX一生黑】撞色23333

使用道具 举报

Rank: 4Rank: 4

0
12
1


UID: 86421
权限: 30
发帖: 74 (1精)
积分: 278
章鱼: 3
大葱: 18
茄子: 264
注册:2011/7/15
存在感:192

创作者

34#
xiphiaz 发表于 2011/10/2 08:27:43 |只看该作者
回复 31# VII


    其实就在于中文没有oremo吧

使用道具 举报

Rank: 4Rank: 4

0
12
1


UID: 86421
权限: 30
发帖: 74 (1精)
积分: 278
章鱼: 3
大葱: 18
茄子: 264
注册:2011/7/15
存在感:192

创作者

33#
xiphiaz 发表于 2011/10/2 08:11:01 |只看该作者
本帖最后由 xiphiaz 于 2011/10/2 08:42 编辑

SU0v5
昨晚和Jerrkiy君讨论了一下B式拆音法,于是做了这样的东西。
命名为SplitU(咦为什么不叫SplitBhiham?因为缩写。。),可以定制pst文件设定拆音方案,预计可以大幅简少调教时的鼠标/键盘输入。
特点如下:

1. 支持自定义拆音方案。也就是说除了标准的B式,再有新方法也可以一并兼容。方言什么的也完全没有问题。

2.拆音方案记录在pst(Phoneme Split Table 音素拆分表)文件中。
    如此一来如果做中文音源的话pst文件大概也会变成类似oto.ini的东西,但预计普适性要更强,
    标准B式pst用在B式音源上应该只需少数改动。

3. 拆音长度可以定义为定长或者比例式。
    例:jiong = ji + io + ong,分别设定为40(定长),30%(比例),50%(比例)。
    那么音符的长度减去40后其余部分按30:50比例分给io和ong。

4. 目前独立于utau存在,还未做成插件形式。通过导入已输入拼音的ust运作。
    小研究了一下U插件,但是看来还得要请教一下DSOUND君插件的接口原理。
    顺便会做成图形界面。Nobody likes console (except coders). 嗯我喜欢命令行因为不用装VS。

5. pst中不存在的音会保持原样。因pst设置不当或者ust做得太极限导致无法正常拆分的也会保持原样。
    不用担心ust会整个乱掉。

运行示例:

拆音前
before

拆音后
after

例中为了测试各种未预见状况,chong字的pst未设置,bian字故意设置成总长超过了音节长度,所以这两个字没有拆。
接下来就等Jerrkiy的标准Bhiham式pst了哇咔咔。

PS. 本来还打算做汉字直接转音素,但是试了一下utau,输入拼音比汉字要方便得多,那就没有必要做了。
PSP. 和J君讨论之后发现,B式拆音法又经过了修改,已经相当完善了,可以预见音节间的过渡会是一流的。
       并且因为可以重复使用整音来截取其中不同音素,录音量会减少。
       同时可以在oto中完成大部分后期,不需要再在AA中截取音素了,后期工作量也会减少。
       以上,可惜J君并没有发布书面的解释,所以大家可能不是非常理解。

嗯。。就这么多。大家赶紧签订契约做中文音源吧 >.<

使用道具 举报

↗頂級'B貨↘

Lv.6-章鱼之目

Rank: 6Rank: 6

5
99
7


UID: 84614
权限: 50
发帖: 1452 (0精)
积分: 1862
章鱼: 19
大葱: 56
茄子: 5057
注册:2011/6/16
存在感:1162

创作者 已经合不上嘴了... 我是loli控 茄子饲养者 水王 发帖达人

32#
1274084726 发表于 2011/10/1 20:05:34 |只看该作者
回复 31# VII


    声音差别是因为糟糕的变调技术…………

使用道具 举报

七喜P(大雾

~音乐版主~

Rank: 11Rank: 11Rank: 11

0
271
29


UID: 71787
权限: 100
属性: 不明
发帖: 1042 (0精)
积分: 3112
章鱼: 47
大葱: 131
茄子: 5683
注册:2010/10/19
存在感:1107

创作者 已经合不上嘴了... 茄子饲养者 创作达人

31#
VII 发表于 2011/10/1 14:48:57 |只看该作者
乃们这群技术宅…为什么我全都看不懂你们说的是什么QAQ
而且那个B啥的虽然J啥说很方便但是我一点也不这么觉得…没办法得一个一个弄OTL
而且D啥做的袅袅,把俺女儿丢进去为毛她声音跟UTAU里差得那么多XSK
(好吧她就是个悲催的孩子…
1

查看全部评分

http://3158495.5sing.com
欢迎兜兜俺的叶子

使用道具 举报

黑历史×n好羞耻×∞

Lv.7-料理用章鱼

Rank: 7Rank: 7Rank: 7

3
200
20


UID: 85027
权限: 60
属性: 揮発性
发帖: 1023 (3精)
积分: 4586
章鱼: 65
大葱: 308
茄子: 2100
注册:2011/6/24
存在感:1418

创作者 已经合不上嘴了... 茄子饲养者 创作达人 葱田播种者 巡音の爱 音の亚种 发帖达人 水王 终身成就

30#
Aspirin﹏ 发表于 2011/9/30 22:30:23 |只看该作者
回复 29# jerrkiy

大叔乃回得真是时候...
补丁什么的没有,不过有新版本~

点击进入下载-Ashine Aya Act2.xChinese.rar

密码==PM乃...


◇芦音アヤ・カヤ公式ウィキ→http://w.livedoor.jp/ashine/
↑有兴趣玩的请去U区翻翻看w
◇各种杂物请戳→http://10313832.5sing.com/

使用道具 举报

钢琴研究圆

Lv.6-章鱼之目

Rank: 6Rank: 6

0
87
0


UID: 86793
权限: 50
发帖: 624 (7精)
积分: 2063
章鱼: 26
大葱: 97
茄子: 5007
注册:2011/7/20
存在感:756

创作者

29#
jerrkiy 发表于 2011/9/30 22:20:40 |只看该作者
回复 3# Aspirin﹏


    嘛,先给我个补丁,快手哦!
  要开做了!

使用道具 举报

↗頂級'B貨↘

Lv.6-章鱼之目

Rank: 6Rank: 6

5
99
7


UID: 84614
权限: 50
发帖: 1452 (0精)
积分: 1862
章鱼: 19
大葱: 56
茄子: 5057
注册:2011/6/16
存在感:1162

创作者 已经合不上嘴了... 我是loli控 茄子饲养者 水王 发帖达人

28#
1274084726 发表于 2011/9/30 18:47:41 |只看该作者
回复 27# jerrkiy


    嘛~不说了…………

使用道具 举报

钢琴研究圆

Lv.6-章鱼之目

Rank: 6Rank: 6

0
87
0


UID: 86793
权限: 50
发帖: 624 (7精)
积分: 2063
章鱼: 26
大葱: 97
茄子: 5007
注册:2011/7/20
存在感:756

创作者

27#
jerrkiy 发表于 2011/9/29 22:38:32 |只看该作者
回复 26# 1274084726


    好咩啊。。。。。。。。

使用道具 举报

↗頂級'B貨↘

Lv.6-章鱼之目

Rank: 6Rank: 6

5
99
7


UID: 84614
权限: 50
发帖: 1452 (0精)
积分: 1862
章鱼: 19
大葱: 56
茄子: 5057
注册:2011/6/16
存在感:1162

创作者 已经合不上嘴了... 我是loli控 茄子饲养者 水王 发帖达人

26#
1274084726 发表于 2011/9/29 18:47:12 |只看该作者
你们讨论得好————啊!

使用道具 举报

钢琴研究圆

Lv.6-章鱼之目

Rank: 6Rank: 6

0
87
0


UID: 86793
权限: 50
发帖: 624 (7精)
积分: 2063
章鱼: 26
大葱: 97
茄子: 5007
注册:2011/7/20
存在感:756

创作者

25#
jerrkiy 发表于 2011/9/29 14:08:54 |只看该作者
本帖最后由 jerrkiy 于 2011/9/29 17:10 编辑

回复 24# dsound

    俺觉得,既然要做汉语歌唱,也就要以最好的人声歌唱为目标,
  utau的母音结合在它的oto。ini便可可视化设置,
  特别是中文是字内连续音,不用重新录就可以做出连续音的效果
   整音真正的调教太麻烦了,
  
   按乃那样说整音调转韵速的话工作量超麻烦(乃要开放个自动分析的来做吗?不过每个拼音的转韵都是有自己的规律的kai是延长a zhong是o和ng都拉长,)。。。。
   软件自动化不错,但机器不具备感性认知,分析出来不一定在最优化的点上。

   简便性很重要但觉得还是以声音效果第一位,
   尽量靠近自然歌唱绝对不能差不多就算了
   某物可是很有发展前途的啊@

使用道具 举报

Rank: 6Rank: 6

0
145
0


UID: 85956
权限: 50
属性: 不明
发帖: 169 (0精)
积分: 2165
章鱼: 46
大葱: 75
茄子: 1944
注册:2011/7/9
存在感:145
24#
dsound 发表于 2011/9/29 01:59:37 |只看该作者
本帖最后由 dsound 于 2011/9/29 02:15 编辑
回复  dsound

回复  dsound
这个知道,但是重新合成整音音源效果会大打折扣不如整音自然,
而且音素音源 ...
jerrkiy 发表于 2011/9/28 23:40

这样啊
不过如果整音(比如dai)调整各个发音部分的延长程度 想做也是能做到的。
现在的袅袅就是:延长音长的时候,声母部分按照“声母长度”参数调整,韵母部分按照音长调整。
至于哪部分是声母,哪部分是韵母,软件内部会自己判断。
如果想做的更细的话也是可能,每个部分各延长多少,只是目前觉得没必要,因为输出还算可以。

utau的母音结合,听(看)起来很麻烦的样子。。
居然需要用户自己设置。。应该是高级向了吧。。
而且用手画的话,是否意味着每个(音源里没有的)拼音都要画一遍才能用?
这样的话是否比录制整音源的工作量差不多?

袅袅的设计理念就是简洁易懂,尽可能的让软件内部自动化处理。。
所以袅袅中一定是:用户输入拼音(整音)->系统根据字典判断如何拆成音素(当然字典也是由用户自定义)->合成时,将各音素连到一起(通过判断音素的基频,音量和音高自动母音结合)

使用道具 举报

钢琴研究圆

Lv.6-章鱼之目

Rank: 6Rank: 6

0
87
0


UID: 86793
权限: 50
发帖: 624 (7精)
积分: 2063
章鱼: 26
大葱: 97
茄子: 5007
注册:2011/7/20
存在感:756

创作者

23#
jerrkiy 发表于 2011/9/28 23:40:33 |只看该作者
本帖最后由 jerrkiy 于 2011/9/28 23:47 编辑

回复 22# dsound

回复 22# dsound
这个知道,但是重新合成整音音源效果会大打折扣不如整音自然,
而且音素音源拥有的自由特性也被磨掉了,也就没有转为整音的必要了。
也就是【B-ハン ≯ 合成整音版≯ 袅袅读取合成整音版】整音路程而不是
【输入完整拼音≯ (插件拆音转换为B-ハン 可读)≯ 袅袅读取B-ハン 】
不是从音源下手,而是只从输入法下手,以保留音素音源的多变的自由度。

转韵速即韵母切换的速度(dao中a到o的时间)
整音的话就会被规定死,扩大就会放大距离所以会感觉歌唱很吃力,憋不出
因为转韵是固定长度而不是相对长度
(不可能唱da....a....a.o.....o.....o..而是da..ao...........o....o...)
其实汉语拼音有一个缺点是字不对音
这里按音标是【da+au】。(所幸ao的录音效果就是[au]ei的效果就是êi)
同理ye的ê与de的e也是有区别的,
所以才引入e‘{=ê}来区分
还有音一旦被拖长就会有失真的危险苗头,
唱有音高变化的长音更是惨。。。
要真正唱好汉语歌唱容不得一点瑕疵。。。
思路便是通过补充来完善da+ai+i+i+i,而不是一味拖长d....a...i......
这是认为整音设计应该改进的地方之一。。。。
用音素音源便是解决这个和录音工作量的

中文utau的连续音是利用相同的口型发出来的相同母音(乃所说的基频相同
但在utau里可以可视化调整切到(bao为例)ba的过度一样,也就是可以让用户自己设置在哪里是转换的接口
(正如乃说的123,但可以让用户自己找到最合适的点来解决)
{类比举例:a颜色【黑-红-暗红-紫】ka b颜色【黑-暗红-橙-白】ai要得到【黑-红-暗红-橙-白】kai
可以用里面的紫线切到【黑-红-暗红-】ka-【-暗红-橙-白】-ai
然后利用母音相同,口型相同(自定义到基频最近似的地方)
再给软件用a+b来读取ka+ai(需要的是打ab就可形成a b两块音符)}
因为这是最影响音素式音源音质和自然感的地方,所以十分重要

乃可以对比升级前后的荟音就知道了(浅色设计连续音版bad apple和我做的渣渣)

使用道具 举报

Rank: 6Rank: 6

0
145
0


UID: 85956
权限: 50
属性: 不明
发帖: 169 (0精)
积分: 2165
章鱼: 46
大葱: 75
茄子: 1944
注册:2011/7/9
存在感:145
22#
dsound 发表于 2011/9/28 22:21:22 |只看该作者
回复  dsound

麻烦Dsound了,随然。。。。好像表达产生歧义了,不过感觉好激动啊。。。。。

然后还是。 ...
jerrkiy 发表于 2011/9/28 21:43

插件作用见21L

【可控制转韵速的字内连续音音源】
转韵速是什么?不大明白。。

另外根据utau实现连续音的原理,就是把前一个音减弱,后一个音渐强,然后交叉相加,
这个按照袅袅的“声母清晰度”的参数就可以更改,
之所以有断音感有以下几点原因:
1.“声母清晰度”参数给出的范围太小,交叉相加的效果不强
2.前后两个音的音量区别太大,结合不自然
3.前后两个音的发音有区别(基频有区别)
第1点和第2点稍微优化一下就能搞定,第3点取决于音源的效果了

使用道具 举报

Rank: 6Rank: 6

0
145
0


UID: 85956
权限: 50
属性: 不明
发帖: 169 (0精)
积分: 2165
章鱼: 46
大葱: 75
茄子: 1944
注册:2011/7/9
存在感:145
21#
dsound 发表于 2011/9/28 22:12:26 |只看该作者
回复  dsound

于是还是用整音合成……
这个有啥用?
把整音的变成B啥,
把B啥的变成整音!?
那么我直接 ...
1274084726 发表于 2011/9/28 20:50

这个把B音转成整音
这个东西放到袅袅里的话 直接就是兼容B音的插件
在音符里输入整音(例如bian),后台就按照字典和结合度去拼B音(bi和ian),然后输出整音

使用道具 举报

↗頂級'B貨↘

Lv.6-章鱼之目

Rank: 6Rank: 6

5
99
7


UID: 84614
权限: 50
发帖: 1452 (0精)
积分: 1862
章鱼: 19
大葱: 56
茄子: 5057
注册:2011/6/16
存在感:1162

创作者 已经合不上嘴了... 我是loli控 茄子饲养者 水王 发帖达人

20#
1274084726 发表于 2011/9/28 21:56:58 |只看该作者
回复 19# jerrkiy

我没把B啥的音源给DSOUND啊!别诬陷!!【= = 你一定是说我,我知道……】

还有误会五我也误会了…………
1

查看全部评分

使用道具 举报

您需要登录后才可以回帖 登录 | 注册/sign up

申请友链|Archiver|iVocaloid - 自由,开放,合作,共享    | 版权持有者点击这里进行举报

GMT+8, 2025/9/10 05:42

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部