搜索

iVocaloid论坛

查看: 1732|回复: 7
打印 上一主题 下一主题

【暂定】开源以后大致的开发路线 [复制链接]

Sleepwalking

我不是技术宅!

Lv.5-章鱼须

Rank: 5Rank: 5Rank: 5

0
9
0


UID: 111156
权限: 40
属性: 宇宙人
发帖: 201 (1精)
积分: 540
章鱼: 3
大葱: 14
茄子: 2688
注册:2012/8/18
存在感:476
跳转到指定楼层
[1L]楼主
Zleepwalking 发表于 2013/6/1 23:39:03 |只看该作者 |倒序浏览
本帖最后由 Zleepwalking 于 2013/6/1 23:45 编辑

今天晚上进行了一些讨论,结论汇总于此:
暑假将重写整个项目(也许除了TDPSMStudio等工具软件吧)
使用语言两套方案:
1. C(文件读写、底层调用)+FreeBasic(算法,CVE,CVSCommon,RSCCommon)+ [C + WXWidget(GUI)]
2. C++, WXWidget全包
开发平台放在Linux上,然后到Windows上做移植,反正WXWidget跨平台。
CVE的算法将重写。
TDPSM仍被使用。TDPSOLA因为没法处理好过渡被否决了。
EFB-GW同样因为没法过渡也被否决了。
反正变调会伤音质,干脆还是用TDPSM变调。
最后合成器方案变成:
经过TDPSM拉伸、变调后用频域算法在发音记号间过渡(避免之前的共振峰破坏问题)。没有找到合适的频域算法,打算自己研究【压力山大。。。


音源库的话,因为反工ddb已经证明采样率只有单声的44100HZ,所以。。。现在96000HZ的音源库可以缩掉一倍多……

我刚学编程时被MFC的Hello world彻彻底底地吓到了,然后就对C++有心理阴影……于是我学了VB.Net……现在要转型成C++。。。还好CVE就是些纯算法类的东西,思想占的比重远高于语言……


另:理论上如果上述算法都能掌握的话。。。写出一个功能和Vocaloid相同,可以读vocaloid的ddb进行合成的东西也有可能呢……当然,都能掌握是很难的。。。。。。。



知识共享许可协议 除非另有声明,本帖内容采用 署名-非商业-相同方式共享 3.0 许可协议 授权,且需注明出处,所有权利归发帖人。

使用道具 举报

Rank: 3

0
3
0


UID: 93325
权限: 20
属性: 難燃性
发帖: 74 (0精)
积分: 100
章鱼: 1
大葱: 2
茄子: 433
注册:2011/10/22
存在感:84
[2L]沙发
rgwan 发表于 2013/6/3 15:10:03 |只看该作者
VOCALOID的DDB就是大坑。为啥里面一堆F啊。
另外就是我准备写个水表软件,cvct(Cyber Voice Convert Tool),隐式支持ddb to cdb。
这样以后就可以光明正大的用初音了。

使用道具 举报

Rank: 3

0
3
0


UID: 93325
权限: 20
属性: 難燃性
发帖: 74 (0精)
积分: 100
章鱼: 1
大葱: 2
茄子: 433
注册:2011/10/22
存在感:84
[3L]板凳
rgwan 发表于 2013/6/3 15:23:52 |只看该作者
另外就是合成器部分前端变速后端TDPSM,原因就是因为我们需要GEN参数……

使用道具 举报

Sleepwalking

我不是技术宅!

Lv.5-章鱼须

Rank: 5Rank: 5Rank: 5

0
9
0


UID: 111156
权限: 40
属性: 宇宙人
发帖: 201 (1精)
积分: 540
章鱼: 3
大葱: 14
茄子: 2688
注册:2012/8/18
存在感:476
[4L]地板
Zleepwalking 发表于 2013/6/3 15:33:15 |只看该作者
rgwan 发表于 2013/6/3 15:10
VOCALOID的DDB就是大坑。为啥里面一堆F啊。
另外就是我准备写个水表软件,cvct(Cyber Voice Convert Tool) ...

只有三个音调肿么办
另外发音记号表里一堆音ddb没有,主要是改参数合成出来的……还有奇葩的组合方法……

使用道具 举报

Rank: 3

0
3
0


UID: 93325
权限: 20
属性: 難燃性
发帖: 74 (0精)
积分: 100
章鱼: 1
大葱: 2
茄子: 433
注册:2011/10/22
存在感:84
[5L]萝莉
rgwan 发表于 2013/6/3 15:44:13 |只看该作者
本帖最后由 rgwan 于 2013/6/3 15:47 编辑
Zleepwalking 发表于 2013/6/3 15:33
只有三个音调肿么办
另外发音记号表里一堆音ddb没有,主要是改参数合成出来的……还有奇葩的组合方法…… ...


也来试试把。另外就是我们这个音源不能并入github的主线中。因为这个不是自由的(non-free)。可以另外提供地址下载。到时候找人献声吧。
我觉得我们能找到萝莉的可能性近似0.扒音源也有版权问题。最后我想了一个奇葩的办法。就是我和你献声。然后分析女声和男声的泛音,通过调整泛音的方式(比如变速)弄出女声……
另外就是CVCT除了做跨软件的转换(UTAU/NN/VOCALOID TO ROCALOID)以外,另外一个功能就是开发音源与发布音源的互转。
也就是合并cbv文件的能力。你原来也说cbv文件太多不好处理,我觉得可以等到重写完成引擎后开发cdb格式,开发的时候用零碎文件,然后调整到没有问题再打包出去。这样同样方便引擎调试。

使用道具 举报

Sleepwalking

我不是技术宅!

Lv.5-章鱼须

Rank: 5Rank: 5Rank: 5

0
9
0


UID: 111156
权限: 40
属性: 宇宙人
发帖: 201 (1精)
积分: 540
章鱼: 3
大葱: 14
茄子: 2688
注册:2012/8/18
存在感:476
Zleepwalking 发表于 2013/6/3 17:21:56 |只看该作者
rgwan 发表于 2013/6/3 15:44
也来试试把。另外就是我们这个音源不能并入github的主线中。因为这个不是自由的(non-free)。可以另外提供 ...

卧槽。。。。。。。。录音方法略凶残。。。被结结实实地恶心到了…………………………………………………………………………………………我会说我能找到萝莉么【你想多了= =
CVCT的功能应该仅是乐谱格式的转换,否则感觉很违背设计思想,应该另写一个CVDC(CyberVoice Database Conversion)用来合并+差分预压缩……

使用道具 举报

Rank: 3

0
3
0


UID: 93325
权限: 20
属性: 難燃性
发帖: 74 (0精)
积分: 100
章鱼: 1
大葱: 2
茄子: 433
注册:2011/10/22
存在感:84
[7L]大姐姐
rgwan 发表于 2013/6/3 18:12:09 |只看该作者
Zleepwalking 发表于 2013/6/3 17:21
卧槽。。。。。。。。录音方法略凶残。。。被结结实实地恶心到了………………………………………………… ...

嗯。确实是这样。命名上有点混乱。
录音方法是有点恶心,调制泛音之类的原来我对很多分离出来的歌声都做过。包括变速和替换啥的。
不过你也听到哪个咕噜碳了,玩脱了的结果……
音源库得预先压缩。算法建议用bz2。压缩率高解起来巨快。
不过我觉得这仅仅在传送的时候用吧。到用户手里的文件最好别压缩。否则引擎还得内置bz2……

使用道具 举报

Rank: 3

0
3
0


UID: 93325
权限: 20
属性: 難燃性
发帖: 74 (0精)
积分: 100
章鱼: 1
大葱: 2
茄子: 433
注册:2011/10/22
存在感:84
[8L]实妹
rgwan 发表于 2013/6/3 18:14:17 |只看该作者
关于音源的话,男性的你觉得我们合适不?
女性的如果找不到就去UTAU版转那些自由的UTAU音源……

使用道具 举报

您需要登录后才可以回帖 登录 | 注册/sign up

申请友链|Archiver|iVocaloid - 自由,开放,合作,共享    | 版权持有者点击这里进行举报

GMT+8, 2025/6/10 21:17

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部