iVocaloid论坛

标题: 【暂定】开源以后大致的开发路线 [打印本页]

作者: Zleepwalking 时间: 2013/6/1 23:39 标题: 【暂定】开源以后大致的开发路线

本帖最后由 Zleepwalking 于 2013/6/1 23:45 编辑

今天晚上进行了一些讨论，结论汇总于此：
暑假将重写整个项目（也许除了TDPSMStudio等工具软件吧）
使用语言两套方案：
1. C（文件读写、底层调用）+FreeBasic（算法，CVE，CVSCommon，RSCCommon）+ [C + WXWidget（GUI）]
2. C++, WXWidget全包
开发平台放在Linux上，然后到Windows上做移植，反正WXWidget跨平台。
CVE的算法将重写。
TDPSM仍被使用。TDPSOLA因为没法处理好过渡被否决了。
EFB-GW同样因为没法过渡也被否决了。
反正变调会伤音质，干脆还是用TDPSM变调。
最后合成器方案变成：
经过TDPSM拉伸、变调后用频域算法在发音记号间过渡（避免之前的共振峰破坏问题）。没有找到合适的频域算法，打算自己研究【压力山大。。。

音源库的话，因为反工ddb已经证明采样率只有单声的44100HZ，所以。。。现在96000HZ的音源库可以缩掉一倍多……

我刚学编程时被MFC的Hello world彻彻底底地吓到了，然后就对C++有心理阴影……于是我学了VB.Net……现在要转型成C++。。。还好CVE就是些纯算法类的东西，思想占的比重远高于语言……

另：理论上如果上述算法都能掌握的话。。。写出一个功能和Vocaloid相同，可以读vocaloid的ddb进行合成的东西也有可能呢……当然，都能掌握是很难的。。。。。。。

作者: rgwan 时间: 2013/6/3 15:10

VOCALOID的DDB就是大坑。为啥里面一堆F啊。
另外就是我准备写个水表软件，cvct(Cyber Voice Convert Tool)，隐式支持ddb to cdb。
这样以后就可以光明正大的用初音了。

作者: rgwan 时间: 2013/6/3 15:23

另外就是合成器部分前端变速后端TDPSM，原因就是因为我们需要GEN参数……

作者: Zleepwalking 时间: 2013/6/3 15:33

rgwan 发表于 2013/6/3 15:10
VOCALOID的DDB就是大坑。为啥里面一堆F啊。
另外就是我准备写个水表软件，cvct(Cyber Voice Convert Tool) ...

只有三个音调肿么办
另外发音记号表里一堆音ddb没有，主要是改参数合成出来的……还有奇葩的组合方法……

作者: rgwan 时间: 2013/6/3 15:44

本帖最后由 rgwan 于 2013/6/3 15:47 编辑

Zleepwalking 发表于 2013/6/3 15:33
只有三个音调肿么办
另外发音记号表里一堆音ddb没有，主要是改参数合成出来的……还有奇葩的组合方法…… ...

也来试试把。另外就是我们这个音源不能并入github的主线中。因为这个不是自由的(non-free)。可以另外提供地址下载。到时候找人献声吧。
我觉得我们能找到萝莉的可能性近似0.扒音源也有版权问题。最后我想了一个奇葩的办法。就是我和你献声。然后分析女声和男声的泛音，通过调整泛音的方式（比如变速）弄出女声……
另外就是CVCT除了做跨软件的转换（UTAU/NN/VOCALOID TO ROCALOID）以外，另外一个功能就是开发音源与发布音源的互转。
也就是合并cbv文件的能力。你原来也说cbv文件太多不好处理，我觉得可以等到重写完成引擎后开发cdb格式，开发的时候用零碎文件，然后调整到没有问题再打包出去。这样同样方便引擎调试。

作者: Zleepwalking 时间: 2013/6/3 17:21

rgwan 发表于 2013/6/3 15:44
也来试试把。另外就是我们这个音源不能并入github的主线中。因为这个不是自由的(non-free)。可以另外提供 ...

卧槽。。。。。。。。录音方法略凶残。。。被结结实实地恶心到了…………………………………………………………………………………………我会说我能找到萝莉么【你想多了= =
CVCT的功能应该仅是乐谱格式的转换，否则感觉很违背设计思想，应该另写一个CVDC（CyberVoice Database Conversion）用来合并+差分预压缩……

作者: rgwan 时间: 2013/6/3 18:12

Zleepwalking 发表于 2013/6/3 17:21
卧槽。。。。。。。。录音方法略凶残。。。被结结实实地恶心到了………………………………………………… ...

嗯。确实是这样。命名上有点混乱。
录音方法是有点恶心，调制泛音之类的原来我对很多分离出来的歌声都做过。包括变速和替换啥的。
不过你也听到哪个咕噜碳了，玩脱了的结果……
音源库得预先压缩。算法建议用bz2。压缩率高解起来巨快。
不过我觉得这仅仅在传送的时候用吧。到用户手里的文件最好别压缩。否则引擎还得内置bz2……

作者: rgwan 时间: 2013/6/3 18:14

关于音源的话，男性的你觉得我们合适不？
女性的如果找不到就去UTAU版转那些自由的UTAU音源……

欢迎光临 iVocaloid论坛 (http://bbs.ivocaloid.com/)