iVocaloid论坛

标题: 【暂定】开源以后大致的开发路线 [打印本页]

作者: Zleepwalking    时间: 2013/6/1 23:39     标题: 【暂定】开源以后大致的开发路线

本帖最后由 Zleepwalking 于 2013/6/1 23:45 编辑

今天晚上进行了一些讨论,结论汇总于此:
暑假将重写整个项目(也许除了TDPSMStudio等工具软件吧)
使用语言两套方案:
1. C(文件读写、底层调用)+FreeBasic(算法,CVE,CVSCommon,RSCCommon)+ [C + WXWidget(GUI)]
2. C++, WXWidget全包
开发平台放在Linux上,然后到Windows上做移植,反正WXWidget跨平台。
CVE的算法将重写。
TDPSM仍被使用。TDPSOLA因为没法处理好过渡被否决了。
EFB-GW同样因为没法过渡也被否决了。
反正变调会伤音质,干脆还是用TDPSM变调。
最后合成器方案变成:
经过TDPSM拉伸、变调后用频域算法在发音记号间过渡(避免之前的共振峰破坏问题)。没有找到合适的频域算法,打算自己研究【压力山大。。。


音源库的话,因为反工ddb已经证明采样率只有单声的44100HZ,所以。。。现在96000HZ的音源库可以缩掉一倍多……

我刚学编程时被MFC的Hello world彻彻底底地吓到了,然后就对C++有心理阴影……于是我学了VB.Net……现在要转型成C++。。。还好CVE就是些纯算法类的东西,思想占的比重远高于语言……


另:理论上如果上述算法都能掌握的话。。。写出一个功能和Vocaloid相同,可以读vocaloid的ddb进行合成的东西也有可能呢……当然,都能掌握是很难的。。。。。。。



作者: rgwan    时间: 2013/6/3 15:10

VOCALOID的DDB就是大坑。为啥里面一堆F啊。
另外就是我准备写个水表软件,cvct(Cyber Voice Convert Tool),隐式支持ddb to cdb。
这样以后就可以光明正大的用初音了。
作者: rgwan    时间: 2013/6/3 15:23

另外就是合成器部分前端变速后端TDPSM,原因就是因为我们需要GEN参数……
作者: Zleepwalking    时间: 2013/6/3 15:33

rgwan 发表于 2013/6/3 15:10
VOCALOID的DDB就是大坑。为啥里面一堆F啊。
另外就是我准备写个水表软件,cvct(Cyber Voice Convert Tool) ...

只有三个音调肿么办
另外发音记号表里一堆音ddb没有,主要是改参数合成出来的……还有奇葩的组合方法……
作者: rgwan    时间: 2013/6/3 15:44

本帖最后由 rgwan 于 2013/6/3 15:47 编辑
Zleepwalking 发表于 2013/6/3 15:33
只有三个音调肿么办
另外发音记号表里一堆音ddb没有,主要是改参数合成出来的……还有奇葩的组合方法…… ...


也来试试把。另外就是我们这个音源不能并入github的主线中。因为这个不是自由的(non-free)。可以另外提供地址下载。到时候找人献声吧。
我觉得我们能找到萝莉的可能性近似0.扒音源也有版权问题。最后我想了一个奇葩的办法。就是我和你献声。然后分析女声和男声的泛音,通过调整泛音的方式(比如变速)弄出女声……
另外就是CVCT除了做跨软件的转换(UTAU/NN/VOCALOID TO ROCALOID)以外,另外一个功能就是开发音源与发布音源的互转。
也就是合并cbv文件的能力。你原来也说cbv文件太多不好处理,我觉得可以等到重写完成引擎后开发cdb格式,开发的时候用零碎文件,然后调整到没有问题再打包出去。这样同样方便引擎调试。

作者: Zleepwalking    时间: 2013/6/3 17:21

rgwan 发表于 2013/6/3 15:44
也来试试把。另外就是我们这个音源不能并入github的主线中。因为这个不是自由的(non-free)。可以另外提供 ...

卧槽。。。。。。。。录音方法略凶残。。。被结结实实地恶心到了…………………………………………………………………………………………我会说我能找到萝莉么【你想多了= =
CVCT的功能应该仅是乐谱格式的转换,否则感觉很违背设计思想,应该另写一个CVDC(CyberVoice Database Conversion)用来合并+差分预压缩……
作者: rgwan    时间: 2013/6/3 18:12

Zleepwalking 发表于 2013/6/3 17:21
卧槽。。。。。。。。录音方法略凶残。。。被结结实实地恶心到了………………………………………………… ...

嗯。确实是这样。命名上有点混乱。
录音方法是有点恶心,调制泛音之类的原来我对很多分离出来的歌声都做过。包括变速和替换啥的。
不过你也听到哪个咕噜碳了,玩脱了的结果……
音源库得预先压缩。算法建议用bz2。压缩率高解起来巨快。
不过我觉得这仅仅在传送的时候用吧。到用户手里的文件最好别压缩。否则引擎还得内置bz2……
作者: rgwan    时间: 2013/6/3 18:14

关于音源的话,男性的你觉得我们合适不?
女性的如果找不到就去UTAU版转那些自由的UTAU音源……




欢迎光临 iVocaloid论坛 (http://bbs.ivocaloid.com/) Powered by Discuz! X2