查看: 2191|回复: 7

【暂定】开源以后大致的开发路线 [复制链接]

Sleepwalking

我不是技术宅！

Lv.5-章鱼须

Rank: 5 Rank: 5 Rank: 5

0

9

0

UID: 111156
权限: 40
属性: 宇宙人
发帖: 201 (1精)
积分: 540
章鱼: 3
大葱: 14
茄子: 2688
注册:2012/8/18
存在感:476

电梯直达

[1L]楼主

Zleepwalking 发表于 2013/6/1 23:39:03 |只看该作者 |倒序浏览

本帖最后由 Zleepwalking 于 2013/6/1 23:45 编辑

今天晚上进行了一些讨论，结论汇总于此：
暑假将重写整个项目（也许除了TDPSMStudio等工具软件吧）
使用语言两套方案：
1. C（文件读写、底层调用）+FreeBasic（算法，CVE，CVSCommon，RSCCommon）+ [C + WXWidget（GUI）]
2. C++, WXWidget全包
开发平台放在Linux上，然后到Windows上做移植，反正WXWidget跨平台。
CVE的算法将重写。
TDPSM仍被使用。TDPSOLA因为没法处理好过渡被否决了。
EFB-GW同样因为没法过渡也被否决了。
反正变调会伤音质，干脆还是用TDPSM变调。
最后合成器方案变成：
经过TDPSM拉伸、变调后用频域算法在发音记号间过渡（避免之前的共振峰破坏问题）。没有找到合适的频域算法，打算自己研究【压力山大。。。

音源库的话，因为反工ddb已经证明采样率只有单声的44100HZ，所以。。。现在96000HZ的音源库可以缩掉一倍多……

我刚学编程时被MFC的Hello world彻彻底底地吓到了，然后就对C++有心理阴影……于是我学了VB.Net……现在要转型成C++。。。还好CVE就是些纯算法类的东西，思想占的比重远高于语言……

另：理论上如果上述算法都能掌握的话。。。写出一个功能和Vocaloid相同，可以读vocaloid的ddb进行合成的东西也有可能呢……当然，都能掌握是很难的。。。。。。。

收藏0

除非另有声明，本帖内容采用署名-非商业-相同方式共享 3.0 许可协议授权,且需注明出处,所有权利归发帖人。

使用道具举报

=\=

Lv.3-章鱼烧

Rank: 3

0

3

0

UID: 93325
权限: 20
属性: 難燃性
发帖: 74 (0精)
积分: 100
章鱼: 1
大葱: 2
茄子: 433
注册:2011/10/22
存在感:84

[2L]沙发

rgwan 发表于 2013/6/3 15:10:03 |只看该作者

VOCALOID的DDB就是大坑。为啥里面一堆F啊。
另外就是我准备写个水表软件，cvct(Cyber Voice Convert Tool)，隐式支持ddb to cdb。
这样以后就可以光明正大的用初音了。

使用道具举报

=\=

Lv.3-章鱼烧

Rank: 3

0

3

0

UID: 93325
权限: 20
属性: 難燃性
发帖: 74 (0精)
积分: 100
章鱼: 1
大葱: 2
茄子: 433
注册:2011/10/22
存在感:84

[3L]板凳

rgwan 发表于 2013/6/3 15:23:52 |只看该作者

另外就是合成器部分前端变速后端TDPSM，原因就是因为我们需要GEN参数……

使用道具举报

Sleepwalking

我不是技术宅！

Lv.5-章鱼须

Rank: 5 Rank: 5 Rank: 5

0

9

0

UID: 111156
权限: 40
属性: 宇宙人
发帖: 201 (1精)
积分: 540
章鱼: 3
大葱: 14
茄子: 2688
注册:2012/8/18
存在感:476

[4L]地板

Zleepwalking 发表于 2013/6/3 15:33:15 |只看该作者

rgwan 发表于 2013/6/3 15:10
VOCALOID的DDB就是大坑。为啥里面一堆F啊。
另外就是我准备写个水表软件，cvct(Cyber Voice Convert Tool) ...

只有三个音调肿么办
另外发音记号表里一堆音ddb没有，主要是改参数合成出来的……还有奇葩的组合方法……

使用道具举报

=\=

Lv.3-章鱼烧

Rank: 3

0

3

0

UID: 93325
权限: 20
属性: 難燃性
发帖: 74 (0精)
积分: 100
章鱼: 1
大葱: 2
茄子: 433
注册:2011/10/22
存在感:84

[5L]萝莉

rgwan 发表于 2013/6/3 15:44:13 |只看该作者

本帖最后由 rgwan 于 2013/6/3 15:47 编辑

Zleepwalking 发表于 2013/6/3 15:33
只有三个音调肿么办
另外发音记号表里一堆音ddb没有，主要是改参数合成出来的……还有奇葩的组合方法…… ...

也来试试把。另外就是我们这个音源不能并入github的主线中。因为这个不是自由的(non-free)。可以另外提供地址下载。到时候找人献声吧。
我觉得我们能找到萝莉的可能性近似0.扒音源也有版权问题。最后我想了一个奇葩的办法。就是我和你献声。然后分析女声和男声的泛音，通过调整泛音的方式（比如变速）弄出女声……
另外就是CVCT除了做跨软件的转换（UTAU/NN/VOCALOID TO ROCALOID）以外，另外一个功能就是开发音源与发布音源的互转。
也就是合并cbv文件的能力。你原来也说cbv文件太多不好处理，我觉得可以等到重写完成引擎后开发cdb格式，开发的时候用零碎文件，然后调整到没有问题再打包出去。这样同样方便引擎调试。

使用道具举报

Sleepwalking

我不是技术宅！

Lv.5-章鱼须

Rank: 5 Rank: 5 Rank: 5

0

9

0

UID: 111156
权限: 40
属性: 宇宙人
发帖: 201 (1精)
积分: 540
章鱼: 3
大葱: 14
茄子: 2688
注册:2012/8/18
存在感:476

⑥

Zleepwalking 发表于 2013/6/3 17:21:56 |只看该作者

rgwan 发表于 2013/6/3 15:44
也来试试把。另外就是我们这个音源不能并入github的主线中。因为这个不是自由的(non-free)。可以另外提供 ...

卧槽。。。。。。。。录音方法略凶残。。。被结结实实地恶心到了…………………………………………………………………………………………我会说我能找到萝莉么【你想多了= =
CVCT的功能应该仅是乐谱格式的转换，否则感觉很违背设计思想，应该另写一个CVDC（CyberVoice Database Conversion）用来合并+差分预压缩……

使用道具举报

=\=

Lv.3-章鱼烧

Rank: 3

0

3

0

UID: 93325
权限: 20
属性: 難燃性
发帖: 74 (0精)
积分: 100
章鱼: 1
大葱: 2
茄子: 433
注册:2011/10/22
存在感:84

[7L]大姐姐

rgwan 发表于 2013/6/3 18:12:09 |只看该作者

Zleepwalking 发表于 2013/6/3 17:21
卧槽。。。。。。。。录音方法略凶残。。。被结结实实地恶心到了………………………………………………… ...

嗯。确实是这样。命名上有点混乱。
录音方法是有点恶心，调制泛音之类的原来我对很多分离出来的歌声都做过。包括变速和替换啥的。
不过你也听到哪个咕噜碳了，玩脱了的结果……
音源库得预先压缩。算法建议用bz2。压缩率高解起来巨快。
不过我觉得这仅仅在传送的时候用吧。到用户手里的文件最好别压缩。否则引擎还得内置bz2……

使用道具举报