iVocaloid论坛

标题: 【合成引擎】CVE3结构图出炉(手机流量党退散……) [打印本页]

作者: Zleepwalking    时间: 2013/8/29 18:22     标题: 【合成引擎】CVE3结构图出炉(手机流量党退散……)

本帖最后由 Zleepwalking 于 2013/8/29 18:27 编辑

CVE3.png
图片尺寸貌似略大,不知道能不能显示出来。
另外这张图是CVE项目的一部分,使用GPLv3授权。本帖下方 署名-非商业-相同方式共享 3.0 许可协议 无效。


图片附件: CVE3.png (2013/8/29 18:22, 324.07 KB) / 下载次数 22
http://bbs.ivocaloid.com/forum.php?mod=attachment&aid=NzMyODR8YmYxZWEyMTh8MTc1MzQ1NDgxOXwwfDA%3D


作者: lazydog    时间: 2013/8/29 19:20

个人觉得,花流量看这图也不亏~
作者: tuxzz    时间: 2013/9/1 18:23

IFFT点数感觉有点小,4096差不多吧
作者: Zleepwalking    时间: 2013/9/1 18:51

tuxzz 发表于 2013/9/1 18:23
IFFT点数感觉有点小,4096差不多吧

4096太大了,速度慢成渣,4096大小的窗失去了语音的短时特性故质量反而会差。
Vocaloid用的是2048.
CVEDSP在2048点下有速度优势。经测试1024和2048的质量差别在事先不知道点数的情况下几乎无法分辨。
1024能支持的最低频率是86Hz,实际会出现的最低频率是130Hz(C2),够用。




欢迎光临 iVocaloid论坛 (http://bbs.ivocaloid.com/) Powered by Discuz! X2