搜索

iVocaloid论坛

查看: 1090|回复: 0
打印 上一主题 下一主题

【算法】从共振峰上来看CVE(PSM)现在的问题 [复制链接]

Sleepwalking

我不是技术宅!

Lv.5-章鱼须

Rank: 5Rank: 5Rank: 5

0
9
0


UID: 111156
权限: 40
属性: 宇宙人
发帖: 201 (1精)
积分: 540
章鱼: 3
大葱: 14
茄子: 2688
注册:2012/8/18
存在感:476
跳转到指定楼层
[1L]楼主
Zleepwalking 发表于 2013/6/11 09:30:36 |只看该作者 |倒序浏览
尽管在QQ群上讨论过,我觉得还是专门拿出来讨论比较好。这是测试的两段音频:

http://pan.baidu.com/share/link?shareid=251992952&uk=3423845838


ai(PSM)是用CVE过渡的a -> i
ai(Praat)使用Praat的VowelEditor过渡的a -> i,如图:
VE.png

用Praat打开Praat合成的a -> i:
Praat_VE.png
基本上就是F1下移,F2上移。

用Praat打开CVE合成的a -> i:
Praat_CVE.png
先不说F2没了的问题。。这两条线根本就没连上…………造成了av595252中所说的ai很奇怪的问题【虽然我用的是a -> e

我再试了一下Goldwave的频谱图,这是Praat:
GW_VE.PNG
这下可以很清楚地看到F1 F2是往两边分开的,也可以说是减弱了原来的F1 F2。

这是CVE(PSM):
GW_CVE.PNG
尽管PSM的频域特性也是把F1 F2往两边分开,但你可以看到它和Praat分开的方式不一样:
Praat先减弱F1F2中间的部分,再慢慢波及到F1F2周围
而PSM几乎是按权减弱整块区域,相当于把两个频谱按权平均……跟它的时域特性一样……【倒是说明了TDPSMStudio的拆帧方式挺不错……

知识共享许可协议 除非另有声明,本帖内容采用 署名-非商业-相同方式共享 3.0 许可协议 授权,且需注明出处,所有权利归发帖人。

使用道具 举报

您需要登录后才可以回帖 登录 | 注册/sign up

申请友链|Archiver|iVocaloid - 自由,开放,合作,共享    | 版权持有者点击这里进行举报

GMT+8, 2025/6/7 16:06

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部