iVocaloid论坛

标题: 【ANN】用SOFM把一些元音聚类到一张表上 [打印本页]

作者: Zleepwalking    时间: 2013/10/3 15:43     标题: 【ANN】用SOFM把一些元音聚类到一张表上

本帖最后由 Zleepwalking 于 2013/10/3 15:44 编辑

依据的特性是LPC谱。把几个元音打到一张10*10的图上,如下:
chart.png
本来按照书上写的先归一化再依据最大点积判断胜出的节点,修改权值。实际操作发现这会导致第一个被识别为胜出的节点始终胜出,最后无论什么输入都被聚为一类……于是我把归一化删了直接计算欧式距离。
LVQ/SOFM识别频谱包络效果并不理想,感觉自组织竞争式网络对咱用途不大……




我不能确定是不是我误解了书的意思,程序已贴GH.
github.com/Sleepwalking/CVEANN



图片附件: chart.png (2013/10/3 15:36, 16.21 KB) / 下载次数 2
http://bbs.ivocaloid.com/forum.php?mod=attachment&aid=NzM1MDl8YmNiZmYzOTV8MTc0OTQ4MDA1M3wwfDA%3D


作者: Zleepwalking    时间: 2013/10/4 20:01

用SOFM把a的各种音高下的频谱特征打到一张图上:
2013-10-04 19:58:05的屏幕截图.png

可以看到以D3、D4为分界线,分出了低中高频端。其中低频(<=D3)极为明显:
2013-10-04 20:00:13的屏幕截图.png

注意这是只提供了LPC频谱包络,没有告知音高下网络进行的聚类。
由此可推断出D3以下和D3以上的发音的频谱有很大差别,识别时需要按频率(D3)分开处理。

图片附件: 2013-10-04 20:00:13的屏幕截图.png (2013/10/4 19:59, 20.22 KB) / 下载次数 2
http://bbs.ivocaloid.com/forum.php?mod=attachment&aid=NzM1MTh8NDQ4NzhmMDd8MTc0OTQ4MDA1M3wwfDA%3D



图片附件: 2013-10-04 19:58:05的屏幕截图.png (2013/10/4 19:57, 13.94 KB) / 下载次数 2
http://bbs.ivocaloid.com/forum.php?mod=attachment&aid=NzM1MTd8ZmI0OTFkYzR8MTc0OTQ4MDA1M3wwfDA%3D






欢迎光临 iVocaloid论坛 (http://bbs.ivocaloid.com/) Powered by Discuz! X2