搜索

iVocaloid论坛

查看: 1572|回复: 1
打印 上一主题 下一主题

【ANN】用SOFM把一些元音聚类到一张表上 [复制链接]

Sleepwalking

我不是技术宅!

Lv.5-章鱼须

Rank: 5Rank: 5Rank: 5

0
9
0


UID: 111156
权限: 40
属性: 宇宙人
发帖: 201 (1精)
积分: 540
章鱼: 3
大葱: 14
茄子: 2688
注册:2012/8/18
存在感:476
跳转到指定楼层
[1L]楼主
Zleepwalking 发表于 2013/10/3 15:43:23 |只看该作者 |倒序浏览
本帖最后由 Zleepwalking 于 2013/10/3 15:44 编辑

依据的特性是LPC谱。把几个元音打到一张10*10的图上,如下:
chart.png
本来按照书上写的先归一化再依据最大点积判断胜出的节点,修改权值。实际操作发现这会导致第一个被识别为胜出的节点始终胜出,最后无论什么输入都被聚为一类……于是我把归一化删了直接计算欧式距离。
LVQ/SOFM识别频谱包络效果并不理想,感觉自组织竞争式网络对咱用途不大……




我不能确定是不是我误解了书的意思,程序已贴GH.
github.com/Sleepwalking/CVEANN


知识共享许可协议 除非另有声明,本帖内容采用 署名-非商业-相同方式共享 3.0 许可协议 授权,且需注明出处,所有权利归发帖人。

使用道具 举报

Sleepwalking

我不是技术宅!

Lv.5-章鱼须

Rank: 5Rank: 5Rank: 5

0
9
0


UID: 111156
权限: 40
属性: 宇宙人
发帖: 201 (1精)
积分: 540
章鱼: 3
大葱: 14
茄子: 2688
注册:2012/8/18
存在感:476
[2L]沙发
Zleepwalking 发表于 2013/10/4 20:01:35 |只看该作者
用SOFM把a的各种音高下的频谱特征打到一张图上:
2013-10-04 19:58:05的屏幕截图.png

可以看到以D3、D4为分界线,分出了低中高频端。其中低频(<=D3)极为明显:
2013-10-04 20:00:13的屏幕截图.png

注意这是只提供了LPC频谱包络,没有告知音高下网络进行的聚类。
由此可推断出D3以下和D3以上的发音的频谱有很大差别,识别时需要按频率(D3)分开处理。

使用道具 举报

您需要登录后才可以回帖 登录 | 注册/sign up

申请友链|Archiver|iVocaloid - 自由,开放,合作,共享    | 版权持有者点击这里进行举报

GMT+8, 2025/6/7 16:53

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部