搜索

iVocaloid论坛

查看: 1674|回复: 5
打印 上一主题 下一主题

【发音词典】CDT3音源映射结构 [复制链接]

Sleepwalking

我不是技术宅!

Lv.5-章鱼须

Rank: 5Rank: 5Rank: 5

0
9
0


UID: 111156
权限: 40
属性: 宇宙人
发帖: 201 (1精)
积分: 540
章鱼: 3
大葱: 14
茄子: 2688
注册:2012/8/18
存在感:476
跳转到指定楼层
[1L]楼主
Zleepwalking 发表于 2013/8/27 20:43:55 |只看该作者 |倒序浏览
算法灵活性上的提升使我们需要用更强大的发音词典数据结构。
于是,这是CDT3的音源文件映射结构。
定义这种结构的目的是用少数音源库文件,结合共振峰修改和变调,填补掉整张汉语拼音表。
如下图,使用a\o\u三个拼音分别在C3\F#3\C4的共9个采样,扩展出了所有a e i o u元音。
CDT3MappingStructureExample.png
另外类似的技术也可应用在Utau音源。想象一下一个汉语整音音源只用录几十个wav是件多爽的事!

知识共享许可协议 除非另有声明,本帖内容采用 署名-非商业-相同方式共享 3.0 许可协议 授权,且需注明出处,所有权利归发帖人。

使用道具 举报

Rank: 6Rank: 6

0
78
0


UID: 93805
权限: 50
属性: 2.5次元
发帖: 872 (1精)
积分: 1808
章鱼: 23
大葱: 78
茄子: 5595
注册:2011/10/30
存在感:747

创作者 茄子饲养者 讨人喜欢的家伙 Gumiの爱 发帖达人 创作达人

[2L]沙发
D-Bood 发表于 2013/8/28 10:52:54 -手机频道 |只看该作者
本帖最后由 D-Bood 于 2013/8/28 10:54 编辑

但是这样做对于原音的还原度是否有影响?

使用道具 举报

Rank: 4Rank: 4

0
29
0


UID: 112484
权限: 30
属性: 不明
发帖: 142 (0精)
积分: 361
章鱼: 6
大葱: 6
茄子: 1451
注册:2012/11/3
存在感:117
[3L]板凳
lazydog 发表于 2013/8/28 16:13:58 |只看该作者
还有一个v(ü)呢?(滚
好吧我自重,而且每次听ai都会听成え怎么破?
1

查看全部评分

使用道具 举报

Rank: 4Rank: 4

0
29
0


UID: 112484
权限: 30
属性: 不明
发帖: 142 (0精)
积分: 361
章鱼: 6
大葱: 6
茄子: 1451
注册:2012/11/3
存在感:117
[4L]地板
lazydog 发表于 2013/8/28 18:38:10 |只看该作者
本帖最后由 lazydog 于 2013/8/28 18:40 编辑
lazydog 发表于 2013/8/28 16:13
还有一个v(ü)呢?(滚
好吧我自重,而且每次听ai都会听成え怎么破?

诶诶诶?我说的是拼音……比如“绿”(lü)什么的,那个没有吧wwwww还有开(kai)什么的都听成け(ke)什么的,是我的问题吗wwww

使用道具 举报

Rank: 6Rank: 6

0
78
0


UID: 93805
权限: 50
属性: 2.5次元
发帖: 872 (1精)
积分: 1808
章鱼: 23
大葱: 78
茄子: 5595
注册:2011/10/30
存在感:747

创作者 茄子饲养者 讨人喜欢的家伙 Gumiの爱 发帖达人 创作达人

[5L]萝莉
D-Bood 发表于 2013/8/28 21:43:43 -手机频道 |只看该作者
lazydog 发表于 2013/8/28 18:38 诶诶诶?我说的是拼音……比如“绿”(lü)什么的,那个没有吧wwwww还有开(kai)什么的都听成け(ke)什么 ...
这应该就是共振峰的局限了吧...

使用道具 举报

Sleepwalking

我不是技术宅!

Lv.5-章鱼须

Rank: 5Rank: 5Rank: 5

0
9
0


UID: 111156
权限: 40
属性: 宇宙人
发帖: 201 (1精)
积分: 540
章鱼: 3
大葱: 14
茄子: 2688
注册:2012/8/18
存在感:476
Zleepwalking 发表于 2013/8/28 23:32:58 |只看该作者
lazydog 发表于 2013/8/28 16:13
还有一个v(ü)呢?(滚
好吧我自重,而且每次听ai都会听成え怎么破?

上图只是个例子,其他发音可以照此增加上去。不过我的确是忘了v\ri\zi
ai其实和罗马音e的发音是不同的。ai是个a->i的过渡状态,和e的确是比较接近。
2L:
如果整个音库只用几个文件制成起来的话,肯定会毁爆的……
填得越多,质量就越高。

使用道具 举报

您需要登录后才可以回帖 登录 | 注册/sign up

申请友链|Archiver|iVocaloid - 自由,开放,合作,共享    | 版权持有者点击这里进行举报

GMT+8, 2025/6/7 16:46

Powered by Discuz! X2

© 2001-2011 Comsenz Inc.

回顶部