iVocaloid论坛

标题: [搬运][科普]初音ミク的“基因图谱”——频谱 [打印本页]

作者: DarkueRaii 时间: 2010/7/7 16:27 标题: [搬运][科普]初音ミク的“基因图谱”——频谱

本帖最后由 DarkueRaii 于 2010-7-7 16:34 编辑

整理,转载自百度初音ミク吧 .
这个纯粹是普及知识.虽然这边可能都知道或者...是初心者向?我不清楚...只是活动应援...

频谱是什么？它与声音的波形有什么关系？它和声音本身又有什么关系？
我不知道，我不是技术宅。
抄答案一样复制解释如下：“复杂振荡分解为振幅不同和频率不同的谐振荡，这些谐振荡的幅值按频率排列的的图形叫做频谱。”
我纯粹是误打误撞地进入频谱的广阔空间，并且偶然地发现了一些小东西……

P.S.此图为防盗链的截图,可能达不到所述效果.
（WAV是无损音频格式，这在其频谱上得到了很好的体现。）
有Audition（CoolEdit）而且有兴趣的网友们可以进行如下实验：把上图复制并以BMP格式保存在您的电脑上，并用Audition打开（直接用鼠标拖进去），然后播放。
怎样？听到了没？
这是初音ミク大人以“la”唱出do-re-mi-fa-sol-la-si-do（高）的声音！
现在，看看上图，最底下的、最连贯的一条直线，表明这些声音（C调音阶中的7个唱名以及一个高do）的频率是成直线状上升的。
现在有一张纸和一支笔——您一定知道平面直角坐标系对吧？假设我们用笔在纸上画出这么一个坐标系，x轴单位是时间，y轴单位是频率（0Hz~22000Hz），好，这就是一张空白的频谱图了。
不同的声音在频谱图上对应不同的点、直线、曲线、面积……然而这还不够，您所听到的声音还有响度（音量）大小的区别，对应成“电平”这种东西，在频谱图上的反映就是颜色的不同。
此外还有一些微不足道的东西：
1、看到那些波浪状的光带了吗？它们对应VOCALOID2里面的“颤音”选项的设定，所有歌手——不论真人还是虚拟——歌声的细节都在频谱中展现无遗；
2、在一般情况下，一首歌中一组水平线状的光带直接对应MIDI谱甚至五线谱上的一串音符，频谱绝对是“扒”谱利器——一般情况下；
3、还有最重要的一点
   数字音乐放大后看都是不连续的，是一系列点的合集
   模拟音乐放大后看，无论如何都是连续的
   将模拟音乐转化为数字音乐的过程叫做“采样”
   采样同样也有频率之分采样频率越高，越无限接近于原声。但是完全还原声是不可能的。

加以佐证：看似连续的音频也是由点点堆起来的！白色的选中部分（上面）好象没有空隙，但是放大以后（下面）就看出来不是连续的线，而是挨的很近的点……

关于“采样”：随便在一个MP3文件上单击右键，选择“属性”，在“摘要”（点选“高级”）栏里面把滚动条拖到最底下，一般会有一个“音频采样级别”，并且后跟“44kHz”——假如您看到“48kHz”什么的，那我向您这音乐发烧友致敬……
Hz是个单位，44kHz（其实是44101Hz）意味着每秒钟进行了44101次的“采样”——每秒钟！4万多次！记录的不仅是响度（电平），还有频率（又是频谱的事，呵呵），以及其他东西……

之所以我们会觉得V家软件的歌声和提供声源的人差很多，除了软件的人为修改。也是经过数字化转换的人声已经不同于由声带发出的声音造成的。再好的录音设备也无法真正做到把声音“原汁原味”地进行保存，一系列的传输、转换大大地降低了“无损”的可能性。

图片附件: 此图为截图可能无法达到原来效果.gif (2010/7/7 16:32, 668.05 KB) / 下载次数 233
http://bbs.ivocaloid.com/forum.php?mod=attachment&aid=MjkzNDB8MDllYjY5YTR8MTc4NDgyNDc3MHwwfDA%3D

图片附件: 0.gif (2010/7/7 16:33, 735.63 KB) / 下载次数 216
http://bbs.ivocaloid.com/forum.php?mod=attachment&aid=MjkzNDF8OGExYzg2ZDV8MTc4NDgyNDc3MHwwfDA%3D

作者: 薰治丽香 时间: 2010/7/7 17:47

………………
好吧我知道零歌的声音为什么不像我了

作者: bainuly 时间: 2010/7/7 18:14

又长知识了，感谢~

作者: HatsuneMio 时间: 2010/7/8 00:00

基础知识扫盲>.<于是在这里继续编辑吧~差不多了丢高阶补分~~

作者: DarkueRaii 时间: 2010/7/9 19:21

我想说这就完结了= =
只是为活动应援一下,分什么的嘛

作者: Doream 时间: 2010/7/10 17:20

估计产业技术综合研究所喜欢研究这些玩意。拿初音的频谱模拟人声的频谱，不是一件容易事呢。

作者: cxm 时间: 2010/7/10 21:32

本帖最后由 cxm 于 2010-7-10 21:37 编辑

估计产业技术综合研究所喜欢研究这些玩意。拿初音的频谱模拟人声的频谱，不是一件容易事呢。 ...
Doream 发表于 2010-7-10 17:20

Vocalistener吧

另外改变音高都存在无损，而且Vocaloid还拉伸了音频长度，无损基本上不可能
现在的软件都不可能做到100%无损来处理音频，不过可以接近无损（Autotune evo）

另外Vocaloid只是一个合成软件╮(╯▽╰)╭只能无限接近人类而不能超越人类
╮(╯▽╰)╭相比UTAU啊，Melodyne来讲啊已经很不错了
另外合成软件都是以公式来计算的，所以说合成的声音都具有规律性，机械化，单一
不过合成软件有一个优点，就是能达到人类不能达到的完美和人类不能达到的绝对音域

作者: cxm 时间: 2010/7/10 21:39

╮(╯▽╰)╭我觉得更像人声音的话声音因素变量取值应该在一定的区间内取随机数效果会更好

作者: cxm 时间: 2010/7/10 21:40

╮(╯▽╰)╭我觉得更像人声音的话声音因素变量取值应该在一定的区间内取随机数效果会更好

欢迎光临 iVocaloid论坛 (http://bbs.ivocaloid.com/)