西西河

主题:【原创】科学的欣赏流行乐 -- 比的原理

共:💬309 🌺1010 🌵31 新:
全看分页树展 · 主题 跟帖
家园 我来说说吧

1,我看了楼主的文章以及博客,显然,楼主是长期在百度贴吧跟声乐发烧友、歌迷探讨过声乐问题的。而且我可以肯定,楼主是在2005年后开始关注用“科学方法”和音频软件来分析歌唱这个课题的,确切的说,是在超女张靓颖唱出第一声海豚音之后。

2,看了楼主的文字以及跟beech的争论,其实问题主要出在:什么是基频,什么是泛音,选定基频和泛音的标准是什么?

3,beech最核心的是这段质问:

他的主要问题是,所说的“基频”、“泛音”的概念完全都是错的。他的“基频”根本不是主音调的真正基频,泛音也不是泛音。他只是任意找了个低频点指定为“基频”,然后以此频率的倍频取样时间波形,把它称为“泛音”,你要是学过信号分析,应该知道,有这样胡乱定义的吗?你见过泛音幅度都比基频大的所谓频谱吗?他的图里都是这样!

4,我对信号分析所知也不多,不过倒是关注到楼主帖中一个显而易见的问题,我不知道楼主会不会弹琴,楼主说男声High C 是中央C以上一个八度(小子二组的c,用c2表示),女声是两个(用c3表示),并说男声的High C是大约523Hz。实际上我想楼主也很清楚,在百度贴吧里关于这个问题一直有争论,有的人说男声High C是c2(523Hz),有的说c3(1046Hz),甚至很多“专业”分析对此也不统一。其实最简单的方法是在钢琴上验证一下。比如播放帕瓦罗蒂《军中女郎》中的那9个High C,同时在钢琴上敲击c2和c3,只要听觉不是太有问题,相同音高和八度音还是很容易分辨的。

5,实际上楼主的博客里也有相关的东西,外链出处这个帖子里有楼主用音频分析软件把楼主认为的“基频”和“泛音”一段段滤出来单独比较的视频。我不知道楼主听出来没有,你滤出的“基频”听上去怪怪的,嗡嗡响,而且明显偏低。帕瓦罗蒂的两段演唱还不明显,姚贝娜的几段就很明显,“基频”明明比正常歌声里的音高低了一个八度。

6,当然,楼主可以认为,人耳对泛音更敏感很正常,就像此贴说的

第一泛音经常是最强的。

实际上根据傅里叶分析的基本原理,基频的振幅肯定是最强的,第二谐波(即楼主认为的“第一泛音”)怎么也不可能凌驾于基频之上。那么就只有两种解释,一是楼主所使用的音频分析,实际上并不是傅里叶展开,二是,这个所谓的“基频”并不是楼主所认为的基频。这也就是beech所质疑的两点。

那么说说我的观点:我认为男声High C是c3(1046Hz),实际上以前我也专门开过帖子讲过这个问题:声乐漫谈:那些让人印象深刻的高音们

我判定的依据很简单,就是在钢琴上弹出c3,然后播放男高音的声乐片段,(比如帕氏的《军中女郎》),用听觉做判断。而且我敢肯定很多在网上争论这个问题的人,都没有亲自做过这个最简单的实验。那么怎么解释楼主的频谱图呢?

我自己做了一个实验,用音频分析软件(名字暂时不说)截取相关频段的声音,用听觉辨别哪个频率跟人耳正常听到的歌声更接近。这是帕氏《军中女郎》“多么美好的一天”中最后一个High C的瞬时频谱图:

点看全图

外链图片需谨慎,可能会被源头改

可以看到,在0.54KHz左右确实有一个比较明显的峰,可是这个峰却明显的小于“第一泛音”,更小于“第二泛音”。但我们并不能单纯的判定,对人耳而言的“音高”最重要的就是这个基频,因为如果最低的声音是判定音高的依据的话,那么一首歌里最容易让人辨别的应该是贝斯。而事实上大多数人都会忽略贝斯。

当然更可靠地方法是用软件过滤,我用的软件有一个很方便的功能,可以任意截取某一频段的声音。如图,我截取了0.5-0.6KHz,1.0-1.1KHz,1.5-1.7KHz三段声音,对频段外的做30dB衰减,并试听10秒。

点看全图

外链图片需谨慎,可能会被源头改

实际上这样处理也不能完全去掉高频声音的影响,如同楼主的视频呈现的。大致听来,0.5-0.6KHz听起来像蚊子哼,1.0-1.1KHz最接近正常的歌唱,1.5-1.7KHz听起来像蜜蜂的声音。不知哪里有可以上传音频的,不然我可以将三段音频传上去大家自己比较。

相比较而言,我还是相信自己的听觉,男声High C是c3。至于楼主所认为的“基频”,首先,我肯定这个基频是客观存在的,但它对人耳的听觉贡献,更重要的是对音高的辨识到底起到什么样的作用,恐怕并不像楼主或很多声乐爱好者所认为的那样,“基频”,或者所谓的“基音”最重要,或者说,判定基频的方式并不是像楼主所说的那样,找出一个最低的尖峰,说这就是基频。实际上就拿我上传的图而言,在0.54KHz这个“基频”以下,分明还有几个“小尖峰”存在,凭什么说它不是基频呢?

所以我认为beech的质疑是有道理的,问题在于:人声并不是一个简单的周期信号(哪怕是截取一小段时间,其中的波形近似周期信号),而是若干个周期/非周期信号相互叠加的、并经过声道选择性过滤/放大后的声音信号,这里面固然可以分离出有若干个近似倍频的尖峰存在的频谱,但那是若干个信号叠加后并放大得到的一个连续谱,跟对一个周期信号用傅里叶变换得出的频谱是两个概念。因此,所谓的“基频”并不是基频,只是若干个信号叠加后在某个低频段形成的能量尖峰,并且它对人耳对音高的识别并不起决定作用。真正的“基频”(如果有的话)应该是楼主所认为的“第一泛音”,这也是为什么很多软件测试音频楼主都认为高了一个八度。

其实关于人声,科学发声,人耳对音响的识别,很多问题还在探讨当中,声学上也建立了若干学说,并没有一个统一的定论。楼主或网友如若感兴趣,可以就这个话题继续探讨,这里只提出自己的一点疑问。先说这么多。

通宝推:铁手,陈王奋起,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河