BK声学与振动 发表于 2023-3-23 15:38

王博聊声学 | 音频感知的主观属性

本帖最后由 BK声学与振动 于 2023-3-23 15:41 编辑


https://pica.zhimg.com/80/v2-79c919d3ea4905bb97ed22b23ea09353_720w.png?source=d16d100b
王博说

在智能音频时代,音频技术的发展突飞猛进,新功能、新产品和新的应用场景不断涌现,如何从主观和客观角度评价音频品质,成为人们日益关注的焦点。HBK在音频领域拥有全球领先的产品方案和深厚的技术背景及工程经验,我们将从音频感知的主观属性、评价方法、客观参数测量等方面与大家共同探讨技术挑战以及HBK的解决方案。


对于音频的主观感知,早期,人们主要关注于音色属性,即以同样方式呈现出来的两个声音,具有相同的响度和音调,但人们可以区分出这两个声音,这种听觉感知属性就是音色。比如声音的清楚/明晰、明亮/黑暗、饱满/单薄、坚硬/柔和、响亮等感觉。

后来引入了空间属性,比如1985年Toole Floyd E在评价扬声器立体声重放时,使用了声像在舞台的连续性、宽度、距离或深度等属性。1989年Letowski建立了多级评价模型,首先将主观品质分为音色和空间两大类,然后再细分对应的子属性。现在人们在评价空间感时,一般从感知声源宽度ASW、听众包围感LEV和空间大小等方面进行评价。

随着人们对主观听感的要求越来越高,最近二十年里出现了几十种描述声音的主观属性,细致地评价声音的不同感受。除了音色和空间感以外,人们还关注杂音、噪声、失真和干扰等音质缺陷。




ITU标准

为了对音频的主观评价做出规范,ITU推出了一系列相关标准:


[*]ITU-R BS. 1116描述了小损伤音频系统的主观评价方法,针对不同的音频系统,给出了主要的主观属性,如下表1。
[*]表1 ITU-R BS.1116定义的主观属性

https://picx.zhimg.com/80/v2-2a6ac9aae0c5b22bb0cf330ec148405f_720w.png?source=d16d100b

ITU-R BS. 1116给出的主观属性还是非常有限的,在此基础上,ITU-R BS. 1284-2给出了音频声品质的一般评价方法,并列出了7类主观属性以及子属性,如下表2。
表2 ITU-R BS. 1284-2定义的主观属性
https://picx.zhimg.com/80/v2-7708001a0be68df0e3432952b811bb4b_720w.png?source=d16d100b


[*]ITU-R BS. 2399专门对音效主观属性的选择、开发和定义做出了详细的描述,综合百家之长形成了下图Audio wheel。
https://picx.zhimg.com/80/v2-b3445a3bb1e78e9df9e62edb7b8f1817_720w.jpg?source=d16d100b图1 The Audio Wheel for reproduced sound


应用场景 – 车载音频系统

近年来,智能座舱的概念非常火热,车载音频成为电动汽车的重要卖点,主流车型都配备十多个以上的专业级扬声器,营造全景音效,沉浸式音乐体验。但是,汽车座舱空间比较小,包含车窗玻璃等反射面、顶棚和座椅等吸声表面,在低频由于声波的反射叠加形成驻波(空腔声模态),在有的位置形成波峰,有的位置形成波谷,而高频声音衰减较快。另外,乘客的位置通常不在扬声器包围的声场中心,这也会带来听感的降低。因此,如何调教出令人愉悦的座舱音效并进行评价和预测成为一个挑战。

从哪些主观角度评价座舱音效?Bai & Hong在对比车载音频声重放算法时选择了以下8个主观属性(见表3),采用ITU-R BS.1534 MUSHRA方法进行主观评价。其中“丰满”、“明亮”、“杂音”属于音色属性范畴,“位置”、“前方”、“靠近”、“包围感”属于空间属性范畴。
表3 主观属性的定义(Bai & Hong, 2009)
https://pic1.zhimg.com/80/v2-92d325a3d288fa9c691a2b969c89dbd6_720w.png?source=d16d100b
在某高端车型项目中,HBK工程咨询部门从ITU-R BS. 2399中选择“总体偏好”、“低频强度”、“鼓声和低频的力度”、“中频强度”、“包围感”、“高频强度”、“中频和高频的清晰度”和“力度”等主观属性进行评价。

Daisuke Koya总结了大量的座舱音效主观研究成果,认为可以从以下10个方面描述座舱的空间听感,见下表4。

表4 空间属性的定义(Daisuke Koya, 2017)
https://picx.zhimg.com/80/v2-95b0d236c55d90ea09351a7ce013cbb4_720w.png?source=d16d100b

应用场景 – VR/AR虚拟场景

VR/AR场景是另一个火热的应用领域,不同的是VR/AR头显或眼镜属于双耳声音重放。Lindau等提出了Spatial audio quality inventory (SAQI),里面给出了 48个属性描述词,用于虚拟环境与真实环境的主观听觉比较,这些属性也包含在了ITU-R BS. 2399。此外,AR/VR还有专门的主观属性,比如:


[*]真实性Authenticity – 即从感觉上与真实世界是没有区别的
[*]合理性Plausibility – 即多大程度上听音者的预期是和真实事件相符的
[*]存在感Sense of Presence – 即感觉到真实存在于这个地方
参考文献:1. Toole, F. E. (1985). “Subjective Measurements of Loudspeaker Sound Quality and Listener Performance”. English. In: Journal of the Audio Engineering Society 33.1/2, pp. 2–32.2. Letowski, T. (1989). “Sound Quality Assessment: Concepts and Criteria”. In: 87th AES Convention. New York, NY, USA: Audio Engineering Society.3. ITU-R (2015b). Recommendation BS.1534-3 - Method for the subjective assessment of intermediate quality level of audio systems.—(2003a). Recommendation BS.1284 - General methods for the subjective assessment of sound quality.—(2015e). Recommendation ITU-R BS.1116-3 - Methods for the subjective assessment of small impairments in audio systems.—(2017c). Report ITU-R BS.2399-0 - Methods for selecting and describing attributes and terms in the preparation of subjective tests.4. Bai, M., Hong, JR. (2009). Signal Processing Implementation and Comparison of Automotive Spatial Sound Rendering Strategies. J AUDIO SPEECH MUSIC PROC. 2009, 876297.5. Lindau, A., V. Erbes, et al. (2014). “A Spatial Audio Quality Inventory (SAQI)”. In: Acta Acustica united with Acustica 100.5, pp. 984–994.6. Daisuke Koya (2017). Predicting the Overall Spatial Quality of Automotive Audio Systems.


全新《HBK电声测量解决方案》已新鲜出炉点击这里,查看 / 下载完整解决方案

https://picx.zhimg.com/80/v2-e78389481b4045bd748cc24f301828c9_720w.png?source=d16d100b
​您还可以通过如下方式联系我们,了解更多产品与应用详情:

邮箱:cn.info@bksv.com

网址:www.bksv.com/zh

电话:400-900-3165(周一至周五9:00-18:00)

点击这里,咨询B&K产品信息:https://www.bksv.com/zh/request-a-quote


页: [1]
查看完整版本: 王博聊声学 | 音频感知的主观属性