声振论坛

 找回密码
 我要加入

QQ登录

只需一步,快速开始

查看: 3258|回复: 7

[其他软件] 免费声音相似度测量软件Sound-Similar Free

[复制链接]
发表于 2019-8-5 19:16 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?我要加入

x
本帖最后由 TestGuru 于 2019-8-5 19:24 编辑

Sound-Similar (免费版)是一个轻巧的工具软件,可用于测量两个具有线性PCM格式的WAV声音文件在听觉上的相似度。这种格式是WAV文件中最常见的。相似度以百分比0%~100%来表示。它不是通过对两个数字文件进行一个字节一个字节的对比而得,也不是通过对时域波形的形状进行对比而得,而是基于人的听觉感受,通过一系列的时域、频域和时频域分析得到的。测得的相似度可用于声音的归类以及基于听感的声音质量检测。

两个WAV文件可以具有不同的采样频率、不同的采样位数以及一个或两个通道的数据。如果是双声道信号,则对比中采用的是两个通道的平均值。声音的音量差别不会影响相似度的测量,除非音量小到足以影响所能感知到的声音品质。

不同类别的声音,例如语音、音乐、和环境声音,可能具有不同的频率范围。 Sound-Similar允许用户指定用于对比的频率范围以提高相似度测量的准确度。频率范围可以延伸到次声波或超声波范围。

有两种对比模式:(1)全长vs全长(Full Length vs Full Length)         (2) 短文件的全长vs长文件的部分长度(Full Length of the Shorter vs Partial Length of the Longer)。这两种模式都允许两个文件有不同的时间长度。模式2可用于判断短文件是否是长文件中的一部分。如果是的话,给出其在长文件中的具体位置。声音长度应大于50毫秒,且应大于所设置的频率低限的倒数。声音长度的高限则只受制于电脑的内存大小。

本软件中的相似度评分算法是按常规用途来优化的。低于几个百分点的相似度通常表示两个声音完全不同,而从几个百分点到100%表示两个声音是相似的,只是相似程度不同。也就是说,Sound-Similar不仅可以用来进行声音归类,而且也可以用来检测声音跟标准样本对比后的质量差别。

Sound-Similar是用虚仪科技研发的Sound Monitoring and Matching (SMM) API编写的。此API允许更加灵活的对比参数设置,并提供了更高级的选项,例如背景噪声滤除、短时噪声和失真检测、不同的评分方法等。该API已成功用于开发无人值守变电站异音采集与识别、八音盒出厂检测、发声玩具出厂检测等项目,也可用于机器故障声的采集与识别,以人工智能软件替代人耳听音辨识,以节省人力,提高效率和测量的准确度。

Sound-Similar Free免费软件下载地址:www.multi-tech.cn/Sound-Similar-Free-Setup.exe
回复
分享到:

使用道具 举报

 楼主| 发表于 2020-5-20 01:08 | 显示全部楼层
Sound-Similar Free 1.1版添加了三种相似度计算模式:

(1)相似度计算不包含由声音传输通道引入的差别(就是说完全相同的声音源,由声音传输通道引入的差别不会使相似度降低

(2)相似度计算包含由声音传输通道引入的差别(就是说即便是完全相同的声音源,由声音传输通道引入的差别也会使相似度降低)

(3)相似度计算包含由声音传输通道引入的差别(就是说即便是完全相同的声音源,由声音传输通道引入的差别也会使相似度降低),而且也包含由声音内容的播放速度的不同引入的差别 。


1.0版只支持模式(1)。1.1版添加了模式(2)和(3)。
发表于 2020-12-11 14:51 | 显示全部楼层
学习学习
 楼主| 发表于 2020-12-14 00:36 | 显示全部楼层
本帖最后由 TestGuru 于 2020-12-14 00:40 编辑

用歌曲举两个例子:

1) 相似度较高的例子
二者都是通过播放同样一段歌曲录制的,只是录制采用的音响和话筒不同,背景噪声和回声也不同,时间上也没严格对齐。测得的相似度为83.5%。
http://www.multi-tech.cn/Sound-S ... 44100-16Bit-10s.wav
http://www.multi-tech.cn/Sound-S ... 44100-16Bit-10s.wav

Song-21vs22-SR44100-16Bit-10s-SS.png

Song-2-SR44100-16Bit-10s-1vs2-MI.png

2)相似度较低的例子
二者为同样一首歌曲的不同部分,相似度为0.3%。
http://www.multi-tech.cn/Sound-S ... 44100-16Bit-10s.wav
http://www.multi-tech.cn/Sound-S ... 44100-16Bit-10s.wav
Song-11vs21-SR44100-16Bit-10s-SS.png

Song-1vs2-SR44100-16Bit-10s-MIs.png
发表于 2021-9-16 11:55 | 显示全部楼层
相当不错。
下面的图形软件呢?可有试用版?

点评

下面的软件就是Multi-Instrument---一个集时域、频域和时频域分析为一体的多功能虚拟仪器软件,支持多种硬件,从几乎所有电脑都配备了的声卡到专用的 ADC 和 DAC 硬件,例如 NI DAQmx 卡、VT DSO (USB数字示波器、频  详情 回复 发表于 2021-9-24 02:06
 楼主| 发表于 2021-9-24 02:06 | 显示全部楼层
AU-VIB 发表于 2021-9-16 11:55
相当不错。
下面的图形软件呢?可有试用版?

下面的软件就是Multi-Instrument---一个集时域、频域和时频域分析为一体的多功能虚拟仪器软件,支持多种硬件,从几乎所有电脑都配备了的声卡到专用的 ADC 和 DAC 硬件,例如 NI DAQmx 卡、VT DSO (USB数字示波器、频谱分析仪及信号发生器)、VT RTA(USB实时频谱分析仪)、VT IEPE(IEPE / ICP接口的USB数据采集器)、VT CAMP(USB数字电荷放大器)、RTX6001音频分析仪、 VT UltraMic-384超声波分析仪等。

下载地址:www.multi-tech.cn/MIsetup.exe,可直接用声卡采集和输出数据,也支持文本数据以及WAV文件的导入和输出。



 楼主| 发表于 2021-9-24 02:30 | 显示全部楼层
对于Sound-Similar Free软件,再举一例:


3)在一个长WAV文件中搜寻一个短WAV文件样本的例子
1秒WAV文件样本: http://www.multi-tech.cn/Sound-S ... R44100-16Bit-1s.wav
20秒WAV文件: http://www.multi-tech.cn/Sound-S ... 44100-16Bit-20s.wav


录制二者所采用的音响和话筒不同,背景噪声和回声也不同。前者含有1秒长的歌曲片段,而后者含同一首歌曲的20秒长的片段。对比模式设置为"Full Length of the Shorter vs Partial Length of the Longer"。


Speech-3-2vs3-1-SR44100-16Bit-1s-20s-SoundSimilarFree.png

以上测试结果显示,第二个文件的14.477秒~15.477秒之间的声音与第一文件的声音相似,相似度为55.2%。

下图为用Multi-Instrument合并以上两个WAV文件于左右声道后的对比图,左上为时域对比,右上为总体频谱对比,左下为长文件的声谱图,右下为
短文件的声谱图。

Speech-3-2vs3-1-SR44100-16Bit-1s-20s-MI.png






您需要登录后才可以回帖 登录 | 我要加入

本版积分规则

QQ|小黑屋|Archiver|手机版|联系我们|声振论坛

GMT+8, 2024-4-16 14:00 , Processed in 0.071038 second(s), 26 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表