声振论坛

 找回密码
 我要加入

QQ登录

只需一步,快速开始

12
返回列表 发新帖
楼主: yderek

[综合] 【求助】关于环境噪音信号特征提取及识别

[复制链接]
发表于 2016-3-29 20:44 | 显示全部楼层
yderek 发表于 2016-3-29 13:36
我这边主要就是简单的分析下加窗后的视频曲线,然后求倒谱距离,不知道还有什么其他方法?

大的方法前面二楼已经讲了。每个方法都有很多细节能影响对信号的识别度,就拿MFCC+DTW来讲,要不要先滤波,怎么滤波,要不要预加重,怎么预加重,窗的长度,窗的重叠比例,多少个MFCC谱组合在一起算DTW,MFCC的频带如何分区(分多少个,怎么分),MFCC的阶次用到多少阶,背景噪音是否要去除,是静态地还是动态地去除背景噪音,相似性的判断的阈值取在哪里.......

评分

1

查看全部评分

回复 支持 反对
分享到:

使用道具 举报

发表于 2016-3-30 09:29 | 显示全部楼层
yderek 发表于 2016-3-29 14:32
刚刚把您分享的资料大致看了一下,觉得我需要的几种不同环境音和机械音的应该比语言识别要简单,现在主要 ...

开源应该是源代码,如果你下载到的是exe的,那应该是经过别人编译的

比如http://www.pudn.com/downloads550 ... /detail2269387.html

评分

1

查看全部评分

 楼主| 发表于 2016-3-30 20:48 | 显示全部楼层
TestGuru 发表于 2016-3-29 20:44
大的方法前面二楼已经讲了。每个方法都有很多细节能影响对信号的识别度,就拿MFCC+DTW来讲,要不要先滤波 ...

谢谢您的回复,虽然我不是信号处理专业的,但是大概能听懂一点,我的MFCC用的16阶的,没有做降噪处理,窗的重叠比例为相邻帧长的一半,至于您说的相似性的判断的阈值是否和我划分的两类不同声音倒谱距离的分界线有关系,目前还不是很懂
 楼主| 发表于 2016-3-30 20:50 | 显示全部楼层
NASA 发表于 2016-3-30 09:29
开源应该是源代码,如果你下载到的是exe的,那应该是经过别人编译的

比如http://www.pudn.com/downloa ...

下载的不是EXE的,倒是真希望能下载到EXE的,在linux下运行和编译的实在看不懂
发表于 2016-3-31 08:35 | 显示全部楼层
yderek 发表于 2016-3-29 14:32
刚刚把您分享的资料大致看了一下,觉得我需要的几种不同环境音和机械音的应该比语言识别要简单,现在主要 ...

是C语言写的,至于是否适用于声音识别意外的就不太清楚了
您需要登录后才可以回帖 登录 | 我要加入

本版积分规则

QQ|小黑屋|Archiver|手机版|联系我们|声振论坛

GMT+8, 2024-11-14 13:30 , Processed in 0.075983 second(s), 18 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表