近期想用 python 对语音处理,去除里面的人声,然后对背景声音进行分析,来初略判断所处环境。(别问为什么,都是有苦衷的) 但是本人对语音处理不是很熟悉不知道有什么好的开源项目学习一下或者现成的库
1
SeanChense 2016-07-10 15:44:49 +08:00 via iPhone
这怕是不是简单一两个库就能解决的,而且有没有这种库都还是问题。
你自己要做的就是把信号源中把人的声音剥离出来,那么就要定义什么是人的声音。在时域是什么样的,在频域是什么样的,各自特征值是什么。然后设计一个滤波器,把不要的噪声剔除。 完成了以上工作,我猜发个 SCI 可能问题不大。 |
2
SeanChense 2016-07-10 15:46:40 +08:00 via iPhone
或许已经有类似的研究了,楼主需要了解的是数字信号处理。查查看一些期刊论文。
|
3
kamikat 2016-07-10 16:12:23 +08:00
|
4
pangpang OP @SeanChense 谢谢,我近期学习一下,本行是无线网络方向的,对数字信号确实不了解
|
6
TaMud 2016-07-10 17:19:50 +08:00
无
|
7
TaMud 2016-07-10 17:20:14 +08:00
如果你能搞出来,直接投简历 google,ms 都可以
|
8
264768502 2016-07-10 18:16:49 +08:00 via iPad
|
11
pangpang OP @SeanChense 其实我的目的只是某个人的声音特征就够了,别人的我也不关心。这样想的话好像还能变简单一点了
|
12
shakespaces 2016-07-10 20:07:22 +08:00 via Android
这的确是个大项目,应该是单独拿出来都能立项的
|
13
JhZ7z587cYROBgVQ 2016-07-10 20:59:13 +08:00
结合楼主的描述和回复,我已经脑补了各种剧情 = =
|
14
TaMud 2016-07-10 21:09:08 +08:00
中科讯飞,百度,微软, google ,都想解决这个问题
|
16
HFcbyqP0iVO5KM05 2016-07-11 06:37:37 +08:00 via Android
去人声的没有,去噪声可以用 Adobe Audition 。 或者可以反着来去噪了再和原声对比求差?
|
17
qcts33 2016-07-11 10:34:48 +08:00
本行无线网络,没学过数字信号处理?我读书少,你不要骗我……
本来想说 python 不适合这种信号处理任务,但发现 scipy 里面基本的滤波器设计都有 不过这种任务确实体现不出 python 的优势,我觉得还是 MATLAB 实在,至少设计滤波器这种事情就没有必要反复敲代码了 |
18
puyaraimondii 2016-07-11 11:47:43 +08:00
前期去噪,预处理方法可以,根据你的数据选择合适的方案
去除人声可以根据声音频率特征,找一个或几个合适的 window function 就行 背景声音分析我只知道你在有了足够的背景声音库的基础上采用的方法,例如 DTW,HMM,ANN 等等,或者 Machine Learning 也有一堆,其他的方案不了解 万方,知网那一堆数据库搜搜的话其实挺多可以参考的 暂时只想到这些,同在学习 |
20
pangpang OP @puyaraimondii 谢谢啦
|
21
pangpang OP @puyaraimondii 谢谢指教
|
22
JhZ7z587cYROBgVQ 2016-07-11 22:46:08 +08:00
@pangpang 别太难过了,祝你好运少年
|