sitiao 最近的时间轴更新
sitiao

sitiao

V2EX 第 77103 号会员,加入于 2014-10-14 14:00:09 +08:00
sitiao 最近回复了
2018-02-09 16:55:03 +08:00
回复了 woshichuanqilz 创建的主题 Python 我有一段跳绳的音频如何识别里面跳了多少下?
@mdluo 说的是对的,那个库适合做音频指纹检索,对这个 case 不太适合。
2018-02-09 16:52:53 +08:00
回复了 woshichuanqilz 创建的主题 Python 我有一段跳绳的音频如何识别里面跳了多少下?
1. 把跳绳的声音一段段切出来,10 段~20 段就可以了,作为模板;模板越多越好;最好选取不同人、不同跳绳的录音;
2. 模板片段提取 MFCC 系数,每个片段的 MFCC 系数做一下平均,作为整个片段的模板;多个模板可以再以下聚类,缩减一下模板数量,假设最后剩下 N 模板。
3. 测试片段的 MFCC 特征序列与 N 模板算一下余弦相似度,每个 MFCC 系数与任意一个模板的相似度超过阈值 t1,则标记为 1,未超过的标记为 0 ;
4. 对测试片段标记为 0~1 的序列做一个 5~10 点平滑,基本就可以用了。

比较简单粗暴,估计误识别会很高。
2018-02-01 17:53:20 +08:00
回复了 enenaaa 创建的主题 程序员 怎样判断一个人写代码的天赋?
见过没有写代码没有天赋,但是却很喜欢 IT 的。
2017-11-14 16:40:50 +08:00
回复了 outlier 创建的主题 酷工作 [广州][20k-40k] 知名券商研发工程师招聘(前后端/iOS/Android)
券商里面技术这么激进的,应该是广发吧!
2017-03-13 15:19:08 +08:00
回复了 zhanzhenzhen 创建的主题 程序员 如果一个程序员是伪娘,还会被人崇拜吗?
参考唐凤 +1
2016-07-11 13:05:46 +08:00
回复了 chengfu 创建的主题 程序员 关于声形码的思考
去搜一个 app 叫 Chirp ,用鸟叫声传输 url ,可以搜到它的原理说明。真实应用场景下,识别效果会很差。其实阿里的声音近场支付用的原理和这个一样。
2015-12-14 23:30:28 +08:00
回复了 cevincheung 创建的主题 PHP 有木有玩过 ffmpeg 的童鞋?
用 C/C++写一个 PHP 的扩展,在扩展里面掉 ffmpeg ,应该就可以实现交互了。
2015-12-11 22:23:36 +08:00
回复了 Counter 创建的主题 程序员 哪种编程语言最适合做图像识别?
楼上的是正解。
2015-10-26 16:52:16 +08:00
回复了 larkifly 创建的主题 程序员 如何通过网上支付完成大于 10w 的大额支付
网银的代扣接口支持 100w 的支付。
你要找的不是程序员,先找技术总监或者产品经理,也可以同时找小的外包公司先把东西做出来。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   941 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 17ms · UTC 21:03 · PVG 05:03 · LAX 13:03 · JFK 16:03
Developed with CodeLauncher
♥ Do have faith in what you're doing.