V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
vss80p585
V2EX  ›  云计算

大家有没有语音转文字的推荐给我下,有道,百度,讯飞都要我去开发,而我是现在就要转个音频

  •  
  •   vss80p585 · 2018-07-28 15:13:33 +08:00 · 4440 次点击
    这是一个创建于 2294 天前的主题,其中的信息可能已经有所发展或是发生改变。

    在线能够转的或者是 app 都可以推荐给我下

    当然关于标题,说说我自己的看法,这个是突然的需求,而且领导催着要,而这个时候肯定是立马解决,而进了这三家平台,却要做接口开发,试问,能不能做个 demo5 分钟体验? 能够给开发者解决刚需,开发者觉得不错,那下一步才是考虑接入吧!

    9 条回复    2020-05-09 08:13:25 +08:00
    vss80p585
        1
    vss80p585  
    OP
       2018-07-28 15:21:41 +08:00
    SDK 接入是要时间的,开发下来黄花菜都凉了
    mahonex
        2
    mahonex  
       2018-07-28 15:59:24 +08:00 via iPhone
    语音转文字都是坑,讯飞和百度都试过,不满足要求。现在在开始折腾 deepspeech 了。你如果是说只单纯的转一下 你试试微软或者 google 的 相关在线服务。
    metorm
        3
    metorm  
       2018-07-28 16:33:17 +08:00 via Android
    讯飞不是有个录音宝什么的吗?锤子好像也有类似的。上传到 u2b 好像也有生成字幕的功能。
    incompatible
        4
    incompatible  
       2018-07-28 16:39:44 +08:00
    所以你是有多急?注册账号+看文档最多一小时、写调 sdk 的代码 10 分钟、调试半小时足够了,这样黄瓜菜就凉了?
    真着急的话你可以让老板找众包。语音转文本不是只有 ASR 一条路可以走的。
    hardwork
        5
    hardwork  
       2018-07-28 23:44:06 +08:00
    阿里的效果不错的,调个 post api 就可以了
    jackroyal
        6
    jackroyal  
       2018-07-29 09:53:15 +08:00 via Android
    微信小程序搜索百度 AI 体验中心
    vss80p585
        7
    vss80p585  
    OP
       2018-07-29 19:39:03 +08:00
    当时是 1.41 分钟的对话,我后来采用一台手机放音,一台手机打开讯飞语音输入法,输出到文本,由于对话语速过快,效果不好,最终采用人工录入,谢谢大家的回复;对于语音转文字,需求还是很大的,比如直播实时生成字母,之前看阿里弄直播都是实时生成,正确率率 99%,值得期待
    vss80p585
        8
    vss80p585  
    OP
       2018-07-29 19:45:21 +08:00
    有道,百度,讯飞,阿里都值得期待一下
    HTWMedia
        9
    HTWMedia  
       2020-05-09 08:13:25 +08:00
    长语音识别,在线音视频识别,可以用 HTWCore,识别速度快,准确。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3122 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 12:46 · PVG 20:46 · LAX 04:46 · JFK 07:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.