V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
kang773371222
V2EX  ›  问与答

语音合成项目需要做新闻播报,如何获取到高质量的音频数据?

  •  
  •   kang773371222 · 2023-06-05 15:25:13 +08:00 · 943 次点击
    这是一个创建于 555 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现成可用的,几百小时左右; 央视新闻一般混杂着采访,这部分不可用,需要去除

    7 条回复    2023-06-20 10:09:34 +08:00
    tisswb
        1
    tisswb  
       2023-06-05 15:46:27 +08:00
    我用 python ,edge-tts 这个库直接走微软 edge 的接口,xiaoxiao 用来读电子书我觉得 OK 的一批。
    AMZsowhat
        2
    AMZsowhat  
       2023-06-05 15:55:55 +08:00
    微软 Azure text to speech 直接生成 免费字数不少
    数据的话 还是人工截取吧
    woctordho
        3
    woctordho  
       2023-06-05 19:40:53 +08:00
    kang773371222
        4
    kang773371222  
    OP
       2023-06-19 19:22:43 +08:00
    @tisswb 谢谢指导,用 tts 合成数据?另外,xiaoxiao 是啥?
    kang773371222
        5
    kang773371222  
    OP
       2023-06-19 19:23:19 +08:00
    @AMZsowhat 谢谢指导,不过用 tts 合成数据训练 tts ,不太合理吧
    kang773371222
        6
    kang773371222  
    OP
       2023-06-19 19:24:01 +08:00
    @woctordho 谢谢指导,感觉可以试试
    tisswb
        7
    tisswb  
       2023-06-20 10:09:34 +08:00
    @kang773371222 xiaoxiao 是 edge 的一个语音角色 语音这块 微软真的强
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2708 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 44ms · UTC 00:33 · PVG 08:33 · LAX 16:33 · JFK 19:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.