V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Nosub  ›  全部回复第 1 页 / 共 17 页
回复总数  326
1  2  3  4  5  6  7  8  9  10 ... 17  
目前只支持中文,后面再看看。
再次回复,因为之前没有开发完成,可以试试我开发的软件,已经接入阿里云达摩院的离线语音引擎 funasr ,目前已经完全支持 Windows ,Linux 和 MacOS ,Nosub v2.6.0Beta1 支持离线语音识别和视频压制
https://github.com/patui/Nosub/releases/tag/2.6.0Beta1
根本原因,人们更加愿意接受泛娱乐性质的内容,因为一般人下班后,人已经很疲惫了,你再给他灌输技术类的视频,无疑只会更加令人厌倦,你想想你自己是不是这样的,工作一天了,还要学习,不断地学习,除了学习就是学习。
@liuguangxuan 可以试试,目前已经完全支持 Windows ,Linux 和 MacOS ,目前仅支持中文,不限时长,阿里宣称可以支持数十小时的视频,Nosub v2.6.0Beta1 支持离线语音识别和视频压制
https://github.com/patui/Nosub/releases/tag/2.6.0Beta1
7 天前
回复了 hikarumx 创建的主题 程序员 apifox 挂了,没有离线版就是不方便。
@cat 下载一个 Postman 免登录的版本不难。

安装 Postman 免登录版
https://nosub.net/posts/p/222
多说一句,我最近一直在实现 funasr 的本地化移植工作( Windows/Linux/Macos ),也算支持下国产大模型,毕竟支持 whisper 的客户端太多了,支持 funasr 的几乎没有,我之前一直不愿意接入本地模型就是因为使用成本太高,一个模型动辄几个 GB ,ct-punc mode ,asr-model ,vad-mode 加起来差不多有 3 个 GB ,连放在哪儿储存给用户下载使用都是个问题,当然这是开发者应该解决的事情,储存成本和使用成本,哪个不是成本。
知乎上有一句,我觉得是对的,先问是不是,再问为什么。

抛开成本,使用接入的便利性不谈,

首先在线语音识别 API 比开源大模型早,这个答案就是回答了你的问题,

七八年前讯飞语音识别 API 就有了,七八年前有 funasr 和 whisper 吗。

你这个逻辑就是剪映这么好,为什么还需要什么其他字幕软件一个逻辑。
当然最大的问题是跨平台,这也是 Linux 内核开发不愿意用 c++的原因,一点点开发上的便利,不足以取代 c 语言的优势。
c++的包管理没有,这可以劝退 90%的程序员,之前你要用第三方库,比如 FFmpeg ,要自己编译,要自己编译就要学脚本语言 cmake ,学完你发现编译一堆 error ,你不是缺少头文件就是缺少依赖,你编译完 Windows 你以为完了,Linux 下又是别的问题,c++ 20 在改变这些,不过推进速度太慢了,世面上有一些第三方库管理工具,比如微软出的 vcpkg ,其实学习 c++,相当于你学了很多语言,c/c++/cmake 。
12 天前
回复了 RiverBWU 创建的主题 C++ C++库脚手架项目及思考
大佬,膜拜。
@bruce0 你为什么不在 Windows 平台开发完了,只是在虚拟机里面完成编译了。
10 年前的 Intel CPU ,加上 32GB 内存,跑 clion 开发都没问题,然后还可以开个 vm 虚拟机跑 Linux 编译 Linux 版本,我现在就是这样做的,如果用 VS 应该够呛,我也准备整台新电脑了。
24 天前
回复了 jsjcjsjc 创建的主题 问与答 这个 nginx 和 xray 配置是啥意思?
Linux 配置 Xray 实现科学上网
https://nosub.net/posts/p/235
歪个楼,看到熟悉的人了。

Nosub v2.5.0 跨平台版本发布啦

https://github.com/patui/Nosub/releases/tag/2.5

已经正式支持 macOS 和 Linux 了,哈哈哈;
28 天前
回复了 Nosub 创建的主题 分享创造 Nosub 一个专注于字幕编辑的字幕软件
@JayeGT002 macOS 和 Linux 版本最近会上线,请关注;
前几天看过一个观点,是说程序员阅读和编程的时间是 10:1 ,AI 把程序员的前面的 10 拿掉了,后面的 1 就变得没有多大意义了,说白了,人类缺乏了阅读能力和动力,进一步必然是缺乏深度思考的能力,从这种观点来说,的确是在降智,说文盲程序员不为过,试想一个场景,你平时用 AI 写了一堆代码,客户那儿出了问题,要你去现在修复,你难道说,这代码是 AI 写的,我要求助 AI ,必须开着 AI 修 bug ,客户说我电脑无法联网,你是不是傻眼了,再举一个例子,我以前要写个视频播放器,需要去 GitHub 阅读 FFmpeg 源码,现在不用了,你不用阅读任何源码,AI 就直接给你写出来了,而且远比你写的好。
33 天前
回复了 chenxiankong 创建的主题 Apple 感觉 macos 的交互延迟做的很烂
@ACSOUV 这事吧,很简单,你开个 vm 虚拟机,用同样的配置,安装 Windows ,MacOS ,和 Linux ,看看谁卡顿就知道了,因为我最近一直在做跨平台的开发,虚拟机里面的 MacOS 基本卡的不行,直白点就是 Windows 和 Linux 多低的配置都可以用,MacOS 基本用不了,这本身就说明了问题。
33 天前
回复了 chenxiankong 创建的主题 Apple 感觉 macos 的交互延迟做的很烂
你的感觉是对的,MacOS 远比 Windows 卡,我八年前的 Intel CPU 跑 Windows 都比 m3 Pro 芯片流程,其实这个道理也简单,MacOS 才多少用户,Windows 多少用户,微软这些年优化不是白优化的。
35 天前
回复了 fareast 创建的主题 计算机 程序员电脑推荐
还是买 Windows 吧,最近我编译了一个我自己用 c++写的一个项目程序,同样的源码,MacOS 运行的速度,比在 Windows 开虚拟机跑的 Linux 上运行的还慢,MacBook 唯一的优势就是续航,搞个大一点的内存的 Windows 笔记本用的舒服。
看到熟悉的话题,说两句,无论腾讯云还是阿里云,都可以精确到词的 api 参数,如果你是程序员,写一个分词并不难,另外如果你是自己制作视频,不是做软件,用剪映旧版本,语音识别没有次数限制。
1  2  3  4  5  6  7  8  9  10 ... 17  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4861 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 09:43 · PVG 17:43 · LAX 02:43 · JFK 05:43
Developed with CodeLauncher
♥ Do have faith in what you're doing.