V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  smalltong02  ›  全部回复第 3 页 / 共 4 页
回复总数  66
1  2  3  4  
307 天前
回复了 mandasaka 创建的主题 Google Google Gemini Advanced 图片生成能力可圈可点
这是得益于 Google Lens 的加持,并不完全依赖 gemini 模型本身的多模态能力。
请问你用的什么模型?最近在 huggingface 上发布的一个 177M 的小模型也可以去除背景,我使用了一下效果蛮不错的。也许你可以更新一下你的模型,也许可以部署到移动端去。模型名称是 RMBG-1.4
@shendaowu
谢谢提醒!
@Nile20
非常感谢,回答很详细!
@BaseException
谢谢,我试试 imgur
我这个项目就可以让 AI 做写简单的事情:
https://github.com/smalltong02/keras-llm-robot

比如画图,搜索,知识库检索等等
开源,让世界更美好!
310 天前
回复了 Angela2022 创建的主题 OpenAI 请问: 如何让 chatGPT 总结视频的内容?
如果你可以把音频提取出来,也可以试一下 Qwen-Audio-Chat 模型,它可以按照自然语言的要求处理音频,比如列出音频内容的提纲。
310 天前
回复了 Angela2022 创建的主题 OpenAI 请问: 如何让 chatGPT 总结视频的内容?
gemini 可以处理 2 分钟以内的视频
@junhua13

谢谢支持!新春快乐!
@buyno1

目前图像生成模型仅适配了 2 个开源的本地模型 OpenDalleV1.1 和 ProteusV0.2 ,它们可以完成简单的图生图和文生图,嵌入各种 style 类型的字体现在还不支持。
@cheunghy 好的兄弟!
@ggggz

有时间您可以参观一下我的开源项目,这个项目主要是我自己用来学习和研究各种模型能力的。并且想把各种模型拼接起来,实现各种有趣的功能。

https://github.com/smalltong02/keras-llm-robot
@kkk9 谢谢支持!: )
一觉醒来发现多了 15 个星星和一个 fork ,多谢大家的支持!
@dankai 谢谢,下一步准备添加本地部署 n8n 的支持。
恭喜发财,新年快乐。

我的开源项目还没有找到变现方式。
311 天前
回复了 nnegier 创建的主题 程序员 在哪里可以下载到 AndroidStudio 的源码呀?
我最近也在研究这个,想把 candle+gguf 的模型部署到移动端。
311 天前
回复了 kaiki 创建的主题 程序员 因为代码水平垃圾所以不敢开源项目
我都干开源,你怕什么!
https://github.com/smalltong02/keras-llm-robot
@Seanfuck 这个分数对于一个可离线运行的多模态小模型来说,其实很不错了。"Qwen-VL-Chat"在图像识别上很出色,但是在语言理解和表达能力上不太行。
1  2  3  4  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4848 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 26ms · UTC 05:39 · PVG 13:39 · LAX 21:39 · JFK 00:39
Developed with CodeLauncher
♥ Do have faith in what you're doing.