V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
mrergouwang666
V2EX  ›  程序员

感觉自己花了好多时间,做了一个伪需求,尴尬😓

  •  
  •   mrergouwang666 · 3 天前 · 6013 次点击

    你们觉得是个伪需求吗?

    https://www.imagedescriber.site

    65 条回复    2025-10-11 19:59:58 +08:00
    mrergouwang666
        1
    mrergouwang666  
    OP
       3 天前
    有大佬分享一下怎么发现需求,如何知道一个需求应不应该做呢?
    mrergouwang666
        2
    mrergouwang666  
    OP
       3 天前
    好吧,还没做完,花了好几个月,还是个半成品,没一点水花,在考虑要不要继续进行下去,求大佬给点意见,万分感谢。
    osilinka
        3
    osilinka  
       3 天前
    感觉没有多大需求啊,还不如加水印
    mrergouwang666
        4
    mrergouwang666  
    OP
       3 天前
    @osilinka 做完之后,我也意识到了,嗐
    TimePPT
        5
    TimePPT  
    PRO
       3 天前 via Android
    image caption ,加个图片问答?这个随便一个多模理解模型都能做的事,没啥意义啊
    mrergouwang666
        6
    mrergouwang666  
    OP
       3 天前
    @TimePPT 图片问答是啥意思? 老哥可以具体说下吗,万分感谢
    Leon6868
        7
    Leon6868  
       3 天前
    not even wrong:

    - 对于开发者,你的服务没有亮点,定价也不便宜。举个例子,我用 GLM-4V-Flash 完全可以免费替代你的产品,你的亮点在哪?
    - 对于普通用户,ChatGPT 、Qwen 、豆包都支持免费的多模态问答和 Agent 功能,你的竞争点在哪?
    mrergouwang666
        8
    mrergouwang666  
    OP
       3 天前
    @Leon6868 嗯嗯 是的,感谢老哥的回复,接下来的产品我会好好思考
    msg7086
        9
    msg7086  
       3 天前
    需求该不该做:你自己会付费用这个服务吗?
    mrergouwang666
        10
    mrergouwang666  
    OP
       3 天前
    @msg7086 是的,说的太好了
    twig
        11
    twig  
       3 天前   ❤️ 1
    这个功能是有用的。因为泛泛地说,任何一个功能都是有用的,只是你需要找到觉得它有用的人……

    感觉作为一个独立的网页,对于用户实际应用的场景是很远的。

    什么场合需要描述图片内容呢?

    - 用户拍了照上传 Instagram ,想写一句话炫耀
    - 创作者写完博客,上传图片,为了 accessibility 想加一个 alt 注释
    - 报纸或者杂志的网站的编辑写完稿子之后,发表之前需要在每幅配图下面配一句话(你猜猜中国杂志界把这个东西叫什么?)

    所以现在的问题是:

    - 你能打通 Instagram 的 iOS app 吗?感觉很难。你能做一个浏览器插件,适配常见的社交网络吗?比如,用户打开「发推」的界面,上传完图片,就自动帮他总结图片。
    - 你能写个 PHP 的东西,做成 WordPress 插件吗?这个确实是很多人会花钱买的。因为 WordPress 用户都是不会写代码的。
    - 同样的道理,你能打通报纸、杂志网站的 CMS 吗?给他们编辑新闻的界面加一个按钮,点一下就掉用你的服务总结一下。然而你看你都不知道中国杂志界把这个东西叫什么,整合进去也不容易吧。

    还有就是你的 UI 啊……无力吐槽啊……
    twig
        12
    twig  
       3 天前
    生成描述之后有一个 复制,有一个下载 JSON 。

    你面向的用户是谁啊?普通用户的话,你让普通用户下载 JSON 干啥?码农的话,我用你这玩意儿干啥?

    你给我生成出来的是啥文本格式啊?

    ```
    Here are a few options for a catchy caption, choose the one that best fits your desired tone!

    Option 1 (Sweet & Simple): Sweet and serene, radiating youthful charm in her classic sailor uniform. Pure school day vibes! 🌸

    Option 2 (Reflective): A gentle smile and a moment of calm reflection. There's a timeless beauty in youthful innocence and a crisp school uniform. ✨

    Option 3 (Engaging): Fresh faces and classic uniforms never go out of style! Loving this sweet schoolgirl aesthetic. 😊

    Appropriate Hashtags: #SchoolGirl #SailorUniform #Seifuku #YouthfulVibes #SweetSmile #StudentLife #AsianBeauty #Portrait #Innocence #FreshFace #UniformStyle #SchoolDays #CuteGirl #GentleLook
    ```

    能不能搞搞 prompt engineering ,让 LLM 直接生成结构化的数据,你自己先 parse 好,最后把干干净净的字给用户。最后给用户一句话、几个 hashtag ,用户点一下「复制」就能利利索索的复制走,直接贴到 Instagram 里?

    像这样:

    soo2
        13
    soo2  
       3 天前 via Android
    我艹,这正是我需要的需求!我有很多张 meme 图。一直想将其归类,根据内容重命名,这样日后使用的时候就很容易找到。手动弄了几百张就搞不下去了,只有用 AI 搞了。
    KuroNekoFan
        14
    KuroNekoFan  
       3 天前 via iPhone   ❤️ 2
    还挺好玩的,除了选了中文输出结果输出了英语
    piku
        15
    piku  
       3 天前 via Android
    没看懂,好像是给视障人士使用的“描述图片”?
    slackerman
        16
    slackerman  
       3 天前 via Android
    11 楼说的没错,有点用,但是离用户太远,可能要集成到某类相关 APP 中才容易被用到
    moefishtang
        17
    moefishtang  
       3 天前
    你的网页被卡巴斯基拦截了...
    (今天 Imgur 怎么上传不了图片...报 400 号错误
    LongLights
        18
    LongLights  
       3 天前   ❤️ 1
    这个需求的确是有的:
    1. 网站主给图片加 alt 标签
    2. 发布平台生成文案(这里和 alt 标签的描述风格应有差异)
    3. 视障人士读屏

    但是我能想到的以上及类似需求需要更高的集成度,比如做成 php 网站的插件之类的
    opengps
        19
    opengps  
       3 天前
    花了大精力去证明了这个事属于“伪需求”,本身也是收获的过程
    NoobNoob030
        20
    NoobNoob030  
       3 天前
    做个 MCP 接口,作为一个小工具发布到别的平台是 OK 的,也许可以收获一点名气,但是想赚米还是困难

    作为独立产品去运营,没有核心竞争力且市场需求不大,多模态可以实现你的功能

    最佳定位:小众玩具
    test00001
        21
    test00001  
       2 天前
    我也有幸做过类似的,我的实现是通过小程序拍照识别。略比你这个有趣。但个人的力量难以支撑它。不了了之了。
    guanzhangzhang
        22
    guanzhangzhang  
       2 天前
    @soo2 梗图搬运工吗
    lanten
        23
    lanten  
       2 天前
    做 api 也许有点用,但都是 api 了我为什么不直接调大模型接口?还更灵活。这个东西有点尴尬
    Felixchen1062
        24
    Felixchen1062  
       2 天前
    冒昧问一句,这个项目复杂度很高吗? 应该就是图片➕预制 Prompt 送给基座大模型然后展示回复吧, 前端页面也像 AI 生成的, 这个站点用 Claude Code 复现感觉会很快诶
    13240284671
        25
    13240284671  
       2 天前
    有个需求,把设计稿转化成 html 相关的提示词,
    kerwincsc
        26
    kerwincsc  
       2 天前
    向钱看,能收到钱就不是伪需求
    superrichman
        27
    superrichman  
       2 天前
    要是能把它做成一款 App ,用摄像头实时讲解盲人面前的场景,比如在路上遇到复杂路况时引导他们避开障碍、走出死胡同,那就更有实用价值
    xiaohanliang
        28
    xiaohanliang  
       2 天前
    1. 拿张纸笔从头到尾写:我遇到了啥问题,我想以什么样的方式解决,为什么这个难题是有共性的,我的产品怎样能解决这个问题,=> 先说服自己
    2. 用 150 字描述给别人听,说 6 了,把问题用简单的话说明白,如果你说不清或者很难用很短的话说清,说明你自己也没想太明白 => 说服别人
    3. 跟老板沟通 => 说服老板
    lumyx
        29
    lumyx  
       2 天前
    能 找到 人群用就不是伪需求。找不到就放弃。
    spike0100
        30
    spike0100  
       2 天前
    先看看这类产品你自己会不会用,你自己使用的频次是什么,大概就有个结论了。
    liuliancc
        31
    liuliancc  
       2 天前
    输出“中文”为什么还是返回了英文
    N0vermber11
        32
    N0vermber11  
       2 天前
    害 我做的跟盘/盯盘助手插件也是无人问津
    lanxxkk
        33
    lanxxkk  
       2 天前
    你做了一个产品后,先看看自己会不会使用它?愿不愿意花时间把它做的更好用(至少让自己用的更爽)?
    Noah1984
        34
    Noah1984  
       2 天前   ❤️ 1
    不如我的需求,已经通过这个 app 赚到 2 千美金了: https://apps.apple.com/app/id6752524747
    Noah1984
        35
    Noah1984  
       2 天前   ❤️ 1
    @mrergouwang666 很简单,就是最小化去验证。你知道现在市值几千亿的小红书,最开始只是 7 份 PDF 攻略吗?真正的需求,不会因为简单就无法验证。
    Noah1984
        36
    Noah1984  
       2 天前
    我刚刚试用了一下 AI 生成图片标题的功能,很不好用。我上传的是演员赵今麦的生活照,生成的标题如下:
    用如盛开的花朵般灿烂的笑容记录美好回忆。拥抱复古气息和快乐时光!
    Qiuchi
        37
    Qiuchi  
       2 天前
    生生做出个 gradio playground
    twig
        38
    twig  
       2 天前
    @Noah1984 羡慕您会做 app 啊。
    zaunist
        39
    zaunist  
       2 天前
    其实是有需求的,我今天还找了个网站,想要把图片转成 prompt ,但是怎么说呢,最大的难题在于你要把识别出来的 prompt 优化的非常好,因为有这个需求的人,大概率是要拿着 prompt 去生成其它同类型的图片。
    但是说实在的,付费确实是个难题,除非你能做到极致的优秀,要不然没人会买你的账。
    xiaofeng2021
        40
    xiaofeng2021  
       2 天前
    网站里中英文混杂,是还没完成吗?
    看起来还不错
    lihuashan
        41
    lihuashan  
       2 天前
    需求是有的,只是与现有的大厂模型相比,你没有优势
    ffw5b7
        42
    ffw5b7  
       2 天前
    可以不局限于图片
    mistsobscure
        43
    mistsobscure  
       2 天前
    这个用的是什么模型,有人晓得吗,我本地确实有挺多图片啥的想让 ai 总结,要是能解释视频就更好了
    CCCCCCCCCCCCCCCC
        44
    CCCCCCCCCCCCCCCC  
       2 天前
    先说结论,您这个属于本末导致,表面上是没有精益来说,分析如下:
    0 机会预判:是否有做过足够多的加法,以及减法,然后定下的项目 #文案工作
    1 需求原点:简单阶段,细分用户,以及什么场景使用到,然后需求的刚性,普遍性,频次,然后天花板多少? #文案工作
    2 解决方案:产品内核是什么,也就是用户最小选择你的解决方案是什么? #MVP 阶段 不要过早解决未经验证的需求
    3 商业模式:未来增长的话,以什么为最小的单元模型,SKU 模式,还是人头模式等等。 #不要过早细化未经思考的解决方案
    4 增长:未来复制商业模式的话,打算以什么渠道进一步获客 #不要过早复制未经调研的商业模式
    5 壁垒

    您在第 1 阶段就把产品 All in 了,且可能就没做机会预判
    mrergouwang666
        45
    mrergouwang666  
    OP
       2 天前
    @twig 感谢老哥,受益匪浅
    mrergouwang666
        46
    mrergouwang666  
    OP
       2 天前
    @KuroNekoFan 还没来记得处理,我尽快处理一下
    mrergouwang666
        47
    mrergouwang666  
    OP
       2 天前
    @piku 可以看下 @twig 老哥的回复,不过说实话,我在做之前也不知道这个东西到底是给谁用的,只是看到竞品在做,我感觉我也能做,所以就做了
    mrergouwang666
        48
    mrergouwang666  
    OP
       2 天前
    @slackerman 是的 @twig 老哥说的很有道理
    mrergouwang666
        49
    mrergouwang666  
    OP
       2 天前
    @moefishtang 啊,我试了一下,没复现出来,老哥是在什么情况下遇到的呢?
    mrergouwang666
        50
    mrergouwang666  
    OP
       2 天前
    @LongLights 是的 只是一个单纯的网页的话,离用户确实太远了
    mrergouwang666
        51
    mrergouwang666  
    OP
       2 天前
    @opengps 嗯嗯 继续加油💪🏻
    mrergouwang666
        52
    mrergouwang666  
    OP
       2 天前
    @NoobNoob030 确实比较尴尬
    mrergouwang666
        53
    mrergouwang666  
    OP
       2 天前
    @lanten 确实,当时脑子一热就做了,没想那么多
    mrergouwang666
        54
    mrergouwang666  
    OP
       2 天前
    @xiaohanliang 感谢老哥
    mrergouwang666
        55
    mrergouwang666  
    OP
       2 天前
    @lanxxkk 确实 老哥说的有道理
    mrergouwang666
        56
    mrergouwang666  
    OP
       2 天前
    @xiaofeng2021 是的 还没完成呢
    mrergouwang666
        57
    mrergouwang666  
    OP
       1 天前
    @CCCCCCCCCCCCCCCC 感谢老哥的建议,我下来好好想一下,非常感谢
    scholarli
        58
    scholarli  
       1 天前
    可能对视力障碍者有用。但是他们现在都直接用豆包
    amoSjiang
        59
    amoSjiang  
       1 天前
    tcper
        60
    tcper  
       1 天前
    这个功能绝对有用,但是没法独立出来收费,因为太过于基础。

    我就举一个例子,例如设计一个大楼,一座桥梁,有 3D 模型还有 2D 的剖面蓝图,有时候就想根据 2D 蓝图生成 3D 模型,此时就需要将 2D 蓝图生成数据,就是类似楼主这个功能,先生成描述,不过可能针对工业设计还需要做一些调整。

    如果楼主能够找到行业切入点还是不错的。
    Do1phln
        61
    Do1phln  
       1 天前
    刚刚测试了一下,在专业领域上描述性能比 Gemini 的还差了一些
    csfreshman
        62
    csfreshman  
       17 小时 53 分钟前
    op 可以做之前调研下,泼个冷水,这个仅对我来说,没啥用处,不会为了这个付费
    wudicgi
        63
    wudicgi  
       17 小时 28 分钟前
    如果有一个离线本地可用的 API, 这功能非常有用
    SnowHall
        64
    SnowHall  
       13 小时 11 分钟前
    @wudicgi 这个估计难了,这功能本身也是掉的其他模型的接口吧
    SnowHall
        65
    SnowHall  
       13 小时 6 分钟前
    如果是本地的话,并且支持批量图片描述生成的话,我想会有很多人愿意付费,因为我们确实有这样一个需求,手里的照片越来越多,想找很久之前的图片,要找很久。要是能批量把所有图片增加上描述,那找起来只需要搜索关键词就能找到,就会很方便。(如果能实现这种效果,我肯定会付费)
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2376 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 01:06 · PVG 09:06 · LAX 18:06 · JFK 21:06
    ♥ Do have faith in what you're doing.