我认为的 ChatGPT 的下一个方向

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 758 天前的主题，其中的信息可能已经有所发展或是发生改变。

ChatGPT 是基于文本的语言模型，做的仅限于文本方面的工作。
我大胆预测下一个方向是基于视频学习的模型，暂且命名为 ActionGPT 哈哈

那么这个模型发展逻辑我觉得可能是这样的：

1 、一个机器人拥有各种基础功能，各个关节具有三维方面的可操作性能力
2 、ActionGPT 开始学习大量视频，并最终理解一些含义。例如喝水动作，首先是拿水杯，让拥有基础动作的机器人
通过视频得到分解的动作，并通过模拟，完成这个拿的动作，然后再送到嘴巴，喝下去。
3 、上面两步完成之时，才是真正大爆发的时代，你甚至有了穿衣服机器人、炒菜机器人、洗澡机器人等等，真正迎来机器人时代，这些只是生活机器人，更恐怖的是延展到其他方面。

细思极恐，新时代的主题已经很明确了，就是机器人时代，爆发就在眼前。

机器人

actiongpt

ChatGPT

模型

4 条回复 • 2023-03-03 15:45:18 +08:00

pepsiwant

2023-03-02 20:04:28 +08:00

我想的是内容创作，当算力足够高的时候，AI 学习了文本、音频和视频，乃至于人类的各种情感体验，你就随便对 ai 说我要看 XX ，我的嗜好是 YY ，包含 ZZ 元素。AI 给你无限生成。再进一步，我要啥样的语音，啥样的剧情，背景故事、男女主角如何，生成十分钟的短片，还是八十集的连续剧，情感体验，反转几次，是笑中带泪还是黑色幽默，是王家卫当导演，还是毕志飞，不管什么样的元素，秒秒钟给你安排了

systemcall

2023-03-03 00:16:57 +08:00 via Android

chatgpt 在文本这块并不完美
比如我问它关于牢厂的问题，它就特别容易卡死，有时候回答到一半就卡壳了，有时候直接报错。最多聊个 2 、3 次就不能再聊下去了

wa007

2023-03-03 09:02:08 +08:00 via iPhone

文生视频，据说已经在做了，但技术上有卡点

donotquestion

2023-03-03 15:45:18 +08:00

@wa007 这个生成视频我不觉得是一个彻底改变性的方向，我觉得方向是机器人学习人的动作并能重复这个动作并理解含义。