V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
unii23i
V2EX  ›  奇思妙想

有没有人来讨论社区推荐帖子的思路

  •  
  •   unii23i · 16 天前 · 1003 次点击

    不知道有没有这种方法,选出 x 个(可能是 100 个)代表用户,简称 [看帖 kol ]

    通过记录点击行为,统计这些 [看帖 kol ] 喜欢点击哪些帖子,就把这些帖子推荐给 [点击过其中一篇帖子过的用户] ,

    相当于两个人都对游泳感兴趣,其中一个人喜欢钓鱼,那么另一个人也可能对钓鱼感兴趣

    Q:这 100 个人是怎么选出来的? A:比方说:根据他们留存率是否达标、每天是否可以消费 3-50 篇内容、是否能产生互动行为

    Q:这些帖子库的排序是什么? A:比如根据 1 小时前点击最多的帖子,组成 top50 帖子。随机排序

    不知道这样可不可行,或者需要花的时间是否以月计算 开发和我说没有一个软件是这样推荐的。。。。

    小红书是根据内容标签进行推荐的吗?不过我们的社区够小暂时无法机器学习打标

    目前的困扰就是帖子按照热度排序后,部分新帖没有曝光,部分老贴依旧曝光,各种帖子曝光不均匀 ,尝试通过调整点击率作为权重,(为了点击率的真实性,必须满足一定曝光才能进入计算),但是低曝光的帖子怎么也进不了这个权重里面

    2 条回复    2024-05-01 03:35:25 +08:00
    zhaodong
        1
    zhaodong  
       15 天前
    做一些时间衰减的权重策略,对新帖提权差异化保量,再加上一些分量曝光的的策略,基本就差不多了
    az422
        2
    az422  
       14 天前 via iPhone
    1. 既然都开始做推荐系统了,x 通常就是全站去非法用户。一般也不止收集点击行为,还有曝光、收藏、评论等
    2. 你说的“推荐方法”术语是召回,具体你描述的其实是 u2i 召回,可以搜索下。此外还有经典的 i2i 召回:用户喜欢这个帖子也可能喜欢相似帖子。
    3. 你的排序方式其实只考虑了帖子特征,小项目还行,成熟的点击率模型需要:用户特征+帖子特征+用户对帖子行为特征。召回 100 个帖子后,分别计算特征当输入,然后输出 100 个预估的点击率,再排序取 top
    4. 最后一个是推荐系统冷启动问题
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1190 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 18:30 · PVG 02:30 · LAX 11:30 · JFK 14:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.