V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
xiaozizayang
V2EX  ›  分享创造

[开源]打造一个干净无广告且个性化的公众号阅读环境

  •  
  •   xiaozizayang ·
    howie6879 · 2021-05-10 08:57:41 +08:00 · 7208 次点击
    这是一个创建于 1329 天前的主题,其中的信息可能已经有所发展或是发生改变。

    作为一名微信公众号的重度用户,公众号一直被我设为汲取知识的地方。随着使用程度的增加,我有一个比较头疼的问题——广告问题。

    假设你关注的公众号有十来个,若一个公众号两周接一次广告,理论上你会面临二十多次广告,实际上会更多,运气不好的话一天刷下来都是广告也不一定。若你关注了二三十个公众号,那很难避免现阶段公众号环境的广告轰炸。

    于是我产生了一个想法,为什么不构建一个多源(公众号、RSS )、干净、个性化的阅读环境呢?

    我的思路很简单,大概流程如下:

    psoFun

    目前已经整了个初版出来,项目已经开源,欢迎试用(来个 Star 呗):

    第 1 条附言  ·  2021-05-10 09:32:43 +08:00

    贴个交流群微信二维码:

    viq1fk

    欢迎加入

    第 2 条附言  ·  2021-05-10 17:00:55 +08:00
    1.本项目没有去广告,只是会多一个是否是广告的标签,也不盈利
    2.本项目没有进行内容抓取然后去其他地方展示
    3.本项目做的事情类似于,转发一篇文章到你的小号,然后评论一句,这是广告
    81 条回复    2021-05-11 20:00:25 +08:00
    bricle
        1
    bricle  
       2021-05-10 09:15:30 +08:00 via iPhone
    律师函警告⚠️
    Ahy
        2
    Ahy  
       2021-05-10 09:22:13 +08:00
    棒 确实是痛点 之前也想过
    xiaozizayang
        3
    xiaozizayang  
    OP
       2021-05-10 09:23:25 +08:00
    @bricle 为啥?
    xiaozizayang
        4
    xiaozizayang  
    OP
       2021-05-10 09:23:40 +08:00
    @Ahy 同道中人
    tanxiaoluo
        5
    tanxiaoluo  
       2021-05-10 09:28:31 +08:00
    轻芒杂志 APP 已经暂时关服了
    xiaozizayang
        6
    xiaozizayang  
    OP
       2021-05-10 09:29:49 +08:00
    @tanxiaoluo 惭愧,我没用过这个,为啥关服?
    free9fw
        7
    free9fw  
       2021-05-10 09:31:32 +08:00
    公众号不看不就行了,因为大部分公众号的文章都来自别的网站
    dcty
        8
    dcty  
       2021-05-10 09:32:02 +08:00
    iOS 用户,公众号文章基本上没看到广告( surge 用规则过滤了)
    xiaozizayang
        9
    xiaozizayang  
    OP
       2021-05-10 09:33:29 +08:00
    @dcty 我说的是公众号文章是推文,不是微信生态的广告
    xiaozizayang
        10
    xiaozizayang  
    OP
       2021-05-10 09:33:38 +08:00
    @free9fw 是个思路
    dcty
        11
    dcty  
       2021-05-10 09:35:15 +08:00
    @xiaozizayang #9 哦,软广的那种啊,比如 python 课程、保险相关。
    xiaozizayang
        12
    xiaozizayang  
    OP
       2021-05-10 09:35:46 +08:00
    @dcty 对滴
    hellhyzcy66
        13
    hellhyzcy66  
       2021-05-10 10:09:36 +08:00 via iPhone
    只看懂前面的目的,实现过程看不懂,成品在哪?
    poxiaobbs
        14
    poxiaobbs  
       2021-05-10 10:09:51 +08:00
    可以支持 rss 吗
    Spoter
        15
    Spoter  
       2021-05-10 10:14:04 +08:00
    作者也是要吃饭的,一边要看作者写的文,一边不想看做的广告,好家伙,好家伙,便宜全给你占了。
    Spoter
        16
    Spoter  
       2021-05-10 10:14:14 +08:00
    做的→作者
    xiaozizayang
        17
    xiaozizayang  
    OP
       2021-05-10 10:18:23 +08:00
    xiaozizayang
        18
    xiaozizayang  
    OP
       2021-05-10 10:19:00 +08:00
    @Spoter 你的思路我也有考量,所以我在项目里面加了声明:

    > 这里声明一点,看广告是对作者的支持,这样一定程度上可以促进作者更好地产出。但我看到喜欢的会直接打赏支持,所以搭便车的言论在我这里站不住脚,谢谢。
    xiaozizayang
        19
    xiaozizayang  
    OP
       2021-05-10 10:19:21 +08:00
    @poxiaobbs 可以,这是下一步的计划
    labulaka521
        20
    labulaka521  
       2021-05-10 10:23:42 +08:00
    @tanxiaoluo app store 已经搜不到了
    BrandonNg
        21
    BrandonNg  
       2021-05-10 10:28:08 +08:00
    想知道是怎么对文章是否包含广告这一块进行分类的?也是用深度学习神经网络那种方法吗
    ljinkai
        22
    ljinkai  
       2021-05-10 10:33:56 +08:00
    @xiaozizayang 想知道框架图用什么画的?
    no1xsyzy
        23
    no1xsyzy  
       2021-05-10 10:37:30 +08:00
    @Spoter 但是从来没有一个广告是精确按此广告的观看量付费的,要么是点击量,要么是广告位。
    后者反正没差,前者反正爱屏蔽广告的看到广告更不可能点进去。

    @BrandonNg 对于文字内容,朴素贝叶斯在大部分情况下已经符合要求,心理视觉文字方法神经网络处理得也不是很好。

    我觉得最后的结果就是长篇废话文章里塞两句广告。猫鼠游戏没兴趣,干脆不看,根源上斩断剥削链。
    阮一峰接广告一年以后质量开始下降得厉害,原本还有不少稀奇玩意儿,现在能有 1/3 是在 V2 上看到过的,甚至还有迟了一周的。
    jsutfun
        24
    jsutfun  
       2021-05-10 10:51:56 +08:00
    mark 一下 有这种痛点
    lydzz
        25
    lydzz  
       2021-05-10 11:03:18 +08:00
    我想知道你们有些啥好的公众号看
    CY4suncheng
        26
    CY4suncheng  
       2021-05-10 11:07:42 +08:00
    @tanxiaoluo 跟之前即刻那会很像,开始说是服务器问题,我还以为真的呢,结果好几天了没恢复,唉
    jy02201949
        27
    jy02201949  
       2021-05-10 11:18:33 +08:00
    印象中这种东西最后都是因为版权等各种问题停止开发或者运营,希望能长久维护
    gyh
        28
    gyh  
       2021-05-10 11:18:56 +08:00 via iPhone
    @xiaozizayang 是不是可以做这样的类比:进博物馆需要买票,热门的展还得忍受拥挤的人流(类似广告)。为了避免这些不便,现在我直接在博物馆里偷偷装了全方位高清摄像头,并说如果我觉得展览物不错我会直接进行捐赠(我深信我会这样做),而且同时这套摄像头系统还是公开给所有人用的,或者说方案公布后其他人复制一套成本很低。

    现在如果把我放到博物馆的位置上,就算有人深信他真的会捐赠,我也还是会觉得不太舒服,觉得没有被尊重,更不舒服的是他还把这套系统公开了。
    zhchyu999
        29
    zhchyu999  
       2021-05-10 11:22:51 +08:00
    人家写个文章也不容易,捎带看看也没啥,老想着不遵守规则,白嫖,这样对么
    Jooooooooo
        30
    Jooooooooo  
       2021-05-10 11:24:24 +08:00
    当心收腾讯的律师函.
    easylee
        31
    easylee  
       2021-05-10 11:27:56 +08:00
    有趣的项目,Star+1 ;
    xiaozizayang
        32
    xiaozizayang  
    OP
       2021-05-10 11:42:19 +08:00
    @BrandonNg 计划师基本的相似度模型(这是样本少的情况),多了会用 charcnn 这种,楼下提的朴素贝叶斯其实也行
    xiaozizayang
        33
    xiaozizayang  
    OP
       2021-05-10 11:42:35 +08:00
    @ljinkai drawio
    xiaozizayang
        34
    xiaozizayang  
    OP
       2021-05-10 11:44:48 +08:00
    @Jooooooooo 收到就改成完全 rss 源,和公众号撇清关系
    xiaozizayang
        35
    xiaozizayang  
    OP
       2021-05-10 11:54:11 +08:00
    @gyh 你说得有道理,我也考虑过这个问题,但是概念上还是有点区别,我说下我的观点:
    1.没有自动过滤掉广告文章,广告对 2c 项目来说就是只是打一个 tag,后面还会有历史、体育的 tag
    2.看公众号不需要买票
    3.我觉得这个行为类似一些技术网站把优质的文章放到网站上,我不关注公众号直接看技术网站不也可以吗
    4.对于 2c 项目公众号只是一个源,我不订阅公众号的源,直接订阅一些技术网站也行
    5.这个项目我最终价值实际是会打造一个多源的,比如依赖 rss 构建的一个知识管理项目,中间会加入一些智能化的模型,比如主题提取,自动标签等

    最后,如果这个项目影响了号主,我会把广告功能关掉。
    Jooooooooo
        36
    Jooooooooo  
       2021-05-10 12:34:41 +08:00
    @xiaozizayang 盈利模式是什么? 平台和作者. 作者会自愿把自己的内容从可以有广告收入的平台转到没有广告收入的平台? 不太可能吧.
    xiaozizayang
        37
    xiaozizayang  
    OP
       2021-05-10 12:35:27 +08:00
    @Jooooooooo 没有盈利,开源项目,我自己写的舒服就行
    Jooooooooo
        38
    Jooooooooo  
       2021-05-10 12:39:51 +08:00
    @xiaozizayang 优质的内容本身就是卖方市场(作者优先), 你这个平台完全从读者角度出发, 搞反了供需.
    czfy
        39
    czfy  
       2021-05-10 13:27:29 +08:00
    主要风险和一般的搬运站类似

    然后下一步会问的就是:当你的服务用户量上来了,你需要持续投入时间维护,你希望你的时间成本能换来回报,下一步是不是就自己放广告了
    xiaozizayang
        40
    xiaozizayang  
    OP
       2021-05-10 13:34:02 +08:00
    @czfy 我这个自己部署的,没有服务。。。
    xiaozizayang
        41
    xiaozizayang  
    OP
       2021-05-10 13:34:55 +08:00
    @Jooooooooo 没有想那么多,我仅仅是这个东西解决我目前的一个问题,后续发展也是用户建立自己的只是体系这块来开发
    czfy
        42
    czfy  
       2021-05-10 13:36:49 +08:00
    @xiaozizayang 如果有人反馈你的广告识别算法(或者其他分类算法)效果不好(召回率太低 /准确率太低),你调不调?
    xiaozizayang
        43
    xiaozizayang  
    OP
       2021-05-10 13:41:16 +08:00
    @czfy 必须调,这个有个 issue 专门进行广告收集,这也就意味着项目要进行更新
    czfy
        44
    czfy  
       2021-05-10 13:41:57 +08:00
    @xiaozizayang 对啊,这就意味着会有时间投入
    xiaozizayang
        45
    xiaozizayang  
    OP
       2021-05-10 13:42:49 +08:00
    @czfy 但是调的话时间成本没什么问题,因为我在用,别人认为识别得不行,说明我自己也用的不舒服,这个属于必要投入,其实做一件事情不用考虑很多,现在投入做这件事情,解决了我的问题,舒爽了,后续有时间就继续开发,这样就好
    liudaolunhuibl
        46
    liudaolunhuibl  
       2021-05-10 13:44:40 +08:00
    现在公众号广告的标题越来越奇怪了,比如今天早上看到一个“六面腾讯终于入职”,按照常理来这个公众号以前是发的面经但是今天就变成广告了,这个如何过滤?
    zw1one
        47
    zw1one  
       2021-05-10 13:55:15 +08:00
    这样的话看公众号的入口变了吧?相当于自己创了个公众号,然后把过滤后的内容推给自己看。
    weishijun14
        48
    weishijun14  
       2021-05-10 14:07:19 +08:00
    你这是在抢腾讯的生意
    xiaozizayang
        49
    xiaozizayang  
    OP
       2021-05-10 14:36:29 +08:00
    @zw1one 入口用企业微信,用了后发现比原本入口更方便
    xiaozizayang
        50
    xiaozizayang  
    OP
       2021-05-10 14:36:44 +08:00
    @weishijun14 想多了,老哥,就是一个 rss 阅读器一样
    xiaozizayang
        51
    xiaozizayang  
    OP
       2021-05-10 14:37:14 +08:00
    @liudaolunhuibl 内容关键字会被提取出来,实在是别不出来就是加样本了
    nym1996
        52
    nym1996  
       2021-05-10 15:05:19 +08:00
    要不试试注册个欧盟 WeChat 账号?朋友圈、公众号(文章内嵌广告)原生无广告。

    如果是公众号发的整篇广告文章那还是有……

    相关讨论组: https://t.me/wechat_tg
    xiaozizayang
        53
    xiaozizayang  
    OP
       2021-05-10 15:09:40 +08:00
    @nym1996 不错哇,谢谢老哥,内嵌广告那种我管不了,楼上好像说可以用软件过滤
    ganzi
        54
    ganzi  
       2021-05-10 15:14:10 +08:00
    很好奇楼主用什么软件画的流程图
    ddeef
        55
    ddeef  
       2021-05-10 15:17:52 +08:00
    真正打赏的能有几个人?估计大部分公众号作者都是靠广告维持的。
    公众号作者在发广告的同时,也会发对订阅者有价值的内容,要不也不会有人订阅了。
    如果彻底没有了收入,谁还去写那部分有价值的内容呢?
    从某种意义上说,作者和读者具有相同的利益,如果作者的利益受损,没有动力再生产内容,最终对读者自身的利益也会造成损害。
    Tianyan
        56
    Tianyan  
       2021-05-10 15:48:13 +08:00
    @ddeef 白嫖党太多了 你说这些我觉得他们都无法理解的 占便宜占习惯了
    iminto
        57
    iminto  
       2021-05-10 15:58:39 +08:00
    你已经违法了。

    轻芒杂志就是你说的这种思路,昨天挂掉了。
    iminto
        58
    iminto  
       2021-05-10 16:03:20 +08:00
    提醒楼主:微信公众号的版权属于作者和腾讯共有,只要腾讯不同意,任何形式的采集,转载,搬运都是违法。

    注意,是任何形式,你怎么狡辩都绕不过去的,就是任何形式出现在腾讯网站之外的都是违法。哪怕是作者本人同意,也是违法的。

    目前为止,只有搜狗搜索的公众号阅读功能是合法的,经过腾讯授权的。
    xiaozizayang
        59
    xiaozizayang  
    OP
       2021-05-10 16:31:44 +08:00
    @iminto 谢谢,如果是这样那我就会把这个功能去掉,我有两个点:
    1.我没有采集搬运到其他地方,我也是在微信里面展示,只是做了这样一件事,就像我看到一个公众号,然后转发给你,打上一行字,说这是广告,只不过人工做变成程序做
    2.唯一可能有影响的是,我在训练模型的时候提取了一下关键字,但是没做任何存储,如果这个有影响我可把这个功能去掉
    xiaozizayang
        60
    xiaozizayang  
    OP
       2021-05-10 16:32:19 +08:00
    @ganzi drawio
    xiaozizayang
        61
    xiaozizayang  
    OP
       2021-05-10 16:35:41 +08:00
    @ddeef 我这个项目是个人搭建的啊,别人没法用啊,而且我没有过滤广告啊,就是打个标签,如果要支持也可以点进去支持,这也不影响的。

    我最终目的是把我自己的各种阅读来源汇总,在智能化的基础上构建自己的阅读体系。
    dawn009
        62
    dawn009  
       2021-05-10 16:36:54 +08:00
    @ddeef 23 已经说的很清楚了,作者的收益不会有差别。

    用户通过强迫自己看广告来折磨自己,并不会给作者带来收入。
    厂商通过强迫用户看广告并不能让自己的东西卖得更好。
    这些无效广告的成本最终会转移到消费者身上。
    所有人的利益都会受损。
    dawn009
        63
    dawn009  
       2021-05-10 16:46:28 +08:00
    @gyh 那么博物馆为什么不直接提供网上参观的票呢?把“广告”类比为“忍受拥挤的人流”说明你已经把广告当作一种纯粹的没有收益的折磨。那么商家为什么要无意义的折磨用户?用户为什么要无意义的折磨自己?
    ganzi
        64
    ganzi  
       2021-05-10 16:49:02 +08:00
    @xiaozizayang 谢谢
    luhe
        65
    luhe  
       2021-05-10 19:08:56 +08:00 via iPhone
    我知道的,App Store 封了好多个 RSS 阅读器了……
    xiaozizayang
        66
    xiaozizayang  
    OP
       2021-05-10 19:28:36 +08:00
    @luhe 这个没有客户端
    as9567585
        67
    as9567585  
       2021-05-10 20:13:08 +08:00
    南山必胜客,关注了这个项目
    luhe
        68
    luhe  
       2021-05-10 20:46:58 +08:00
    @xiaozizayang 苹果封 RSS 阅读器的原因是不符合中国法规,你这个产品别的 V 友也说了,风险很大==
    gyh
        69
    gyh  
       2021-05-11 00:29:14 +08:00 via iPhone
    @dawn009 我没有把“广告当作一种纯粹的没有收益的折磨”,这里“拥挤的人流”只是拿来举例的不便之一,也可以是去博物馆路远天热之类的,就像公众号看广告是一种不便。至于“博物馆为什么不直接提供网上参观”,我想你是想说可以有一个比打广告更好的方式获得收入。可能有的,楼主这个工具可能就是他认为的更优解:不用担心看广告,并仍然会打赏。但我想说的是问题在没有获得作者的同意,像是强迫作者接受了这个单方面认为的更优解(假设并相信楼主出发点是好的),同时还进行了公开的分发。
    shuntdown42
        70
    shuntdown42  
       2021-05-11 08:21:47 +08:00
    我建议换一个汲取知识的地方,不要用微信
    James369
        71
    James369  
       2021-05-11 08:42:50 +08:00
    劣币驱逐良币,很多文章完全文不对题,打开全是广告,充满了陷阱和诱惑。
    Spoter
        72
    Spoter  
       2021-05-11 10:24:54 +08:00
    @no1xsyzy YouTube TrueView 就是按照观看次数收费。

    再说了,这和广告收费模式有啥关系。楼上已经说得很清楚了,作者和读者具有相同的利益,如果作者的利益受损,没有动力再生产内容,最终对读者自身的利益也会造成损害。
    xyqhkr
        73
    xyqhkr  
       2021-05-11 11:06:48 +08:00
    想问下楼主,流程图用啥画的?
    jones2000
        74
    jones2000  
       2021-05-11 12:50:26 +08:00
    断人财路如杀人父母
    xiaozizayang
        75
    xiaozizayang  
    OP
       2021-05-11 15:26:03 +08:00
    @xyqhkr drawio
    6qHc19ohwmC9wDT3
        76
    6qHc19ohwmC9wDT3  
       2021-05-11 16:04:39 +08:00
    原来的广告和内容是分开的,看电视的时候我只看内容就行了,
    现在的广告和内容界限模糊,广告已经成为了内容的一部分,
    xyqhkr
        77
    xyqhkr  
       2021-05-11 16:33:02 +08:00
    @xiaozizayang 我也用 drawio,但是没找到你画图的这些图标哦。是自己导入的嘛。
    dawn009
        78
    dawn009  
       2021-05-11 16:37:19 +08:00
    @gyh #69 “拥挤的人流”和“路远天热”没有任何收益,没有任何收益的不便,既是纯粹的折磨。如果展览内容一样,用户会选择人少的、近的、凉快的。
    用户愿意看广告,只能是因为广告也能给用户带来收益,推送需要的产品。否则便是单纯的不便,需要屏蔽。
    用户有权控制自己的设备上显示什么、不显示什么、怎样显示,作者并没有权利控制内容在用户设备上如何呈现。因此屏蔽广告不需要作者同意。分发屏蔽广告的工具是提高其他用户管理自己设备的能力,和作者本身没有直接关系,因此也不需要征得作者同意。
    xiaozizayang
        79
    xiaozizayang  
    OP
       2021-05-11 17:24:33 +08:00
    @xyqhkr 有样式选择,你研究下
    gyh
        80
    gyh  
       2021-05-11 17:29:37 +08:00 via iPhone
    @dawn009 你想看作者的内容,那你就要接受作者发布这个内容时做的限制(平台、广告)。你觉得限制过多那你只有选择不看或者和作者协商出另外的方式的权利,并不能为你在自己设备上强行看正名。作者公开发布,广告就是其设定的代价,你想获得作者成果却不愿意付出作者设定的代价不是夺取吗?按你说的广告如果对用户没有利益,那用户屏蔽天经地义,同样的逻辑也可以用在付费服务之上,如果不付费就能享受服务那用户为什么要付费呢?更进一步,结合你的设备完全控制说,软件都是我控制显示运行在我自己设备上的,软件开发方凭什么收我钱呢?不会继续回复了,如果你对你上面回的确信无疑,那我们可以各自坚持自己相信的。
    dawn009
        81
    dawn009  
       2021-05-11 20:00:25 +08:00
    @gyh #80 那为什么“获取用户隐私”、“控制用户设备”这样的“代价”就不被允许呢?
    作者要的是广告费,是收益,而不是要用户付出“代价”。这取决于广告是否能得到有效转化。如果推送的广告是你不感兴趣、不会购买的产品,你强迫自己看这些广告并不会给作者带来任何收益,仅仅是一种“我付出了代价”的无意义自嗨罢了。
    如果作者要的仅仅是“用户观看广告”,他就应该加密文章内容,然后弹出一个选择或填空题,答案是广告中的内容,同时是解密文章的密钥。用户只有看了广告才能得到密钥。实际上,类似的代价已经被以"看广告赠游戏币"的形式用在某些游戏中了。
    这就是免费+广告模式和付费模式的不同。

    不止是我对此确信无疑。在 Spiegel 对 AdBlock Plus 的起诉里面法官也是这么认为的:
    Internet users have a legitimate interest in the prevention of undesired advertising, protection from malicious software and control of their data.
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2285 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 43ms · UTC 15:59 · PVG 23:59 · LAX 07:59 · JFK 10:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.