HelloWorld556
V2EX  ›  Blogger

今天搜自己的博客,发现了有一篇和自己一样的,还以为是被人转载了,还挺开心,结果看完发现作者和原链接都不是自己的,瞬间就不开心了

  •  1
     
  •   HelloWorld556 · Nov 24, 2020 · 5565 views
    This topic created in 2009 days ago, the information mentioned may be changed or developed.
    35 replies    2020-11-25 15:59:38 +08:00
    SniperXu
        1
    SniperXu  
       Nov 24, 2020
    你要习惯。。。
    hoyixi
        2
    hoyixi  
       Nov 24, 2020
    现在还写博客都是雷 F
    写完还把链接发在大站点炫耀 or 企图引流的,那是爬虫们的衣食父母
    natashahollyz
        3
    natashahollyz  
       Nov 24, 2020
    禁止一下右键,如果别人实在要强行扒,那也没办法
    no1xsyzy
        4
    no1xsyzy  
       Nov 24, 2020
    @natashahollyz 防不了爬虫……
    Jooooooooo
        5
    Jooooooooo  
       Nov 24, 2020
    网上写东西要有这种觉悟
    280303
        6
    280303  
       Nov 24, 2020
    能被人转也是一种认可
    natashahollyz
        7
    natashahollyz  
       Nov 24, 2020
    @no1xsyzy 加干扰码?
    dusays
        8
    dusays  
       Nov 24, 2020
    正如一楼说的那样,要习惯啊!我可能比博主还惨,我算是一个写口水文的博主,博客是 dusays.com
    偶尔突发奇想,写了一些自以为的精文,没过两天,就发现百度有收录,不过收录的却不是我的网站,一看就是被转走了~
    博主没写原文地址,还声明是原创,接下来就是重头了!
    联系这些博主,各个振振有词。又说是自己原创的,拒绝承认转载。又说是用户投稿的,平台不管真实作者。更有甚者,直说盗你文是看得起你~
    我前段时间还发帖询问,全静态的博客,有没有办法加密 html 文件,但不影响浏览器的解析,因为我经常被扒站!
    GetMoney
        9
    GetMoney  
       Nov 24, 2020
    付费阅读
    myevery
        10
    myevery  
       Nov 24, 2020
    @dusays 这么惨啊。。。。
    HelloWorld556
        11
    HelloWorld556  
    OP
       Nov 24, 2020
    @dusays 看了一下那个人的博客,搜了几篇文章标题,别处都有,估计大部分都是爬虫来的,可能也有你的
    xuanbg
        12
    xuanbg  
       Nov 24, 2020
    随便了。但写好文,不问剽窃。
    Adriel
        13
    Adriel  
       Nov 24, 2020   ❤️ 1
    CSDN 微微一笑~
    bequt
        14
    bequt  
       Nov 24, 2020
    即使被转载, 写得多精彩, 最后也会都停留在你的博客上
    wvidc
        15
    wvidc  
       Nov 24, 2020
    习惯就好,我们开发的小功能被人开着公司倒卖,也一样只能习惯着
    tcp
        16
    tcp  
       Nov 24, 2020
    @dusays 后端文章数据加密,前段 js 解密?
    cs419
        17
    cs419  
       Nov 24, 2020
    网上公开的东西,人家想盗,自然拦不住
    可以适当提高对方的盗取成本

    博文里多加配图+水印
    文章里穿插点 超链接 加上博客链接
    加点空格隐写术
    toomlo
        18
    toomlo  
       Nov 24, 2020
    你这还算好的,见过那种抄袭了还来你博客下面评论他抄袭的吗...
    lovecy
        19
    lovecy  
       Nov 24, 2020
    确实,网上写东西要有觉悟。。
    爬虫站 /爬虫号 /爬虫博+没有辨识能力的人很多,自己的东西变得不像自己的了很正常。。
    Patrick95
        20
    Patrick95  
       Nov 24, 2020
    等你洞察到网上采集站的规模之后
    你就放宽心了
    Lemeng
        21
    Lemeng  
       Nov 24, 2020
    瞬间不开心了,哈哈哈,可爱
    muzuiget
        22
    muzuiget  
       Nov 24, 2020
    看开点算了,现在哪怕 Google 搜中文,前面结果也是各种内容农场的网站,本来通用搜索引擎就是垃圾了,你在怎么优化也是白搭,还不如用垂直搜索引擎好。
    dustin2016
        23
    dustin2016  
       Nov 24, 2020
    我之前的 wqordpress 博客也被人镜像了
    用了十几种防止爬取和镜像的方法

    目前,已放弃治疗😂
    ob
        24
    ob  
       Nov 24, 2020 via Android
    把文字内容全部转成图片加水印,大家觉得怎么样?就不管爬虫了。。
    fasionchan
        25
    fasionchan  
       Nov 24, 2020
    @GetMoney 付费阅读也不能幸免……

    我去年在慕课网写了一个 Python 源码剖析专栏: https://www.imooc.com/read/76
    刚发表不久就发现被某些公众号抄了,只字未改……
    好在,微信公众平台上可以投诉,官方处理也快,不然真拿这些孙子没办法……
    ragnaroks
        26
    ragnaroks  
       Nov 24, 2020
    匿名用户前 30%内容直接展现,后面内容需要登录可见
    wenzichel
        27
    wenzichel  
       Nov 24, 2020
    https://www.xiabingbao.com/post/blog/blog-be-cloned.html

    曾经我的博客也被人爬过,是整站的爬下来。然后我就想着去工信部投诉这个网站,不过后面他把他网站上的内容给删了。

    后来我就在 js 里加了一个域名的判断,如果是非自己的域名就跳转。就是不知道管不管用。
    aristolochic
        28
    aristolochic  
       Nov 24, 2020
    @dusays 不在乎 CDN 开销的话...可以用邪恶的私有字体。就是得费点儿劲。
    大致就是字体和编号随机一对一重新排列,生成的 HTML 中的文本部分也做此处理
    这种...也就别想被搜索引擎收录了
    (不太清楚现在的采集站能不能发现
    VgV
        29
    VgV  
       Nov 24, 2020
    这种事情要淡定,如果不在乎搜索引擎可以把内容转为图片加水印。
    Tyuans
        30
    Tyuans  
       Nov 24, 2020
    看了看上面的,以后部分内容文字部分文字图片,倒是没什么用,也就是恶心恶心。
    sDG9xz87SqqCC3mN
        31
    sDG9xz87SqqCC3mN  
       Nov 24, 2020 via Android
    淡定,碰到好一点的会评论说自己转载的,坏的情况就是直接爬过去
    dusays
        32
    dusays  
       Nov 25, 2020
    @myevery 我已经习惯了~
    dusays
        33
    dusays  
       Nov 25, 2020
    @HelloWorld556 确实如此,不仅扒了我的内容,还有别人的站,就是个采集站,看到好的就扒!
    dusays
        34
    dusays  
       Nov 25, 2020
    @tcp 没有后端,博客用的是 Hexo,直接生成 html 的页面~
    dusays
        35
    dusays  
       Nov 25, 2020
    @aristolochic 倒也不担心被采集,只是希望转载之后,可以保留版权,别伪原创~
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   4488 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 132ms · UTC 00:12 · PVG 08:12 · LAX 17:12 · JFK 20:12
    ♥ Do have faith in what you're doing.