首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  程序员

国内的百科网站真的烂的无可救药了,特别是百度

  •  
  •   windowsuuy · 231 天前 · 7180 次点击
    这是一个创建于 231 天前的主题,其中的信息可能已经有所发展或是发生改变。
    70 回复  |  直到 2019-03-02 16:45:11 +08:00
        1
    jinksw   231 天前
    貌似赌 x,x 色网站都爱用申请别人用过的过期的域名
        2
    TRIKING   231 天前 via Android
    这种抢注过期域名貌似真没什么好办法防治
        3
    fengci   231 天前
    求你救救他们把
        4
    picone   231 天前   ♥ 2
    你行你上?意见又不给就吐槽
        5
    agagega   231 天前 via iPhone
    恰烂钱
        6
    lfzyx   231 天前   ♥ 5
    萌娘百科 了解一下?
        7
    v2chou   231 天前   ♥ 1
    这种程序很难预防吧,以前我一个备案域名后来没续费了,直接被人抢注过去做赌*网站了,备案信息还没删除,后来要新备案网站才知道,弄了好久才把那个备案信息删除了
        8
    jmercer   231 天前
    新大陆嘛
        9
    jadec0der   231 天前 via iPhone   ♥ 2
    这关百度什么事,广州上学网倒闭的时候通知百度了?
        10
    miniwade514   231 天前   ♥ 7
    楼上几位泼冷水的,真要做治理,也不是没有一点办法吧?又没有让你治理抢注过期域名这个现象,只是治理自家页面上的外链。
    爬取参考资料里面的链接指向的页面,解析页面上的关键词,鉴定是否黄赌网站。百度就是做搜索引擎+人工智能的,对他们来说很难吗?
    更多是因为这是一个“负向”工作(不能直接带来关键数据增长),所以没人愿意投入精力去做吧。
        11
    LicV587   231 天前
    u can u up, no can no BB
        12
    hanbing135   231 天前 via Android   ♥ 3
    百度是全面的垃圾
        13
    liuxey   231 天前   ♥ 2
    这件事情,百度百科没有问题,但是我还是要说:百度 sucks
        14
    DOLLOR   231 天前   ♥ 4
    国内的百科网站确实不好,但是你黑要黑到点上。你列出的这条资讯里,是因为广州上学网关站后,原域名被不良网站抢注,从而导致来自其他网站的链接失效而导致失误的。核心问题是“过期域名被黑产利用”,跟百科好不好关系不大。
        15
    droiz   231 天前
    别问,问就 wikipedia
        16
    jianzhao123   231 天前 via iPhone
    果然,百度上貌似所有关于广州上学网的东西都没了……包括百度知道(:
        17
    caqiko   231 天前 via Android
    @DOLLOR 楼主的意思是百度百科有必要不定期的检测并更新外部饮用信息的有效性。
        18
    DrPikaduo   231 天前
    我觉得百度得对搜索内容负责,我不提竞价的事情,就是说你可以有广告,但是也得有我需要的信息,最好不要有不良信息,但是结果并不是这样的
        19
    1648820920   231 天前
    这很正常吧,例如我去查一个规划,规划上面有当时规划局的网址,然后规划局改网址了,那个规划公示上面就有黄网的网址了。基本无解。。
        20
    windowsuuy   231 天前
    @DOLLOR 我可没有黑它的意思,我只是在陈述一个事实,既然百科是百度下属一个网站,那么它就有责任分辨出里面的信息是否是好还是坏,你说是吧
        21
    windowsuuy   231 天前
    @DrPikaduo 我觉得也是
        22
    windowsuuy   231 天前
    @droiz wikipedia 不是每个人都能用的呀,大部分人还是用的百度更多
        23
    LicV587   231 天前
    @windowsuuy 既然微信是腾讯下属一个产品,那么它就有责任分辨出用户发送的消息里面的信息是否是好还是坏,你说是吧
    既然淘宝是阿里下属一个网站,那么它就有责任分辨出里面商品是否是正版还是盗版,你说是吧
        24
    windowsuuy   231 天前
    @LicV587 你举得的第一个例子显然不合适,微信和腾讯属于同一家公司但是微信里面发送的信息属于个人隐私,而百科与淘宝里面的商品属于正版还是盗版属于公开信息。
        25
    alfredsun   231 天前   ♥ 2
    楼上的这些人的气质和这些百科很相符了 XD
        26
    LicV587   231 天前
    @windowsuuy 并不觉得第一个例子不合适,你只有微信账号的使用权,并没有所有权,所以,严格来说,你在微信里发送的信息并不属于隐私
        27
    honist   231 天前 via iPhone   ♥ 4
    互联网上的链接那么多 咋能一个一个验证? 就算验证 也有时效性,以及误判可能。

    为什么楼主不要求这种域名在注册时相关部门就审核内容?
    为什么不要求监管部门在网站上线之初就封掉呢
        28
    loveour   231 天前   ♥ 2
    看了新闻链接,这个应该是很难保证的,看里面的描述,百度应该是有扫描外链,只是频度不够。说实话,我不是特别赞同厂商承担过度的责任,毕竟,有个成本问题。就好像警方破案也是要讲成本的。不过这个度在哪儿,感觉还是可以讨论的。
        29
    loveour   231 天前
    以及,我相信类似问题没有网站能完全保证,Youtube 还刚被爆存在儿童色情群体找视频的情况呢。完全的责任就意味着没办法做事了。
        30
    CEBBCAT   231 天前 via Android
    想了想,维基百科没法躲得过这个


    但我们允许机器人帮忙验证有效性啊 洋洋得意. gif
        31
    windowsuuy   231 天前
    @LicV587 你这个不对,比如你租了一个房子你只有使用权对吧,就跟微信一样,但是你在房间里做什么,放什么,属于你的个人隐私
        32
    orvice   231 天前
    维基百科的引用来源相对不会是这种小网站
        33
    sowish   231 天前
    错误就是错误,无脑开喷就不对了
        34
    580a388da131   231 天前 via iPhone
    互联网链接真是一点都不保险,应该再弄个页面缓存。
        35
    aimiyooo   231 天前
    就问你一句,为什么要用百度呢
        36
    sugars   231 天前
    这百度... 打开 gzshangxue 后吓我一跳
        37
    janus77   231 天前
    都懒得说了,因为已经是不需要强调的事了
        38
    Jzer0n   231 天前
    声明:和任何百科无任何利益关系。

    虽然我是看维基百科的,看了链接的内容,本身文章标题就不够严谨(外链是否以“个别外链”代替更准确?),楼主你标题的判断又是基于什么来做判断?你贴的那个链接的一篇文章个人觉得并不能就可以得到你标题的结论。
        39
    windowsuuy   231 天前
    @aimiyooo 我一般不用啊,但是我不用,不代表其他人不用,我只是把问题贴出来希望引起更多的人去注意它,去监督它,这样别人才能用到更好的产品,才能让厂商知道自己的错误。
        40
    windowsuuy   231 天前
    @sowish 可没人无脑开喷,不知道你的无脑是怎么得来的
        41
    l00t   231 天前
    不认为百度有这个责任去验证外链是否有效。
        42
    Greendays   231 天前
    我是不知道这种东西该怎么防备,百度的反应也已经很快了。
        43
    icyalala   231 天前
    我很像知道百度(或者 Google、维基百科)这种网站责任的边界在哪里。。
    外链网站改版,内容和标题不符了,是否要负责?
    外链网站临时挂了,是否要负责?
    外链网站被临时挂马了或者受攻击了,是否要负责?
    外链网站什么都没变,但是政策变了,原本里面只是个食物名称,现在变成敏感词了,是否也要负责?
        44
    Heiban   231 天前 via iPhone
    @windowsuuy #22 国内百科有大大小小各种问题,有些词条里面还有广告属性。总的来说不够严谨
        45
    kzfile   231 天前
    你们都在讨论对错?
    我在想我如果要实现预防类似的问题,该如何下手
        46
    zxcslove   231 天前
    作为百科网站不算做错只能说是不够好,同时作为一个搜索引擎公司就挺丢人。
        47
    NekoPr   231 天前
    以后给页面做快照不就好了,既锁定了内容,又保证了即使以后变更导致被解析到奇怪的网站,话说回来,估计改百科的这个人也没想到事情能闹的这么大 2333333
        48
    lfzyx   231 天前
    @honist 我觉得你的观点和 申纪兰 有的一拼~ 为什么要封掉网站?为什么要审核内容?成人网站对于成人来说就是合法浏览的。
        49
    xianxiaobo   231 天前   ♥ 2
    吐槽多容易啊,随便拿个产品,我都能找到无数个槽点,那你倒是提出解决办法啊
        50
    sowish   231 天前
    @windowsuuy 无脑是只会开喷,遇到问题难道不是提出解决办法吗
        51
    jadec0der   231 天前
    我觉得这个问题可以分为两部分:

    1. URL 指向的内容是会变的。一个 URL,以前内容是算法,打开后可能变成了厨艺,这是正常的。这就是 Tim 设计万维网的初衷,一个松散的分布式网络。当你留下一个 URL 作为 reference 的时候,它可能会越来越完善,也可能改变主题,也可能 404 了。正是这种不太严格的设计让 www 超过同时代的竞争者,成为互联网的主流。

    2. 一个网站的内容可能是「违法」的。这就是另一个问题了,而且肯定不是百度的责任。
        52
    calpes   231 天前
    @icyalala 技术伦理问题
        53
    windowsuuy   231 天前
    @sowish 麻烦指出无脑点与开喷点。
        54
    Jelen   231 天前
    百度百科内容和审核机制确实存在问题,举个栗子:
    查询福田区的一个街道,在同一个页面的三个区域,说明街道有多少个社区时,分别出现了 13、14、15 三个不同的说法。这是明显的错误。
    我去编辑正确的并提交之后,第一次竟然给我退回来,说因为样式的问题,审核不通过,真是滑稽。
    我再次提交之后才给通过了。
    你无法校对内容也就罢了,别人修正的你至少认真核对一下吧。。
        55
    whatsmyip   231 天前
    是不是可以专门找一下类似的,然后去举报一波?:doge:
        56
    LicV587   231 天前
    对有些人来说,百度的责任无限大,百度的权利无限小,喷百度无限正确,赞百度无限错误。现在喷百度已经是互联网的政治正确了
        57
    kid177   231 天前   ♥ 4
    v 站和逼乎现在基本都是见百度就无脑黑,这个我就不说了。

    针对这个问题,我们来讨论下所谓方案的可行性,现在大家比较认同的方案就是,百度应该通过技术手段去验证外链文字描述和实际对应的外链到底是不是「相关」。

    1).你想到了这个方案,并不代表百度没做这件事,稍微做过策略的人都知道任何策略都是有准确率和召回率的,可能这个 case 刚好是没被召回(不过这也只是我的推测),而且「内容相关」这个问题,了解下 NLP 就知道,其实并不简单,不要认为这件事很好做。你非要和我杠,百度就是个技术公司,做不好丢脸,那我也无话可说。

    2).如果策略识别出来这个外链是有问题的,那准备对这个外链怎么处理。你要替换成正确的内容这个几乎不可能,你是不知道他真实对应的外链应该是哪个,那如果直接删了或者给个风险提示呢。上面说了策略都是有准确率的,万一你误识别了,给别人好的外链删了或者提示了,那是不是又是一波节奏,万一恰巧还是把竞品或者重要词条给提示了呢。那这个节奏估计又要带的飞起了。

    所以大家还是理性点,提方案很简单,实施起来真没那么容易。并不是不能黑百度,但是也别瞎逼黑啊
        58
    nosky   231 天前
    @lfzyx 你指的是哪种成人网站,sex 网站在中国是触犯了刑法的
        59
    whwq2012   231 天前 via Android
    不能只有百度背锅,他只是个平台而已。这还得靠百度和用户合作才能解决。
        60
    yingfengi   231 天前 via Android
    讲道理,这种锅百度不背啊
        61
    snw   231 天前 via Android
    @lfzyx 萌百是立足美利坚啊,虽然后来站长被现实拍醒,回国内注册了公司。
        62
    Shintaku   231 天前 via Android
    每日一黑 1/1
        63
    baskice   231 天前
    你这地图炮开的,不过我们也不是大陆网站
        64
    tabris17   231 天前
    gzshangxue (点) com ?
        65
    livc   231 天前
    脉脉的氛围倒是理性很多,同样是程序员,差距真大。
        66
    yann1992   230 天前
    做技术的也这么无脑黑?就不能理性地讨论问题?这个问题真的是百度的锅?
        67
    soho776   230 天前
    乱喷,这个事情的重点是,网站变成了色情网站为啥国内还能正常访问那,伟大的墙,这个时候为啥不发挥他应有的作用那?
        68
    superbai   230 天前
    讲真,从综合素质来说,百度百科应该算是国内做的最好的了吧
        69
    MaiKuraki   230 天前
    维基百科中文版本更垃圾
        70
    sobigfish   230 天前
    百度作为一个搜索引擎时时都在爬网页,验证引用的网页很容易就是懒的占用资源而已。
    但也不能全怪 wiki 服务商,出问题了提交个修改就是了(除非他们主动禁止你的修改)
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2401 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 66ms · UTC 13:43 · PVG 21:43 · LAX 06:43 · JFK 09:43
    ♥ Do have faith in what you're doing.