V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Leon6868
V2EX  ›  Google

搜索引擎是怎么处理零宽字符的?

  •  
  •   Leon6868 · 2020-08-22 23:08:51 +08:00 via Android · 2588 次点击
    这是一个创建于 1557 天前的主题,其中的信息可能已经有所发展或是发生改变。
    举个例子:
    如果我在一段文字中加入零宽字符;当我在引擎中查询这段文字,搜索搜索引擎在返回结果时,是否会忽略零宽字符?

    如以下字符串:(咱花了好久才试出来的)
    unicode:8234 前‪后 1‪2
    unicode:8235 这是真的‫可爱 1‫2
    unicode:8236 前‬后 1‬2
    unicode:8237 前‭后 1‭2
    unicode:8203 前​后 1​2
    unicode:8204 前‌后 1‌2
    unicode:8205 前‍后 1‍2
    unicode:8206 前‎后 1‎2
    unicode:8207 前‏后 1‏2

    我是否可以通过零宽字符来溯源?
    5 条回复    2020-08-23 16:38:12 +08:00
    billlee
        1
    billlee  
       2020-08-22 23:13:18 +08:00
    搜索引擎都是要先分词的,零宽字符大概和空格是一样的效果吧
    TimePPT
        2
    TimePPT  
       2020-08-23 01:25:34 +08:00 via Android
    停用词
    Leon6868
        3
    Leon6868  
    OP
       2020-08-23 11:03:10 +08:00 via Android
    @TimePPT 就是说,零宽字符不会影响搜索引擎的结果?
    TimePPT
        4
    TimePPT  
       2020-08-23 11:41:43 +08:00 via Android
    @Leon6868 不影响
    codehz
        5
    codehz  
       2020-08-23 16:38:12 +08:00
    你用 chrome 的页内搜索功能搜索前后两个字试试(
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   6002 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 46ms · UTC 02:31 · PVG 10:31 · LAX 18:31 · JFK 21:31
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.