首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  程序员

求微信聊天记录搜索算法的思路

  •  
  •   xmflswood · 317 天前 · 1876 次点击
    这是一个创建于 317 天前的主题,其中的信息可能已经有所发展或是发生改变。

    今天发现微信的聊天记录搜索算法有点特殊:

    例如聊天记录中有 evan69780 这句话

    1.搜索 evan 匹配

    2.搜索 evan697 匹配

    3.搜索 van 不匹配

    4.搜索 697 匹配

    5.搜索 97 不匹配

    请问这是一种什么思路呢?(想必是通过牺牲一定的准确性来提升搜索效率)

    12 回复  |  直到 2018-12-05 20:09:24 +08:00
        1
    wdv2ly   317 天前 via Android
    就是个 bug 而已
        2
    boileryao   317 天前 via Android   ♥ 1
    应该是分词+前缀适配
        3
    reself   317 天前 via Android
    顶楼上,我也觉得很可能是分词+前缀
        4
    ballshapesdsd   317 天前
    van you see?
        5
    mumbler   317 天前
    97 之于 evan69780 可能权重太低而被过滤了,不如 97 年,1997
        6
    337136897   317 天前
    楼主大佬请问下微信的聊天记录的数据库如何打开。。。
        7
    graysheeep   317 天前
    @337136897 你能打开张小龙直接 500W 请你过去
        8
    tyx1703   317 天前
    @graysheeep 现在的不知道能不能打开。至少今年 1,2 月份的时候可以。Android
        9
    azh7138m   317 天前
    我猜类似 bitap 这种,取决于 score 怎么给和 token 怎么做

    https://en.wikipedia.org/wiki/Bitap_algorithm
        10
    janus77   317 天前 via iPhone   ♥ 2
        11
    xmflswood   317 天前
    @janus77 感谢!
        12
    falsemask   316 天前
    刚测了一下,对方手机是 iphone,我的是安卓,我搜 van 搜不到,她能搜到
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   4144 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 35ms · UTC 06:45 · PVG 14:45 · LAX 23:45 · JFK 02:45
    ♥ Do have faith in what you're doing.