首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Coding
V2EX  ›  问与答

关于 lucene 分词的一个问题

  •  
  •   gavinnnnn · 179 天前 · 499 次点击
    这是一个创建于 179 天前的主题,其中的信息可能已经有所发展或是发生改变。

    本人初次接触搜索, 遇到一个问题: 可以用词搜的出来, 用单字搜索不了.

    比如用分词器 IKAnalyzer 做分词时, 把 空调 分词成了 [空调], 这样我搜索 的时候就没有返回值, 因为索引中没有这个字, 但是如果分词器把所有单字都分词的话有很傻, 感觉是个很简单的问题, 应该有解决方案, 却怎么也搜不到, 在此向各位大神求教!

    5 回复  |  直到 2019-06-15 18:31:25 +08:00
        1
    misaka19000   179 天前
    照你这需求那就分成单个吧
        2
    Phuasheng   179 天前
    不是专门搞这个的
    我的解决方法是,分词先解决一部分精准,然后剩余的用模糊搜索,😂
        3
    avastms   179 天前
    这个分词器有两个模式,一个 smart 模式一个 max word 模式,smart 一搬不会产生单个字的 token 但 max word 会。

    你想索引单个字当然要分成单字了。

    如果你不想占索引空间那你只能现场计算
        4
    gavinnnnn   179 天前
    @avastms 两个模式我都试了, 但我上面说的问题都没有解决.
        5
    rogwan   179 天前 via iPhone
    @gavinnnnn 每次更换分词模式,都要重建索引。重新索引一下试试
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2597 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 24ms · UTC 13:42 · PVG 21:42 · LAX 05:42 · JFK 08:42
    ♥ Do have faith in what you're doing.