V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
muxi
V2EX  ›  程序员

有赞搜索引擎实践(工程篇)

  •  
  •   muxi ·
    cuimuxi · 2016-03-22 16:36:36 +08:00 · 3146 次点击
    这是一个创建于 2949 天前的主题,其中的信息可能已经有所发展或是发生改变。

    随着数据的增长,搜索引擎在很多公司的业务上都是必备的基础设施之一了,有赞也不例外。 经过接近一年的持续迭代,有赞在搜索引擎上也做了一些事情。希望能对于正在寻找解决方案的同学有所启发。

    访问地址:

    http://tech.youzan.com/you-zan-sou-suo-yin-qing-shi-jian-gong-cheng-pian-2/

    有赞技术团队会持续的对外公布这两年积累的一些经验和基础设施源码

    有赞的技术发展离不开互联网的各种牛逼人士的贡献,现在有点能力,开始慢慢对外输出自己的积累。

    4 条回复    2016-03-22 17:12:28 +08:00
    aszxqw
        1
    aszxqw  
       2016-03-22 16:41:16 +08:00
    感觉不错。已收藏。
    3dwelcome
        2
    3dwelcome  
       2016-03-22 16:57:32 +08:00
    支持一下楼主,可惜都是软件使用,没有自研算法介绍啊。

    我自己发明一个基于 bitset cache ,全新的 filter 算法,用于论坛的标题全文的检索里,感觉不错,又快又好又 NB 。等有空整理一下,把 blog 里的文章转过来,再附带一篇详细实战教程。
    sjtlqy
        3
    sjtlqy  
       2016-03-22 17:08:23 +08:00
    自研算法? 自研组件?
    3dwelcome
        4
    3dwelcome  
       2016-03-22 17:12:28 +08:00
    可以理解成 bloom filter 的针对全文搜索版本优化版,不过原理完全不一样,虽然都是用 bitset 操作的。全文搜索里基于 bitset 的快速筛选是很重要的一步。

    是自研组件,脑洞太大,没办法,什么都喜欢先自研一下。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   949 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 21:05 · PVG 05:05 · LAX 14:05 · JFK 17:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.