V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
xuanwu
V2EX  ›  问与答

请问如何开发一个针对使用中文命名的源码库的代码搜索引擎?

  •  
  •   xuanwu · 2018-08-20 15:08:51 +08:00 · 935 次点击
    这是一个创建于 2285 天前的主题,其中的信息可能已经有所发展或是发生改变。

    原址: https://github.com/program-in-chinese/overview/issues/80

    类似 searchcode/Sourcegraph, 不同处是针对中文命名的源代码进行索引. 主要目的是促进源码交流和再利用. 暂时想到的相比英文代码搜索引擎的额外问题:

    技术方面: 中文分词. 比如在 github 搜索"简繁体互转"就无法找到这个源码, 而搜索"确认简繁体互转"就可以.

    非技术: 找到合适的代码库, 并定期更新

    做了一点初步调研, 参考这帖, 只找到这个开源的可供参考(还未细看许可证): https://github.com/boyter/searchcode-server 看起来多数此类英文代码搜索引擎项目都已废止. 相信除了本身投入较大之外, 面向人群有限也是个因素(相对一般搜索引擎的用户量, 对编程有兴趣群体应该是个零头). 中文代码总量仍极少, 初期硬件投入会较小.

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   984 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 21:18 · PVG 05:18 · LAX 13:18 · JFK 16:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.