V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
kirch
V2EX  ›  分享创造

通过文本分析给商品分类

  •  
  •   kirch · 2015-03-01 23:02:22 +08:00 · 3256 次点击
    这是一个创建于 3305 天前的主题,其中的信息可能已经有所发展或是发生改变。
    上次撸了个爬虫爬各种什么值得买网站,后来发现分类是个问题,因为每个网站都有自己的分类标准
    然后试着用文本分析的给商品分类,效果还可以,已经用在了那个网站上。

    不知道这类服务是否会有需求?

    这个是测试DEMO
    http://www.suimai.com/api/classify

    ALI云有CPU限制,大家轻点插啊
    7 条回复    2015-03-22 19:00:06 +08:00
    cevincheung
        1
    cevincheung  
       2015-03-01 23:35:15 +08:00
    开源是王道
    kslr
        2
    kslr  
       2015-03-02 00:19:18 +08:00 via Android
    Tag ?
    best1a
        3
    best1a  
       2015-03-02 00:22:16 +08:00
    TF-IDF?
    xiaogui
        4
    xiaogui  
       2015-03-02 01:26:52 +08:00   ❤️ 2
    分享下几年前借助淘宝 sdk 的做法,不一定是最准确的,但是挺取巧的。
    1、对商品名称进行分词;
    2、将分词后的内容使用淘宝 sdk 进行搜素;
    3、将搜索后的结果取 top 100 ,然后对这 top 100 的分类进行类似 group by 的操作;
    4、将分类占比率最大或者前两名作为该商品的商品分类。
    备注:
    1、此方法对特殊商品无效,比如药品类。
    2、如果遇到淘宝 sdk 访问频率超限,可以通过建立授权池的方法进行解决。
    RangerWolf
        5
    RangerWolf  
       2015-03-06 16:56:39 +08:00
    试了几个 感觉不错啊!
    分享一下你的做法?
    llhh
        6
    llhh  
       2015-03-22 17:31:14 +08:00
    楼主这是机器学习吗?
    kirch
        7
    kirch  
    OP
       2015-03-22 19:00:06 +08:00
    @kslr
    @best1a
    @RangerWolf
    @llhh
    支持向量机
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3383 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 11:39 · PVG 19:39 · LAX 04:39 · JFK 07:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.