V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
acpp
V2EX  ›  问与答

v2的技术控们,集思广益,大家一起来讨论下团购导航网站的技术组成

  •  
  •   acpp · 2012-11-05 16:02:41 +08:00 · 2559 次点击
    这是一个创建于 4197 天前的主题,其中的信息可能已经有所发展或是发生改变。
    像http://tuan.360.cn/ 这种团购导航站,会自动对其他网站的数据进行搜集 分类
    就聊聊这网站技术性的问题吧。比如说如何正确的抓取数据回来 如何判断产品价格和目标站点是否统一 还有就是如何对数据进行分类 大家可以捡自己最熟悉的一个小分类说,如果说的不完善,其他友人再在基础上进行补充
    7 条回复    1970-01-01 08:00:00 +08:00
    binux
        1
    binux  
       2012-11-05 16:04:56 +08:00   ❤️ 1
    我不认为360是去抓回来的,而是提供标准接口让其他网站给他提交
    acpp
        2
    acpp  
    OP
       2012-11-05 16:12:52 +08:00   ❤️ 1
    @binux 一般网站在初期的时候,没流量没资源,就提供了接口,也没几个人愿意去提交自己网站的啊,相反,都是有了流量以后,大家才变得积极起来,所以前期的话,不能按照成功后的方法去考虑啊
    tuzi
        3
    tuzi  
       2012-11-05 18:27:16 +08:00   ❤️ 1
    就是采集建站的问题,规划好信息架构,之后针对目标站写好采集规则,入库。做好定时任务,自动更新就行了。有空的话,每天手工审核一下!
    markmx
        4
    markmx  
       2012-11-05 18:52:52 +08:00
    为了看一些特价信息方便。我自己搞个 uh5.cn , 相当与聚合一样,没什么的!
    skydiver
        5
    skydiver  
       2012-11-05 20:43:57 +08:00   ❤️ 2
    @acpp 之前做过一段团购导航网站。其实是团购网站提供了接口的。这个接口的格式有约定俗成的标准,不过忘了是哪家团购网站最先弄的了。团购网站也是希望自己的内容被抓取的,一般联系一下会主动提供接口。
    sadara
        6
    sadara  
       2012-11-05 21:13:30 +08:00   ❤️ 1
    好多建站程序都支持啊
    sp1sp1
        7
    sp1sp1  
       2012-11-06 10:52:04 +08:00   ❤️ 1
    网站提供api,它们采集就行了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   823 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 22:23 · PVG 06:23 · LAX 15:23 · JFK 18:23
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.