V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
asing
V2EX  ›  程序员

美丽说这样的地址可以抓取么?

  •  
  •   asing · 2013-01-28 14:07:07 +08:00 · 3711 次点击
    这是一个创建于 4324 天前的主题,其中的信息可能已经有所发展或是发生改变。
    例如
    http://www.meilishuo.com/share/842617785?sn=aspn&wzz=p0r0c1

    右侧的“去购买”点击后跳转到淘宝链接,有办法可以把淘宝链接读取出来么

    curl试了,不行
    感谢
    11 条回复    1970-01-01 08:00:00 +08:00
    sobigfish
        1
    sobigfish  
       2013-01-28 14:12:41 +08:00   ❤️ 1
    asing
        2
    asing  
    OP
       2013-01-28 14:29:40 +08:00
    @sobigfish 能说下思路么
    sobigfish
        3
    sobigfish  
       2013-01-28 14:41:31 +08:00
    这个地址就在你的贴的那个页面里啊,那么多`去购买` 都有这个地址,貌似这个最容易采集 <a class="price_go" href,而且那个页面里的js也有定义
    url
    asing
        4
    asing  
    OP
       2013-01-28 14:53:50 +08:00
    嗯,我就是在centos上 执行了下,也得到了
    <script>
    function goURL( goUrlStr ) {
    if ( typeof(goUrlStr) != 'undefined') {
    var isIe=(document.all)? true : false;
    if(isIe) {
    var linka = document.createElement('a');
    linka.href = goUrlStr;
    document.body.appendChild(linka);
    linka.click();
    } else {
    window.location = goUrlStr;
    }
    }
    return true;
    }
    </script>
    <body><script>goURL('http://www.77169link.com/go/?t=18616859973&u=http%3A%2F%2Fitem.taobao.com%2Fitem.htm%3Fid%3D18616859973');</script></body>


    你说的是那个页面的js有定义URL?
    DKR
        5
    DKR  
       2013-01-28 15:49:33 +08:00
    正好刚刚也在用curl 需要伪装一个http请求 参数
    CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT']
    这样就可以了
    qiongqi
        6
    qiongqi  
       2013-01-28 16:41:36 +08:00
    抓这个有什么用啊?每个淘宝客id对应的链接都是不一样的啊
    sobigfish
        7
    sobigfish  
       2013-01-28 17:08:09 +08:00
    @qiongqi 查了查 http://api.taobao.com/apitools/apiTools.htm?catId=4&apiName=taobao.item.get 貌似确实是啊 num_iid
    请问怎么区分track_iid和num_iid
    asing
        8
    asing  
    OP
       2013-01-29 15:10:31 +08:00
    @qiongqi 什么意思?淘宝客id去除掉不是可以得到原始的url么?

    我然后再加上我的不行么?
    qiongqi
        9
    qiongqi  
       2013-01-29 18:10:40 +08:00
    @sobigfish 不清楚,没做过这块。应该都是api返回的吧,返回什么用什么
    qiongqi
        10
    qiongqi  
       2013-01-29 18:13:09 +08:00
    @asing 你试试吧,我觉得不行,淘宝客的url都是通过一些算法加密过的。都这么简单能拼出来的话,还给每个appkey设置调用限制干嘛?
    gfreezy
        11
    gfreezy  
       2013-01-29 22:20:29 +08:00
    用淘宝的api可以转换淘宝客链接,不过现在只支持客户端转换,就是用淘宝提供的JS SDK来转了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2674 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 10:27 · PVG 18:27 · LAX 02:27 · JFK 05:27
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.