V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
leafonsword
V2EX  ›  奇思妙想

基于微博、twitter 分析做一个编程语言排行榜

  •  
  •   leafonsword · 2014-06-28 11:09:58 +08:00 · 4086 次点击
    这是一个创建于 3588 天前的主题,其中的信息可能已经有所发展或是发生改变。
    现在有各种编程语言排行榜,譬如TOIBE基于谷歌、维基百科和youtube来排名,RedMonk基于github和stackoverflow来排名,但目前似乎没有基于微博、twitter海量数据这样的一个排名,我想做一个,并且将所用程序和算法公开,大家觉得怎么样?
    12 条回复    2014-07-04 11:46:17 +08:00
    acpp
        1
    acpp  
       2014-06-28 11:14:37 +08:00
    想做就做,不要问别人怎么样
    acpp
        2
    acpp  
       2014-06-28 11:14:53 +08:00
    做得出来再说
    GhostFlying
        3
    GhostFlying  
       2014-06-28 11:35:53 +08:00
    twitter不好说,现在微博的API给的接口不一定够用来做这种分析啊,而且觉得这种SNS上很可能受到各种课程之类的影响,可能会和实际差异比较大
    alexapollo
        4
    alexapollo  
       2014-06-28 13:08:14 +08:00
    首先是要有微博的增量数据,入库,然后做啥都容易……
    WildCat
        5
    WildCat  
       2014-06-28 13:17:08 +08:00
    微博的数据不可信
    ooof
        6
    ooof  
       2014-06-28 13:52:18 +08:00 via Android
    各种语言,每天在微博搜索一下提到的数量,算出当天的增量,j积累一段时间做比较?
    missdeer
        7
    missdeer  
       2014-06-28 14:37:38 +08:00
    我对在微博上聊技术人表示常常的不屑,不管他的技术水平怎样。
    ChiChou
        8
    ChiChou  
       2014-06-28 16:11:58 +08:00
    这个事情好像很早以前就有人做了。

    http://www.csdn.net/article/2012-02-02/311363
    imcj
        9
    imcj  
       2014-06-28 22:23:12 +08:00
    好奇,你能不能在激情褪去以前,先爬到所有的微博数据。微博API的请求有配额限制
    leafonsword
        10
    leafonsword  
    OP
       2014-06-29 16:00:19 +08:00
    @ChiChou
    哎,还真是
    jerryjhou
        11
    jerryjhou  
       2014-07-01 22:27:14 +08:00
    @imcj ???那自由微博是如何做到动态监控新的微博,并且筛选被屏蔽或删除的?
    imcj
        12
    imcj  
       2014-07-04 11:46:17 +08:00
    @jerryhou 不是这个事情能不能做到,而是个人基于兴趣开发产品,在爬微博数据上,就消耗了大量的精力。最后到最关键的问题上,却已经疲惫了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5321 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 08:32 · PVG 16:32 · LAX 01:32 · JFK 04:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.