V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  gfreezy  ›  全部回复第 18 页 / 共 22 页
回复总数  439
1 ... 10  11  12  13  14  15  16  17  18  19 ... 22  
@lizheming "然后有兴趣的朋友,可以一起来搞,可以聚合更多的东西。 "
这个可以有。
@lizheming @laiwei "其实,我做这个东西的初衷,就是可以保存我的一些东西,然后慢慢上了年纪,就会老翻出来看看,比较怀旧"

我跟@laiwei的想法差不多,把多个sns站多个帐号的feed存档,供以后慢慢翻阅。 直接读取api只能取到最近的200条feed,achieve就实现不了了。
@ant_sz Google了只找到个推广视频。。。。。
@benzhe python,才开始熟悉,算不上开始写都。
@laiwei 怎么样的形式?我想的是:
输入: 不同网站的用户名 @a @b @c ,不需要用户自己在连接授权什么的
输出: 时间排序的timeline

如果一样的话,我来加入你吧。
@benzhe 这个好像一般来说是确实用不着超过200。不过这个好比配电脑买主板,便宜点的是一内存槽插个4G的;或者贵点的多个槽插个4G的。考虑到以后可能性微乎其微的升级问题,还是决定买贵点的。
有个东西限制死了就是让人不爽。。。纯主观。。。
@lizheming @benzhe 今天弄了弄sina的api,然后想到了200这个是限制只能取到最近的200条。因为要获取多个sns网站的feed,然后按照实际排序,所以实际上是需要本地存储feed的。

因为本地有存储,就绕过了这个200的限制。只是取不到现在200条以前的feed的而已,不过这个关系不大。

实际动手了才发现,真心不好弄,麻烦。。。
@lizheming 这个用什么方法来做比较好啊?
新浪的API是要OAuth认证的,而且只能取到最近的200个feed,但是抓网页的话怎么都感觉很麻烦啊?
2012-01-12 19:25:37 +08:00
回复了 tylr42 创建的主题 问与答 有没有有趣(small project oriented)的JavaScript教程/书籍推荐?
JavaScript 艺术与科学
http://book.douban.com/subject/5352321/
全书以多个小实例来讲的,都是比较实际的东西。
@lizheming 看样子,自己动手,丰衣足食啊。
@fature 不多,曾经公司要爬新浪博客,爬了个把星期。。。--
千把页面还好。。。
@fature beautifulsoup,xpath+lxml效率不低啊,况且一个页面,再大也没多少数据啊。
phantomjs是直接用Qt的webkit内核,跟浏览器差不多,不会效率很差啊。
@fature beautifulsoup,xpath什么的可以处理这个。
用js来抓 http://www.phantomjs.org/
@jiyinyiyong 电信劫持吧,我最近也总是跳出这个广告“宽带提速啊,神码到10M、20M的”
不明白需求 +1
如果只是把所有的 <p></p>直接的内容匹配出来

regrex = r'<p>(.*?)</p>'
paragraphs = re.findall(regrex, html_content)

应该可以,没测试。
@hanbaoo 可以脚本么,实在不行手动也没几个人,自己用么
@zhaoyafei 不知道 “有人” 要做的是什么。。。不会用
回复不支持Markdown的啊。。。
只知道A、B、C的帐号民而不获取账户的token能实现这个不?
谢谢各位
@lizheming 飞信这个只能把 **一个人** 在不同网站上的信息流聚合在一起。
我要的是这样一个: 有A、B、C 3人,分别在人人、新浪、腾讯有账户,我希望有一个地方可以 **同时** 看到A、B、C **分别** 发在自己的账户上的信息。
1 ... 10  11  12  13  14  15  16  17  18  19 ... 22  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1142 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 18:48 · PVG 02:48 · LAX 11:48 · JFK 14:48
Developed with CodeLauncher
♥ Do have faith in what you're doing.