首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX 提问指南
广告
V2EX
›
问与答
Python 实现
archive.org
类似快照的功能,有什么好的思路?
cszhiyue
·
2016-08-17 03:12:21 +08:00
· 1081 次点击
这是一个创建于 2823 天前的主题,其中的信息可能已经有所发展或是发生改变。
页面的渲染? phantomjs
css/js/img 下载
更改页面的路径?
还需要注意些什么?
img
phantomjs
Python
页面
3 条回复
•
2016-08-17 21:16:57 +08:00
1
imcocc
2016-08-17 12:57:44 +08:00 via iPhone
1
页面渲染不需要的。
复杂点的, js 里包含网页地址就需要解析 js 了。
简单点的,类似离线浏览的功能,把所有需要的 htmljs 等网页文件抓好,换个路径供人访问。
你可以试试离线浏览器感受一下,学学思路( Offline Explorer )。
2
cszhiyue
OP
2016-08-17 19:06:00 +08:00
@
imcocc
这样的话暂时只需要把 js css img 抓取。然后更换路径了。
3
imcocc
2016-08-17 21:16:57 +08:00 via iPhone
@
cszhiyue
对的,这就是扒站
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
5780 人在线
最高记录 6543
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms ·
UTC 06:52
·
PVG 14:52
·
LAX 23:52
·
JFK 02:52
Developed with
CodeLauncher
♥ Do have faith in what you're doing.