我想把一个网站上的文章爬取下来,有没有办法可以自动触发 chrome 插件(简悦),他可以重新排版,保存的日记中。但是怎么批量的去做这件事情呢?大家有什么 idea ?
|  |      16J73U552K5UVij4R      2021-07-13 16:30:44 +08:00 用 selenium ?然后加载的时候把 chrome 插件 load 进去,再用 xpath 操作? | 
|  |      3itechify PRO 爬虫爬得好 | 
|      4ingdawn      2021-07-13 17:10:06 +08:00 坐牢坐到老 | 
|  |      5seamonster      2021-07-13 17:10:47 +08:00 真刑啊,日子越来越有判头了 | 
|  |      6zelentre      2021-07-13 17:18:55 +08:00 很刑. | 
|      7HankLu      2021-07-13 17:22:47 +08:00 很简单 | 
|      8ztcaoll222      2021-07-13 17:25:18 +08:00 先这样 | 
|  |      9HashV2      2021-07-13 17:28:29 +08:00 再这样 | 
|  |      10tojike      2021-07-13 17:29:39 +08:00 进去进得早 | 
|  |      11yunyuyuan      2021-07-13 17:32:09 +08:00 然后再这样 | 
|  |      12nepiedg      2021-07-13 17:35:32 +08:00 最后在这样 | 
|  |      13jingcoco      2021-07-13 18:40:44 +08:00 有个 网联网记忆的 工具,初衷是解决有些网站过了几年下线了 没法看的问题。 | 
|  |      14kasusa      2021-07-13 22:48:29 +08:00 python 写,selenium 库,模拟点击按钮,用 xpath 定位下一篇按钮,刷新再来。 就这么个流程吧。 不过我感觉网上还是垃圾信息多。都爬下来有什么用呢? | 
|      15caicaiwoshishui      2021-07-13 23:20:38 +08:00 via iPhone 楼上队形笑死我 | 
|  |      166J73U552K5UVij4R      2021-07-14 02:47:02 +08:00 @hackingwu 可以的,用 js dom 就可以,xpath 估计也可以。 | 
|      17solopython      2021-07-14 09:47:57 +08:00 试试 Newspaper3k | 
|  |      18muzuiget      2021-07-14 13:33:39 +08:00 写个浏览器扩展就可以了,专事专办。 |