文章很长,内部有多个分页,请问如何每个分页都采集后再合成一个完整的文章?
比如漫画的一个篇章有很多个页面,但是都属于同一话,采集完后要归类到同一个页面。
Url 一般是这种格式。
https://www.dmzj.com/view/jinshangxiang/83169.html#@page=1
https://www.dmzj.com/view/jinshangxiang/83169.html#@page=2
https://www.dmzj.com/view/jinshangxiang/83169.html#@page=3
比如漫画的一个篇章有很多个页面,但是都属于同一话,采集完后要归类到同一个页面。
Url 一般是这种格式。
https://www.dmzj.com/view/jinshangxiang/83169.html#@page=1
https://www.dmzj.com/view/jinshangxiang/83169.html#@page=2
https://www.dmzj.com/view/jinshangxiang/83169.html#@page=3