比如对于以下数据
<p id="a">data</p>
我只想保留
<p>data</p>
该如何操作,有快捷的方法吗?
1
xgzxy 2018-04-08 11:53:10 +08:00
用 text()提取出文本吧,就能取出 data 了吧
|
2
sheep3 2018-04-08 12:02:59 +08:00 1
直接正则 replaceAll("<\S+\s(.*?)>","")
唔..... 大概有这种语法吧..... |
3
Daniel65536 2018-04-08 12:17:15 +08:00 via iPhone 2
lxml.html.clean
|
4
hanxiV2EX 2018-04-08 12:19:54 +08:00 via Android
二楼的正则可以搞定吧
|
5
woscaizi 2018-04-08 12:48:55 +08:00 via iPhone
Xpath 语法可解
|
6
rayhy 2018-04-08 14:48:29 +08:00
|
8
Luckyray 2018-04-08 16:58:36 +08:00
为什么要保留 html 文件?保存下来想要的数据不行吗
|
9
qsnow6 2018-04-08 22:14:25 +08:00
都让开,看我这个贴: https://www.v2ex.com/t/342064#reply12
|