我发现 BS4 处理代码时会改变属性的顺序,
<td height="250" class="infodetail" id="TDContent" valign="top">
上边这行代码经过 BeautifulSoup(htmlstr,'html.parser')处理后会变成
<td class="infodetail" height="250" id="TDContent" valign="top">
很显然,这是根据标签属性的顺序进行了重新排序,有什么方法能不能取消这种排序吗?
(我因为装了几次 lxml 都不成功,所以还是在用 html.parser)
<td height="250" class="infodetail" id="TDContent" valign="top">
上边这行代码经过 BeautifulSoup(htmlstr,'html.parser')处理后会变成
<td class="infodetail" height="250" id="TDContent" valign="top">
很显然,这是根据标签属性的顺序进行了重新排序,有什么方法能不能取消这种排序吗?
(我因为装了几次 lxml 都不成功,所以还是在用 html.parser)
)