最近写一个爬虫程序,一直用 aiohttp 用的好好的,突然有一天模拟登陆不正常了 查了半天发现是网站换了 http2,所有 http1.1 协议的操作请求都 403 了. 找了半天才发现现在 python 的库基本没什么支持 http2 的,就一个 hyper 可以在 client 端发送 http2 请求. 可这货也是很久不更新了,很多功能不支持,连在 https 上 proxy 都不支持,而且功能少的可怜,很难用. 现在我想请教一下各位,有没有什么好的办法
1
cnilnhf 2018-10-15 15:04:09 +08:00 via Android
思路是,http2 应该有降级模式,不可能只强制使用 http2 协议连接,或许能解决你的问题。
|
2
reus 2018-10-15 15:04:35 +08:00
换 go
|
3
LokiSharp 2018-10-15 15:06:19 +08:00
requests 手动导入证书就行了 aiohttp 应该也可以的
|
4
zy8595208 OP @cnilnhf 网页页面 http1.1 可以请求打开查看,但是所有的 API 操作请求,都强制 http2 了.
|
6
LokiSharp 2018-10-15 15:13:34 +08:00
@zy8595208 #5
https://docs.aiohttp.org/en/stable/client_advanced.html#ssl-control-for-tcp-sockets 看这里,默认是没有导入证书的所以不支持 https 手动指定一个证书就行了 |
7
zy8595208 OP @LokiSharp 现在不是 https 的问题,是被爬的网站必须使用 http/2 协议才能正常模拟登陆操作. 但是 aiohttp 现在还不支持 http/2 协议
|
8
LokiSharp 2018-10-15 15:26:36 +08:00
诶,这个站用不支持 h2 的浏览器不会降级么?
|