最近有个网页整体翻译的需求,看了一下,Google 网页翻译是最优解,但是使用 selenium 也获取不了网页翻译后的源码。
网页对象链接( Google 网页翻译页面): https://translate.google.com.hk/translate?hl=&sl=en&tl=zh-CN&u=https://docs.python.org/3/tutorial/index.html
使用 selenium 取这个网页的源码,但是只能获取到 head 源码,body 主要的信息获取不到,请问有什么方法能获取到整个页面的源码吗?
1
DonnyChao OP ![image.png]( https://p.pstatp.com/origin/ff450002d304a982cd55)
|
2
noqwerty 2020-06-14 22:51:57 +08:00 1
Google 的 Cloud Translation 可以直接调 API 的: https://cloud.google.com/translate/docs/
|
3
laoyur 2020-06-14 22:52:42 +08:00 1
处理 iframe 时,要先 driver.switch_to.frame(frames[0])一下才行
|
4
9yu 2020-06-14 22:52:53 +08:00 via Android 1
检查有没有 iframe
|
5
xiri 2020-06-14 22:59:33 +08:00
为什么不直接调用 API
|
6
jizhihaoSAMA 2020-06-14 23:04:01 +08:00
iframe 正解
|
9
sxd96 2020-06-15 01:59:16 +08:00 via iPhone 1
如果只是这个网页的话,你知不知道这有中文选项...
|
10
polarpy 2020-06-15 11:37:46 +08:00
正解
|
11
yucongo 2020-06-16 23:08:58 +08:00 via Android
用 Pyppeteer 吧,还能异步操作。有现成的基于 Pyppeteer 的包 https://pypi.org/project/deepl-tr-async/ pip install deepl-tr-async,可异步调 google 翻译或 deepl
|