puppeteer 运行大概一周后,就无法再打开 chrome 进程了,在这期间会非常频繁的打开关闭 browser
以下为伪代码,部分业务处理已移除
try {
let proxy = await jsonUtil.getProxy();
logger.info("proxy", proxy);
let proxy_server = 'http://' + proxy.ip + ':' + proxy.port
const launch_options = {
headless: true,
ignoreDefaultArgs: ['--enable-automation', '--window-size=1440,1024',
'--proxy-server=' + proxy_server,
'--user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36',
'--disable-extensions'],
dumpio: true, autoClose: true, devtools: false,
args: ['--no-sandbox', '--disable-gpu', '--disable-dev-shm-usage']
};
browser = await puppeteer.launch(launch_options);
const pages = await browser.pages();
if (common.proxyName !== null) {
await page.authenticate({username: common.proxyName, password: common.proxyPwd});
}
await page.setViewport({width: 1440, height: 1024});
await page.setDefaultNavigationTimeout(45000);
await page.goto('http://localhost:8085/crackByGt?gt=' + data.gt + "&challenge=" + data.challenge, {waitUntil: 'networkidle0'});
//Some business processing
} catch (e) {
logger.error("error", e)
} finally {
await page.close();
await browser.close();
logger.info("浏览器关闭完成")
}
除此之外,还有一个 kill 长时间未关闭的 shell 脚本,目的是杀死超过 12 小时未关闭的 chrome-linux 进程
#!/bin/bash
#please specify the process run time,which you want to kill
run_tim=12
pid=`ps -ef | grep chrome-linux | awk '{print $2}'`
for i in $pid
do
number=`ps -p $i -o etime | wc -l`
if [ $number -eq 2 ];then
tim=`ps -p $i -o etime | awk -F ":" 'NR==2{print $1}'`
if [ $tim -ge ${run_tim} ];then
kill -9 $i
fi
else
continue
fi
done
[2021-01-17T08:00:19.648] [ERROR] jiyan - 异常 Error: Failed to launch the browser process! spawn /opt/bbd_verify_nodejs/node_modules/[email protected]@puppeteer/.local-chromium/linux-818858/chrome-linux/chrome EAGAIN
TROUBLESHOOTING: https://github.com/puppeteer/puppeteer/blob/main/docs/troubleshooting.md
at onClose (/opt/bbd_verify_nodejs/node_modules/[email protected]@puppeteer/lib/cjs/puppeteer/node/BrowserRunner.js:193:20)
at ChildProcess.<anonymous> (/opt/bbd_verify_nodejs/node_modules/[email protected]@puppeteer/lib/cjs/puppeteer/node/BrowserRunner.js:185:85)
at ChildProcess.emit (events.js:311:20)
at Process.ChildProcess._handle.onexit (internal/child_process.js:273:12)
at onErrorNT (internal/child_process.js:469:16)
at processTicksAndRejections (internal/process/task_queues.js:84:21)
[2021-01-17T08:00:19.770] [ERROR] jiyan - 异常 Error: Failed to launch the browser process!
[0117/080019.402868:FATAL:zygote_host_impl_linux.cc(174)] Check failed: process.IsValid(). Failed to launch zygote process
#0 0x5619c2f86b39 base::debug::CollectStackTrace()
#1 0x5619c2ef94c3 base::debug::StackTrace::StackTrace()
#2 0x5619c2f09c80 logging::LogMessage::~LogMessage()
#3 0x5619c2f0a84e logging::LogMessage::~LogMessage()
#4 0x5619c199c59c content::ZygoteHostImpl::LaunchZygote()
#5 0x5619c2ea476a content::(anonymous namespace)::LaunchZygoteHelper()
#6 0x5619c0f678d6 content::ZygoteCommunication::Init()
#7 0x5619c0f67fd7 content::CreateUnsandboxedZygote()
#8 0x5619c2ea3d46 content::ContentMainRunnerImpl::Initialize()
#9 0x5619c2ea1e0b content::RunContentProcess()
#10 0x5619c2ea1f5c content::ContentMain()
#11 0x5619c2ef33d2 headless::(anonymous namespace)::RunContentMain()
#12 0x5619c2ef30bc headless::HeadlessShellMain()
#13 0x5619c04f4a03 ChromeMain
#14 0x7f3f7349f555 __libc_start_main
#15 0x5619c04f482a _start
Received signal 6
#0 0x5619c2f86b39 base::debug::CollectStackTrace()
#1 0x5619c2ef94c3 base::debug::StackTrace::StackTrace()
#2 0x5619c2f866db base::debug::(anonymous namespace)::StackDumpSignalHandler()
#3 0x7f3f78e35630 (/usr/lib64/libpthread-2.17.so+0xf62f)
#4 0x7f3f734b3387 __GI_raise
#5 0x7f3f734b4a78 __GI_abort
#6 0x5619c2f85665 base::debug::BreakDebugger()
#7 0x5619c2f0a0f2 logging::LogMessage::~LogMessage()
#8 0x5619c2f0a84e logging::LogMessage::~LogMessage()
#9 0x5619c199c59c content::ZygoteHostImpl::LaunchZygote()
#10 0x5619c2ea476a content::(anonymous namespace)::LaunchZygoteHelper()
#11 0x5619c0f678d6 content::ZygoteCommunication::Init()
#12 0x5619c0f67fd7 content::CreateUnsandboxedZygote()
#13 0x5619c2ea3d46 content::ContentMainRunnerImpl::Initialize()
#14 0x5619c2ea1e0b content::RunContentProcess()
#15 0x5619c2ea1f5c content::ContentMain()
#16 0x5619c2ef33d2 headless::(anonymous namespace)::RunContentMain()
#17 0x5619c2ef30bc headless::HeadlessShellMain()
#18 0x5619c04f4a03 ChromeMain
#19 0x7f3f7349f555 __libc_start_main
#20 0x5619c04f482a _start
r8: 0000000000000000 r9: 0000000000000000 r10: 0000000000000008 r11: 0000000000000202
r12: 00001db7754aedc0 r13: aaaaaaaaaaaaaaaa r14: 00001db7754aedd0 r15: 00007fffdb5a2270
di: 000000000000217f si: 000000000000217f bp: 00007fffdb5a1a20 bx: 00007fffdb5a2290
dx: 0000000000000006 ax: 0000000000000000 cx: ffffffffffffffff sp: 00007fffdb5a18e8
ip: 00007f3f734b3387 efl: 0000000000000202 cgf: 0000000000000033 erf: 0000000000000000
trp: 0000000000000000 msk: 0000000000000000 cr2: 0000000000000000
[end of stack trace]
Calling _exit(1). Core file will not be generated.
1
guochao 2021-01-18 10:39:39 +08:00
我原来遇到过 chrome 标签无法自己关闭的情况,所以后来是用了 cgroup 啊、timeout 啊之类的工具,来清理 chrome 进程。
你上面贴的信息不足以得到为什么启动不了进程的原因。原因有很多,比如说资源不够了( pid,mem,……)。我没读过 chromium 实现,但是有没有可能是用了同一个 profile ?用同样的参数能不能手动启动一个 headless chromium ? 建议先自己再调研一下 |
2
WishMeLz 2021-01-18 10:52:33 +08:00
这个东西我在服务器里面运行不成功,我也不知道什么原因。我只能在我的电脑里面运行
|
3
Areym 2021-01-18 11:08:35 +08:00
建议每次只开一个浏览器进程 然后每次新开一个标签页做任务 完事之后关闭标签页 不关闭浏览器
|
4
guochao 2021-01-18 11:40:55 +08:00
@WishMeLz 可能性有几个,一个是这玩意儿依赖 X,是不是什么库没有装。另一个是 chromium 带了几种沙箱实现,是不是这几种沙箱都不能正常工作,不能正常工作的话会失败。
@missz 想起来忘了说的一个问题。你加了'--no-sandbox',建议还是不要这个。在代码里面修一下 sandbox 的权限,sandbox 文件的 owner 需要是 root ( puppeteer 解压以后是当前用户,需要 chown ),并且需要 chmod u+s 来让当前用户下执行的程序自动切换到 root (用来配置沙箱环境限制子进程)。而且,对,推荐用 @Areym #2 提到的开标签页做事儿。 |
5
lozzow 2021-01-18 11:57:35 +08:00 via iPhone
可以尝试使用 docker 版本的,然后直接退出 docker 来清理资源
|
6
Justin13 2021-01-18 12:52:05 +08:00 via Android
加参数"--no-zygote"
|
8
missz OP @Justin13 这个好像是不允许 zygote 进程创建 fork 子进程,但是没有在服务器上找到 zygote 相关的进程
|
9
libook 2021-01-18 13:42:19 +08:00
我在自己的 Server 上跑 puppeteer 就很难跑起来,这个可能和依赖有关系,比如虽然是 headless 模式,但可能依然依赖一些 GUI 的东西。
再加上缓存管理之类的事情,我后来就换容器搞了,出问题直接回退镜像。 可以直接去找一些可用的 puppeteer 镜像,自己改。 |
10
missz OP @libook 目前公司所有服务器环境都没有使用 docker,并且这个程序已经上线到正式了,服务器环境相对固定了,换成 docker 上面不会同意
|
11
Justin13 2021-01-18 14:40:07 +08:00 via Android
@missz
"FATAL:zygote_host_impl_linux.cc(174)] Check failed: process.IsValid(). Failed to launch zygote process" |
12
Itoktsnhc 2021-01-18 14:44:38 +08:00
有一个 browerless 的项目 https://github.com/browserless/chrome 他应该就是集成了很多清理 /重启这些额外的管理功能。我们目前有服务有部分用到他的 docker 镜像,但是没试过自己源码部署
|
13
lozzow 2021-01-18 15:34:39 +08:00
@missz 我看了下你的日志关键字,和我们公司使用的是同一个业务场景😂现在公司也是用的物理机部署,用命名空间做隔离,但是后面还是做了 docker 容器化的处理,只是由于线上业务很稳定,没有正式上线,但是容器化之后对于业务扩展和资源控制,有很好的提升
|
14
missz OP 通过核查服务器情况:
1 ):内存、cpu 相对正常 2 ):用户子进程达到系统上限(也是出现异常的原因) 3 ):chromium 所依赖的库确认都有安装 目前的问题: 1 ):kill 进程的脚本似乎会导致 puppeteer 无法再打开浏览器(存疑) 2 ):@Justin13 老哥提出的--no-zygote 需要到测试环境验证一段时间,暂时不能确定是否是该参数的问题 3 ):@Itoktsnhc @lozzow 两位老哥提出的容器化可以解决问题,但是人为环境阻力太大,只能仅限于本地,淦 4 ):@guochao 老哥提出的沙箱环境多次测试目前还是没能启动起来。。。 目前的解决方案 进程满了用脚本重启。。。 |