具体情况
1 、通过 pve 自带的 zfs ,使用两块 nvme 做软 raid1
2 、系统也安装在 zfs 的分区上
3 、今天启动后,提示 PANIC: rpool :blkptr at 00000000ac54239? DUA 0 has inualid OFFSET 72058398811901952
5 、执行 zpool import rpool 或者类似命令,会无响应
6 、pve 上跑的都是开发环境的虚拟机,虽然没有影响生产,但是数据丢了也很糟心。
目前尝试的方案有:
1 、使用 ubuntu live cd 进入 ubuntu 桌面后,手动挂载,结果:系统无响应
2 、windows 平台安装 open zfs for windows ,挂载磁盘后系统蓝屏
3 、分别拆除 raid1 其中一块硬盘后,重新启动,结果:与原故障情况一致
4 、分别将 raid1 其中一块硬盘安装在其他机器上启动,,结果:与原故障情况一致
怀疑触发的原因:
1 、磁盘之上部署了 sentry ,最近两个月写入了大量数据,大概在 180T
2 、机房温度较高,无空调
github 类似报错:
https://github.com/openzfs/zfs/issues/12019
图片:
1
NessajCN 253 天前
> 使用 ubuntu live cd 进入 ubuntu 桌面后,手动挂载,结果:系统无响应
这具体啥意思? ls /dev 有盘在吗? 有的话 mount /dev/md0 /mnt 啥结果? |
2
vone OP @NessajCN 盘是正常的,但是没办法挂载。
使用 ubuntu live cd 的意思是,pve 的磁盘挂了以后是没办法正常引导进入系统的。只能通过另外一个系统加载后执行命令。 |
3
ooxxcc 253 天前
ubuntu live cd 的 zfs 版本可能比较低,尝试用 proxmox 的 live cd 引导尝试能否挂载
参考 https://pve.proxmox.com/wiki/Root_Password_Reset 中 method 2 对于挂载 zpool 的描述 |
4
ooxxcc 253 天前
|
12
yanest 253 天前 via Android
以前用过一阵 zfs ,现在基本弃用。劝大家还是尽量别用了。用阵列或分布式吧
|
13
bkmi 253 天前 via Android
是 zfs 问题还是硬盘问题,两块盘一起坏也太背了吧
|