有没有 V 友使用双卡的时候遇到这个问题,我在 windows 上安装驱动是能识别两张卡,在 Ubuntu 上只能识别一张,主板是华硕 X670E-F 第一个 pcie 全长插槽支持 5.0x16 第二个只支持 4.0 x4 不支持拆分 x8 x8 但是在 windows 下安装好驱动 nvidia-smi 能识别到两张卡都能工作,单独测每张卡都是好的,在 ubuntu 24.04 桌面和 server 都不行只能识别到第一个 pcie 插槽的卡。 主板设置,Resizable BAR 关闭的,Above 4G Decoding 开启
1
akadanjuan101 OP 有没有朋友遇到这种情况给点建议下面是日志
sudo dmesg | grep -i nvidia [ 7.143512] nvidia: loading out-of-tree module taints kernel. [ 7.143518] nvidia: module license 'NVIDIA' taints kernel. [ 7.143520] nvidia: module verification failed: signature and/or required key missing - tainting kernel [ 7.143520] nvidia: module license taints kernel. [ 7.213959] nvidia-nvlink: Nvlink Core is being initialized, major device number 235 [ 7.229299] nvidia 0000:01:00.0: vgaarb: VGA decodes changed: olddecodes=io+mem,decodes=none:owns=none [ 7.287510] nvidia 0000:05:00.0: vgaarb: VGA decodes changed: olddecodes=io+mem,decodes=none:owns=none [ 7.322709] input: HDA NVidia HDMI/DP,pcm=3 as /devices/pci0000:00/0000:00:01.1/0000:01:00.1/sound/card0/input15 [ 7.322731] input: HDA NVidia HDMI/DP,pcm=7 as /devices/pci0000:00/0000:00:01.1/0000:01:00.1/sound/card0/input16 [ 7.322750] input: HDA NVidia HDMI/DP,pcm=8 as /devices/pci0000:00/0000:00:01.1/0000:01:00.1/sound/card0/input17 [ 7.322767] input: HDA NVidia HDMI/DP,pcm=9 as /devices/pci0000:00/0000:00:01.1/0000:01:00.1/sound/card0/input18 [ 7.346135] NVRM: loading NVIDIA UNIX x86_64 Kernel Module 580.95.05 Tue Sep 23 10:11:16 UTC 2025 [ 7.372805] nvidia-modeset: Loading NVIDIA Kernel Mode Setting Driver for UNIX platforms 580.95.05 Tue Sep 23 09:41:17 UTC 2025 [ 7.375236] [drm] [nvidia-drm] [GPU ID 0x00000100] Loading driver [ 7.385160] input: HDA NVidia HDMI/DP,pcm=3 as /devices/pci0000:00/0000:00:02.1/0000:03:00.0/0000:04:00.0/0000:05:00.1/sound/card2/input19 [ 7.385185] input: HDA NVidia HDMI/DP,pcm=7 as /devices/pci0000:00/0000:00:02.1/0000:03:00.0/0000:04:00.0/0000:05:00.1/sound/card2/input20 [ 7.385202] input: HDA NVidia HDMI/DP,pcm=8 as /devices/pci0000:00/0000:00:02.1/0000:03:00.0/0000:04:00.0/0000:05:00.1/sound/card2/input21 [ 7.385217] input: HDA NVidia HDMI/DP,pcm=9 as /devices/pci0000:00/0000:00:02.1/0000:03:00.0/0000:04:00.0/0000:05:00.1/sound/card2/input22 [ 9.028308] [drm] Initialized nvidia-drm 0.0.0 for 0000:01:00.0 on minor 1 [ 9.070544] nvidia 0000:01:00.0: vgaarb: deactivate vga console [ 9.116203] fbcon: nvidia-drmdrmfb (fb0) is primary device [ 9.116207] nvidia 0000:01:00.0: [drm] fb0: nvidia-drmdrmfb frame buffer device [ 9.134266] [drm] [nvidia-drm] [GPU ID 0x00000500] Loading driver [ 11.778846] [drm:nv_drm_dev_load [nvidia_drm]] *ERROR* [nvidia-drm] [GPU ID 0x00000500] Failed to allocate NvKmsKapiDevice [ 11.792882] nvidia_uvm: module uses symbols nvUvmInterf |
2
Kirkcong 10 小时 29 分钟前
linux nvdia 驱动装了么?是说 nvdia-smi 识别不到第二张卡还是系统的 lspci 也没有?
|
3
NoobPhper 9 小时 50 分钟前
lspci |grep "NVIDIA"
|
4
NoobPhper 9 小时 50 分钟前
你是把 secureboot 打开了吧
|
5
ayogo 9 小时 33 分钟前 via Android
装的什么版本的驱动?看下是不是 open 版
|
6
mx2dream 9 小时 0 分钟前
有没有屏蔽开源驱动?感觉你的问题大概是同时启用两张不同插槽引起的兼容性问题,或者是电源问题?我曾经遇到不同但类似的问题,在 windows10 和 11 上可以,虚拟机直通也可以,偶尔重启后掉驱动,但 Ubuntu22.04 上就怎么都装不上,BIOS 各种设置都反复测试过,连主板电源都换了一遍,最后发现除了兼容性之外,显卡硬件有点问题。
PCIe 的相关设置都设置为 GEN3 以上,不要 auto 。有的主板查过有人说可以分拆,有的说不能分拆,还有 BIOS 版本,这些也要一点一点测试 |
7
nuII 8 小时 38 分钟前
先 lspci 看下是不是物理识别到了 2 块,确认下是来自硬件还是来自驱动/系统。nvidia-smi 里只能显示一张卡吗? drm 的报错的话,看下 grub.cfg 的配置,加个 drm 的命令试试?
|
8
akadanjuan101 OP @nuII lspci 是能识别两块,nvidia-smi 里只能显示一张
|
9
akadanjuan101 OP @mx2dream 安装的 server 版本驱动也是一样我设置 GEN3 试试
|
10
akadanjuan101 OP @Kirkcong lspci 是能识别两块,nvidia-smi 里只能显示一张
|
11
akadanjuan101 OP @NoobPhper 没有呀
|
12
akadanjuan101 OP @ayogo server ,open 都试过
|
13
ryd994 7 小时 32 分钟前 via Android
lspci 能找到就说明不是硬件问题。大概率是配置/驱动的问题。查查 dmesg 里有什么关于显卡驱动的日志
|