[求助] HP EliteBook 735 G5 (Ryzen 5 PRO 2500U) 开机随机黑屏,amdgpu 驱动问题

大家好,我是没有技术基础,但是喜欢linux且使用ubuntu多年,如今转到arch的小白用户。

硬件信息:

  • 机型:HP EliteBook 735 G5
  • CPU:AMD Ryzen 5 PRO 2500U w/ Radeon Vega Gfx
  • GPU:AMD Radeon Vega 8 集成显卡 (15DD:83DA)
  • BIOS:Q81 Ver. 01.21.01 (2022/07/29)
  • 内存:2/2 插槽已占用
  • 内核:linux-zen 6.19.14-zen1-1-zen(linux-lts 也试过,同样问题)
  • 启动:GRUB + BTRFS subvol=@
  • 桌面:Niri+Noctalia

问题描述:
开机时随机出现黑屏。机器大约只有 10% 的概率能正常启动,无法找到触发规律。热启动、冷启动、断开电源等待后重启——全部随机失败。

黑屏发生在内核日志显示之后、显示管理器(ly)之前。无法通过 Ctrl+Alt+F2 切换到 TTY,但 SSH 可以连上,说明系统实际在运行,只是没有显示输出。

当前内核参数:
zswap.enabled=0 amdgpu.dc=1 tsc=unstable loglevel=2 nowatchdog modprobe.blacklist=sp5100_tco amdgpu.noretry=1

已尝试的排查方法:

  1. amdgpu.dc=0 — 完全无法启动
  2. amdgpu.dc=1 — 随机成功/失败
  3. amdgpu.noretry=1 — 部分有效,仍然随机失败
  4. amdgpu.agf=0 — 内核不识别此参数("unknown parameter" 已忽略)
  5. amdgpu.smart_shift=0 — [测试中]
  6. linux-lts 内核 — 同样问题
  7. 未连接任何外接设备
  8. BIOS 中已禁用 Fast Boot
  9. BIOS 已更新到最新版本(Q81 Ver. 01.21.01)

成功启动时的 dmesg:
amdgpu: initializing kernel modesetting (RAVEN 0x1002:0x15DD 0x103C:0x83DA 0xD1)
amdgpu: detected ip block number 0-8 (common, gmc, ih, psp, smu, dce, gfx, sdma, vcn)
amdgpu: Fetched VBIOS from ROM BAR

正常启动时 dmesg 中无明显错误。失败启动时无日志(只能 SSH 进系统,屏幕完全无输出)。

问题:

  1. 有没有办法把失败时的详细日志输出到串口或文件,以便定位具体卡在哪一步?
  2. 有可能是硬件问题(edp 屏线、面板连接器)吗?
  3. 还有哪些内核参数值得一试?

谢谢。

既然 ssh 还能连,那 journald 应该还是正常记录了日志?

感谢回复。是的,我今天让ai帮我查日志,虽然没能解决,不过整理的关键信息:

项目 内容
关键错误 Failed to create link encoder!(×4次)
根本原因 amdgpu DRM 无法枚举 output connector,信号没有输出路径
证据 /sys/class/drm/ 下只有 card1,没有 card1-eDP-1 等 connector
额外线索 VBIOS ROM header 无效(0xffff),ACPI 资源冲突警告
可能方向 BIOS 设置、内核版本、HP DSDT 表问题

debug_output.txt (9.8 KB)

另外AI建议我查看这两个命令并上传结果:
sudo dmesg | grep -i amdgpu
cat /sys/kernel/debug/dri/1/state

附件及结果