Orin nano nx CPU:0, Error: dce-fabric@0xde00000, irq=28

在orin nx中,会偶发性的出现这个错误,并且系统崩溃,风扇停转,这可能是什么原因?
我使用的jetpack是5.1.2

s[ 1250.671112] CPU:0, Error: dce-fabric@0xde00000, irq=28
[ 1250.671120] **************************************
[ 1250.671121] CPU:0, Error:dce-fabric, Errmon:4
[ 1250.671129]    Error Code            : SLAVE_ERR
[ 1250.671130]    Overflow              : Multiple SLAVE_ERR
[ 1250.671139] 
[ 1250.671140]    Error Code            : SLAVE_ERR
[ 1250.671141]    MASTER_ID             : DCE
[ 1250.671142]    Address               : 0xdc9ed80
[ 1250.671143]    Cache                 : 0x3 -- Bufferable Modifiable 
[ 1250.671145]    Protection            : 0x2 -- Unprivileged, Non-Secure, Data Access
[ 1250.671148]    Access_Type           : Read
[ 1250.671149]    Access_ID             : 0x0
[ 1250.671150]    Fabric                : dce-fabric
[ 1250.671151]    Slave_Id              : 0x5
[ 1250.671152]    Burst_length          : 0x7
[ 1250.671153]    Burst_type            : 0x1
[ 1250.671154]    Beat_size             : 0x3
[ 1250.671154]    VQC                   : 0x0
[ 1250.671155]    GRPSEC                : 0x3f
[ 1250.671156]    FALCONSEC             : 0x0
[ 1250.671158]  **************************************
[ 1250.865874] CPU1: shutdown
[ 1250.893779] CPU2: shutdown
[ 1250.917755] CPU3: shutdown
[ 1250.953708] CPU4: shutdown
[ 1251.013692] CPU5: shutdown
[ 1251.053673] CPU6: shutdown
����k_mach_suspend_early
clk_mach_suspend_early done
suspended vdd_core @ 867625uV
��e entering sc7
��k_mach_suspend
clk_mach_suspend done
fmon_suspend done
t234_adc_suspend done
WAKE_MASK[31:0]  = 0x21000002
WAKE_MASK[63:32] = 0x0
WAKE_MASK[95:64] = 0x1ff200
TIER0[31:0]      = 0x0
TIER0[63:32]     = 0x0
TIER0[95:64]     = 0x0
TIER1[31:0]      = 0x0
TIER1[63:32]     = 0x0
TIER1[95:64]     = 0x0
TIER2[31:0]      = 0x21000002
TIER2[63:32]     = 0x0
TIER2[95:64]     = 0xff200

先看看是不是這個問題

我看了这个帖子,我想知道我具体应该怎么打patch来绕过这个错误?

你是哪一步不懂

那个帖子里的问题似乎是通过增加HDMI patch解决,但我实际上并没有使用HDMI,却出现了类似的错误。我尝试增加了这个patch,问题依旧出现。
我的步骤是修改./bootloader/t186ref/BCT/tegra234-mb2-bct-scr-p3767-0000.dts文件随后烧录整机。
我需要提供哪些文件帮助你排查这个问题?

你是用DevKit嗎?
是的話什麼情況下會戳到 不是的話改成DevKit會不會遇到
DCE是跟display有關的hardware component 你就算沒用HDMI也還是跟display有關

1.该问题是在官方的开发板上出现的。
2.我之前使用的是desktop的根文件系统,并未出现该现象。
最近需要使用minimal的镜像(因为不需要显示功能),相对于desktop只更改了rootfs目录下的内容。编译后烧录便出现了上述的问题。
3.该现象在开机后一段时间后出现,出现后机器会挂掉,无法操作,具体时间不固定,有时几分钟,有时几十分钟。

你的minimal rootfs是用我們的script做的?
什麼程式都沒跑也會crash?5.1.3會不會?

你只是不用GUI的話要不要試試看裝desktop那一包
開進去之後把ubuntu-desktop這個package砍掉就好

是的,我使用的是nv_build_samplefs.sh相关的脚本制作的文件系统。
我试过烧录后什么也不做,过一段时间机器会自己挂掉
目前使用的是5.1.2,并未试过5.1.3
我制作minimal镜像的另一个目的是缩小镜像大小,因此我从minimal开始会更好些。
我让我的同事试一试烧录minimal镜像,看是否会出现同样的问题,排除下烧录环境问题。

你們的log看起來也不像是 “自己掛掉”. 看起來你們是在跑系統suspend吧?

[ 1250.865874] CPU1: shutdown
[ 1250.893779] CPU2: shutdown
[ 1250.917755] CPU3: shutdown
[ 1250.953708] CPU4: shutdown
[ 1251.013692] CPU5: shutdown
[ 1251.053673] CPU6: shutdown
����k_mach_suspend_early
clk_mach_suspend_early done
suspended vdd_core @ 867625uV
��e entering sc7

我烧录后设备起来后什么也没做,不一会在串口终端中发现了这个日志
你说的系统suspend具体指的是什么?如果有影响我该如何排查?

簡單來講我看到的是你整個系統進了suspend mode…
如果用software指令來說就是你們跑了sudo systemctl suspend…

如果你需要用中文解釋… 就是進了待命/休眠模式…

1 Like

休眠模式连串口终端也会休眠吗?这有些不可思议
所以我该如何唤醒它,接上键盘敲击后唤醒?

是的 console也會休眠.
你可以先試試看用鍵盤能不能喚醒他來確認一下到底是不是進了suspend mode.

我进行了尝试,的确是系统进入了休眠,挺让人诧异的
于是我查了不休眠的设置,给出的策略是

sudo vim /etc/systemd/logind.conf 
然后将其中的:
#HandleLidSwitch=suspend
改成:
HandleLidSwitch=ignore

不过最后还是休眠了,咱的系统应该如何有效的禁用休眠?

既然這不是你預期的 你也說這是在NV devkit上複製出來的
能否請你給一下你整個setup要怎樣複製到這個問題?

我使用这条命令禁用休眠后
sudo systemctl mask sleep.target suspend.target hibernate.target hybrid-sleep.target
跑了一晚上没再出现休眠问题
应该是我的系统这样设置才能禁用休眠

1 Like

This topic was automatically closed 14 days after the last reply. New replies are no longer allowed.