Orin frequently restarts abnormally

    您好在我的自定义电路板上使用orin会频繁的发生重启的问题,我们在之前的帖子上面纠结过复位源的问题,后续得知需要串口的数据来判断为什么重启,而不是通过PMC复位源。

具体在这篇论坛里; Xavier frequently restarts abnormally - #21 by jingyi.Li

    后续我们成功的复现了这次现象而且我们抓到了串口的数据,十分希望您能帮我们分析一下是哪里出了问题,我们可以得知排查方向。串口数据在下面附件里面。这件事对我们十分重要,提前感谢您。

issue.txt (52.6 KB)

[21267.088744] INFO: task gdbus:942133 blocked for more than 120 seconds.
[21267.088755] Tainted: G W OE 5.10.104-rt63-tegra #79
[21267.088757] “echo 0 > /proc/sys/kernel/hung_task_timeout_secs” disables this message.

請問你們是在用哪一版本的jetpack? 而且是不是在使用rt kernel?

我们在使用jetpack 5.1 而且使用了rt kernel.

您对于这些串口日志有什么好的建议吗?

这对我们十分重要提前感谢您的支持

能請你們用Orin AGX devkit + jetpack5.1.2 + RT kernel做一樣的狀況複製嗎?

目前看起來是ubuntu裡面的gdbus hang住導致watchdog.

这是客户的现场我们不能更换版本了,关于这个gdbus hang原因有更多的排除思路吗?我觉得我们重点应该放在去排查这个问题上,感谢!

沒有. 基本上現在要做的事情就是你得想辦法在devkit上複製出問題我們才能幫你看.

您的意思是需要我在Orin AGX devkit 更新到Jetpack5.1.2版本才能定位问题吗?

應該說你們得提供一個能在devkit上面能複製到這個問題的方法. 我們才有辦法在我們這端debug.

比方說在你們客戶端有沒有跑什麼特別的usecase才能打到這個問題.
如果你們不想升級的話可以試試看先用jp5.1 +RT kernel + NV devkit複製.

不過不論狀況如何我們這邊都會移到jp5.1.2複製. 基本上我們不會用舊版本debug.

我这还有一篇相关的日志您能帮我看看是哪里发生问题重启了吗?
BYD-dmesg.txt (82.0 KB)

你的log第一行就寫了

[13224.979110] serial-tegra 3110000.serial: RxData DMA copy to tty layer failed
[13225.507804] Unable to handle kernel NULL pointer dereference at virtual address 0000000000000001

不確定下面這篇有沒有幫助

This topic was automatically closed 14 days after the last reply. New replies are no longer allowed.