我们的orin设备系统升级到Jetpack 5.1.3后,在reboot压测时出现卡死在开机界面的问题,后来在冷启动压测中也出现了相同问题,并且三台设备在压测时先后都出现了同样的现象,以下是问题出现时的日志:
orin_hung_rebot.txt (133.8 KB)
出现该问题后,orin无法再正常启动,只能重新刷机才可以启动,以下是出现问题后,掉电再上电的日志:
orin_hung_rebot2.txt (60.4 KB)
我们采用的测试方法是开机后,等待4分钟左右,然后执行reboot命令重启设备;冷启动测试类似,开机4分钟左右,系统掉电再上电; 三台设备有一台进行reboot测试,一次是测试227次出现了问题,另一次是测试了771次出现了问题; 另外两台做冷启动测试,都是770次左右出现了问题;
請問你們有重新build過UEFI嗎? 版本看起來不是jetpack5.1.3上面的
你好,我们有自己build UEFI, 使用的UEFI是JP5.1.3版本release时,同步下载的r35.5.0版本对应的UEFI版本,里面合并了一些我们自己的修改。
請你apply這個patch進optee
diff --git a/core/arch/arm/kernel/stmm_sp.c b/core/arch/arm/kernel/stmm_sp.c
index bc5fb9b..6217636 100644
--- a/core/arch/arm/kernel/stmm_sp.c
+++ b/core/arch/arm/kernel/stmm_sp.c
@@ -80,7 +80,7 @@
static const uint16_t ffa_variable_authentication = 5U;
static const unsigned int stmm_stack_size = 4 * SMALL_PAGE_SIZE;
-static const unsigned int stmm_heap_size = 750 * SMALL_PAGE_SIZE;
+static const unsigned int stmm_heap_size = 1024 * SMALL_PAGE_SIZE;
static const unsigned int stmm_sec_buf_size = 21 * SMALL_PAGE_SIZE;
static const unsigned int stmm_ns_comm_buf_size = 21 * SMALL_PAGE_SIZE;
好的,感谢回复!另外想问下这个是不是Jetpack5.1.3当前已知的bug
是已經修掉的問題 但不幸的rel-35.5沒有包含fix.
您好,关于这个问题,我们打了patch后,正常跑了上千次压测,都没有出现问题,但是在后续的操作中,我先在域控端执行了reboot命令,设备重启时,我又拔掉电源重新给设备上电,就又出现了上面的问题,出现问题后我用批量刷机工具刷机也刷不进去了,刷机刷到一半就会退出,出错的日志如下:
orin_uefi_err.txt (299.0 KB)
能請你把現在這個module放回NV devkit上然後看還能否燒錄嗎?
抱歉,烧录的事,排查完了,是其他原因导致的,当前也可烧录,只是op-tee打完patch后,问题还是会复现
你能提供一下複製手法嗎?
因為這一個issue就如同你所說的 重開幾千次都沒事, 這在我們這裡也是同樣的情形
所以需要知道詳細的複製方法.
从日志可以看出来,我是在uefi显示到 Enter to continue boot…,***WARNING:Test Key is used.***这里的时候把电源拔掉了,等待几秒后又上了电,然后启动过程中就出错了
所以後來又複製到的error是你前面貼的這份log嗎?
可能還是得需要你提供一下後來打到的問題的log. 可能需要你再多複製幾次 (optee patch依然需要)
麻煩就先用這塊能複製到問題的板子繼續複製
你好,orin_uefi_err.txt就是后来复现的log,日志里面有我贴的图片对应的日志的部分
如果你能穩定復現的話 請給我們log + 你的複製手法 +大概要用這個手法複製多少次才會碰上error.
另外, 如果可以 請你用NV devkit複製… 因為這問題有非常高的機率需要在我們這邊複製出來才能分析…
好的,感谢回复 ,这个问题的复现的日志看起来跟修改前的日志基本是一样的,是否有些有效信息?