Failed to flash the Jetson Orin NX 16G firmware

Hello, I recently purchased a batch of Jetson Orin NX 16G modules. However, I encountered issues when using the SDK manager. The command error code was 11. Only a few were able to be written successfully, but the module and P-NUMBLE\ 699-level part number showed errors. I suspect that the hardware update of the Orin NX 16G module has caused my problem. Please help me solve these issues. I am extremely grateful.

Here are the pictures showing the errors during the firmware flashing process of my SDK manager.

Here are some pictures of my few cases where the writing was successful but the correct module did not display.

Hi,

Please try to download bsp and rootfs from latest bsp:

And follow the Quick Start — NVIDIA Jetson Linux Developer Guide 1 documentation to flash your device.

Thanks

HI David
Thanks for your replay,I used Jetpack 5.1.5, Jetpack 6.2, Jetpack 6.2.1, and SDK Manager to flash the system, but all gave the same error message: “Parsing boardid failed”. Are there any other solutions to help me troubleshoot this issue?

I have some Jetson Orin NX 16GB modules that I purchased before. I was able to successfully update and display the correct module and P number using the SDK manager. I believe the module has been updated, but the software has not. Please confirm.

HI,

Please try below commands to skip the board check

sudo SKIP_EEPROM_CHECK=1 BOARDID="3767" BOARDSKU="0000" ./tools/kernel_flash/l4t_initrd_flash.sh --external-device nvme0n1p1 -p "-c ./bootloader/generic/cfg/flash_t234_qspi.xml" -c ./tools/kernel_flash/flash_l4t_t234_nvme.xml --showlogs --network usb0 jetson-orin-nano-devkit external

Thanks

HI
Where do I need to run this command? The SDK manager can’t execute the instructions during the burning process, can it? Do I still need to use the BSP flashing method?

OK, I understand what you mean. This item you mentioned is to help me solve the problem of failed write operation. Then, how should I go about resolving the issues related to the “module” and “P-numble” errors?

When I was checking the update files, I found the issue PCN 212661: Update of the Jetson Orin NX Ordering Part Numbers. This issue is similar to the problem I couldn’t view the Part Numbers. Could you please confirm if this is caused by the update? If so, how should we solve it? Please let us know.


HI
I have found the relevant documents that describe and address this issue. I need to inform you about the solution to this problem. Could you please let me know how I should go about resolving it?

Hi,

Some questions need to confirm

  • Is your carrier board a custom board or a dev kit?

To get the P number, you could use Qrcode app supporting Data Matrix format referred link

To read Module, you could cat /etc/nv_boot_control.conf to get .

Thanks

This has nothing to do with the custom board or the development kit. The reason for the error is the incorrect number of the core board. Currently, I am using the custom board. Executing the “Read Module” command does not enable me to determine whether its model is Jetson Orin NX 16G or not.
7197E934-7DDC-4b7b-9D15-D829123BA025

My SN code is: 1610725602242, which matches the incorrect EEPROM number shown in the picture above.

Hi,

你的問題跟PCN一點關係都沒有 只是你之前可能某些動作把EEPROM裡面的值給搞砸了 (比方說i2c write)
EEPROM裡面最後一個byte 代表的是整個EEPROM的CRC. 現在這個值在sdkmanager檢查的時候發現不對, 所以不給你燒

@DavidDDD 這裡提的方法就是讓你可以強制燒錄用的

如果你的機器根本就還能開, 那就請你去把EEPROM的CRC改成對的, sdkmanager就可以燒了

但如果你的問題是你從一開始拿到這顆module那一天就不能燒錄, 那就是兩回事了

希望我用中文能讓你比較清楚. 你後面整個討論方向都亂了

比方說我完全不懂你這裡到底想表示甚麼. 請問你之前沒用過sdkmanager以外的方法燒過機器嗎?

HI
好久不见,感谢你的回复,我使用:sudo SKIP_EEPROM_CHECK=1 BOARDID=“3767” BOARDSKU=“0000” ./tools/kernel_flash/l4t_initrd_flash.sh --external-device nvme0n1p1 -p “-c ./bootloader/generic/cfg/flash_t234_qspi.xml” -c ./tools/kernel_flash/flash_l4t_t234_nvme.xml --showlogs --network usb0 jetson-orin-nano-devkit external 指令烧录成功了,但是导致我EEPROM裡面的值错误的原因是什么?我并没有做过什么操作。
有几个问题还需要帮助一下:
1.我该如何把EEPROM的CRC改成對的,我现在只是绕过了这个地方的检查。
2.这个地方改成对的之后我的module 型号就能正常显示吗,现在还是错误的型号

但是导致我EEPROM裡面的值错误的原因是什么?我并没有做过什么操作。

基本上很多用戶都跟我問過類似的問題. 但其實我也不清楚你們到底做了什麼.
比方說到底有沒有用i2c write之類的操作不小心改到i2c bus 0上面的內容. 有些用戶在操作camera的時候不知道為何會動到這個導致eeprom內容出問題. 但我自己是從來沒碰過.

1.我该如何把EEPROM的CRC改成對的,我现在只是绕过了这个地方的检查。

這裡的概念是這樣, 我們下面的文件有提供EEPROM的欄位內容

你可以透過 sudo i2cdump -f -y 0 0x50 去讀你目前的CVM EEPROM. 確認一下裡面的內容到底哪些被改成錯的.
比方說好了, 如果今天你的EEPROM內容整個都被改亂了, 除非你知道原本的內容, 不然通常你是改不回來的.

但如果大部分的內容都還是對的, 只有一些無管緊要的byte被動到, 那你可以直接把CRC bit寫成對的. 其實sdkmager在這裡就已經幫你算好CRC的內容了

你自己一開始提供的截圖就有寫

現在的狀況就是EEPROM裡面的CRC變成0xff了


如你所说,这个地方确实都变成了0xff,我问了一下,我们对这块module 只进行了flash 刷写的操作,部分module正常,部分module 变成了这样,有没有可能是我们收到module就是这样的?我不太明白怎么样把这个地方修改成正确的,能说得更详细一些吗

Hi,

現在這個module的情況我認為應該不是要做"把內容寫回去" 這件事情.

比較傾向這個module可能得RMA

但你說你有其他module也變成這樣. 那現在我們該做的應該是查一下你那裡到底具體上怎麼複製出這個問題的.

燒錄本身不會影響EEPROM的內容. 如果這件事會發生, 我們每天都會有人回報這問題出來. 但你是這半年來唯一一位整個EEPROM內容都變成0xff的.

麻煩先回答以下問題幫助我們排查

  1. 請問你現在這個dump是在你們自己的開發板還是NV devkit? 當你跑完i2dump指令之後你的dmesg有跑出任何新的錯誤嗎?

  2. 如果(1)的回答還是在你們自己的開發板, 麻煩幫我把module全部移回NV devkit上作測試.或是多測幾個不同的底板

  3. 你們手邊還有全新未開封的module嗎? 如果有, 請先放上NV devkit做燒錄. 能燒錄的話,開機之後抓一次i2cdump 的結果. 之後移到你們的開發板上做你們的開發工作, 看會不會忽然造成module EEPROM內容被清掉的現象.

基本上現在要做的檢查就是

  1. 確認不是板子本身讀不到EEPROM的問題 (EEPROM本身內容還在, 但不知道為何在開發板上無法讀)
  2. 確認問題是不是只出在某些開發板
  3. 確認是不是一開始全新未開封的module就有此問題 (如果是的話sdkmanager應該一開始就無法燒他們, 不會等一陣子才不能燒)

你好
我们一般是购买一批未拆封的modules去烧录,大概有十多个有这个问题,可能是某尾数箱是这样,我们自己做了jetpack 6.2的super 文件,都是通过flash 刷写的,其中购买的这些异常modules相比其余正常的那些第一次刷写都失败了,使用全盘刷写才成功,打开就发现没有module的型号,我拿到手的时候已经发现无法进行正常的刷写操作了,查询了资料发现p-numble有出现过变更且我们一直以来都是用这个方法刷写,所以认为刷写完不正常的原因是变更导致的。
关于需要我确认的问题:
1.是在我们自己的开发板上,大概这个开发板售出了几千,但是这个问题是第一次出现,没有其余的新错误,看起来只有无法再次刷写、读不到module等错误。
2.我在 NV devkit做了测试,仍然无法读取module型号,问题跟着module。
3.目前没有未烧录过的module 了,这个没办法再去验证了,只能等我们下一批采购再验证这个问题,我无法确认是否全新未开封就有这个问题,我个人认为未拆封就有这个问题可能性比较大,因为我们烧录方法开发板是统一的,只是其中尾数箱的module有这个情况

Hi,

我們近期有一批module的EEPROM在工廠燒錄的時候有出現問題. 這裡的文件有公告. 請參考known issue 3.

但問題是這一個hardware 問題是EEPROM內容有些許被燒錯. 並不是整個EERPOM內容都無效.
但還是請你幫我對照一下序號看你有沒有購買到這一批.

現在無法解釋的部份還是, 你的那一批module聽起來"一開始是可以燒錄的". 但如果EEPROM一開始就有問題, 照理你整批module連第一次都沒辦法燒.

HI,
这个公告我开始就看了,SN码是符合出现问题的那批。
我提供两个SN码给你:
1610725602227
1610725602242
值得一提的是,我就是看到这个地方+PCN212261变更我才觉得是核心板发生了未知的变化才导致的问题。我一开始就告诉你们了