Hi Wilson,
Also want to know, could you change to another kind HDMI cable and test?
Hi Wilson,
Also want to know, could you change to another kind HDMI cable and test?
Hi Wayne,
Yes, we got the same error when we used other HDMI cable.
Sorry for the late response, have you managed to get issue resolved or still need the support? Thanks
Hi Kay,
Thanks your reply. We still need help.
We got the error sometimes with no dell monitor.
But we can’t duplicate it 100%. It rarely happens. We don’t know why it happens.
If you have hardware engineer on your side, please help measure the signal on HDMI_DDC, HPD and HDMI_EN pins status when issue happened and not happened.
Hi Wayne,
Update the status.
The issue looks like that isn’t depend on Dell monitor.
It’s happended 100% in that day. But it become intermittent when we want to duplicate again.
And we check it happend on Orin Nano too. (Orin Nano 8GB + Xaviver Devkit, p3509-a02+p3767-0000.conf)
It looks like same as the post .
[ WARNING occurs when plugin/out HDMI in OrinNX]
If it’s not depend on Dell monitor. Do you need to the signal on HDMI_DDC, HPD and HDMI_EN pins status too?
Hi Wilson,
Yes, as my post here. I already knew why tegra186_gpio_irq is getting printed.
But this is related to hardware signal. So HDMI_DDC, HPD and HDMI_EN pins status are needed.
我順便用中文解釋一下, 怕沒有看懂我貼的連結的意思.
tegra186_gpio_irq 只是一個很common的錯誤. 有可能是硬體設計造成, 也可能在devkit上面會發生. 目前已知當這個錯誤發生的時候, hotplug pin那邊會有一些不正常的行為造成jetson端收到interrupt. 每當有一次不正常的interrupt進來tegra186_gpio_irq 就會報錯一次. 如果不斷進來就會導致kernel panic.
現在有一個狀況是很多用戶誤以為所有的tegra186_gpio_irq warning都是同一件事情, 有些人甚至去用一些奇怪的usecase來造成tegra186_gpio_irq然後要我們幫忙確認 … 但其實這些都是case by case.
比方說我目前看到
Hello WayneWWW
我是硬體工程師,描述目前狀況遇到tegra186_gpio_irq的情境如下:
(1)Ubuntu執行關機的時候:
→p3509-a02+p3767-0000.conf
→Xavier_NX kit + Orin_NX module + Dell monitor(P2319H-4Y)(HDMI)
→Ubuntu執行Shutdown,無法順利關機。
→從Debug mode可以看到,tegra186_gpio_irq error一直出現,最後kernal panic。
(a.)目前只有Dell monitor(P2319H-4Y)能複製問題,但不是100%複製問題。
(2)After removing HDMI cable
→p3509-a02+p3767-0000.conf
→Orin_Nano Kit + Orin_Nano module + SSD1 + Any HDMI monitors
→Xavier_NX Kit + Orin_Nano module + SSD1 + Any HDMI monitors
→我們底板 + Orin_Nano module + SSD1 + Any HDMI monitors
→只能看到NVIDIA Logo這階段的畫面(應該是boot loader前)。之後,就一直黑畫面(應該是進入boot loader後)。
→系統並沒有當機,還能從debug port輸入帳號、密碼。
→此時,移除HDMI cable。
→從Debug mode可以看到,tegra186_gpio_irq error一直出現,最後kernal panic。
(a.)Orin_Nano module + SSD1,能100%複製問題。
(b.)與螢幕,無關。
(c.)與Power source(DC adapter),無關。
(d.)只有Orin_Nano module,沒有SSD1,NVIDIA Logo、UEFI階段的畫面都正常,HPD HDMI cable也正常。
(e.)HDMI 的level shift線路(DDC、EN、HPD),都是參考Xavier_NX Kit設計。
關於第一點使用情境, 這跟我這邊其他用戶碰到的類似. 我們還在確認
關於第二點使用情境, 說實話我看不太懂你在說什麼
→Orin_Nano Kit + Orin_Nano module + SSD1 + Any HDMI monitors
比方說這個, 這個usecase沒有支援HDMI. 不太懂為何要測這個. Orin Nano devkit就只有支援DP port.
→ Xavier_NX Kit + Orin_Nano module + SSD1 + Any HDMI monitors**
請問這個usecase跟 Orin NX那個的差別是什麼?換了module是嗎? 我也不太確定SSD1 在這裡是在指什麼. Orin NX開機應該也需要SSD.
(a.) Xavier_NX Kit + Orin_Nano module + SSD1 + Any HDMI monitors
我的意思是這個usecase本身跟Orin NX感覺是完全一樣的東西. Orin Nano跟Orin NX module也只是sku上的差異, 他們本身的driver都是相同的. 你能在Orin Nano上複製的東西, 在Orin NX上也會能複製. 你在Orin NX上不能複製的話, 在Orin Nano也不能複製.
另外想要提醒一下, 目前rel-35.3.1的p3509-a02+p3767-0000.conf 有個bug.需要加上下面這個patch才會燒錄正確的dtb.
diff --git a/scripts/board_config/p3509-a02+p3767-0000.conf b/scripts/board_config/p3509-a02+p3767-0000.conf
index 78fd01c..e4928d0 100644
--- a/scripts/board_config/p3509-a02+p3767-0000.conf
+++ b/scripts/board_config/p3509-a02+p3767-0000.conf
@@ -55,7 +55,7 @@
BPFDTB_FILE="tegra234-bpmp-3767-0000-a00-3509-a02.dtb";
fi
elif [ "${board_sku}" = "0001" ]; then
- DTB_FILE="tegra234-p3767-0000-p3509-a02.dtb";
+ DTB_FILE="tegra234-p3767-0001-p3509-a02.dtb";
BPFDTB_FILE="tegra234-bpmp-3767-0001-3509-a02.dtb";
elif [ "${board_sku}" = "0003" ] || [ "${board_sku}" = "0005" ]; then
DTB_FILE="tegra234-p3767-0003-p3509-a02.dtb";
非常感謝提醒,我們目前沒有使用Orin NX 8GB,所以沒有遇到此dtb問題。
抱歉補充說明一下第二個case:
我們交叉測試
使用相同一組Orin Nano 8GB module + 剛剛開機沒畫面的SSD:
不管是任何底版(Xavier NX Kit/ Orin Nano kit)都會有此問題,而且目前使用此組有問題的module和SSD能100%複製此問題。 (Orin Nano Kit有用DP轉HDMI轉接)
此兩個case一個是關機時觸發tegra186_gpio_irq
一個是開機後移除HDMI觸發tegra186_gpio_irq
不確定是否算是相同,但tegra186_gpio_irq導致kernal panic是一樣的沒錯。
再次感謝你的回覆。
Hi,
這個狀況聽起來好像不太需要討論…
我們不討論任何 “特定 module” 才能複製到的問題 如果你能用其他任何module都能複製到, 那我們再進行確認…
Orin Nano Devkit + DP to HDMI轉接頭這個測試也是不討論. 這個狀況下driver還是DP mode. 並沒有完整支援HDMI.
我前面貼的post已經講過了, 最近開始有一些用戶把任何tegra186_gpio_irq 都當成相同問題, 但這個問題背後的root cause可能不同… 所以真的不要拿一些奇怪的狀況下打到的tegra186_gpio_irq拿回來問. 這個作法有點失去意義…
舉例來說好了, 今天如果你要確認 “偶爾不能開機” 這種問題, 你應該要做的是想辦法在工板上用你的usecase進行複製, 而不是說拿一顆好像有問題的module然後跟我說:“複製到問題了, 麻煩你看一下”. 結果我幫你確認到最後發現是這顆module需要RMA. 這種作法只是在浪費彼此時間.
Hello Wayne
SSD1就是,裝Orin_Nano使用的image的M.2 SSD(PCIe x4),簡稱SSD1。
(1.)我們不討論任何 “特定 module” 才能複製到的問題 如果你能用其他任何module都能複製到, 那我們再進行確認。
→【特定Orin_nano + SSD1】,稍後我們再重新燒錄一次,再確認移除HDMI cable後,是不是100%能複製問題?!
(2.)Orin Nano Devkit + DP to HDMI轉接頭。
→這個不討論。請忽略此提問。
(3)Ubuntu執行關機的時候:
→p3509-a02+p3767-0000.conf
→Xavier_NX kit + Orin_NX module + Dell monitor(P2319H-4Y)(HDMI)
→Ubuntu執行Shutdown,無法順利關機。
→從Debug mode可以看到,tegra186_gpio_irq error一直出現,最後kernal panic。
→NV確認此問題,有沒有解答時間點?
→【特定Orin_nano + SSD1】,稍後我們再重新燒錄一次,再確認移除HDMI cable後,是不是100%能複製問題?!
我的意思是如果你們有10片Jetson Orin nano module可以做測試, 麻煩多用幾個module做嘗試. 如果有Orin NX, 也可以試試看 另外, 也不限定說一定要使用那個SSD. 你們可以多做一點嘗試然後再給出結論…
當然我們這邊之後也會根據你們的手法複製看看.
→NV確認此問題,有沒有解答時間點?
目前沒有, 另外 我想再澄清一下. “只有特定螢幕"會發生的問題, 跟"你底板上才會發生的問題”, 這兩件事情可能是沒有關聯的. 只要是HPD interrupt有異常行為, tegra186_gpio_irq就會出現.
比方說好了. 這個Dell2319的問題可能是此款螢幕在某些狀況下hpd可能會有連續異常的訊號進來. 如果換成其他款螢幕就沒發生, 那這個問題可能就不是我們能幫忙修的. (這不是結論, 我只是說有這個可能性)
我這邊想說的跟前面提過的一樣, 請不要把所有問題都歸類成同一種.
除了Dell的螢幕之外, 我們還需要你們確認到底有沒有辦法在NV devkit複製一樣的問題. 所謂的"一樣的問題"是指你們在custom board上複製到的方法,完全搬到devkit上做測試, 然後也能複製到這樣.
Hello Wayne
明白您想表達的意思!
依你的要求,
我量了HDMI DDC、HPD、HDMI Power enable(MOD_SLEEP#)
HPD和MOD_SLEEP#,看起來沒有問題。
但,DDC有問題!(使用Xavier_NX Kit+ NV Orin_NX Image量測,得到以下結果)
NV logo這段,DDC 3.3V/5V 通訊可以active Low,正常。
但
進到Ubuntu這段,DDC 3.3V/5V 通訊無法到Low,會卡在約2V的地方。(與螢幕型號無關)
我抓了NV module side的DDC(3V)和 螢幕端的DDC(5V)給你,看起來是NV端的DDC出問題!
Verify
Xavier_NX Kit + Xaver_NX module,DDC信號正常。
不確定DDC信號瑕疵與tegra186_gpio_irq error有沒有關係!?
但
DDC的波形,確定有問題。你們可以拿Xavier_NX Kit,Orin_NX,驗證看看。
Hi Charlie,
感謝你的幫忙量測. 我想請問一下. 請問你跟 @Wilson_Lin 最一開始碰到的問題就是這個情境嗎?
還是說你為了複製出問題 又去測了這個情境出來?
當系統程序(Shut down or Reboot)完成→拔掉HDMI cable!(timing 需要揣摩一下)
請問你的意思是說桌面已經消失了但是可能關機步驟還沒有結束這樣嗎?
不確定DDC信號瑕疵與tegra186_gpio_irq error有沒有關係!?
其實這就相當於HDMI driver部份還沒有做完de-init流程的狀況下你們就拔掉了HDMI. tegra186_gpio_irq還是從hotplug那邊偵測到不尋常的行為
另外想請問一下, 你能把訊號圖原圖分享一下嗎? 我們這邊看縮圖有點小 看的不是很清楚.
Hello Wayne
對,就是同一個Case!
因為我覺得問題太發散,所以先以這case討論就好。
回到你的提問,
…桌面已經消失了但是可能關機步驟還沒有結束這樣嗎?
→對。
→Ubuntu選了"關機"→但系統還在關機程序中→拔掉HDMI cable→就能複製。
…相當於HDMI driver部份還沒有做完de-init流程,就拔掉了HDMI,
tegra186_gpio_irq還是從hotplug那邊偵測到不尋常的行為
→明白。
→但這有瑕疵,不應該限制使用者,什麼時候拔HDMI cable。
→我明白Xavier_NX 和 Orin 架構不同,但實際上 Xavier_NX module,確實沒這個問題。
原檔,我想辦法夾上來給你。
Orin_NX + Xavier Kit,能100%複製。 Orin_NX + 我們的底板(DSC-NV002-WT),能100%複製。Orin_Nano + Xavier Kit + p3509-a02+p3767-0000.conf,能100%複製。
Orin_Nano + 我們的底板(DSC-NV002-WT) + p3509-a02+p3767-0000.conf,能100%複製。
了解. 我只是想要確認說我們以這個case做討論.
Hello Wayne
<1>Orin_NX_NV002-WT_DDC_NV logo-1
<2>Orin_NX_NV002-WT_DDC_NV logo-2
<3>Orin_NX_NV002-WT_DDC_uBuntu-1
<4>Orin_NX_NV002-WT_DDC_uBuntu-2
<5>Orin_NX_Xavier_Kit_DDC_NV logo
<6>Orin_NX_Xavier_Kit_DDC_uBuntu
Hi Charlie,
抱歉再請教一個問題, 你剛才好像提到拔線的timing可能要抓一下
請問在沒有辦法複製到問題的情況下, DDC的訊號跟有複製到問題的情況是一樣的嗎