// Disassembling _Z11mem3_kernelPiS_i .entry _Z11mem3_kernelPiS_i { .lmem 0 .smem 48 .reg 12 .bar 1 cvt.rn.u32.u16 $r3, $r0.lo cvt.rn.u32.u16 $r8, %ntid.y shl.u32 $r6, $r3, 0x00000002 join.label label1 shl.u32 $r5, $r8, 0x00000002 add.b32 $r0, $r6, 0x00000030 mov.b32 $r1, $r3 add.b32 $r7, $r3, 0x000006ff add.half.b32 $r4, s[0x0010], $r6 mov.half.b32 $r2, $r0 label0: mov.u32 $r11, g[$r4] movsh.b32 $ofs1, $r2, 0x00000000 add.u32 $r3, $r3, $r8 set.le.s32 $p0|$o127, $r3, $r7 mov.b32 s[$ofs1+0x0000], $r11 add.half.b32 $r2, $r5, $r2 add.half.b32 $r4, $r5, $r4 @$p0.ne bra.label label0 label1: nop.join bar.sync.u32 0x00000000 set.eq.s32 $p1|$r2, $r1, $r124 cvt.rn.s32 $p0|$o127, $r2 mov.b32 $r2, %clock @$p1.neu shl.u32 $r9, $r2, 0x00000001 bar.sync.u32 0x00000000 cvt.rn.abs.u32.s32 $r2, s[0x0020] mov.b32 $r3, 0x1b4e81b5 mul24.lo.u32.u16.u16 $r4, $r2.lo, $r3.hi mad24.lo.u32.u16.u16.u32 $p1|$r4, $r2.hi, $r3.lo, $r4 shl.u32 $r11, $r4, 0x00000010 shr.u32 $r4, $r4, 0x00000010 mad24.lo.u32.u16.u16.u32 $p2|$o127, $r2.lo, $r3.lo, $r11 @$p1.cf add.u32 $r4, $r4, c1[0x0000] mad24c1.lo.u32.u16.u16.u32 $r2, -$r2.hi, $r3.hi, -$r4 shr.s32 $r2, $r2, 0x00000003 set.lt.s32 $p1|$o127, s[0x0020], $r124 subr.b32 $r3, $r2, 0x00000000 @$p1.ne mov.b32 $r2, $r3 mov.b32 $r3, 0x0000004b mul24.lo.u32.u16.u16 $r4, $r2.lo, $r3.hi mad24.lo.u32.u16.u16.u32 $r4, $r2.hi, $r3.lo, $r4 shl.u32 $r4, $r4, 0x00000010 mad24.lo.u32.u16.u16.u32 $r3, $r2.lo, $r3.lo, $r4 set.le.s32 $p1|$o127, $r3, $r124 mov.b32 $r4, $r124 @$p1.ne bra.label label3 movsh.b32 $ofs1, $r1, 0x00000002 label2: mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 add.b32 $r4, $r4, 0x0000004b set.gt.s32 $p1|$o127, $r3, $r4 @$p1.ne bra.label label2 label3: set.le.s32 $p1|$o127, s[0x0020], $r4 @$p1.ne bra.label label5 movsh.b32 $ofs1, $r1, 0x00000002 label4: mov.b32 $r2, s[$ofs1+0x0030] mov.b32 s[$ofs1+0x1c30], $r2 add.b32 $ofs2, $ofs1, 0x00000430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2030], $r2 add.b32 $ofs2, $ofs1, 0x00000830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2430], $r2 add.b32 $ofs2, $ofs1, 0x00000c30 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2830], $r2 add.b32 $ofs2, $ofs1, 0x00001030 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x2c30], $r2 add.b32 $ofs2, $ofs1, 0x00001430 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3030], $r2 add.b32 $ofs2, $ofs1, 0x00001830 mov.b32 $r2, s[$ofs2+0x0000] mov.b32 s[$ofs1+0x3430], $r2 bar.sync.u32 0x00000000 add.b32 $r4, $r4, 0x00000001 set.ne.s32 $p1|$o127, s[0x0020], $r4 @$p1.ne bra.label label4 label5: mov.b32 $r2, %clock @$p0.neu shl.u32 $r10, $r2, 0x00000001 bar.sync.u32 0x00000000 add.u32 $r3, s[0x0018], $r6 join.label label7 label6: movsh.b32 $ofs1, $r0, 0x00000000 add.b32 $ofs1, $ofs1, 0x00001c00 mov.half.b32 $r2, s[$ofs1+0x0000] add.half.b32 $r1, $r1, $r8 mov.u32 g[$r3], $r2 set.le.s32 $p1|$o127, $r1, $r7 add.half.b32 $r0, $r5, $r0 add.half.b32 $r3, $r5, $r3 @$p1.ne bra.label label6 label7: nop.join bar.sync.u32 0x00000000 @$p0.eq return sub.half.b32 $r1, $r10, $r73 mov.half.b32 $r0, s[0x0018] mov.end.u32 g[$r0], $r1 #.constseg 1:0x0000 const #{ #d.u32 0x00010000 // 0000 #} }