.entry __globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2
{
.reg .u16 %rh<4>;
.reg .u32 %r<14>;
.reg .u64 %rd<13>;
.reg .f32 %f<9>;
.reg .pred %p<3>;
.param .u64 __cudaparm___globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2_Target;
.param .u64 __cudaparm___globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2_Source;
.param .u64 __cudaparm___globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2_Keys;
.local .align 16 .b8 __cuda___cuda_maxs064[16];
.loc 15 237 0
$LBB1___globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2:
mov.u16 Â %rh1, %ctaid.x; Â Â Â //
mov.u16 Â %rh2, %ntid.x; Â Â Â Â //
mul.wide.u16 Â %r1, %rh1, %rh2; //
cvt.u32.u16 Â %r2, %tid.x; Â Â Â //
add.u32 Â %r3, %r2, %r1; Â Â Â Â //
ld.const.u32 Â %r4, [gNumberOfTriangles]; // id:68 gNumberOfTriangles+0x0
setp.gt.u32 Â %p1, %r4, %r3; Â Â //
@%p1 bra  $Lt_0_4;       //
bra.uni  $LBB4___globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2; //
$Lt_0_4:
.loc 15 244 0
mul.lo.u32 Â %r5, %r3, 8; Â Â Â //
cvt.u64.u32 Â %rd1, %r5; Â Â Â Â //
ld.param.u64 Â %rd2, [__cudaparm___globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2_Keys]; // id:69 __cudaparm___globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2_Keys+0x0
add.u64 Â %rd3, %rd1, %rd2; Â Â //
ld.global.u32 Â %r6, [%rd3+4]; Â // id:70
.loc 15 246 0
mul.lo.u32 Â %r7, %r6, 32; Â Â Â //
cvt.u64.u32 Â %rd4, %r7; Â Â Â Â //
ld.param.u64 Â %rd5, [__cudaparm___globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2_Source]; // id:71 __cudaparm___globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2_Source+0x0
add.u64 Â %rd6, %rd4, %rd5; Â Â //
ld.global.v4.f32 Â {%f1,%f2,%f3,_}, [%rd6+0]; //
.loc 15 247 0
add.u64 Â %rd7, %rd6, 16; Â Â Â //
mov.u64 Â %rd8, __cuda___cuda_maxs064; //
ld.global.v4.u32 Â {%r8,%r9,%r10,%r11}, [%rd7+0]; //
[b] st.local.u32 Â [%rd8+0], %r8; Â // id:89 __cuda___cuda_maxs064+0x0
st.local.u32 Â [%rd8+4], %r9; Â // id:89 __cuda___cuda_maxs064+0x0
st.local.u32 Â [%rd8+8], %r10; Â // id:89 __cuda___cuda_maxs064+0x0
st.local.u32 Â [%rd8+12], %r11; // id:89 __cuda___cuda_maxs064+0x0
[/b] .loc 15 251 0
mul.lo.u32 Â %r12, %r3, 32; Â Â //
cvt.u64.u32 Â %rd9, %r12; Â Â Â //
ld.param.u64 Â %rd10, [__cudaparm___globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2_Target]; // id:76 __cudaparm___globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2_Target+0x0
add.u64 Â %rd11, %rd9, %rd10; Â //
mov.b32 Â %f4, %r6; Â Â Â Â Â Â //
st.global.v4.f32 Â [%rd11+0], {%f1,%f2,%f3,%f4}; //
.loc 15 252 0
[b] ld.local.f32 Â %f5, [__cuda___cuda_maxs064+0]; // id:82 __cuda___cuda_maxs064+0x0
ld.local.f32 Â %f6, [__cuda___cuda_maxs064+4]; // id:84 __cuda___cuda_maxs064+0x4
ld.local.f32 Â %f7, [__cuda___cuda_maxs064+8]; // id:86 __cuda___cuda_maxs064+0x8
[/b] st.global.v4.f32 Â [%rd11+16], {%f5,%f6,%f7,%f4}; //
$LBB4___globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2:
.loc 15 254 0
exit; Â Â Â Â Â Â Â Â Â Â Â Â Â //
$LDWend___globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2:
} // __globfunc__Z18KDKernelMINMAXCopyP6float4S0_P5uint2