Running main() from gtest_main.cc Note: Google Test filter = JIT.ISSUE_1646 [==========] Running 1 test from 1 test case. [----------] Global test environment set-up. [----------] 1 test from JIT [ RUN ] JIT.ISSUE_1646 JIT_KERNEL:------------------------- typedef unsigned int uint; typedef long long dim_t; /******************************************************* * Copyright (c) 2014, ArrayFire * All rights reserved. * * This file is distributed under 3-clause BSD license. * The complete license agreement can be obtained at: * http://arrayfire.com/licenses/BSD-3-Clause ********************************************************/ typedef float2 cuFloatComplex; typedef cuFloatComplex cfloat; typedef double2 cuDoubleComplex; typedef cuDoubleComplex cdouble; // ---------------------------------------------- // REAL NUMBER OPERATIONS // ---------------------------------------------- #define sign(in) signbit((in)) #define __noop(a) (a) #define __add(lhs, rhs) (lhs) + (rhs) #define __sub(lhs, rhs) (lhs) - (rhs) #define __mul(lhs, rhs) (lhs) * (rhs) #define __div(lhs, rhs) (lhs) / (rhs) #define __and(lhs, rhs) (lhs) && (rhs) #define __or(lhs, rhs) (lhs) || (rhs) #define __lt(lhs, rhs) (lhs) < (rhs) #define __gt(lhs, rhs) (lhs) > (rhs) #define __le(lhs, rhs) (lhs) <= (rhs) #define __ge(lhs, rhs) (lhs) >= (rhs) #define __eq(lhs, rhs) (lhs) == (rhs) #define __neq(lhs, rhs) (lhs) != (rhs) #define __conj(in) (in) #define __real(in) (in) #define __imag(in) (0) #define __abs(in) abs(in) #define __sigmoid(in) (1.0/(1 + exp(-(in)))) #define __bitor(lhs, rhs) ((lhs) | (rhs)) #define __bitand(lhs, rhs) ((lhs) & (rhs)) #define __bitxor(lhs, rhs) ((lhs) ^ (rhs)) #define __bitshiftl(lhs, rhs) ((lhs) << (rhs)) #define __bitshiftr(lhs, rhs) ((lhs) >> (rhs)) #define __min(lhs, rhs) ((lhs) < (rhs)) ? (lhs) : (rhs) #define __max(lhs, rhs) ((lhs) > (rhs)) ? (lhs) : (rhs) #define __rem(lhs, rhs) ((lhs) % (rhs)) #define __mod(lhs, rhs) ((lhs) % (rhs)) #define __pow(lhs, rhs) fpow((float)lhs, (float)rhs) #define __convert_char(val) (char)((val) != 0) #define fpow(lhs, rhs) pow((lhs), (rhs)) #define frem(lhs, rhs) remainder((lhs), (rhs)) #define iszero(a) ((a) == 0) // ---------------------------------------------- // COMPLEX FLOAT OPERATIONS // ---------------------------------------------- #define __crealf(in) ((in).x) #define __cimagf(in) ((in).y) #define __cabsf(in) hypotf(in.x, in.y) __device__ cfloat __cplx2f(float x, float y) { cfloat res = {x, y}; return res; } __device__ cfloat __cconjf(cfloat in) { cfloat res = {in.x, -in.y}; return res; } __device__ cfloat __caddf(cfloat lhs, cfloat rhs) { cfloat res = {lhs.x + rhs.x, lhs.y + rhs.y}; return res; } __device__ cfloat __csubf(cfloat lhs, cfloat rhs) { cfloat res = {lhs.x - rhs.x, lhs.y - rhs.y}; return res; } __device__ cfloat __cmulf(cfloat lhs, cfloat rhs) { cfloat out; out.x = lhs.x * rhs.x - lhs.y * rhs.y; out.y = lhs.x * rhs.y + lhs.y * rhs.x; return out; } __device__ cfloat __cdivf(cfloat lhs, cfloat rhs) { // Normalize by absolute value and multiply float rhs_abs = __cabsf(rhs); float inv_rhs_abs = 1.0f / rhs_abs; float rhs_x = inv_rhs_abs * rhs.x; float rhs_y = inv_rhs_abs * rhs.y; cfloat out = {lhs.x * rhs_x + lhs.y * rhs_y, lhs.y * rhs_x - lhs.x * rhs_y}; out.x *= inv_rhs_abs; out.y *= inv_rhs_abs; return out; } __device__ cfloat __cminf(cfloat lhs, cfloat rhs) { return __cabsf(lhs) < __cabsf(rhs) ? lhs : rhs; } __device__ cfloat __cmaxf(cfloat lhs, cfloat rhs) { return __cabsf(lhs) > __cabsf(rhs) ? lhs : rhs; } #define __candf(lhs, rhs) __cabsf(lhs) && __cabsf(rhs) #define __corf(lhs, rhs) __cabsf(lhs) || __cabsf(rhs) #define __ceqf(lhs, rhs) (((lhs).x == (rhs).x) && ((lhs).y == (rhs).y)) #define __cneqf(lhs, rhs) !__ceqf((lhs), (rhs)) #define __cltf(lhs, rhs) (__cabsf(lhs) < __cabsf(rhs)) #define __clef(lhs, rhs) (__cabsf(lhs) <= __cabsf(rhs)) #define __cgtf(lhs, rhs) (__cabsf(lhs) > __cabsf(rhs)) #define __cgef(lhs, rhs) (__cabsf(lhs) >= __cabsf(rhs)) #define __convert_cfloat(real) __cplx2f(real, 0) #define __convert_c2c(in) (in) #define __convert_z2c(in) __cplx2f((float)in.x, (float)in.y) // ---------------------------------------------- // COMPLEX DOUBLE OPERATIONS // ---------------------------------------------- #define __creal(in) ((in).x) #define __cimag(in) ((in).y) #define __cabs(in) hypot(in.x, in.y) __device__ cdouble __cplx2(double x, double y) { cdouble res = {x, y}; return res; } __device__ cdouble __cconj(cdouble in) { cdouble res = {in.x, -in.y}; return res; } __device__ cdouble __cadd(cdouble lhs, cdouble rhs) { cdouble res = {lhs.x + rhs.x, lhs.y + rhs.y}; return res; } __device__ cdouble __csub(cdouble lhs, cdouble rhs) { cdouble res = {lhs.x - rhs.x, lhs.y - rhs.y}; return res; } __device__ cdouble __cmul(cdouble lhs, cdouble rhs) { cdouble out; out.x = lhs.x * rhs.x - lhs.y * rhs.y; out.y = lhs.x * rhs.y + lhs.y * rhs.x; return out; } __device__ cdouble __cdiv(cdouble lhs, cdouble rhs) { // Normalize by absolute value and multiply double rhs_abs = __cabs(rhs); double inv_rhs_abs = 1.0 / rhs_abs; double rhs_x = inv_rhs_abs * rhs.x; double rhs_y = inv_rhs_abs * rhs.y; cdouble out = {lhs.x * rhs_x + lhs.y * rhs_y, lhs.y * rhs_x - lhs.x * rhs_y}; out.x *= inv_rhs_abs; out.y *= inv_rhs_abs; return out; } __device__ cdouble __cmin(cdouble lhs, cdouble rhs) { return __cabs(lhs) < __cabs(rhs) ? lhs : rhs; } __device__ cdouble __cmax(cdouble lhs, cdouble rhs) { return __cabs(lhs) > __cabs(rhs) ? lhs : rhs; } #define __cand(lhs, rhs) __cabs(lhs) && __cabs(rhs) #define __cor(lhs, rhs) __cabs(lhs) || __cabs(rhs) #define __ceq(lhs, rhs) (((lhs).x == (rhs).x) && ((lhs).y == (rhs).y)) #define __cneq(lhs, rhs) !__ceq((lhs), (rhs)) #define __clt(lhs, rhs) (__cabs(lhs) < __cabs(rhs)) #define __cle(lhs, rhs) (__cabs(lhs) <= __cabs(rhs)) #define __cgt(lhs, rhs) (__cabs(lhs) > __cabs(rhs)) #define __cge(lhs, rhs) (__cabs(lhs) >= __cabs(rhs)) #define __convert_cdouble(real) __cplx2(real, 0) #define __convert_z2z(in) (in) #define __convert_c2z(in) __cplx2((double)in.x, (double)in.y) template struct Param { T *ptr; dim_t dims[4]; dim_t strides[4]; }; extern "C" __global__ void KER12444251140956856( float *in0_ptr, float *in1_ptr, float *in2_ptr, float *in5_ptr, float *in8_ptr, float *in11_ptr, float *in14_ptr, float *in17_ptr, float *in20_ptr, float *in23_ptr, float *in26_ptr, float *in29_ptr, float *in32_ptr, float *in35_ptr, float *in38_ptr, float *in41_ptr, float *in44_ptr, float *in47_ptr, float *in50_ptr, Param out52, uint blocks_x, uint blocks_y, uint blocks_x_total, uint num_odims) { Param outref = out52; for (int blockIdx_x = blockIdx.x; blockIdx_x < blocks_x_total; blockIdx_x += gridDim.x) { uint threadId = threadIdx.x; int idx = blockIdx_x * blockDim.x * blockDim.y + threadId; if (idx >= outref.dims[3] * outref.strides[3]) return; int idx0 = idx; int idx1 = idx; int idx2 = idx; int idx5 = idx; int idx8 = idx; int idx11 = idx; int idx14 = idx; int idx17 = idx; int idx20 = idx; int idx23 = idx; int idx26 = idx; int idx29 = idx; int idx32 = idx; int idx35 = idx; int idx38 = idx; int idx41 = idx; int idx44 = idx; int idx47 = idx; int idx50 = idx; float val0 = in0_ptr[idx0]; float val1 = in1_ptr[idx1]; float val2 = in2_ptr[idx2]; float val3 = __add(val1, val2); float val4 = __add(val0, val3); float val5 = in5_ptr[idx5]; float val6 = __add(val3, val5); float val7 = __add(val4, val6); float val8 = in8_ptr[idx8]; float val9 = __add(val6, val8); float val10 = __add(val7, val9); float val11 = in11_ptr[idx11]; float val12 = __add(val9, val11); float val13 = __add(val10, val12); float val14 = in14_ptr[idx14]; float val15 = __add(val12, val14); float val16 = __add(val13, val15); float val17 = in17_ptr[idx17]; float val18 = __add(val15, val17); float val19 = __add(val16, val18); float val20 = in20_ptr[idx20]; float val21 = __add(val18, val20); float val22 = __add(val19, val21); float val23 = in23_ptr[idx23]; float val24 = __add(val21, val23); float val25 = __add(val22, val24); float val26 = in26_ptr[idx26]; float val27 = __add(val24, val26); float val28 = __add(val25, val27); float val29 = in29_ptr[idx29]; float val30 = __add(val27, val29); float val31 = __add(val28, val30); float val32 = in32_ptr[idx32]; float val33 = __add(val30, val32); float val34 = __add(val31, val33); float val35 = in35_ptr[idx35]; float val36 = __add(val33, val35); float val37 = __add(val34, val36); float val38 = in38_ptr[idx38]; float val39 = __add(val36, val38); float val40 = __add(val37, val39); float val41 = in41_ptr[idx41]; float val42 = __add(val39, val41); float val43 = __add(val40, val42); float val44 = in44_ptr[idx44]; float val45 = __add(val42, val44); float val46 = __add(val43, val45); float val47 = in47_ptr[idx47]; float val48 = __add(val45, val47); float val49 = __add(val46, val48); float val50 = in50_ptr[idx50]; float val51 = __add(val48, val50); float val52 = __add(val49, val51); out52.ptr[idx] = val52; } } ----------------------------- num_options=3 compiler_options: [--gpu-architecture=compute_62] compiler_options: [--device-debug] compiler_options: [--generate-line-info] compiledPTX size 76035 PTX [// // Generated by NVIDIA NVVM Compiler // // Compiler Build ID: CL-23162084 // Cuda compilation tools, release 9.0, V9.0.252 // Based on LLVM 3.4svn // .version 6.0 .target sm_62, debug .address_size 64 // .globl _Z8__cplx2fff .func (.param .b32 func_retval0) hypotf ( .param .b32 hypotf_param_0, .param .b32 hypotf_param_1 ) ; .func (.param .b64 func_retval0) hypot ( .param .b64 hypot_param_0, .param .b64 hypot_param_1 ) ; .visible .func (.param .align 8 .b8 func_retval0[8]) _Z8__cplx2fff( .param .b32 _Z8__cplx2fff_param_0, .param .b32 _Z8__cplx2fff_param_1 ) { .local .align 8 .b8 __local_depot0[8]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<5>; .reg .b64 %rd<2>; .loc 1 68 1 func_begin0: .loc 1 0 0 .loc 1 68 1 mov.u64 %rd1, __local_depot0; cvta.local.u64 %SP, %rd1; ld.param.f32 %f1, [_Z8__cplx2fff_param_0]; ld.param.f32 %f2, [_Z8__cplx2fff_param_1]; tmp0: func_exec_begin0: .loc 1 70 12 st.f32 [%SP+0], %f1; st.f32 [%SP+4], %f2; .loc 1 71 5 ld.f32 %f3, [%SP+4]; ld.f32 %f4, [%SP+0]; st.param.f32 [func_retval0+0], %f4; st.param.f32 [func_retval0+4], %f3; ret; tmp1: func_end0: } // .globl _Z8__cconjf6float2 .visible .func (.param .align 8 .b8 func_retval0[8]) _Z8__cconjf6float2( .param .align 8 .b8 _Z8__cconjf6float2_param_0[8] ) { .local .align 8 .b8 __local_depot1[16]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<8>; .reg .b64 %rd<2>; .loc 1 74 1 func_begin1: .loc 1 0 0 .loc 1 74 1 mov.u64 %rd1, __local_depot1; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z8__cconjf6float2_param_0+4]; ld.param.f32 %f1, [_Z8__cconjf6float2_param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; tmp2: func_exec_begin1: .loc 1 76 12 ld.f32 %f3, [%SP+0]; st.f32 [%SP+8], %f3; ld.f32 %f4, [%SP+4]; neg.f32 %f5, %f4; st.f32 [%SP+12], %f5; .loc 1 77 5 ld.f32 %f6, [%SP+12]; ld.f32 %f7, [%SP+8]; st.param.f32 [func_retval0+0], %f7; st.param.f32 [func_retval0+4], %f6; ret; tmp3: func_end1: } // .globl _Z7__caddf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__caddf6float2S_( .param .align 8 .b8 _Z7__caddf6float2S__param_0[8], .param .align 8 .b8 _Z7__caddf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot2[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<13>; .reg .b64 %rd<2>; .loc 1 80 1 func_begin2: .loc 1 0 0 .loc 1 80 1 mov.u64 %rd1, __local_depot2; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__caddf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__caddf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__caddf6float2S__param_1]; ld.param.f32 %f1, [_Z7__caddf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp4: func_exec_begin2: .loc 1 82 12 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; add.f32 %f7, %f5, %f6; st.f32 [%SP+16], %f7; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; add.f32 %f10, %f8, %f9; st.f32 [%SP+20], %f10; .loc 1 83 5 ld.f32 %f11, [%SP+20]; ld.f32 %f12, [%SP+16]; st.param.f32 [func_retval0+0], %f12; st.param.f32 [func_retval0+4], %f11; ret; tmp5: func_end2: } // .globl _Z7__csubf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__csubf6float2S_( .param .align 8 .b8 _Z7__csubf6float2S__param_0[8], .param .align 8 .b8 _Z7__csubf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot3[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<13>; .reg .b64 %rd<2>; .loc 1 86 1 func_begin3: .loc 1 0 0 .loc 1 86 1 mov.u64 %rd1, __local_depot3; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__csubf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__csubf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__csubf6float2S__param_1]; ld.param.f32 %f1, [_Z7__csubf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp6: func_exec_begin3: .loc 1 88 12 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; sub.f32 %f7, %f5, %f6; st.f32 [%SP+16], %f7; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; sub.f32 %f10, %f8, %f9; st.f32 [%SP+20], %f10; .loc 1 89 5 ld.f32 %f11, [%SP+20]; ld.f32 %f12, [%SP+16]; st.param.f32 [func_retval0+0], %f12; st.param.f32 [func_retval0+4], %f11; ret; tmp7: func_end3: } // .globl _Z7__cmulf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cmulf6float2S_( .param .align 8 .b8 _Z7__cmulf6float2S__param_0[8], .param .align 8 .b8 _Z7__cmulf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot4[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<21>; .reg .b64 %rd<2>; .loc 1 92 1 func_begin4: .loc 1 0 0 .loc 1 92 1 mov.u64 %rd1, __local_depot4; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cmulf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cmulf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cmulf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cmulf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp8: func_exec_begin4: .loc 1 95 5 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; mul.f32 %f7, %f5, %f6; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; mul.f32 %f10, %f8, %f9; sub.f32 %f11, %f7, %f10; st.f32 [%SP+16], %f11; .loc 1 96 5 ld.f32 %f12, [%SP+0]; ld.f32 %f13, [%SP+12]; mul.f32 %f14, %f12, %f13; ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+8]; mul.f32 %f17, %f15, %f16; add.f32 %f18, %f14, %f17; st.f32 [%SP+20], %f18; .loc 1 97 5 ld.f32 %f19, [%SP+20]; ld.f32 %f20, [%SP+16]; st.param.f32 [func_retval0+0], %f20; st.param.f32 [func_retval0+4], %f19; ret; tmp9: func_end4: } // .globl _Z7__cdivf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cdivf6float2S_( .param .align 8 .b8 _Z7__cdivf6float2S__param_0[8], .param .align 8 .b8 _Z7__cdivf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot5[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<29>; .reg .b64 %rd<2>; .loc 1 100 1 func_begin5: .loc 1 0 0 .loc 1 100 1 mov.u64 %rd1, __local_depot5; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cdivf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cdivf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cdivf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cdivf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp10: func_exec_begin5: .loc 1 103 19 ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 103 21 // Callseq Start 0 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 0 tmp11: .loc 1 104 23 rcp.rn.f32 %f8, %f7; tmp12: .loc 1 105 17 ld.f32 %f9, [%SP+8]; mul.f32 %f10, %f8, %f9; tmp13: .loc 1 106 17 ld.f32 %f11, [%SP+12]; mul.f32 %f12, %f8, %f11; tmp14: .loc 1 107 12 ld.f32 %f13, [%SP+0]; mul.f32 %f14, %f13, %f10; ld.f32 %f15, [%SP+4]; mul.f32 %f16, %f15, %f12; add.f32 %f17, %f14, %f16; st.f32 [%SP+16], %f17; ld.f32 %f18, [%SP+4]; mul.f32 %f19, %f18, %f10; ld.f32 %f20, [%SP+0]; mul.f32 %f21, %f20, %f12; sub.f32 %f22, %f19, %f21; st.f32 [%SP+20], %f22; .loc 1 109 5 ld.f32 %f23, [%SP+16]; mul.f32 %f24, %f23, %f8; st.f32 [%SP+16], %f24; .loc 1 110 5 ld.f32 %f25, [%SP+20]; mul.f32 %f26, %f25, %f8; st.f32 [%SP+20], %f26; .loc 1 111 5 ld.f32 %f27, [%SP+20]; ld.f32 %f28, [%SP+16]; st.param.f32 [func_retval0+0], %f28; st.param.f32 [func_retval0+4], %f27; ret; tmp15: func_end5: } // .globl _Z7__cminf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cminf6float2S_( .param .align 8 .b8 _Z7__cminf6float2S__param_0[8], .param .align 8 .b8 _Z7__cminf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot6[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f32 %f<17>; .reg .b64 %rd<2>; .loc 1 114 1 func_begin6: .loc 1 0 0 .loc 1 114 1 mov.u64 %rd1, __local_depot6; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cminf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cminf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cminf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cminf6float2S__param_0]; st.f32 [%SP+12], %f2; st.f32 [%SP+8], %f1; st.f32 [%SP+20], %f4; st.f32 [%SP+16], %f3; func_exec_begin6: .loc 1 116 5 tmp16: ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 116 12 // Callseq Start 1 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 1 ld.f32 %f8, [%SP+16]; ld.f32 %f9, [%SP+20]; .loc 1 116 27 // Callseq Start 2 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f8; .param .b32 param1; st.param.f32 [param1+0], %f9; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f10, [retval0+0]; //{ }// Callseq End 2 setp.lt.f32 %p1, %f7, %f10; not.pred %p2, %p1; @%p2 bra BB6_2; bra.uni BB6_1; BB6_1: ld.f32 %f13, [%SP+8]; ld.f32 %f14, [%SP+12]; st.f32 [%SP+4], %f14; st.f32 [%SP+0], %f13; bra.uni BB6_3; BB6_2: ld.f32 %f11, [%SP+16]; ld.f32 %f12, [%SP+20]; st.f32 [%SP+4], %f12; st.f32 [%SP+0], %f11; BB6_3: ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+0]; st.param.f32 [func_retval0+0], %f16; st.param.f32 [func_retval0+4], %f15; ret; tmp17: func_end6: } // .globl _Z7__cmaxf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cmaxf6float2S_( .param .align 8 .b8 _Z7__cmaxf6float2S__param_0[8], .param .align 8 .b8 _Z7__cmaxf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot7[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f32 %f<17>; .reg .b64 %rd<2>; .loc 1 119 1 func_begin7: .loc 1 0 0 .loc 1 119 1 mov.u64 %rd1, __local_depot7; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cmaxf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cmaxf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cmaxf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cmaxf6float2S__param_0]; st.f32 [%SP+12], %f2; st.f32 [%SP+8], %f1; st.f32 [%SP+20], %f4; st.f32 [%SP+16], %f3; func_exec_begin7: .loc 1 121 5 tmp18: ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 121 12 // Callseq Start 3 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 3 ld.f32 %f8, [%SP+16]; ld.f32 %f9, [%SP+20]; .loc 1 121 27 // Callseq Start 4 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f8; .param .b32 param1; st.param.f32 [param1+0], %f9; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f10, [retval0+0]; //{ }// Callseq End 4 setp.gt.f32 %p1, %f7, %f10; not.pred %p2, %p1; @%p2 bra BB7_2; bra.uni BB7_1; BB7_1: ld.f32 %f13, [%SP+8]; ld.f32 %f14, [%SP+12]; st.f32 [%SP+4], %f14; st.f32 [%SP+0], %f13; bra.uni BB7_3; BB7_2: ld.f32 %f11, [%SP+16]; ld.f32 %f12, [%SP+20]; st.f32 [%SP+4], %f12; st.f32 [%SP+0], %f11; BB7_3: ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+0]; st.param.f32 [func_retval0+0], %f16; st.param.f32 [func_retval0+4], %f15; ret; tmp19: func_end7: } // .globl _Z7__cplx2dd .visible .func (.param .align 16 .b8 func_retval0[16]) _Z7__cplx2dd( .param .b64 _Z7__cplx2dd_param_0, .param .b64 _Z7__cplx2dd_param_1 ) { .local .align 16 .b8 __local_depot8[16]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<5>; .reg .b64 %rd<2>; .loc 1 142 1 func_begin8: .loc 1 0 0 .loc 1 142 1 mov.u64 %rd1, __local_depot8; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd1, [_Z7__cplx2dd_param_0]; ld.param.f64 %fd2, [_Z7__cplx2dd_param_1]; tmp20: func_exec_begin8: .loc 1 144 13 st.f64 [%SP+0], %fd1; st.f64 [%SP+8], %fd2; .loc 1 145 5 ld.f64 %fd3, [%SP+8]; ld.f64 %fd4, [%SP+0]; st.param.f64 [func_retval0+0], %fd4; st.param.f64 [func_retval0+8], %fd3; ret; tmp21: func_end8: } // .globl _Z7__cconj7double2 .visible .func (.param .align 16 .b8 func_retval0[16]) _Z7__cconj7double2( .param .align 16 .b8 _Z7__cconj7double2_param_0[16] ) { .local .align 16 .b8 __local_depot9[32]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<8>; .reg .b64 %rd<2>; .loc 1 148 1 func_begin9: .loc 1 0 0 .loc 1 148 1 mov.u64 %rd1, __local_depot9; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z7__cconj7double2_param_0+8]; ld.param.f64 %fd1, [_Z7__cconj7double2_param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; tmp22: func_exec_begin9: .loc 1 150 13 ld.f64 %fd3, [%SP+0]; st.f64 [%SP+16], %fd3; ld.f64 %fd4, [%SP+8]; neg.f64 %fd5, %fd4; st.f64 [%SP+24], %fd5; .loc 1 151 5 ld.f64 %fd6, [%SP+24]; ld.f64 %fd7, [%SP+16]; st.param.f64 [func_retval0+0], %fd7; st.param.f64 [func_retval0+8], %fd6; ret; tmp23: func_end9: } // .globl _Z6__cadd7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cadd7double2S_( .param .align 16 .b8 _Z6__cadd7double2S__param_0[16], .param .align 16 .b8 _Z6__cadd7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot10[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<13>; .reg .b64 %rd<2>; .loc 1 154 1 func_begin10: .loc 1 0 0 .loc 1 154 1 mov.u64 %rd1, __local_depot10; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cadd7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cadd7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cadd7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cadd7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp24: func_exec_begin10: .loc 1 156 13 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; add.f64 %fd7, %fd5, %fd6; st.f64 [%SP+32], %fd7; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; add.f64 %fd10, %fd8, %fd9; st.f64 [%SP+40], %fd10; .loc 1 157 5 ld.f64 %fd11, [%SP+40]; ld.f64 %fd12, [%SP+32]; st.param.f64 [func_retval0+0], %fd12; st.param.f64 [func_retval0+8], %fd11; ret; tmp25: func_end10: } // .globl _Z6__csub7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__csub7double2S_( .param .align 16 .b8 _Z6__csub7double2S__param_0[16], .param .align 16 .b8 _Z6__csub7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot11[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<13>; .reg .b64 %rd<2>; .loc 1 160 1 func_begin11: .loc 1 0 0 .loc 1 160 1 mov.u64 %rd1, __local_depot11; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__csub7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__csub7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__csub7double2S__param_1]; ld.param.f64 %fd1, [_Z6__csub7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp26: func_exec_begin11: .loc 1 162 13 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; sub.f64 %fd7, %fd5, %fd6; st.f64 [%SP+32], %fd7; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; sub.f64 %fd10, %fd8, %fd9; st.f64 [%SP+40], %fd10; .loc 1 163 5 ld.f64 %fd11, [%SP+40]; ld.f64 %fd12, [%SP+32]; st.param.f64 [func_retval0+0], %fd12; st.param.f64 [func_retval0+8], %fd11; ret; tmp27: func_end11: } // .globl _Z6__cmul7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmul7double2S_( .param .align 16 .b8 _Z6__cmul7double2S__param_0[16], .param .align 16 .b8 _Z6__cmul7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot12[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<21>; .reg .b64 %rd<2>; .loc 1 166 1 func_begin12: .loc 1 0 0 .loc 1 166 1 mov.u64 %rd1, __local_depot12; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmul7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmul7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmul7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmul7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp28: func_exec_begin12: .loc 1 169 5 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; mul.f64 %fd7, %fd5, %fd6; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; mul.f64 %fd10, %fd8, %fd9; sub.f64 %fd11, %fd7, %fd10; st.f64 [%SP+32], %fd11; .loc 1 170 5 ld.f64 %fd12, [%SP+0]; ld.f64 %fd13, [%SP+24]; mul.f64 %fd14, %fd12, %fd13; ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+16]; mul.f64 %fd17, %fd15, %fd16; add.f64 %fd18, %fd14, %fd17; st.f64 [%SP+40], %fd18; .loc 1 171 5 ld.f64 %fd19, [%SP+40]; ld.f64 %fd20, [%SP+32]; st.param.f64 [func_retval0+0], %fd20; st.param.f64 [func_retval0+8], %fd19; ret; tmp29: func_end12: } // .globl _Z6__cdiv7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cdiv7double2S_( .param .align 16 .b8 _Z6__cdiv7double2S__param_0[16], .param .align 16 .b8 _Z6__cdiv7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot13[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<29>; .reg .b64 %rd<2>; .loc 1 174 1 func_begin13: .loc 1 0 0 .loc 1 174 1 mov.u64 %rd1, __local_depot13; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cdiv7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cdiv7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cdiv7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cdiv7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp30: func_exec_begin13: .loc 1 177 20 ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 177 22 // Callseq Start 5 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 5 tmp31: .loc 1 178 24 rcp.rn.f64 %fd8, %fd7; tmp32: .loc 1 179 18 ld.f64 %fd9, [%SP+16]; mul.f64 %fd10, %fd8, %fd9; tmp33: .loc 1 180 18 ld.f64 %fd11, [%SP+24]; mul.f64 %fd12, %fd8, %fd11; tmp34: .loc 1 181 13 ld.f64 %fd13, [%SP+0]; mul.f64 %fd14, %fd13, %fd10; ld.f64 %fd15, [%SP+8]; mul.f64 %fd16, %fd15, %fd12; add.f64 %fd17, %fd14, %fd16; st.f64 [%SP+32], %fd17; ld.f64 %fd18, [%SP+8]; mul.f64 %fd19, %fd18, %fd10; ld.f64 %fd20, [%SP+0]; mul.f64 %fd21, %fd20, %fd12; sub.f64 %fd22, %fd19, %fd21; st.f64 [%SP+40], %fd22; .loc 1 183 5 ld.f64 %fd23, [%SP+32]; mul.f64 %fd24, %fd23, %fd8; st.f64 [%SP+32], %fd24; .loc 1 184 5 ld.f64 %fd25, [%SP+40]; mul.f64 %fd26, %fd25, %fd8; st.f64 [%SP+40], %fd26; .loc 1 185 5 ld.f64 %fd27, [%SP+40]; ld.f64 %fd28, [%SP+32]; st.param.f64 [func_retval0+0], %fd28; st.param.f64 [func_retval0+8], %fd27; ret; tmp35: func_end13: } // .globl _Z6__cmin7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmin7double2S_( .param .align 16 .b8 _Z6__cmin7double2S__param_0[16], .param .align 16 .b8 _Z6__cmin7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot14[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f64 %fd<17>; .reg .b64 %rd<2>; .loc 1 188 1 func_begin14: .loc 1 0 0 .loc 1 188 1 mov.u64 %rd1, __local_depot14; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmin7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmin7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmin7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmin7double2S__param_0]; st.f64 [%SP+24], %fd2; st.f64 [%SP+16], %fd1; st.f64 [%SP+40], %fd4; st.f64 [%SP+32], %fd3; func_exec_begin14: .loc 1 190 5 tmp36: ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 190 12 // Callseq Start 6 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 6 ld.f64 %fd8, [%SP+32]; ld.f64 %fd9, [%SP+40]; .loc 1 190 26 // Callseq Start 7 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd8; .param .b64 param1; st.param.f64 [param1+0], %fd9; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd10, [retval0+0]; //{ }// Callseq End 7 setp.lt.f64 %p1, %fd7, %fd10; not.pred %p2, %p1; @%p2 bra BB14_2; bra.uni BB14_1; BB14_1: ld.f64 %fd13, [%SP+16]; ld.f64 %fd14, [%SP+24]; st.f64 [%SP+8], %fd14; st.f64 [%SP+0], %fd13; bra.uni BB14_3; BB14_2: ld.f64 %fd11, [%SP+32]; ld.f64 %fd12, [%SP+40]; st.f64 [%SP+8], %fd12; st.f64 [%SP+0], %fd11; BB14_3: ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+0]; st.param.f64 [func_retval0+0], %fd16; st.param.f64 [func_retval0+8], %fd15; ret; tmp37: func_end14: } // .globl _Z6__cmax7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmax7double2S_( .param .align 16 .b8 _Z6__cmax7double2S__param_0[16], .param .align 16 .b8 _Z6__cmax7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot15[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f64 %fd<17>; .reg .b64 %rd<2>; .loc 1 193 1 func_begin15: .loc 1 0 0 .loc 1 193 1 mov.u64 %rd1, __local_depot15; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmax7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmax7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmax7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmax7double2S__param_0]; st.f64 [%SP+24], %fd2; st.f64 [%SP+16], %fd1; st.f64 [%SP+40], %fd4; st.f64 [%SP+32], %fd3; func_exec_begin15: .loc 1 195 5 tmp38: ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 195 12 // Callseq Start 8 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 8 ld.f64 %fd8, [%SP+32]; ld.f64 %fd9, [%SP+40]; .loc 1 195 26 // Callseq Start 9 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd8; .param .b64 param1; st.param.f64 [param1+0], %fd9; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd10, [retval0+0]; //{ }// Callseq End 9 setp.gt.f64 %p1, %fd7, %fd10; not.pred %p2, %p1; @%p2 bra BB15_2; bra.uni BB15_1; BB15_1: ld.f64 %fd13, [%SP+16]; ld.f64 %fd14, [%SP+24]; st.f64 [%SP+8], %fd14; st.f64 [%SP+0], %fd13; bra.uni BB15_3; BB15_2: ld.f64 %fd11, [%SP+32]; ld.f64 %fd12, [%SP+40]; st.f64 [%SP+8], %fd12; st.f64 [%SP+0], %fd11; BB15_3: ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+0]; st.param.f64 [func_retval0+0], %fd16; st.param.f64 [func_retval0+8], %fd15; ret; tmp39: func_end15: } // .globl KER12444251140956856 .visible .entry KER12444251140956856( .param .u64 KER12444251140956856_param_0, .param .u64 KER12444251140956856_param_1, .param .u64 KER12444251140956856_param_2, .param .u64 KER12444251140956856_param_3, .param .u64 KER12444251140956856_param_4, .param .u64 KER12444251140956856_param_5, .param .u64 KER12444251140956856_param_6, .param .u64 KER12444251140956856_param_7, .param .u64 KER12444251140956856_param_8, .param .u64 KER12444251140956856_param_9, .param .u64 KER12444251140956856_param_10, .param .u64 KER12444251140956856_param_11, .param .u64 KER12444251140956856_param_12, .param .u64 KER12444251140956856_param_13, .param .u64 KER12444251140956856_param_14, .param .u64 KER12444251140956856_param_15, .param .u64 KER12444251140956856_param_16, .param .u64 KER12444251140956856_param_17, .param .u64 KER12444251140956856_param_18, .param .align 8 .b8 KER12444251140956856_param_19[72], .param .u32 KER12444251140956856_param_20, .param .u32 KER12444251140956856_param_21, .param .u32 KER12444251140956856_param_22, .param .u32 KER12444251140956856_param_23 ) { .local .align 8 .b8 __local_depot16[144]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<5>; .reg .f32 %f<73>; .reg .b32 %r<40>; .reg .b64 %rd<107>; .loc 1 220 1 func_begin16: .loc 1 0 0 .loc 1 220 1 mov.u64 %rd106, __local_depot16; cvta.local.u64 %SP, %rd106; ld.param.u64 %rd1, [KER12444251140956856_param_0]; ld.param.u64 %rd2, [KER12444251140956856_param_1]; ld.param.u64 %rd3, [KER12444251140956856_param_2]; ld.param.u64 %rd4, [KER12444251140956856_param_3]; ld.param.u64 %rd5, [KER12444251140956856_param_4]; ld.param.u64 %rd6, [KER12444251140956856_param_5]; ld.param.u64 %rd7, [KER12444251140956856_param_6]; ld.param.u64 %rd8, [KER12444251140956856_param_7]; ld.param.u64 %rd9, [KER12444251140956856_param_8]; ld.param.u64 %rd10, [KER12444251140956856_param_9]; ld.param.u64 %rd11, [KER12444251140956856_param_10]; ld.param.u64 %rd12, [KER12444251140956856_param_11]; ld.param.u64 %rd13, [KER12444251140956856_param_12]; ld.param.u64 %rd14, [KER12444251140956856_param_13]; ld.param.u64 %rd15, [KER12444251140956856_param_14]; ld.param.u64 %rd16, [KER12444251140956856_param_15]; ld.param.u64 %rd17, [KER12444251140956856_param_16]; ld.param.u64 %rd18, [KER12444251140956856_param_17]; ld.param.u64 %rd19, [KER12444251140956856_param_18]; ld.param.u64 %rd21, [KER12444251140956856_param_19+8]; ld.param.u64 %rd22, [KER12444251140956856_param_19+16]; ld.param.u64 %rd23, [KER12444251140956856_param_19+24]; ld.param.u64 %rd24, [KER12444251140956856_param_19+32]; ld.param.u64 %rd25, [KER12444251140956856_param_19+40]; ld.param.u64 %rd26, [KER12444251140956856_param_19+48]; ld.param.u64 %rd27, [KER12444251140956856_param_19+56]; ld.param.u64 %rd28, [KER12444251140956856_param_19+64]; ld.param.u32 %r5, [KER12444251140956856_param_20]; ld.param.u32 %r6, [KER12444251140956856_param_21]; ld.param.u32 %r7, [KER12444251140956856_param_22]; ld.param.u32 %r8, [KER12444251140956856_param_23]; ld.param.u64 %rd20, [KER12444251140956856_param_19]; st.u64 [%SP+64], %rd28; st.u64 [%SP+56], %rd27; st.u64 [%SP+48], %rd26; st.u64 [%SP+40], %rd25; st.u64 [%SP+32], %rd24; st.u64 [%SP+24], %rd23; st.u64 [%SP+16], %rd22; st.u64 [%SP+8], %rd21; st.u64 [%SP+0], %rd20; mov.b32 %r9, %r5; mov.b32 %r10, %r6; mov.b32 %r11, %r8; tmp40: func_exec_begin16: .loc 1 244 21 ld.u64 %rd29, [%SP+0]; ld.u64 %rd30, [%SP+8]; ld.u64 %rd31, [%SP+16]; ld.u64 %rd32, [%SP+24]; ld.u64 %rd33, [%SP+32]; ld.u64 %rd34, [%SP+40]; ld.u64 %rd35, [%SP+48]; ld.u64 %rd36, [%SP+56]; ld.u64 %rd37, [%SP+64]; st.u64 [%SP+136], %rd37; st.u64 [%SP+128], %rd36; st.u64 [%SP+120], %rd35; st.u64 [%SP+112], %rd34; st.u64 [%SP+104], %rd33; st.u64 [%SP+96], %rd32; st.u64 [%SP+88], %rd31; st.u64 [%SP+80], %rd30; st.u64 [%SP+72], %rd29; .loc 1 246 25 tmp41: mov.u32 %r12, %ctaid.x; mov.b32 %r1, %r12; tmp42: mov.u32 %r39, %r1; tmp43: BB16_1: .loc 1 246 5 mov.u32 %r2, %r39; tmp44: setp.lt.u32 %p1, %r2, %r7; not.pred %p2, %p1; @%p2 bra BB16_6; bra.uni BB16_2; BB16_2: .loc 1 248 23 tmp45: mov.u32 %r13, %tid.x; mov.b32 %r14, %r13; tmp46: .loc 1 249 17 mov.u32 %r15, %ntid.x; mul.lo.s32 %r16, %r2, %r15; mov.u32 %r17, %ntid.y; mul.lo.s32 %r18, %r16, %r17; add.s32 %r3, %r18, %r14; tmp47: .loc 1 250 9 cvt.s64.s32 %rd38, %r3; add.u64 %rd39, %SP, 72; add.s64 %rd40, %rd39, 8; ld.u64 %rd41, [%rd40+24]; add.s64 %rd42, %rd39, 40; ld.u64 %rd43, [%rd42+24]; mul.lo.s64 %rd44, %rd41, %rd43; setp.ge.s64 %p3, %rd38, %rd44; not.pred %p4, %p3; @%p4 bra BB16_4; bra.uni BB16_3; BB16_3: .loc 1 250 56 tmp48: bra.uni BB16_7; tmp49: BB16_4: .loc 1 251 18 mov.b32 %r19, %r3; tmp50: .loc 1 252 10 mov.b32 %r20, %r3; tmp51: .loc 1 253 10 mov.b32 %r21, %r3; tmp52: .loc 1 254 10 mov.b32 %r22, %r3; tmp53: .loc 1 255 10 mov.b32 %r23, %r3; tmp54: .loc 1 256 11 mov.b32 %r24, %r3; tmp55: .loc 1 257 11 mov.b32 %r25, %r3; tmp56: .loc 1 258 11 mov.b32 %r26, %r3; tmp57: .loc 1 259 11 mov.b32 %r27, %r3; tmp58: .loc 1 260 11 mov.b32 %r28, %r3; tmp59: .loc 1 261 11 mov.b32 %r29, %r3; tmp60: .loc 1 262 11 mov.b32 %r30, %r3; tmp61: .loc 1 263 11 mov.b32 %r31, %r3; tmp62: .loc 1 264 11 mov.b32 %r32, %r3; tmp63: .loc 1 265 11 mov.b32 %r33, %r3; tmp64: .loc 1 266 11 mov.b32 %r34, %r3; tmp65: .loc 1 267 11 mov.b32 %r35, %r3; tmp66: .loc 1 268 11 mov.b32 %r36, %r3; tmp67: .loc 1 269 11 mov.b32 %r37, %r3; tmp68: .loc 1 270 12 cvt.s64.s32 %rd45, %r19; shl.b64 %rd46, %rd45, 2; add.s64 %rd47, %rd1, %rd46; ld.f32 %f1, [%rd47]; mov.f32 %f2, %f1; tmp69: .loc 1 271 12 cvt.s64.s32 %rd48, %r20; shl.b64 %rd49, %rd48, 2; add.s64 %rd50, %rd2, %rd49; ld.f32 %f3, [%rd50]; mov.f32 %f4, %f3; tmp70: .loc 1 272 12 cvt.s64.s32 %rd51, %r21; shl.b64 %rd52, %rd51, 2; add.s64 %rd53, %rd3, %rd52; ld.f32 %f5, [%rd53]; mov.f32 %f6, %f5; tmp71: .loc 1 273 12 add.f32 %f7, %f4, %f6; tmp72: .loc 1 274 12 add.f32 %f8, %f2, %f7; tmp73: .loc 1 275 12 cvt.s64.s32 %rd54, %r22; shl.b64 %rd55, %rd54, 2; add.s64 %rd56, %rd4, %rd55; ld.f32 %f9, [%rd56]; mov.f32 %f10, %f9; tmp74: .loc 1 276 12 add.f32 %f11, %f7, %f10; tmp75: .loc 1 277 12 add.f32 %f12, %f8, %f11; tmp76: .loc 1 278 12 cvt.s64.s32 %rd57, %r23; shl.b64 %rd58, %rd57, 2; add.s64 %rd59, %rd5, %rd58; ld.f32 %f13, [%rd59]; mov.f32 %f14, %f13; tmp77: .loc 1 279 12 add.f32 %f15, %f11, %f14; tmp78: .loc 1 280 13 add.f32 %f16, %f12, %f15; tmp79: .loc 1 281 13 cvt.s64.s32 %rd60, %r24; shl.b64 %rd61, %rd60, 2; add.s64 %rd62, %rd6, %rd61; ld.f32 %f17, [%rd62]; mov.f32 %f18, %f17; tmp80: .loc 1 282 13 add.f32 %f19, %f15, %f18; tmp81: .loc 1 283 13 add.f32 %f20, %f16, %f19; tmp82: .loc 1 284 13 cvt.s64.s32 %rd63, %r25; shl.b64 %rd64, %rd63, 2; add.s64 %rd65, %rd7, %rd64; ld.f32 %f21, [%rd65]; mov.f32 %f22, %f21; tmp83: .loc 1 285 13 add.f32 %f23, %f19, %f22; tmp84: .loc 1 286 13 add.f32 %f24, %f20, %f23; tmp85: .loc 1 287 13 cvt.s64.s32 %rd66, %r26; shl.b64 %rd67, %rd66, 2; add.s64 %rd68, %rd8, %rd67; ld.f32 %f25, [%rd68]; mov.f32 %f26, %f25; tmp86: .loc 1 288 13 add.f32 %f27, %f23, %f26; tmp87: .loc 1 289 13 add.f32 %f28, %f24, %f27; tmp88: .loc 1 290 13 cvt.s64.s32 %rd69, %r27; shl.b64 %rd70, %rd69, 2; add.s64 %rd71, %rd9, %rd70; ld.f32 %f29, [%rd71]; mov.f32 %f30, %f29; tmp89: .loc 1 291 13 add.f32 %f31, %f27, %f30; tmp90: .loc 1 292 13 add.f32 %f32, %f28, %f31; tmp91: .loc 1 293 13 cvt.s64.s32 %rd72, %r28; shl.b64 %rd73, %rd72, 2; add.s64 %rd74, %rd10, %rd73; ld.f32 %f33, [%rd74]; mov.f32 %f34, %f33; tmp92: .loc 1 294 13 add.f32 %f35, %f31, %f34; tmp93: .loc 1 295 13 add.f32 %f36, %f32, %f35; tmp94: .loc 1 296 13 cvt.s64.s32 %rd75, %r29; shl.b64 %rd76, %rd75, 2; add.s64 %rd77, %rd11, %rd76; ld.f32 %f37, [%rd77]; mov.f32 %f38, %f37; tmp95: .loc 1 297 13 add.f32 %f39, %f35, %f38; tmp96: .loc 1 298 13 add.f32 %f40, %f36, %f39; tmp97: .loc 1 299 13 cvt.s64.s32 %rd78, %r30; shl.b64 %rd79, %rd78, 2; add.s64 %rd80, %rd12, %rd79; ld.f32 %f41, [%rd80]; mov.f32 %f42, %f41; tmp98: .loc 1 300 13 add.f32 %f43, %f39, %f42; tmp99: .loc 1 301 13 add.f32 %f44, %f40, %f43; tmp100: .loc 1 302 13 cvt.s64.s32 %rd81, %r31; shl.b64 %rd82, %rd81, 2; add.s64 %rd83, %rd13, %rd82; ld.f32 %f45, [%rd83]; mov.f32 %f46, %f45; tmp101: .loc 1 303 13 add.f32 %f47, %f43, %f46; tmp102: .loc 1 304 13 add.f32 %f48, %f44, %f47; tmp103: .loc 1 305 13 cvt.s64.s32 %rd84, %r32; shl.b64 %rd85, %rd84, 2; add.s64 %rd86, %rd14, %rd85; ld.f32 %f49, [%rd86]; mov.f32 %f50, %f49; tmp104: .loc 1 306 13 add.f32 %f51, %f47, %f50; tmp105: .loc 1 307 13 add.f32 %f52, %f48, %f51; tmp106: .loc 1 308 13 cvt.s64.s32 %rd87, %r33; shl.b64 %rd88, %rd87, 2; add.s64 %rd89, %rd15, %rd88; ld.f32 %f53, [%rd89]; mov.f32 %f54, %f53; tmp107: .loc 1 309 13 add.f32 %f55, %f51, %f54; tmp108: .loc 1 310 13 add.f32 %f56, %f52, %f55; tmp109: .loc 1 311 13 cvt.s64.s32 %rd90, %r34; shl.b64 %rd91, %rd90, 2; add.s64 %rd92, %rd16, %rd91; ld.f32 %f57, [%rd92]; mov.f32 %f58, %f57; tmp110: .loc 1 312 13 add.f32 %f59, %f55, %f58; tmp111: .loc 1 313 13 add.f32 %f60, %f56, %f59; tmp112: .loc 1 314 13 cvt.s64.s32 %rd93, %r35; shl.b64 %rd94, %rd93, 2; add.s64 %rd95, %rd17, %rd94; ld.f32 %f61, [%rd95]; mov.f32 %f62, %f61; tmp113: .loc 1 315 13 add.f32 %f63, %f59, %f62; tmp114: .loc 1 316 13 add.f32 %f64, %f60, %f63; tmp115: .loc 1 317 13 cvt.s64.s32 %rd96, %r36; shl.b64 %rd97, %rd96, 2; add.s64 %rd98, %rd18, %rd97; ld.f32 %f65, [%rd98]; mov.f32 %f66, %f65; tmp116: .loc 1 318 13 add.f32 %f67, %f63, %f66; tmp117: .loc 1 319 13 add.f32 %f68, %f64, %f67; tmp118: .loc 1 320 13 cvt.s64.s32 %rd99, %r37; shl.b64 %rd100, %rd99, 2; add.s64 %rd101, %rd19, %rd100; ld.f32 %f69, [%rd101]; mov.f32 %f70, %f69; tmp119: .loc 1 321 13 add.f32 %f71, %f67, %f70; tmp120: .loc 1 322 13 add.f32 %f72, %f68, %f71; tmp121: .loc 1 323 1 ld.u64 %rd102, [%SP+0]; cvt.s64.s32 %rd103, %r3; shl.b64 %rd104, %rd103, 2; add.s64 %rd105, %rd102, %rd104; st.f32 [%rd105], %f72; tmp122: .loc 1 246 68 mov.u32 %r38, %nctaid.x; add.s32 %r4, %r2, %r38; tmp123: mov.u32 %r39, %r4; tmp124: bra.uni BB16_1; tmp125: BB16_6: BB16_7: .loc 1 328 1 ret; tmp126: func_end16: } .func (.param .b32 func_retval0) hypotf( .param .b32 hypotf_param_0, .param .b32 hypotf_param_1 ) { .reg .pred %p<5>; .reg .f32 %f<20>; .reg .b32 %r<13>; ld.param.f32 %f7, [hypotf_param_0]; ld.param.f32 %f8, [hypotf_param_1]; abs.f32 %f9, %f7; abs.f32 %f10, %f8; mov.b32 %r1, %f10; mov.b32 %r2, %f9; min.s32 %r3, %r1, %r2; mov.b32 %f1, %r3; mov.b32 %r4, %f9; mov.b32 %r5, %f10; max.s32 %r6, %r4, %r5; mov.b32 %f2, %r6; and.b32 %r7, %r6, -33554432; sub.s32 %r8, %r7, 1065353216; add.s32 %r9, %r8, 8388608; mov.u32 %r10, 1065353216; sub.s32 %r11, %r10, %r9; mov.b32 %f11, %r11; mul.f32 %f12, %f1, %f11; mul.f32 %f13, %f2, %f11; mul.f32 %f14, %f12, %f12; fma.rn.f32 %f15, %f13, %f13, %f14; sqrt.rn.f32 %f16, %f15; add.s32 %r12, %r9, 1065353216; mov.b32 %f17, %r12; mul.f32 %f3, %f16, %f17; setp.eq.f32 %p1, %f1, 0f00000000; not.pred %p2, %p1; mov.f32 %f18, %f3; @%p2 bra BB17_2; bra.uni BB17_1; BB17_1: mov.f32 %f18, %f2; BB17_2: mov.f32 %f4, %f18; setp.eq.f32 %p3, %f1, 0f7F800000; not.pred %p4, %p3; mov.f32 %f19, %f4; @%p4 bra BB17_4; bra.uni BB17_3; BB17_3: mov.f32 %f5, 0f7F800000; mov.f32 %f19, %f5; BB17_4: mov.f32 %f6, %f19; st.param.f32 [func_retval0+0], %f6; ret; } .func (.param .b64 func_retval0) hypot( .param .b64 hypot_param_0, .param .b64 hypot_param_1 ) { .reg .pred %p<5>; .reg .b32 %r<11>; .reg .f64 %fd<32>; .reg .b64 %rd<7>; ld.param.f64 %fd6, [hypot_param_0]; ld.param.f64 %fd7, [hypot_param_1]; abs.f64 %fd10, %fd6; abs.f64 %fd11, %fd7; mov.b64 %rd1, %fd11; mov.b64 %rd2, %fd10; min.u64 %rd3, %rd1, %rd2; mov.b64 %fd1, %rd3; mov.b64 %rd4, %fd10; mov.b64 %rd5, %fd11; max.u64 %rd6, %rd4, %rd5; mov.b64 %fd2, %rd6; { .reg .b32 %temp; mov.b64 {%temp, %r1}, %fd2; } and.b32 %r2, %r1, -4194304; sub.s32 %r3, %r2, 1072693248; add.s32 %r4, %r3, 1048576; mov.u32 %r5, 1072693248; sub.s32 %r6, %r5, %r4; mov.u32 %r7, 0; mov.b64 %fd12, {%r7, %r6}; mul.f64 %fd13, %fd1, %fd12; mul.f64 %fd14, %fd2, %fd12; mul.f64 %fd15, %fd13, %fd13; fma.rn.f64 %fd16, %fd14, %fd14, %fd15; mov.f64 %fd17, 0d7FEFFFFFFFFFFFFF; min.f64 %fd9, %fd16, %fd17; // inline asm rsqrt.approx.ftz.f64 %fd8, %fd9; // inline asm mul.rn.f64 %fd18, %fd8, %fd8; neg.f64 %fd19, %fd18; mov.f64 %fd20, 0d3FF0000000000000; fma.rn.f64 %fd21, %fd9, %fd19, %fd20; mov.f64 %fd22, 0d3FE0000000000000; mov.f64 %fd23, 0d3FD8000000000000; fma.rn.f64 %fd24, %fd23, %fd21, %fd22; mul.rn.f64 %fd25, %fd21, %fd8; fma.rn.f64 %fd26, %fd24, %fd25, %fd8; mul.f64 %fd27, %fd16, %fd26; add.s32 %r8, %r4, 1072693248; mov.b64 %fd28, {%r7, %r8}; mul.f64 %fd3, %fd27, %fd28; setp.eq.f64 %p1, %fd1, 0d0000000000000000; not.pred %p2, %p1; mov.f64 %fd30, %fd3; @%p2 bra BB18_2; bra.uni BB18_1; BB18_1: mov.f64 %fd30, %fd2; BB18_2: mov.f64 %fd4, %fd30; { .reg .b32 %temp; mov.b64 {%temp, %r9}, %fd1; } mov.f64 %fd29, 0d7FF0000000000000; { .reg .b32 %temp; mov.b64 {%temp, %r10}, %fd29; } setp.ge.u32 %p3, %r9, %r10; not.pred %p4, %p3; mov.f64 %fd31, %fd4; @%p4 bra BB18_4; bra.uni BB18_3; BB18_3: mov.f64 %fd31, %fd1; BB18_4: mov.f64 %fd5, %fd31; st.param.f64 [func_retval0+0], %fd5; ret; } .file 1 "/media/nvidia/Data/arrayfire/github/build/TX2-R28.2-DP_Debug/KER12444251140956856" .file 2 "/media/nvidia/Data/arrayfire/github/build/TX2-R28.2-DP_Debug/__nv_nvrtc_builtin_header.h" .section .debug_info { .b32 6319 .b8 2 .b8 0 .b32 .debug_abbrev .b8 8 .b8 1 .b8 108 .b8 103 .b8 101 .b8 110 .b8 102 .b8 101 .b8 58 .b8 32 .b8 69 .b8 68 .b8 71 .b8 32 .b8 52 .b8 46 .b8 49 .b8 50 .b8 0 .b8 4 .b8 75 .b8 69 .b8 82 .b8 49 .b8 50 .b8 52 .b8 52 .b8 52 .b8 50 .b8 53 .b8 49 .b8 49 .b8 52 .b8 48 .b8 57 .b8 53 .b8 54 .b8 56 .b8 53 .b8 54 .b8 0 .b64 0 .b32 .debug_line .b8 47 .b8 109 .b8 101 .b8 100 .b8 105 .b8 97 .b8 47 .b8 110 .b8 118 .b8 105 .b8 100 .b8 105 .b8 97 .b8 47 .b8 68 .b8 97 .b8 116 .b8 97 .b8 47 .b8 97 .b8 114 .b8 114 .b8 97 .b8 121 .b8 102 .b8 105 .b8 114 .b8 101 .b8 47 .b8 103 .b8 105 .b8 116 .b8 104 .b8 117 .b8 98 .b8 47 .b8 98 .b8 117 .b8 105 .b8 108 .b8 100 .b8 47 .b8 84 .b8 88 .b8 50 .b8 45 .b8 82 .b8 50 .b8 56 .b8 46 .b8 50 .b8 45 .b8 68 .b8 80 .b8 95 .b8 68 .b8 101 .b8 98 .b8 117 .b8 103 .b8 0 .b8 2 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b32 1 .b32 68 .b32 277 .b8 1 .b64 func_begin0 .b64 func_end0 .b8 1 .b8 156 .b8 3 .b8 120 .b8 0 .b32 1 .b32 68 .b32 376 .b8 5 .b8 144 .b8 177 .b8 204 .b8 149 .b8 1 .b8 2 .b8 3 .b8 121 .b8 0 .b32 1 .b32 68 .b32 376 .b8 5 .b8 144 .b8 178 .b8 204 .b8 149 .b8 1 .b8 2 .b8 4 .b64 tmp0 .b64 tmp1 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 70 .b32 277 .b8 11 .b8 3 .b64 __local_depot0 .b8 35 .b8 0 .b8 6 .b8 0 .b8 0 .b8 6 .b32 289 .b8 99 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 0 .b8 6 .b32 309 .b8 99 .b8 117 .b8 70 .b8 108 .b8 111 .b8 97 .b8 116 .b8 67 .b8 111 .b8 109 .b8 112 .b8 108 .b8 101 .b8 120 .b8 0 .b8 6 .b32 321 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b8 7 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 8 .b32 2 .b32 728 .b8 8 .b8 120 .b8 0 .b32 376 .b32 2 .b32 728 .b8 0 .b8 1 .b8 8 .b8 121 .b8 0 .b32 376 .b32 2 .b32 728 .b8 4 .b8 1 .b8 0 .b8 9 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 0 .b8 4 .b32 4 .b8 2 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 1 .b32 74 .b32 277 .b8 1 .b64 func_begin1 .b64 func_end1 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 0 .b32 1 .b32 74 .b32 277 .b8 11 .b8 3 .b64 __local_depot1 .b8 35 .b8 0 .b8 6 .b8 4 .b64 tmp2 .b64 tmp3 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 76 .b32 277 .b8 11 .b8 3 .b64 __local_depot1 .b8 35 .b8 8 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 80 .b32 277 .b8 1 .b64 func_begin2 .b64 func_end2 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 80 .b32 277 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 80 .b32 277 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp4 .b64 tmp5 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 82 .b32 277 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 86 .b32 277 .b8 1 .b64 func_begin3 .b64 func_end3 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 86 .b32 277 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 86 .b32 277 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp6 .b64 tmp7 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 88 .b32 277 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 92 .b32 277 .b8 1 .b64 func_begin4 .b64 func_end4 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 92 .b32 277 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 92 .b32 277 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp8 .b64 tmp9 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 94 .b32 277 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 100 .b32 277 .b8 1 .b64 func_begin5 .b64 func_end5 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 100 .b32 277 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 100 .b32 277 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp10 .b64 tmp15 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 107 .b32 277 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 16 .b8 6 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 103 .b32 376 .b8 5 .b8 144 .b8 183 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 105 .b8 110 .b8 118 .b8 95 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 104 .b32 376 .b8 5 .b8 144 .b8 184 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 105 .b32 376 .b8 6 .b8 144 .b8 176 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 106 .b32 376 .b8 6 .b8 144 .b8 178 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 114 .b32 277 .b8 1 .b64 func_begin6 .b64 func_end6 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 114 .b32 277 .b8 11 .b8 3 .b64 __local_depot6 .b8 35 .b8 8 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 114 .b32 277 .b8 11 .b8 3 .b64 __local_depot6 .b8 35 .b8 16 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 119 .b32 277 .b8 1 .b64 func_begin7 .b64 func_end7 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 119 .b32 277 .b8 11 .b8 3 .b64 __local_depot7 .b8 35 .b8 8 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 119 .b32 277 .b8 11 .b8 3 .b64 __local_depot7 .b8 35 .b8 16 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b32 1 .b32 142 .b32 1793 .b8 1 .b64 func_begin8 .b64 func_end8 .b8 1 .b8 156 .b8 3 .b8 120 .b8 0 .b32 1 .b32 142 .b32 1896 .b8 6 .b8 144 .b8 177 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 3 .b8 121 .b8 0 .b32 1 .b32 142 .b32 1896 .b8 6 .b8 144 .b8 178 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 4 .b64 tmp20 .b64 tmp21 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 144 .b32 1793 .b8 11 .b8 3 .b64 __local_depot8 .b8 35 .b8 0 .b8 6 .b8 0 .b8 0 .b8 6 .b32 1806 .b8 99 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 0 .b8 6 .b32 1827 .b8 99 .b8 117 .b8 68 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 67 .b8 111 .b8 109 .b8 112 .b8 108 .b8 101 .b8 120 .b8 0 .b8 6 .b32 1840 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b8 7 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 16 .b32 2 .b32 774 .b8 8 .b8 120 .b8 0 .b32 1896 .b32 2 .b32 776 .b8 0 .b8 1 .b8 8 .b8 121 .b8 0 .b32 1896 .b32 2 .b32 776 .b8 8 .b8 1 .b8 0 .b8 9 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 0 .b8 4 .b32 8 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 1 .b32 148 .b32 1793 .b8 1 .b64 func_begin9 .b64 func_end9 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 0 .b32 1 .b32 148 .b32 1793 .b8 11 .b8 3 .b64 __local_depot9 .b8 35 .b8 0 .b8 6 .b8 4 .b64 tmp22 .b64 tmp23 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 150 .b32 1793 .b8 11 .b8 3 .b64 __local_depot9 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 154 .b32 1793 .b8 1 .b64 func_begin10 .b64 func_end10 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 154 .b32 1793 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 154 .b32 1793 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp24 .b64 tmp25 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 156 .b32 1793 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 160 .b32 1793 .b8 1 .b64 func_begin11 .b64 func_end11 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 160 .b32 1793 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 160 .b32 1793 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp26 .b64 tmp27 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 162 .b32 1793 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 166 .b32 1793 .b8 1 .b64 func_begin12 .b64 func_end12 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 166 .b32 1793 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 166 .b32 1793 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp28 .b64 tmp29 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 168 .b32 1793 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 174 .b32 1793 .b8 1 .b64 func_begin13 .b64 func_end13 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 174 .b32 1793 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 174 .b32 1793 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp30 .b64 tmp35 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 181 .b32 1793 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 32 .b8 6 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 177 .b32 1896 .b8 6 .b8 144 .b8 183 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 110 .b8 118 .b8 95 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 178 .b32 1896 .b8 6 .b8 144 .b8 184 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 179 .b32 1896 .b8 7 .b8 144 .b8 176 .b8 226 .b8 144 .b8 179 .b8 214 .b8 4 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 180 .b32 1896 .b8 7 .b8 144 .b8 178 .b8 226 .b8 144 .b8 179 .b8 214 .b8 4 .b8 2 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 188 .b32 1793 .b8 1 .b64 func_begin14 .b64 func_end14 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 188 .b32 1793 .b8 11 .b8 3 .b64 __local_depot14 .b8 35 .b8 16 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 188 .b32 1793 .b8 11 .b8 3 .b64 __local_depot14 .b8 35 .b8 32 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 193 .b32 1793 .b8 1 .b64 func_begin15 .b64 func_end15 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 193 .b32 1793 .b8 11 .b8 3 .b64 __local_depot15 .b8 35 .b8 16 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 193 .b32 1793 .b8 11 .b8 3 .b64 __local_depot15 .b8 35 .b8 32 .b8 6 .b8 0 .b8 2 .b8 75 .b8 69 .b8 82 .b8 49 .b8 50 .b8 52 .b8 52 .b8 52 .b8 50 .b8 53 .b8 49 .b8 49 .b8 52 .b8 48 .b8 57 .b8 53 .b8 54 .b8 56 .b8 53 .b8 54 .b8 0 .b8 75 .b8 69 .b8 82 .b8 49 .b8 50 .b8 52 .b8 52 .b8 52 .b8 50 .b8 53 .b8 49 .b8 49 .b8 52 .b8 48 .b8 57 .b8 53 .b8 54 .b8 56 .b8 53 .b8 54 .b8 0 .b32 1 .b32 220 .b32 6134 .b8 1 .b64 func_begin16 .b64 func_end16 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 48 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 221 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_0 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 222 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_1 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 223 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_2 .b8 7 .b8 3 .b8 105 .b8 110 .b8 53 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 224 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_3 .b8 7 .b8 3 .b8 105 .b8 110 .b8 56 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 225 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_4 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 226 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_5 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 52 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 227 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_6 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 55 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 228 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_7 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 48 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 229 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_8 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 51 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 230 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_9 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 54 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 231 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_10 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 57 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 232 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_11 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 50 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 233 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_12 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 53 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 234 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_13 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 56 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 235 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_14 .b8 7 .b8 3 .b8 105 .b8 110 .b8 52 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 236 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_15 .b8 7 .b8 3 .b8 105 .b8 110 .b8 52 .b8 52 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 237 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_16 .b8 7 .b8 3 .b8 105 .b8 110 .b8 52 .b8 55 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 238 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_17 .b8 7 .b8 3 .b8 105 .b8 110 .b8 53 .b8 48 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 239 .b32 6255 .b8 9 .b8 3 .b64 KER12444251140956856_param_18 .b8 7 .b8 3 .b8 111 .b8 117 .b8 116 .b8 53 .b8 50 .b8 0 .b32 1 .b32 240 .b32 6167 .b8 11 .b8 3 .b64 __local_depot16 .b8 35 .b8 0 .b8 6 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 241 .b32 6283 .b8 5 .b8 144 .b8 185 .b8 228 .b8 149 .b8 1 .b8 2 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 241 .b32 6283 .b8 6 .b8 144 .b8 176 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 120 .b8 95 .b8 116 .b8 111 .b8 116 .b8 97 .b8 108 .b8 0 .b32 1 .b32 241 .b32 6283 .b8 9 .b8 3 .b64 KER12444251140956856_param_22 .b8 7 .b8 3 .b8 110 .b8 117 .b8 109 .b8 95 .b8 111 .b8 100 .b8 105 .b8 109 .b8 115 .b8 0 .b32 1 .b32 241 .b32 6283 .b8 6 .b8 144 .b8 177 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 4 .b64 tmp40 .b64 tmp126 .b8 5 .b8 111 .b8 117 .b8 116 .b8 114 .b8 101 .b8 102 .b8 0 .b32 1 .b32 244 .b32 6167 .b8 11 .b8 3 .b64 __local_depot16 .b8 35 .b8 72 .b8 6 .b8 4 .b64 tmp41 .b64 tmp125 .b8 10 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 73 .b8 100 .b8 120 .b8 95 .b8 120 .b8 0 .b32 1 .b32 246 .b32 6312 .b32 .debug_loc .b8 4 .b64 tmp45 .b64 tmp125 .b8 4 .b64 tmp45 .b64 tmp122 .b8 5 .b8 116 .b8 104 .b8 114 .b8 101 .b8 97 .b8 100 .b8 73 .b8 100 .b8 0 .b32 1 .b32 248 .b32 6283 .b8 6 .b8 144 .b8 180 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 0 .b32 1 .b32 249 .b32 6312 .b8 5 .b8 144 .b8 179 .b8 228 .b8 149 .b8 1 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 48 .b8 0 .b32 1 .b32 251 .b32 6312 .b8 6 .b8 144 .b8 185 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 0 .b32 1 .b32 252 .b32 6312 .b8 6 .b8 144 .b8 176 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 0 .b32 1 .b32 253 .b32 6312 .b8 6 .b8 144 .b8 177 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 53 .b8 0 .b32 1 .b32 254 .b32 6312 .b8 6 .b8 144 .b8 178 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 56 .b8 0 .b32 1 .b32 255 .b32 6312 .b8 6 .b8 144 .b8 179 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 49 .b8 0 .b32 1 .b32 256 .b32 6312 .b8 6 .b8 144 .b8 180 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 52 .b8 0 .b32 1 .b32 257 .b32 6312 .b8 6 .b8 144 .b8 181 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 55 .b8 0 .b32 1 .b32 258 .b32 6312 .b8 6 .b8 144 .b8 182 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 48 .b8 0 .b32 1 .b32 259 .b32 6312 .b8 6 .b8 144 .b8 183 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 51 .b8 0 .b32 1 .b32 260 .b32 6312 .b8 6 .b8 144 .b8 184 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 54 .b8 0 .b32 1 .b32 261 .b32 6312 .b8 6 .b8 144 .b8 185 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 57 .b8 0 .b32 1 .b32 262 .b32 6312 .b8 6 .b8 144 .b8 176 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 50 .b8 0 .b32 1 .b32 263 .b32 6312 .b8 6 .b8 144 .b8 177 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 53 .b8 0 .b32 1 .b32 264 .b32 6312 .b8 6 .b8 144 .b8 178 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 56 .b8 0 .b32 1 .b32 265 .b32 6312 .b8 6 .b8 144 .b8 179 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 52 .b8 49 .b8 0 .b32 1 .b32 266 .b32 6312 .b8 6 .b8 144 .b8 180 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 52 .b8 52 .b8 0 .b32 1 .b32 267 .b32 6312 .b8 6 .b8 144 .b8 181 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 52 .b8 55 .b8 0 .b32 1 .b32 268 .b32 6312 .b8 6 .b8 144 .b8 182 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 53 .b8 48 .b8 0 .b32 1 .b32 269 .b32 6312 .b8 6 .b8 144 .b8 183 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 48 .b8 0 .b32 1 .b32 270 .b32 376 .b8 5 .b8 144 .b8 178 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 0 .b32 1 .b32 271 .b32 376 .b8 5 .b8 144 .b8 180 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 0 .b32 1 .b32 272 .b32 376 .b8 5 .b8 144 .b8 182 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 0 .b32 1 .b32 273 .b32 376 .b8 5 .b8 144 .b8 183 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 0 .b32 1 .b32 274 .b32 376 .b8 5 .b8 144 .b8 184 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 53 .b8 0 .b32 1 .b32 275 .b32 376 .b8 6 .b8 144 .b8 176 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 54 .b8 0 .b32 1 .b32 276 .b32 376 .b8 6 .b8 144 .b8 177 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 55 .b8 0 .b32 1 .b32 277 .b32 376 .b8 6 .b8 144 .b8 178 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 56 .b8 0 .b32 1 .b32 278 .b32 376 .b8 6 .b8 144 .b8 180 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 57 .b8 0 .b32 1 .b32 279 .b32 376 .b8 6 .b8 144 .b8 181 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 48 .b8 0 .b32 1 .b32 280 .b32 376 .b8 6 .b8 144 .b8 182 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 49 .b8 0 .b32 1 .b32 281 .b32 376 .b8 6 .b8 144 .b8 184 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 50 .b8 0 .b32 1 .b32 282 .b32 376 .b8 6 .b8 144 .b8 185 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 51 .b8 0 .b32 1 .b32 283 .b32 376 .b8 6 .b8 144 .b8 176 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 52 .b8 0 .b32 1 .b32 284 .b32 376 .b8 6 .b8 144 .b8 178 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 53 .b8 0 .b32 1 .b32 285 .b32 376 .b8 6 .b8 144 .b8 179 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 54 .b8 0 .b32 1 .b32 286 .b32 376 .b8 6 .b8 144 .b8 180 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 55 .b8 0 .b32 1 .b32 287 .b32 376 .b8 6 .b8 144 .b8 182 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 56 .b8 0 .b32 1 .b32 288 .b32 376 .b8 6 .b8 144 .b8 183 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 57 .b8 0 .b32 1 .b32 289 .b32 376 .b8 6 .b8 144 .b8 184 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 48 .b8 0 .b32 1 .b32 290 .b32 376 .b8 6 .b8 144 .b8 176 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 49 .b8 0 .b32 1 .b32 291 .b32 376 .b8 6 .b8 144 .b8 177 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 50 .b8 0 .b32 1 .b32 292 .b32 376 .b8 6 .b8 144 .b8 178 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 51 .b8 0 .b32 1 .b32 293 .b32 376 .b8 6 .b8 144 .b8 180 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 52 .b8 0 .b32 1 .b32 294 .b32 376 .b8 6 .b8 144 .b8 181 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 53 .b8 0 .b32 1 .b32 295 .b32 376 .b8 6 .b8 144 .b8 182 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 54 .b8 0 .b32 1 .b32 296 .b32 376 .b8 6 .b8 144 .b8 184 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 55 .b8 0 .b32 1 .b32 297 .b32 376 .b8 6 .b8 144 .b8 185 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 56 .b8 0 .b32 1 .b32 298 .b32 376 .b8 6 .b8 144 .b8 176 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 57 .b8 0 .b32 1 .b32 299 .b32 376 .b8 6 .b8 144 .b8 178 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 48 .b8 0 .b32 1 .b32 300 .b32 376 .b8 6 .b8 144 .b8 179 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 49 .b8 0 .b32 1 .b32 301 .b32 376 .b8 6 .b8 144 .b8 180 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 50 .b8 0 .b32 1 .b32 302 .b32 376 .b8 6 .b8 144 .b8 182 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 51 .b8 0 .b32 1 .b32 303 .b32 376 .b8 6 .b8 144 .b8 183 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 52 .b8 0 .b32 1 .b32 304 .b32 376 .b8 6 .b8 144 .b8 184 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 53 .b8 0 .b32 1 .b32 305 .b32 376 .b8 6 .b8 144 .b8 176 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 54 .b8 0 .b32 1 .b32 306 .b32 376 .b8 6 .b8 144 .b8 177 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 55 .b8 0 .b32 1 .b32 307 .b32 376 .b8 6 .b8 144 .b8 178 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 56 .b8 0 .b32 1 .b32 308 .b32 376 .b8 6 .b8 144 .b8 180 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 57 .b8 0 .b32 1 .b32 309 .b32 376 .b8 6 .b8 144 .b8 181 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 48 .b8 0 .b32 1 .b32 310 .b32 376 .b8 6 .b8 144 .b8 182 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 49 .b8 0 .b32 1 .b32 311 .b32 376 .b8 6 .b8 144 .b8 184 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 50 .b8 0 .b32 1 .b32 312 .b32 376 .b8 6 .b8 144 .b8 185 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 51 .b8 0 .b32 1 .b32 313 .b32 376 .b8 6 .b8 144 .b8 176 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 52 .b8 0 .b32 1 .b32 314 .b32 376 .b8 6 .b8 144 .b8 178 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 53 .b8 0 .b32 1 .b32 315 .b32 376 .b8 6 .b8 144 .b8 179 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 54 .b8 0 .b32 1 .b32 316 .b32 376 .b8 6 .b8 144 .b8 180 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 55 .b8 0 .b32 1 .b32 317 .b32 376 .b8 6 .b8 144 .b8 182 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 56 .b8 0 .b32 1 .b32 318 .b32 376 .b8 6 .b8 144 .b8 183 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 57 .b8 0 .b32 1 .b32 319 .b32 376 .b8 6 .b8 144 .b8 184 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 53 .b8 48 .b8 0 .b32 1 .b32 320 .b32 376 .b8 6 .b8 144 .b8 176 .b8 238 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 53 .b8 49 .b8 0 .b32 1 .b32 321 .b32 376 .b8 6 .b8 144 .b8 177 .b8 238 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 53 .b8 50 .b8 0 .b32 1 .b32 322 .b32 376 .b8 6 .b8 144 .b8 178 .b8 238 .b8 152 .b8 171 .b8 2 .b8 2 .b8 0 .b8 0 .b8 0 .b8 0 .b8 0 .b8 11 .b8 118 .b8 111 .b8 105 .b8 100 .b8 0 .b8 6 .b32 6151 .b8 100 .b8 105 .b8 109 .b8 95 .b8 116 .b8 0 .b8 9 .b8 108 .b8 111 .b8 110 .b8 103 .b8 32 .b8 108 .b8 111 .b8 110 .b8 103 .b8 0 .b8 5 .b32 8 .b8 7 .b8 95 .b8 90 .b8 53 .b8 80 .b8 97 .b8 114 .b8 97 .b8 109 .b8 73 .b8 102 .b8 69 .b8 0 .b32 72 .b32 1 .b32 212 .b8 8 .b8 112 .b8 116 .b8 114 .b8 0 .b32 6255 .b32 1 .b32 214 .b8 0 .b8 1 .b8 8 .b8 100 .b8 105 .b8 109 .b8 115 .b8 0 .b32 6261 .b32 1 .b32 215 .b8 8 .b8 1 .b8 8 .b8 115 .b8 116 .b8 114 .b8 105 .b8 100 .b8 101 .b8 115 .b8 0 .b32 6261 .b32 1 .b32 216 .b8 40 .b8 1 .b8 0 .b8 12 .b32 376 .b8 12 .b8 13 .b32 6140 .b8 14 .b32 6273 .b8 3 .b8 0 .b8 15 .b8 105 .b8 110 .b8 116 .b8 0 .b32 4 .b8 5 .b8 6 .b32 6293 .b8 117 .b8 105 .b8 110 .b8 116 .b8 0 .b8 9 .b8 117 .b8 110 .b8 115 .b8 105 .b8 103 .b8 110 .b8 101 .b8 100 .b8 32 .b8 105 .b8 110 .b8 116 .b8 0 .b8 7 .b32 4 .b8 9 .b8 105 .b8 110 .b8 116 .b8 0 .b8 5 .b32 4 .b8 0 } .section .debug_abbrev { .b8 1 .b8 17 .b8 1 .b8 37 .b8 8 .b8 19 .b8 11 .b8 3 .b8 8 .b8 17 .b8 1 .b8 16 .b8 6 .b8 27 .b8 8 .b8 0 .b8 0 .b8 2 .b8 46 .b8 1 .b8 135 .b8 64 .b8 8 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 63 .b8 12 .b8 17 .b8 1 .b8 18 .b8 1 .b8 64 .b8 10 .b8 0 .b8 0 .b8 3 .b8 5 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 10 .b8 51 .b8 11 .b8 0 .b8 0 .b8 4 .b8 11 .b8 1 .b8 17 .b8 1 .b8 18 .b8 1 .b8 0 .b8 0 .b8 5 .b8 52 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 10 .b8 51 .b8 11 .b8 0 .b8 0 .b8 6 .b8 22 .b8 0 .b8 73 .b8 19 .b8 3 .b8 8 .b8 0 .b8 0 .b8 7 .b8 19 .b8 1 .b8 3 .b8 8 .b8 11 .b8 6 .b8 58 .b8 6 .b8 59 .b8 6 .b8 0 .b8 0 .b8 8 .b8 13 .b8 0 .b8 3 .b8 8 .b8 73 .b8 19 .b8 58 .b8 6 .b8 59 .b8 6 .b8 56 .b8 15 .b8 50 .b8 11 .b8 0 .b8 0 .b8 9 .b8 36 .b8 0 .b8 3 .b8 8 .b8 62 .b8 11 .b8 11 .b8 6 .b8 0 .b8 0 .b8 10 .b8 52 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 6 .b8 0 .b8 0 .b8 11 .b8 59 .b8 0 .b8 3 .b8 8 .b8 0 .b8 0 .b8 12 .b8 15 .b8 0 .b8 73 .b8 19 .b8 51 .b8 11 .b8 0 .b8 0 .b8 13 .b8 1 .b8 1 .b8 73 .b8 19 .b8 0 .b8 0 .b8 14 .b8 33 .b8 0 .b8 73 .b8 19 .b8 47 .b8 15 .b8 0 .b8 0 .b8 15 .b8 36 .b8 0 .b8 3 .b8 8 .b8 11 .b8 6 .b8 62 .b8 11 .b8 0 .b8 0 .b8 0 } .section .debug_loc { .b64 tmp42 .b64 tmp43 .b8 5 .b8 0 .b8 144 .b8 177 .b8 228 .b8 149 .b8 1 .b64 tmp43 .b64 tmp44 .b8 6 .b8 0 .b8 144 .b8 185 .b8 230 .b8 200 .b8 171 .b8 2 .b64 tmp44 .b64 tmp123 .b8 5 .b8 0 .b8 144 .b8 178 .b8 228 .b8 149 .b8 1 .b64 tmp123 .b64 tmp124 .b8 5 .b8 0 .b8 144 .b8 180 .b8 228 .b8 149 .b8 1 .b64 tmp124 .b64 func_end16 .b8 6 .b8 0 .b8 144 .b8 185 .b8 230 .b8 200 .b8 171 .b8 2 .b64 0 .b64 0 } .section .debug_ranges { } .section .debug_pubnames { .b32 408 .b8 2 .b8 0 .b32 .debug_info .b32 6319 .b32 388 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 1640 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b32 2600 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 124 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b32 1079 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1374 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1507 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2057 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 536 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 717 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 3032 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2238 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2419 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 898 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 3165 .b8 75 .b8 69 .b8 82 .b8 49 .b8 50 .b8 52 .b8 52 .b8 52 .b8 50 .b8 53 .b8 49 .b8 49 .b8 52 .b8 48 .b8 57 .b8 53 .b8 54 .b8 56 .b8 53 .b8 54 .b8 0 .b32 2899 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1909 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 0 } ] JIT_KERNEL:------------------------- typedef unsigned int uint; typedef long long dim_t; /******************************************************* * Copyright (c) 2014, ArrayFire * All rights reserved. * * This file is distributed under 3-clause BSD license. * The complete license agreement can be obtained at: * http://arrayfire.com/licenses/BSD-3-Clause ********************************************************/ typedef float2 cuFloatComplex; typedef cuFloatComplex cfloat; typedef double2 cuDoubleComplex; typedef cuDoubleComplex cdouble; // ---------------------------------------------- // REAL NUMBER OPERATIONS // ---------------------------------------------- #define sign(in) signbit((in)) #define __noop(a) (a) #define __add(lhs, rhs) (lhs) + (rhs) #define __sub(lhs, rhs) (lhs) - (rhs) #define __mul(lhs, rhs) (lhs) * (rhs) #define __div(lhs, rhs) (lhs) / (rhs) #define __and(lhs, rhs) (lhs) && (rhs) #define __or(lhs, rhs) (lhs) || (rhs) #define __lt(lhs, rhs) (lhs) < (rhs) #define __gt(lhs, rhs) (lhs) > (rhs) #define __le(lhs, rhs) (lhs) <= (rhs) #define __ge(lhs, rhs) (lhs) >= (rhs) #define __eq(lhs, rhs) (lhs) == (rhs) #define __neq(lhs, rhs) (lhs) != (rhs) #define __conj(in) (in) #define __real(in) (in) #define __imag(in) (0) #define __abs(in) abs(in) #define __sigmoid(in) (1.0/(1 + exp(-(in)))) #define __bitor(lhs, rhs) ((lhs) | (rhs)) #define __bitand(lhs, rhs) ((lhs) & (rhs)) #define __bitxor(lhs, rhs) ((lhs) ^ (rhs)) #define __bitshiftl(lhs, rhs) ((lhs) << (rhs)) #define __bitshiftr(lhs, rhs) ((lhs) >> (rhs)) #define __min(lhs, rhs) ((lhs) < (rhs)) ? (lhs) : (rhs) #define __max(lhs, rhs) ((lhs) > (rhs)) ? (lhs) : (rhs) #define __rem(lhs, rhs) ((lhs) % (rhs)) #define __mod(lhs, rhs) ((lhs) % (rhs)) #define __pow(lhs, rhs) fpow((float)lhs, (float)rhs) #define __convert_char(val) (char)((val) != 0) #define fpow(lhs, rhs) pow((lhs), (rhs)) #define frem(lhs, rhs) remainder((lhs), (rhs)) #define iszero(a) ((a) == 0) // ---------------------------------------------- // COMPLEX FLOAT OPERATIONS // ---------------------------------------------- #define __crealf(in) ((in).x) #define __cimagf(in) ((in).y) #define __cabsf(in) hypotf(in.x, in.y) __device__ cfloat __cplx2f(float x, float y) { cfloat res = {x, y}; return res; } __device__ cfloat __cconjf(cfloat in) { cfloat res = {in.x, -in.y}; return res; } __device__ cfloat __caddf(cfloat lhs, cfloat rhs) { cfloat res = {lhs.x + rhs.x, lhs.y + rhs.y}; return res; } __device__ cfloat __csubf(cfloat lhs, cfloat rhs) { cfloat res = {lhs.x - rhs.x, lhs.y - rhs.y}; return res; } __device__ cfloat __cmulf(cfloat lhs, cfloat rhs) { cfloat out; out.x = lhs.x * rhs.x - lhs.y * rhs.y; out.y = lhs.x * rhs.y + lhs.y * rhs.x; return out; } __device__ cfloat __cdivf(cfloat lhs, cfloat rhs) { // Normalize by absolute value and multiply float rhs_abs = __cabsf(rhs); float inv_rhs_abs = 1.0f / rhs_abs; float rhs_x = inv_rhs_abs * rhs.x; float rhs_y = inv_rhs_abs * rhs.y; cfloat out = {lhs.x * rhs_x + lhs.y * rhs_y, lhs.y * rhs_x - lhs.x * rhs_y}; out.x *= inv_rhs_abs; out.y *= inv_rhs_abs; return out; } __device__ cfloat __cminf(cfloat lhs, cfloat rhs) { return __cabsf(lhs) < __cabsf(rhs) ? lhs : rhs; } __device__ cfloat __cmaxf(cfloat lhs, cfloat rhs) { return __cabsf(lhs) > __cabsf(rhs) ? lhs : rhs; } #define __candf(lhs, rhs) __cabsf(lhs) && __cabsf(rhs) #define __corf(lhs, rhs) __cabsf(lhs) || __cabsf(rhs) #define __ceqf(lhs, rhs) (((lhs).x == (rhs).x) && ((lhs).y == (rhs).y)) #define __cneqf(lhs, rhs) !__ceqf((lhs), (rhs)) #define __cltf(lhs, rhs) (__cabsf(lhs) < __cabsf(rhs)) #define __clef(lhs, rhs) (__cabsf(lhs) <= __cabsf(rhs)) #define __cgtf(lhs, rhs) (__cabsf(lhs) > __cabsf(rhs)) #define __cgef(lhs, rhs) (__cabsf(lhs) >= __cabsf(rhs)) #define __convert_cfloat(real) __cplx2f(real, 0) #define __convert_c2c(in) (in) #define __convert_z2c(in) __cplx2f((float)in.x, (float)in.y) // ---------------------------------------------- // COMPLEX DOUBLE OPERATIONS // ---------------------------------------------- #define __creal(in) ((in).x) #define __cimag(in) ((in).y) #define __cabs(in) hypot(in.x, in.y) __device__ cdouble __cplx2(double x, double y) { cdouble res = {x, y}; return res; } __device__ cdouble __cconj(cdouble in) { cdouble res = {in.x, -in.y}; return res; } __device__ cdouble __cadd(cdouble lhs, cdouble rhs) { cdouble res = {lhs.x + rhs.x, lhs.y + rhs.y}; return res; } __device__ cdouble __csub(cdouble lhs, cdouble rhs) { cdouble res = {lhs.x - rhs.x, lhs.y - rhs.y}; return res; } __device__ cdouble __cmul(cdouble lhs, cdouble rhs) { cdouble out; out.x = lhs.x * rhs.x - lhs.y * rhs.y; out.y = lhs.x * rhs.y + lhs.y * rhs.x; return out; } __device__ cdouble __cdiv(cdouble lhs, cdouble rhs) { // Normalize by absolute value and multiply double rhs_abs = __cabs(rhs); double inv_rhs_abs = 1.0 / rhs_abs; double rhs_x = inv_rhs_abs * rhs.x; double rhs_y = inv_rhs_abs * rhs.y; cdouble out = {lhs.x * rhs_x + lhs.y * rhs_y, lhs.y * rhs_x - lhs.x * rhs_y}; out.x *= inv_rhs_abs; out.y *= inv_rhs_abs; return out; } __device__ cdouble __cmin(cdouble lhs, cdouble rhs) { return __cabs(lhs) < __cabs(rhs) ? lhs : rhs; } __device__ cdouble __cmax(cdouble lhs, cdouble rhs) { return __cabs(lhs) > __cabs(rhs) ? lhs : rhs; } #define __cand(lhs, rhs) __cabs(lhs) && __cabs(rhs) #define __cor(lhs, rhs) __cabs(lhs) || __cabs(rhs) #define __ceq(lhs, rhs) (((lhs).x == (rhs).x) && ((lhs).y == (rhs).y)) #define __cneq(lhs, rhs) !__ceq((lhs), (rhs)) #define __clt(lhs, rhs) (__cabs(lhs) < __cabs(rhs)) #define __cle(lhs, rhs) (__cabs(lhs) <= __cabs(rhs)) #define __cgt(lhs, rhs) (__cabs(lhs) > __cabs(rhs)) #define __cge(lhs, rhs) (__cabs(lhs) >= __cabs(rhs)) #define __convert_cdouble(real) __cplx2(real, 0) #define __convert_z2z(in) (in) #define __convert_c2z(in) __cplx2((double)in.x, (double)in.y) template struct Param { T *ptr; dim_t dims[4]; dim_t strides[4]; }; extern "C" __global__ void KER5193270764107642551( float *in0_ptr, float *in1_ptr, float *in3_ptr, float *in5_ptr, float *in7_ptr, float *in9_ptr, float *in11_ptr, float *in13_ptr, float *in15_ptr, float *in17_ptr, float *in19_ptr, float *in21_ptr, float *in23_ptr, float *in25_ptr, float *in27_ptr, float *in29_ptr, float *in31_ptr, float *in33_ptr, float *in35_ptr, Param out36, uint blocks_x, uint blocks_y, uint blocks_x_total, uint num_odims) { Param outref = out36; for (int blockIdx_x = blockIdx.x; blockIdx_x < blocks_x_total; blockIdx_x += gridDim.x) { uint threadId = threadIdx.x; int idx = blockIdx_x * blockDim.x * blockDim.y + threadId; if (idx >= outref.dims[3] * outref.strides[3]) return; int idx0 = idx; int idx1 = idx; int idx3 = idx; int idx5 = idx; int idx7 = idx; int idx9 = idx; int idx11 = idx; int idx13 = idx; int idx15 = idx; int idx17 = idx; int idx19 = idx; int idx21 = idx; int idx23 = idx; int idx25 = idx; int idx27 = idx; int idx29 = idx; int idx31 = idx; int idx33 = idx; int idx35 = idx; float val0 = in0_ptr[idx0]; float val1 = in1_ptr[idx1]; float val2 = __add(val0, val1); float val3 = in3_ptr[idx3]; float val4 = __add(val2, val3); float val5 = in5_ptr[idx5]; float val6 = __add(val4, val5); float val7 = in7_ptr[idx7]; float val8 = __add(val6, val7); float val9 = in9_ptr[idx9]; float val10 = __add(val8, val9); float val11 = in11_ptr[idx11]; float val12 = __add(val10, val11); float val13 = in13_ptr[idx13]; float val14 = __add(val12, val13); float val15 = in15_ptr[idx15]; float val16 = __add(val14, val15); float val17 = in17_ptr[idx17]; float val18 = __add(val16, val17); float val19 = in19_ptr[idx19]; float val20 = __add(val18, val19); float val21 = in21_ptr[idx21]; float val22 = __add(val20, val21); float val23 = in23_ptr[idx23]; float val24 = __add(val22, val23); float val25 = in25_ptr[idx25]; float val26 = __add(val24, val25); float val27 = in27_ptr[idx27]; float val28 = __add(val26, val27); float val29 = in29_ptr[idx29]; float val30 = __add(val28, val29); float val31 = in31_ptr[idx31]; float val32 = __add(val30, val31); float val33 = in33_ptr[idx33]; float val34 = __add(val32, val33); float val35 = in35_ptr[idx35]; float val36 = __add(val34, val35); out36.ptr[idx] = val36; } } ----------------------------- num_options=3 compiler_options: [--gpu-architecture=compute_62] compiler_options: [--device-debug] compiler_options: [--generate-line-info] compiledPTX size 73014 PTX [// // Generated by NVIDIA NVVM Compiler // // Compiler Build ID: CL-23162084 // Cuda compilation tools, release 9.0, V9.0.252 // Based on LLVM 3.4svn // .version 6.0 .target sm_62, debug .address_size 64 // .globl _Z8__cplx2fff .func (.param .b32 func_retval0) hypotf ( .param .b32 hypotf_param_0, .param .b32 hypotf_param_1 ) ; .func (.param .b64 func_retval0) hypot ( .param .b64 hypot_param_0, .param .b64 hypot_param_1 ) ; .visible .func (.param .align 8 .b8 func_retval0[8]) _Z8__cplx2fff( .param .b32 _Z8__cplx2fff_param_0, .param .b32 _Z8__cplx2fff_param_1 ) { .local .align 8 .b8 __local_depot0[8]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<5>; .reg .b64 %rd<2>; .loc 1 68 1 func_begin0: .loc 1 0 0 .loc 1 68 1 mov.u64 %rd1, __local_depot0; cvta.local.u64 %SP, %rd1; ld.param.f32 %f1, [_Z8__cplx2fff_param_0]; ld.param.f32 %f2, [_Z8__cplx2fff_param_1]; tmp0: func_exec_begin0: .loc 1 70 12 st.f32 [%SP+0], %f1; st.f32 [%SP+4], %f2; .loc 1 71 5 ld.f32 %f3, [%SP+4]; ld.f32 %f4, [%SP+0]; st.param.f32 [func_retval0+0], %f4; st.param.f32 [func_retval0+4], %f3; ret; tmp1: func_end0: } // .globl _Z8__cconjf6float2 .visible .func (.param .align 8 .b8 func_retval0[8]) _Z8__cconjf6float2( .param .align 8 .b8 _Z8__cconjf6float2_param_0[8] ) { .local .align 8 .b8 __local_depot1[16]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<8>; .reg .b64 %rd<2>; .loc 1 74 1 func_begin1: .loc 1 0 0 .loc 1 74 1 mov.u64 %rd1, __local_depot1; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z8__cconjf6float2_param_0+4]; ld.param.f32 %f1, [_Z8__cconjf6float2_param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; tmp2: func_exec_begin1: .loc 1 76 12 ld.f32 %f3, [%SP+0]; st.f32 [%SP+8], %f3; ld.f32 %f4, [%SP+4]; neg.f32 %f5, %f4; st.f32 [%SP+12], %f5; .loc 1 77 5 ld.f32 %f6, [%SP+12]; ld.f32 %f7, [%SP+8]; st.param.f32 [func_retval0+0], %f7; st.param.f32 [func_retval0+4], %f6; ret; tmp3: func_end1: } // .globl _Z7__caddf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__caddf6float2S_( .param .align 8 .b8 _Z7__caddf6float2S__param_0[8], .param .align 8 .b8 _Z7__caddf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot2[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<13>; .reg .b64 %rd<2>; .loc 1 80 1 func_begin2: .loc 1 0 0 .loc 1 80 1 mov.u64 %rd1, __local_depot2; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__caddf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__caddf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__caddf6float2S__param_1]; ld.param.f32 %f1, [_Z7__caddf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp4: func_exec_begin2: .loc 1 82 12 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; add.f32 %f7, %f5, %f6; st.f32 [%SP+16], %f7; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; add.f32 %f10, %f8, %f9; st.f32 [%SP+20], %f10; .loc 1 83 5 ld.f32 %f11, [%SP+20]; ld.f32 %f12, [%SP+16]; st.param.f32 [func_retval0+0], %f12; st.param.f32 [func_retval0+4], %f11; ret; tmp5: func_end2: } // .globl _Z7__csubf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__csubf6float2S_( .param .align 8 .b8 _Z7__csubf6float2S__param_0[8], .param .align 8 .b8 _Z7__csubf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot3[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<13>; .reg .b64 %rd<2>; .loc 1 86 1 func_begin3: .loc 1 0 0 .loc 1 86 1 mov.u64 %rd1, __local_depot3; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__csubf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__csubf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__csubf6float2S__param_1]; ld.param.f32 %f1, [_Z7__csubf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp6: func_exec_begin3: .loc 1 88 12 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; sub.f32 %f7, %f5, %f6; st.f32 [%SP+16], %f7; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; sub.f32 %f10, %f8, %f9; st.f32 [%SP+20], %f10; .loc 1 89 5 ld.f32 %f11, [%SP+20]; ld.f32 %f12, [%SP+16]; st.param.f32 [func_retval0+0], %f12; st.param.f32 [func_retval0+4], %f11; ret; tmp7: func_end3: } // .globl _Z7__cmulf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cmulf6float2S_( .param .align 8 .b8 _Z7__cmulf6float2S__param_0[8], .param .align 8 .b8 _Z7__cmulf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot4[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<21>; .reg .b64 %rd<2>; .loc 1 92 1 func_begin4: .loc 1 0 0 .loc 1 92 1 mov.u64 %rd1, __local_depot4; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cmulf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cmulf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cmulf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cmulf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp8: func_exec_begin4: .loc 1 95 5 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; mul.f32 %f7, %f5, %f6; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; mul.f32 %f10, %f8, %f9; sub.f32 %f11, %f7, %f10; st.f32 [%SP+16], %f11; .loc 1 96 5 ld.f32 %f12, [%SP+0]; ld.f32 %f13, [%SP+12]; mul.f32 %f14, %f12, %f13; ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+8]; mul.f32 %f17, %f15, %f16; add.f32 %f18, %f14, %f17; st.f32 [%SP+20], %f18; .loc 1 97 5 ld.f32 %f19, [%SP+20]; ld.f32 %f20, [%SP+16]; st.param.f32 [func_retval0+0], %f20; st.param.f32 [func_retval0+4], %f19; ret; tmp9: func_end4: } // .globl _Z7__cdivf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cdivf6float2S_( .param .align 8 .b8 _Z7__cdivf6float2S__param_0[8], .param .align 8 .b8 _Z7__cdivf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot5[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<29>; .reg .b64 %rd<2>; .loc 1 100 1 func_begin5: .loc 1 0 0 .loc 1 100 1 mov.u64 %rd1, __local_depot5; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cdivf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cdivf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cdivf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cdivf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp10: func_exec_begin5: .loc 1 103 19 ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 103 21 // Callseq Start 10 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 10 tmp11: .loc 1 104 23 rcp.rn.f32 %f8, %f7; tmp12: .loc 1 105 17 ld.f32 %f9, [%SP+8]; mul.f32 %f10, %f8, %f9; tmp13: .loc 1 106 17 ld.f32 %f11, [%SP+12]; mul.f32 %f12, %f8, %f11; tmp14: .loc 1 107 12 ld.f32 %f13, [%SP+0]; mul.f32 %f14, %f13, %f10; ld.f32 %f15, [%SP+4]; mul.f32 %f16, %f15, %f12; add.f32 %f17, %f14, %f16; st.f32 [%SP+16], %f17; ld.f32 %f18, [%SP+4]; mul.f32 %f19, %f18, %f10; ld.f32 %f20, [%SP+0]; mul.f32 %f21, %f20, %f12; sub.f32 %f22, %f19, %f21; st.f32 [%SP+20], %f22; .loc 1 109 5 ld.f32 %f23, [%SP+16]; mul.f32 %f24, %f23, %f8; st.f32 [%SP+16], %f24; .loc 1 110 5 ld.f32 %f25, [%SP+20]; mul.f32 %f26, %f25, %f8; st.f32 [%SP+20], %f26; .loc 1 111 5 ld.f32 %f27, [%SP+20]; ld.f32 %f28, [%SP+16]; st.param.f32 [func_retval0+0], %f28; st.param.f32 [func_retval0+4], %f27; ret; tmp15: func_end5: } // .globl _Z7__cminf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cminf6float2S_( .param .align 8 .b8 _Z7__cminf6float2S__param_0[8], .param .align 8 .b8 _Z7__cminf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot6[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f32 %f<17>; .reg .b64 %rd<2>; .loc 1 114 1 func_begin6: .loc 1 0 0 .loc 1 114 1 mov.u64 %rd1, __local_depot6; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cminf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cminf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cminf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cminf6float2S__param_0]; st.f32 [%SP+12], %f2; st.f32 [%SP+8], %f1; st.f32 [%SP+20], %f4; st.f32 [%SP+16], %f3; func_exec_begin6: .loc 1 116 5 tmp16: ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 116 12 // Callseq Start 11 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 11 ld.f32 %f8, [%SP+16]; ld.f32 %f9, [%SP+20]; .loc 1 116 27 // Callseq Start 12 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f8; .param .b32 param1; st.param.f32 [param1+0], %f9; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f10, [retval0+0]; //{ }// Callseq End 12 setp.lt.f32 %p1, %f7, %f10; not.pred %p2, %p1; @%p2 bra BB6_2; bra.uni BB6_1; BB6_1: ld.f32 %f13, [%SP+8]; ld.f32 %f14, [%SP+12]; st.f32 [%SP+4], %f14; st.f32 [%SP+0], %f13; bra.uni BB6_3; BB6_2: ld.f32 %f11, [%SP+16]; ld.f32 %f12, [%SP+20]; st.f32 [%SP+4], %f12; st.f32 [%SP+0], %f11; BB6_3: ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+0]; st.param.f32 [func_retval0+0], %f16; st.param.f32 [func_retval0+4], %f15; ret; tmp17: func_end6: } // .globl _Z7__cmaxf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cmaxf6float2S_( .param .align 8 .b8 _Z7__cmaxf6float2S__param_0[8], .param .align 8 .b8 _Z7__cmaxf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot7[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f32 %f<17>; .reg .b64 %rd<2>; .loc 1 119 1 func_begin7: .loc 1 0 0 .loc 1 119 1 mov.u64 %rd1, __local_depot7; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cmaxf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cmaxf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cmaxf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cmaxf6float2S__param_0]; st.f32 [%SP+12], %f2; st.f32 [%SP+8], %f1; st.f32 [%SP+20], %f4; st.f32 [%SP+16], %f3; func_exec_begin7: .loc 1 121 5 tmp18: ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 121 12 // Callseq Start 13 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 13 ld.f32 %f8, [%SP+16]; ld.f32 %f9, [%SP+20]; .loc 1 121 27 // Callseq Start 14 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f8; .param .b32 param1; st.param.f32 [param1+0], %f9; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f10, [retval0+0]; //{ }// Callseq End 14 setp.gt.f32 %p1, %f7, %f10; not.pred %p2, %p1; @%p2 bra BB7_2; bra.uni BB7_1; BB7_1: ld.f32 %f13, [%SP+8]; ld.f32 %f14, [%SP+12]; st.f32 [%SP+4], %f14; st.f32 [%SP+0], %f13; bra.uni BB7_3; BB7_2: ld.f32 %f11, [%SP+16]; ld.f32 %f12, [%SP+20]; st.f32 [%SP+4], %f12; st.f32 [%SP+0], %f11; BB7_3: ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+0]; st.param.f32 [func_retval0+0], %f16; st.param.f32 [func_retval0+4], %f15; ret; tmp19: func_end7: } // .globl _Z7__cplx2dd .visible .func (.param .align 16 .b8 func_retval0[16]) _Z7__cplx2dd( .param .b64 _Z7__cplx2dd_param_0, .param .b64 _Z7__cplx2dd_param_1 ) { .local .align 16 .b8 __local_depot8[16]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<5>; .reg .b64 %rd<2>; .loc 1 142 1 func_begin8: .loc 1 0 0 .loc 1 142 1 mov.u64 %rd1, __local_depot8; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd1, [_Z7__cplx2dd_param_0]; ld.param.f64 %fd2, [_Z7__cplx2dd_param_1]; tmp20: func_exec_begin8: .loc 1 144 13 st.f64 [%SP+0], %fd1; st.f64 [%SP+8], %fd2; .loc 1 145 5 ld.f64 %fd3, [%SP+8]; ld.f64 %fd4, [%SP+0]; st.param.f64 [func_retval0+0], %fd4; st.param.f64 [func_retval0+8], %fd3; ret; tmp21: func_end8: } // .globl _Z7__cconj7double2 .visible .func (.param .align 16 .b8 func_retval0[16]) _Z7__cconj7double2( .param .align 16 .b8 _Z7__cconj7double2_param_0[16] ) { .local .align 16 .b8 __local_depot9[32]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<8>; .reg .b64 %rd<2>; .loc 1 148 1 func_begin9: .loc 1 0 0 .loc 1 148 1 mov.u64 %rd1, __local_depot9; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z7__cconj7double2_param_0+8]; ld.param.f64 %fd1, [_Z7__cconj7double2_param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; tmp22: func_exec_begin9: .loc 1 150 13 ld.f64 %fd3, [%SP+0]; st.f64 [%SP+16], %fd3; ld.f64 %fd4, [%SP+8]; neg.f64 %fd5, %fd4; st.f64 [%SP+24], %fd5; .loc 1 151 5 ld.f64 %fd6, [%SP+24]; ld.f64 %fd7, [%SP+16]; st.param.f64 [func_retval0+0], %fd7; st.param.f64 [func_retval0+8], %fd6; ret; tmp23: func_end9: } // .globl _Z6__cadd7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cadd7double2S_( .param .align 16 .b8 _Z6__cadd7double2S__param_0[16], .param .align 16 .b8 _Z6__cadd7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot10[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<13>; .reg .b64 %rd<2>; .loc 1 154 1 func_begin10: .loc 1 0 0 .loc 1 154 1 mov.u64 %rd1, __local_depot10; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cadd7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cadd7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cadd7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cadd7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp24: func_exec_begin10: .loc 1 156 13 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; add.f64 %fd7, %fd5, %fd6; st.f64 [%SP+32], %fd7; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; add.f64 %fd10, %fd8, %fd9; st.f64 [%SP+40], %fd10; .loc 1 157 5 ld.f64 %fd11, [%SP+40]; ld.f64 %fd12, [%SP+32]; st.param.f64 [func_retval0+0], %fd12; st.param.f64 [func_retval0+8], %fd11; ret; tmp25: func_end10: } // .globl _Z6__csub7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__csub7double2S_( .param .align 16 .b8 _Z6__csub7double2S__param_0[16], .param .align 16 .b8 _Z6__csub7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot11[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<13>; .reg .b64 %rd<2>; .loc 1 160 1 func_begin11: .loc 1 0 0 .loc 1 160 1 mov.u64 %rd1, __local_depot11; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__csub7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__csub7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__csub7double2S__param_1]; ld.param.f64 %fd1, [_Z6__csub7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp26: func_exec_begin11: .loc 1 162 13 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; sub.f64 %fd7, %fd5, %fd6; st.f64 [%SP+32], %fd7; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; sub.f64 %fd10, %fd8, %fd9; st.f64 [%SP+40], %fd10; .loc 1 163 5 ld.f64 %fd11, [%SP+40]; ld.f64 %fd12, [%SP+32]; st.param.f64 [func_retval0+0], %fd12; st.param.f64 [func_retval0+8], %fd11; ret; tmp27: func_end11: } // .globl _Z6__cmul7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmul7double2S_( .param .align 16 .b8 _Z6__cmul7double2S__param_0[16], .param .align 16 .b8 _Z6__cmul7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot12[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<21>; .reg .b64 %rd<2>; .loc 1 166 1 func_begin12: .loc 1 0 0 .loc 1 166 1 mov.u64 %rd1, __local_depot12; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmul7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmul7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmul7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmul7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp28: func_exec_begin12: .loc 1 169 5 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; mul.f64 %fd7, %fd5, %fd6; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; mul.f64 %fd10, %fd8, %fd9; sub.f64 %fd11, %fd7, %fd10; st.f64 [%SP+32], %fd11; .loc 1 170 5 ld.f64 %fd12, [%SP+0]; ld.f64 %fd13, [%SP+24]; mul.f64 %fd14, %fd12, %fd13; ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+16]; mul.f64 %fd17, %fd15, %fd16; add.f64 %fd18, %fd14, %fd17; st.f64 [%SP+40], %fd18; .loc 1 171 5 ld.f64 %fd19, [%SP+40]; ld.f64 %fd20, [%SP+32]; st.param.f64 [func_retval0+0], %fd20; st.param.f64 [func_retval0+8], %fd19; ret; tmp29: func_end12: } // .globl _Z6__cdiv7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cdiv7double2S_( .param .align 16 .b8 _Z6__cdiv7double2S__param_0[16], .param .align 16 .b8 _Z6__cdiv7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot13[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<29>; .reg .b64 %rd<2>; .loc 1 174 1 func_begin13: .loc 1 0 0 .loc 1 174 1 mov.u64 %rd1, __local_depot13; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cdiv7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cdiv7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cdiv7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cdiv7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp30: func_exec_begin13: .loc 1 177 20 ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 177 22 // Callseq Start 15 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 15 tmp31: .loc 1 178 24 rcp.rn.f64 %fd8, %fd7; tmp32: .loc 1 179 18 ld.f64 %fd9, [%SP+16]; mul.f64 %fd10, %fd8, %fd9; tmp33: .loc 1 180 18 ld.f64 %fd11, [%SP+24]; mul.f64 %fd12, %fd8, %fd11; tmp34: .loc 1 181 13 ld.f64 %fd13, [%SP+0]; mul.f64 %fd14, %fd13, %fd10; ld.f64 %fd15, [%SP+8]; mul.f64 %fd16, %fd15, %fd12; add.f64 %fd17, %fd14, %fd16; st.f64 [%SP+32], %fd17; ld.f64 %fd18, [%SP+8]; mul.f64 %fd19, %fd18, %fd10; ld.f64 %fd20, [%SP+0]; mul.f64 %fd21, %fd20, %fd12; sub.f64 %fd22, %fd19, %fd21; st.f64 [%SP+40], %fd22; .loc 1 183 5 ld.f64 %fd23, [%SP+32]; mul.f64 %fd24, %fd23, %fd8; st.f64 [%SP+32], %fd24; .loc 1 184 5 ld.f64 %fd25, [%SP+40]; mul.f64 %fd26, %fd25, %fd8; st.f64 [%SP+40], %fd26; .loc 1 185 5 ld.f64 %fd27, [%SP+40]; ld.f64 %fd28, [%SP+32]; st.param.f64 [func_retval0+0], %fd28; st.param.f64 [func_retval0+8], %fd27; ret; tmp35: func_end13: } // .globl _Z6__cmin7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmin7double2S_( .param .align 16 .b8 _Z6__cmin7double2S__param_0[16], .param .align 16 .b8 _Z6__cmin7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot14[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f64 %fd<17>; .reg .b64 %rd<2>; .loc 1 188 1 func_begin14: .loc 1 0 0 .loc 1 188 1 mov.u64 %rd1, __local_depot14; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmin7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmin7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmin7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmin7double2S__param_0]; st.f64 [%SP+24], %fd2; st.f64 [%SP+16], %fd1; st.f64 [%SP+40], %fd4; st.f64 [%SP+32], %fd3; func_exec_begin14: .loc 1 190 5 tmp36: ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 190 12 // Callseq Start 16 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 16 ld.f64 %fd8, [%SP+32]; ld.f64 %fd9, [%SP+40]; .loc 1 190 26 // Callseq Start 17 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd8; .param .b64 param1; st.param.f64 [param1+0], %fd9; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd10, [retval0+0]; //{ }// Callseq End 17 setp.lt.f64 %p1, %fd7, %fd10; not.pred %p2, %p1; @%p2 bra BB14_2; bra.uni BB14_1; BB14_1: ld.f64 %fd13, [%SP+16]; ld.f64 %fd14, [%SP+24]; st.f64 [%SP+8], %fd14; st.f64 [%SP+0], %fd13; bra.uni BB14_3; BB14_2: ld.f64 %fd11, [%SP+32]; ld.f64 %fd12, [%SP+40]; st.f64 [%SP+8], %fd12; st.f64 [%SP+0], %fd11; BB14_3: ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+0]; st.param.f64 [func_retval0+0], %fd16; st.param.f64 [func_retval0+8], %fd15; ret; tmp37: func_end14: } // .globl _Z6__cmax7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmax7double2S_( .param .align 16 .b8 _Z6__cmax7double2S__param_0[16], .param .align 16 .b8 _Z6__cmax7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot15[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f64 %fd<17>; .reg .b64 %rd<2>; .loc 1 193 1 func_begin15: .loc 1 0 0 .loc 1 193 1 mov.u64 %rd1, __local_depot15; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmax7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmax7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmax7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmax7double2S__param_0]; st.f64 [%SP+24], %fd2; st.f64 [%SP+16], %fd1; st.f64 [%SP+40], %fd4; st.f64 [%SP+32], %fd3; func_exec_begin15: .loc 1 195 5 tmp38: ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 195 12 // Callseq Start 18 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 18 ld.f64 %fd8, [%SP+32]; ld.f64 %fd9, [%SP+40]; .loc 1 195 26 // Callseq Start 19 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd8; .param .b64 param1; st.param.f64 [param1+0], %fd9; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd10, [retval0+0]; //{ }// Callseq End 19 setp.gt.f64 %p1, %fd7, %fd10; not.pred %p2, %p1; @%p2 bra BB15_2; bra.uni BB15_1; BB15_1: ld.f64 %fd13, [%SP+16]; ld.f64 %fd14, [%SP+24]; st.f64 [%SP+8], %fd14; st.f64 [%SP+0], %fd13; bra.uni BB15_3; BB15_2: ld.f64 %fd11, [%SP+32]; ld.f64 %fd12, [%SP+40]; st.f64 [%SP+8], %fd12; st.f64 [%SP+0], %fd11; BB15_3: ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+0]; st.param.f64 [func_retval0+0], %fd16; st.param.f64 [func_retval0+8], %fd15; ret; tmp39: func_end15: } // .globl KER5193270764107642551 .visible .entry KER5193270764107642551( .param .u64 KER5193270764107642551_param_0, .param .u64 KER5193270764107642551_param_1, .param .u64 KER5193270764107642551_param_2, .param .u64 KER5193270764107642551_param_3, .param .u64 KER5193270764107642551_param_4, .param .u64 KER5193270764107642551_param_5, .param .u64 KER5193270764107642551_param_6, .param .u64 KER5193270764107642551_param_7, .param .u64 KER5193270764107642551_param_8, .param .u64 KER5193270764107642551_param_9, .param .u64 KER5193270764107642551_param_10, .param .u64 KER5193270764107642551_param_11, .param .u64 KER5193270764107642551_param_12, .param .u64 KER5193270764107642551_param_13, .param .u64 KER5193270764107642551_param_14, .param .u64 KER5193270764107642551_param_15, .param .u64 KER5193270764107642551_param_16, .param .u64 KER5193270764107642551_param_17, .param .u64 KER5193270764107642551_param_18, .param .align 8 .b8 KER5193270764107642551_param_19[72], .param .u32 KER5193270764107642551_param_20, .param .u32 KER5193270764107642551_param_21, .param .u32 KER5193270764107642551_param_22, .param .u32 KER5193270764107642551_param_23 ) { .local .align 8 .b8 __local_depot16[144]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<5>; .reg .f32 %f<57>; .reg .b32 %r<40>; .reg .b64 %rd<107>; .loc 1 220 1 func_begin16: .loc 1 0 0 .loc 1 220 1 mov.u64 %rd106, __local_depot16; cvta.local.u64 %SP, %rd106; ld.param.u64 %rd1, [KER5193270764107642551_param_0]; ld.param.u64 %rd2, [KER5193270764107642551_param_1]; ld.param.u64 %rd3, [KER5193270764107642551_param_2]; ld.param.u64 %rd4, [KER5193270764107642551_param_3]; ld.param.u64 %rd5, [KER5193270764107642551_param_4]; ld.param.u64 %rd6, [KER5193270764107642551_param_5]; ld.param.u64 %rd7, [KER5193270764107642551_param_6]; ld.param.u64 %rd8, [KER5193270764107642551_param_7]; ld.param.u64 %rd9, [KER5193270764107642551_param_8]; ld.param.u64 %rd10, [KER5193270764107642551_param_9]; ld.param.u64 %rd11, [KER5193270764107642551_param_10]; ld.param.u64 %rd12, [KER5193270764107642551_param_11]; ld.param.u64 %rd13, [KER5193270764107642551_param_12]; ld.param.u64 %rd14, [KER5193270764107642551_param_13]; ld.param.u64 %rd15, [KER5193270764107642551_param_14]; ld.param.u64 %rd16, [KER5193270764107642551_param_15]; ld.param.u64 %rd17, [KER5193270764107642551_param_16]; ld.param.u64 %rd18, [KER5193270764107642551_param_17]; ld.param.u64 %rd19, [KER5193270764107642551_param_18]; ld.param.u64 %rd21, [KER5193270764107642551_param_19+8]; ld.param.u64 %rd22, [KER5193270764107642551_param_19+16]; ld.param.u64 %rd23, [KER5193270764107642551_param_19+24]; ld.param.u64 %rd24, [KER5193270764107642551_param_19+32]; ld.param.u64 %rd25, [KER5193270764107642551_param_19+40]; ld.param.u64 %rd26, [KER5193270764107642551_param_19+48]; ld.param.u64 %rd27, [KER5193270764107642551_param_19+56]; ld.param.u64 %rd28, [KER5193270764107642551_param_19+64]; ld.param.u32 %r5, [KER5193270764107642551_param_20]; ld.param.u32 %r6, [KER5193270764107642551_param_21]; ld.param.u32 %r7, [KER5193270764107642551_param_22]; ld.param.u32 %r8, [KER5193270764107642551_param_23]; ld.param.u64 %rd20, [KER5193270764107642551_param_19]; st.u64 [%SP+64], %rd28; st.u64 [%SP+56], %rd27; st.u64 [%SP+48], %rd26; st.u64 [%SP+40], %rd25; st.u64 [%SP+32], %rd24; st.u64 [%SP+24], %rd23; st.u64 [%SP+16], %rd22; st.u64 [%SP+8], %rd21; st.u64 [%SP+0], %rd20; mov.b32 %r9, %r5; mov.b32 %r10, %r6; mov.b32 %r11, %r8; tmp40: func_exec_begin16: .loc 1 244 21 ld.u64 %rd29, [%SP+0]; ld.u64 %rd30, [%SP+8]; ld.u64 %rd31, [%SP+16]; ld.u64 %rd32, [%SP+24]; ld.u64 %rd33, [%SP+32]; ld.u64 %rd34, [%SP+40]; ld.u64 %rd35, [%SP+48]; ld.u64 %rd36, [%SP+56]; ld.u64 %rd37, [%SP+64]; st.u64 [%SP+136], %rd37; st.u64 [%SP+128], %rd36; st.u64 [%SP+120], %rd35; st.u64 [%SP+112], %rd34; st.u64 [%SP+104], %rd33; st.u64 [%SP+96], %rd32; st.u64 [%SP+88], %rd31; st.u64 [%SP+80], %rd30; st.u64 [%SP+72], %rd29; .loc 1 246 25 tmp41: mov.u32 %r12, %ctaid.x; mov.b32 %r1, %r12; tmp42: mov.u32 %r39, %r1; tmp43: BB16_1: .loc 1 246 5 mov.u32 %r2, %r39; tmp44: setp.lt.u32 %p1, %r2, %r7; not.pred %p2, %p1; @%p2 bra BB16_6; bra.uni BB16_2; BB16_2: .loc 1 248 23 tmp45: mov.u32 %r13, %tid.x; mov.b32 %r14, %r13; tmp46: .loc 1 249 17 mov.u32 %r15, %ntid.x; mul.lo.s32 %r16, %r2, %r15; mov.u32 %r17, %ntid.y; mul.lo.s32 %r18, %r16, %r17; add.s32 %r3, %r18, %r14; tmp47: .loc 1 250 9 cvt.s64.s32 %rd38, %r3; add.u64 %rd39, %SP, 72; add.s64 %rd40, %rd39, 8; ld.u64 %rd41, [%rd40+24]; add.s64 %rd42, %rd39, 40; ld.u64 %rd43, [%rd42+24]; mul.lo.s64 %rd44, %rd41, %rd43; setp.ge.s64 %p3, %rd38, %rd44; not.pred %p4, %p3; @%p4 bra BB16_4; bra.uni BB16_3; BB16_3: .loc 1 250 56 tmp48: bra.uni BB16_7; tmp49: BB16_4: .loc 1 251 18 mov.b32 %r19, %r3; tmp50: .loc 1 252 10 mov.b32 %r20, %r3; tmp51: .loc 1 253 10 mov.b32 %r21, %r3; tmp52: .loc 1 254 10 mov.b32 %r22, %r3; tmp53: .loc 1 255 10 mov.b32 %r23, %r3; tmp54: .loc 1 256 10 mov.b32 %r24, %r3; tmp55: .loc 1 257 11 mov.b32 %r25, %r3; tmp56: .loc 1 258 11 mov.b32 %r26, %r3; tmp57: .loc 1 259 11 mov.b32 %r27, %r3; tmp58: .loc 1 260 11 mov.b32 %r28, %r3; tmp59: .loc 1 261 11 mov.b32 %r29, %r3; tmp60: .loc 1 262 11 mov.b32 %r30, %r3; tmp61: .loc 1 263 11 mov.b32 %r31, %r3; tmp62: .loc 1 264 11 mov.b32 %r32, %r3; tmp63: .loc 1 265 11 mov.b32 %r33, %r3; tmp64: .loc 1 266 11 mov.b32 %r34, %r3; tmp65: .loc 1 267 11 mov.b32 %r35, %r3; tmp66: .loc 1 268 11 mov.b32 %r36, %r3; tmp67: .loc 1 269 11 mov.b32 %r37, %r3; tmp68: .loc 1 270 12 cvt.s64.s32 %rd45, %r19; shl.b64 %rd46, %rd45, 2; add.s64 %rd47, %rd1, %rd46; ld.f32 %f1, [%rd47]; mov.f32 %f2, %f1; tmp69: .loc 1 271 12 cvt.s64.s32 %rd48, %r20; shl.b64 %rd49, %rd48, 2; add.s64 %rd50, %rd2, %rd49; ld.f32 %f3, [%rd50]; mov.f32 %f4, %f3; tmp70: .loc 1 272 12 add.f32 %f5, %f2, %f4; tmp71: .loc 1 273 12 cvt.s64.s32 %rd51, %r21; shl.b64 %rd52, %rd51, 2; add.s64 %rd53, %rd3, %rd52; ld.f32 %f6, [%rd53]; mov.f32 %f7, %f6; tmp72: .loc 1 274 12 add.f32 %f8, %f5, %f7; tmp73: .loc 1 275 12 cvt.s64.s32 %rd54, %r22; shl.b64 %rd55, %rd54, 2; add.s64 %rd56, %rd4, %rd55; ld.f32 %f9, [%rd56]; mov.f32 %f10, %f9; tmp74: .loc 1 276 12 add.f32 %f11, %f8, %f10; tmp75: .loc 1 277 12 cvt.s64.s32 %rd57, %r23; shl.b64 %rd58, %rd57, 2; add.s64 %rd59, %rd5, %rd58; ld.f32 %f12, [%rd59]; mov.f32 %f13, %f12; tmp76: .loc 1 278 12 add.f32 %f14, %f11, %f13; tmp77: .loc 1 279 12 cvt.s64.s32 %rd60, %r24; shl.b64 %rd61, %rd60, 2; add.s64 %rd62, %rd6, %rd61; ld.f32 %f15, [%rd62]; mov.f32 %f16, %f15; tmp78: .loc 1 280 13 add.f32 %f17, %f14, %f16; tmp79: .loc 1 281 13 cvt.s64.s32 %rd63, %r25; shl.b64 %rd64, %rd63, 2; add.s64 %rd65, %rd7, %rd64; ld.f32 %f18, [%rd65]; mov.f32 %f19, %f18; tmp80: .loc 1 282 13 add.f32 %f20, %f17, %f19; tmp81: .loc 1 283 13 cvt.s64.s32 %rd66, %r26; shl.b64 %rd67, %rd66, 2; add.s64 %rd68, %rd8, %rd67; ld.f32 %f21, [%rd68]; mov.f32 %f22, %f21; tmp82: .loc 1 284 13 add.f32 %f23, %f20, %f22; tmp83: .loc 1 285 13 cvt.s64.s32 %rd69, %r27; shl.b64 %rd70, %rd69, 2; add.s64 %rd71, %rd9, %rd70; ld.f32 %f24, [%rd71]; mov.f32 %f25, %f24; tmp84: .loc 1 286 13 add.f32 %f26, %f23, %f25; tmp85: .loc 1 287 13 cvt.s64.s32 %rd72, %r28; shl.b64 %rd73, %rd72, 2; add.s64 %rd74, %rd10, %rd73; ld.f32 %f27, [%rd74]; mov.f32 %f28, %f27; tmp86: .loc 1 288 13 add.f32 %f29, %f26, %f28; tmp87: .loc 1 289 13 cvt.s64.s32 %rd75, %r29; shl.b64 %rd76, %rd75, 2; add.s64 %rd77, %rd11, %rd76; ld.f32 %f30, [%rd77]; mov.f32 %f31, %f30; tmp88: .loc 1 290 13 add.f32 %f32, %f29, %f31; tmp89: .loc 1 291 13 cvt.s64.s32 %rd78, %r30; shl.b64 %rd79, %rd78, 2; add.s64 %rd80, %rd12, %rd79; ld.f32 %f33, [%rd80]; mov.f32 %f34, %f33; tmp90: .loc 1 292 13 add.f32 %f35, %f32, %f34; tmp91: .loc 1 293 13 cvt.s64.s32 %rd81, %r31; shl.b64 %rd82, %rd81, 2; add.s64 %rd83, %rd13, %rd82; ld.f32 %f36, [%rd83]; mov.f32 %f37, %f36; tmp92: .loc 1 294 13 add.f32 %f38, %f35, %f37; tmp93: .loc 1 295 13 cvt.s64.s32 %rd84, %r32; shl.b64 %rd85, %rd84, 2; add.s64 %rd86, %rd14, %rd85; ld.f32 %f39, [%rd86]; mov.f32 %f40, %f39; tmp94: .loc 1 296 13 add.f32 %f41, %f38, %f40; tmp95: .loc 1 297 13 cvt.s64.s32 %rd87, %r33; shl.b64 %rd88, %rd87, 2; add.s64 %rd89, %rd15, %rd88; ld.f32 %f42, [%rd89]; mov.f32 %f43, %f42; tmp96: .loc 1 298 13 add.f32 %f44, %f41, %f43; tmp97: .loc 1 299 13 cvt.s64.s32 %rd90, %r34; shl.b64 %rd91, %rd90, 2; add.s64 %rd92, %rd16, %rd91; ld.f32 %f45, [%rd92]; mov.f32 %f46, %f45; tmp98: .loc 1 300 13 add.f32 %f47, %f44, %f46; tmp99: .loc 1 301 13 cvt.s64.s32 %rd93, %r35; shl.b64 %rd94, %rd93, 2; add.s64 %rd95, %rd17, %rd94; ld.f32 %f48, [%rd95]; mov.f32 %f49, %f48; tmp100: .loc 1 302 13 add.f32 %f50, %f47, %f49; tmp101: .loc 1 303 13 cvt.s64.s32 %rd96, %r36; shl.b64 %rd97, %rd96, 2; add.s64 %rd98, %rd18, %rd97; ld.f32 %f51, [%rd98]; mov.f32 %f52, %f51; tmp102: .loc 1 304 13 add.f32 %f53, %f50, %f52; tmp103: .loc 1 305 13 cvt.s64.s32 %rd99, %r37; shl.b64 %rd100, %rd99, 2; add.s64 %rd101, %rd19, %rd100; ld.f32 %f54, [%rd101]; mov.f32 %f55, %f54; tmp104: .loc 1 306 13 add.f32 %f56, %f53, %f55; tmp105: .loc 1 307 1 ld.u64 %rd102, [%SP+0]; cvt.s64.s32 %rd103, %r3; shl.b64 %rd104, %rd103, 2; add.s64 %rd105, %rd102, %rd104; st.f32 [%rd105], %f56; tmp106: .loc 1 246 68 mov.u32 %r38, %nctaid.x; add.s32 %r4, %r2, %r38; tmp107: mov.u32 %r39, %r4; tmp108: bra.uni BB16_1; tmp109: BB16_6: BB16_7: .loc 1 312 1 ret; tmp110: func_end16: } .func (.param .b32 func_retval0) hypotf( .param .b32 hypotf_param_0, .param .b32 hypotf_param_1 ) { .reg .pred %p<5>; .reg .f32 %f<20>; .reg .b32 %r<13>; ld.param.f32 %f7, [hypotf_param_0]; ld.param.f32 %f8, [hypotf_param_1]; abs.f32 %f9, %f7; abs.f32 %f10, %f8; mov.b32 %r1, %f10; mov.b32 %r2, %f9; min.s32 %r3, %r1, %r2; mov.b32 %f1, %r3; mov.b32 %r4, %f9; mov.b32 %r5, %f10; max.s32 %r6, %r4, %r5; mov.b32 %f2, %r6; and.b32 %r7, %r6, -33554432; sub.s32 %r8, %r7, 1065353216; add.s32 %r9, %r8, 8388608; mov.u32 %r10, 1065353216; sub.s32 %r11, %r10, %r9; mov.b32 %f11, %r11; mul.f32 %f12, %f1, %f11; mul.f32 %f13, %f2, %f11; mul.f32 %f14, %f12, %f12; fma.rn.f32 %f15, %f13, %f13, %f14; sqrt.rn.f32 %f16, %f15; add.s32 %r12, %r9, 1065353216; mov.b32 %f17, %r12; mul.f32 %f3, %f16, %f17; setp.eq.f32 %p1, %f1, 0f00000000; not.pred %p2, %p1; mov.f32 %f18, %f3; @%p2 bra BB17_2; bra.uni BB17_1; BB17_1: mov.f32 %f18, %f2; BB17_2: mov.f32 %f4, %f18; setp.eq.f32 %p3, %f1, 0f7F800000; not.pred %p4, %p3; mov.f32 %f19, %f4; @%p4 bra BB17_4; bra.uni BB17_3; BB17_3: mov.f32 %f5, 0f7F800000; mov.f32 %f19, %f5; BB17_4: mov.f32 %f6, %f19; st.param.f32 [func_retval0+0], %f6; ret; } .func (.param .b64 func_retval0) hypot( .param .b64 hypot_param_0, .param .b64 hypot_param_1 ) { .reg .pred %p<5>; .reg .b32 %r<11>; .reg .f64 %fd<32>; .reg .b64 %rd<7>; ld.param.f64 %fd6, [hypot_param_0]; ld.param.f64 %fd7, [hypot_param_1]; abs.f64 %fd10, %fd6; abs.f64 %fd11, %fd7; mov.b64 %rd1, %fd11; mov.b64 %rd2, %fd10; min.u64 %rd3, %rd1, %rd2; mov.b64 %fd1, %rd3; mov.b64 %rd4, %fd10; mov.b64 %rd5, %fd11; max.u64 %rd6, %rd4, %rd5; mov.b64 %fd2, %rd6; { .reg .b32 %temp; mov.b64 {%temp, %r1}, %fd2; } and.b32 %r2, %r1, -4194304; sub.s32 %r3, %r2, 1072693248; add.s32 %r4, %r3, 1048576; mov.u32 %r5, 1072693248; sub.s32 %r6, %r5, %r4; mov.u32 %r7, 0; mov.b64 %fd12, {%r7, %r6}; mul.f64 %fd13, %fd1, %fd12; mul.f64 %fd14, %fd2, %fd12; mul.f64 %fd15, %fd13, %fd13; fma.rn.f64 %fd16, %fd14, %fd14, %fd15; mov.f64 %fd17, 0d7FEFFFFFFFFFFFFF; min.f64 %fd9, %fd16, %fd17; // inline asm rsqrt.approx.ftz.f64 %fd8, %fd9; // inline asm mul.rn.f64 %fd18, %fd8, %fd8; neg.f64 %fd19, %fd18; mov.f64 %fd20, 0d3FF0000000000000; fma.rn.f64 %fd21, %fd9, %fd19, %fd20; mov.f64 %fd22, 0d3FE0000000000000; mov.f64 %fd23, 0d3FD8000000000000; fma.rn.f64 %fd24, %fd23, %fd21, %fd22; mul.rn.f64 %fd25, %fd21, %fd8; fma.rn.f64 %fd26, %fd24, %fd25, %fd8; mul.f64 %fd27, %fd16, %fd26; add.s32 %r8, %r4, 1072693248; mov.b64 %fd28, {%r7, %r8}; mul.f64 %fd3, %fd27, %fd28; setp.eq.f64 %p1, %fd1, 0d0000000000000000; not.pred %p2, %p1; mov.f64 %fd30, %fd3; @%p2 bra BB18_2; bra.uni BB18_1; BB18_1: mov.f64 %fd30, %fd2; BB18_2: mov.f64 %fd4, %fd30; { .reg .b32 %temp; mov.b64 {%temp, %r9}, %fd1; } mov.f64 %fd29, 0d7FF0000000000000; { .reg .b32 %temp; mov.b64 {%temp, %r10}, %fd29; } setp.ge.u32 %p3, %r9, %r10; not.pred %p4, %p3; mov.f64 %fd31, %fd4; @%p4 bra BB18_4; bra.uni BB18_3; BB18_3: mov.f64 %fd31, %fd1; BB18_4: mov.f64 %fd5, %fd31; st.param.f64 [func_retval0+0], %fd5; ret; } .file 1 "/media/nvidia/Data/arrayfire/github/build/TX2-R28.2-DP_Debug/KER5193270764107642551" .file 2 "/media/nvidia/Data/arrayfire/github/build/TX2-R28.2-DP_Debug/__nv_nvrtc_builtin_header.h" .section .debug_info { .b32 5891 .b8 2 .b8 0 .b32 .debug_abbrev .b8 8 .b8 1 .b8 108 .b8 103 .b8 101 .b8 110 .b8 102 .b8 101 .b8 58 .b8 32 .b8 69 .b8 68 .b8 71 .b8 32 .b8 52 .b8 46 .b8 49 .b8 50 .b8 0 .b8 4 .b8 75 .b8 69 .b8 82 .b8 53 .b8 49 .b8 57 .b8 51 .b8 50 .b8 55 .b8 48 .b8 55 .b8 54 .b8 52 .b8 49 .b8 48 .b8 55 .b8 54 .b8 52 .b8 50 .b8 53 .b8 53 .b8 49 .b8 0 .b64 0 .b32 .debug_line .b8 47 .b8 109 .b8 101 .b8 100 .b8 105 .b8 97 .b8 47 .b8 110 .b8 118 .b8 105 .b8 100 .b8 105 .b8 97 .b8 47 .b8 68 .b8 97 .b8 116 .b8 97 .b8 47 .b8 97 .b8 114 .b8 114 .b8 97 .b8 121 .b8 102 .b8 105 .b8 114 .b8 101 .b8 47 .b8 103 .b8 105 .b8 116 .b8 104 .b8 117 .b8 98 .b8 47 .b8 98 .b8 117 .b8 105 .b8 108 .b8 100 .b8 47 .b8 84 .b8 88 .b8 50 .b8 45 .b8 82 .b8 50 .b8 56 .b8 46 .b8 50 .b8 45 .b8 68 .b8 80 .b8 95 .b8 68 .b8 101 .b8 98 .b8 117 .b8 103 .b8 0 .b8 2 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b32 1 .b32 68 .b32 279 .b8 1 .b64 func_begin0 .b64 func_end0 .b8 1 .b8 156 .b8 3 .b8 120 .b8 0 .b32 1 .b32 68 .b32 378 .b8 5 .b8 144 .b8 177 .b8 204 .b8 149 .b8 1 .b8 2 .b8 3 .b8 121 .b8 0 .b32 1 .b32 68 .b32 378 .b8 5 .b8 144 .b8 178 .b8 204 .b8 149 .b8 1 .b8 2 .b8 4 .b64 tmp0 .b64 tmp1 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 70 .b32 279 .b8 11 .b8 3 .b64 __local_depot0 .b8 35 .b8 0 .b8 6 .b8 0 .b8 0 .b8 6 .b32 291 .b8 99 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 0 .b8 6 .b32 311 .b8 99 .b8 117 .b8 70 .b8 108 .b8 111 .b8 97 .b8 116 .b8 67 .b8 111 .b8 109 .b8 112 .b8 108 .b8 101 .b8 120 .b8 0 .b8 6 .b32 323 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b8 7 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 8 .b32 2 .b32 728 .b8 8 .b8 120 .b8 0 .b32 378 .b32 2 .b32 728 .b8 0 .b8 1 .b8 8 .b8 121 .b8 0 .b32 378 .b32 2 .b32 728 .b8 4 .b8 1 .b8 0 .b8 9 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 0 .b8 4 .b32 4 .b8 2 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 1 .b32 74 .b32 279 .b8 1 .b64 func_begin1 .b64 func_end1 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 0 .b32 1 .b32 74 .b32 279 .b8 11 .b8 3 .b64 __local_depot1 .b8 35 .b8 0 .b8 6 .b8 4 .b64 tmp2 .b64 tmp3 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 76 .b32 279 .b8 11 .b8 3 .b64 __local_depot1 .b8 35 .b8 8 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 80 .b32 279 .b8 1 .b64 func_begin2 .b64 func_end2 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 80 .b32 279 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 80 .b32 279 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp4 .b64 tmp5 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 82 .b32 279 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 86 .b32 279 .b8 1 .b64 func_begin3 .b64 func_end3 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 86 .b32 279 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 86 .b32 279 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp6 .b64 tmp7 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 88 .b32 279 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 92 .b32 279 .b8 1 .b64 func_begin4 .b64 func_end4 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 92 .b32 279 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 92 .b32 279 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp8 .b64 tmp9 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 94 .b32 279 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 100 .b32 279 .b8 1 .b64 func_begin5 .b64 func_end5 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 100 .b32 279 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 100 .b32 279 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp10 .b64 tmp15 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 107 .b32 279 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 16 .b8 6 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 103 .b32 378 .b8 5 .b8 144 .b8 183 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 105 .b8 110 .b8 118 .b8 95 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 104 .b32 378 .b8 5 .b8 144 .b8 184 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 105 .b32 378 .b8 6 .b8 144 .b8 176 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 106 .b32 378 .b8 6 .b8 144 .b8 178 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 114 .b32 279 .b8 1 .b64 func_begin6 .b64 func_end6 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 114 .b32 279 .b8 11 .b8 3 .b64 __local_depot6 .b8 35 .b8 8 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 114 .b32 279 .b8 11 .b8 3 .b64 __local_depot6 .b8 35 .b8 16 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 119 .b32 279 .b8 1 .b64 func_begin7 .b64 func_end7 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 119 .b32 279 .b8 11 .b8 3 .b64 __local_depot7 .b8 35 .b8 8 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 119 .b32 279 .b8 11 .b8 3 .b64 __local_depot7 .b8 35 .b8 16 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b32 1 .b32 142 .b32 1795 .b8 1 .b64 func_begin8 .b64 func_end8 .b8 1 .b8 156 .b8 3 .b8 120 .b8 0 .b32 1 .b32 142 .b32 1898 .b8 6 .b8 144 .b8 177 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 3 .b8 121 .b8 0 .b32 1 .b32 142 .b32 1898 .b8 6 .b8 144 .b8 178 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 4 .b64 tmp20 .b64 tmp21 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 144 .b32 1795 .b8 11 .b8 3 .b64 __local_depot8 .b8 35 .b8 0 .b8 6 .b8 0 .b8 0 .b8 6 .b32 1808 .b8 99 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 0 .b8 6 .b32 1829 .b8 99 .b8 117 .b8 68 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 67 .b8 111 .b8 109 .b8 112 .b8 108 .b8 101 .b8 120 .b8 0 .b8 6 .b32 1842 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b8 7 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 16 .b32 2 .b32 774 .b8 8 .b8 120 .b8 0 .b32 1898 .b32 2 .b32 776 .b8 0 .b8 1 .b8 8 .b8 121 .b8 0 .b32 1898 .b32 2 .b32 776 .b8 8 .b8 1 .b8 0 .b8 9 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 0 .b8 4 .b32 8 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 1 .b32 148 .b32 1795 .b8 1 .b64 func_begin9 .b64 func_end9 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 0 .b32 1 .b32 148 .b32 1795 .b8 11 .b8 3 .b64 __local_depot9 .b8 35 .b8 0 .b8 6 .b8 4 .b64 tmp22 .b64 tmp23 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 150 .b32 1795 .b8 11 .b8 3 .b64 __local_depot9 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 154 .b32 1795 .b8 1 .b64 func_begin10 .b64 func_end10 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 154 .b32 1795 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 154 .b32 1795 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp24 .b64 tmp25 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 156 .b32 1795 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 160 .b32 1795 .b8 1 .b64 func_begin11 .b64 func_end11 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 160 .b32 1795 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 160 .b32 1795 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp26 .b64 tmp27 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 162 .b32 1795 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 166 .b32 1795 .b8 1 .b64 func_begin12 .b64 func_end12 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 166 .b32 1795 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 166 .b32 1795 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp28 .b64 tmp29 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 168 .b32 1795 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 174 .b32 1795 .b8 1 .b64 func_begin13 .b64 func_end13 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 174 .b32 1795 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 174 .b32 1795 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp30 .b64 tmp35 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 181 .b32 1795 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 32 .b8 6 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 177 .b32 1898 .b8 6 .b8 144 .b8 183 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 110 .b8 118 .b8 95 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 178 .b32 1898 .b8 6 .b8 144 .b8 184 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 179 .b32 1898 .b8 7 .b8 144 .b8 176 .b8 226 .b8 144 .b8 179 .b8 214 .b8 4 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 180 .b32 1898 .b8 7 .b8 144 .b8 178 .b8 226 .b8 144 .b8 179 .b8 214 .b8 4 .b8 2 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 188 .b32 1795 .b8 1 .b64 func_begin14 .b64 func_end14 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 188 .b32 1795 .b8 11 .b8 3 .b64 __local_depot14 .b8 35 .b8 16 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 188 .b32 1795 .b8 11 .b8 3 .b64 __local_depot14 .b8 35 .b8 32 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 193 .b32 1795 .b8 1 .b64 func_begin15 .b64 func_end15 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 193 .b32 1795 .b8 11 .b8 3 .b64 __local_depot15 .b8 35 .b8 16 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 193 .b32 1795 .b8 11 .b8 3 .b64 __local_depot15 .b8 35 .b8 32 .b8 6 .b8 0 .b8 2 .b8 75 .b8 69 .b8 82 .b8 53 .b8 49 .b8 57 .b8 51 .b8 50 .b8 55 .b8 48 .b8 55 .b8 54 .b8 52 .b8 49 .b8 48 .b8 55 .b8 54 .b8 52 .b8 50 .b8 53 .b8 53 .b8 49 .b8 0 .b8 75 .b8 69 .b8 82 .b8 53 .b8 49 .b8 57 .b8 51 .b8 50 .b8 55 .b8 48 .b8 55 .b8 54 .b8 52 .b8 49 .b8 48 .b8 55 .b8 54 .b8 52 .b8 50 .b8 53 .b8 53 .b8 49 .b8 0 .b32 1 .b32 220 .b32 5706 .b8 1 .b64 func_begin16 .b64 func_end16 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 48 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 221 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_0 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 222 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_1 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 223 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_2 .b8 7 .b8 3 .b8 105 .b8 110 .b8 53 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 224 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_3 .b8 7 .b8 3 .b8 105 .b8 110 .b8 55 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 225 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_4 .b8 7 .b8 3 .b8 105 .b8 110 .b8 57 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 226 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_5 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 227 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_6 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 51 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 228 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_7 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 53 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 229 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_8 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 55 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 230 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_9 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 57 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 231 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_10 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 232 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_11 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 51 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 233 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_12 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 53 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 234 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_13 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 55 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 235 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_14 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 57 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 236 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_15 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 237 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_16 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 51 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 238 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_17 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 53 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 239 .b32 5827 .b8 9 .b8 3 .b64 KER5193270764107642551_param_18 .b8 7 .b8 3 .b8 111 .b8 117 .b8 116 .b8 51 .b8 54 .b8 0 .b32 1 .b32 240 .b32 5739 .b8 11 .b8 3 .b64 __local_depot16 .b8 35 .b8 0 .b8 6 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 241 .b32 5855 .b8 5 .b8 144 .b8 185 .b8 228 .b8 149 .b8 1 .b8 2 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 241 .b32 5855 .b8 6 .b8 144 .b8 176 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 120 .b8 95 .b8 116 .b8 111 .b8 116 .b8 97 .b8 108 .b8 0 .b32 1 .b32 241 .b32 5855 .b8 9 .b8 3 .b64 KER5193270764107642551_param_22 .b8 7 .b8 3 .b8 110 .b8 117 .b8 109 .b8 95 .b8 111 .b8 100 .b8 105 .b8 109 .b8 115 .b8 0 .b32 1 .b32 241 .b32 5855 .b8 6 .b8 144 .b8 177 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 4 .b64 tmp40 .b64 tmp110 .b8 5 .b8 111 .b8 117 .b8 116 .b8 114 .b8 101 .b8 102 .b8 0 .b32 1 .b32 244 .b32 5739 .b8 11 .b8 3 .b64 __local_depot16 .b8 35 .b8 72 .b8 6 .b8 4 .b64 tmp41 .b64 tmp109 .b8 10 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 73 .b8 100 .b8 120 .b8 95 .b8 120 .b8 0 .b32 1 .b32 246 .b32 5884 .b32 .debug_loc .b8 4 .b64 tmp45 .b64 tmp109 .b8 4 .b64 tmp45 .b64 tmp106 .b8 5 .b8 116 .b8 104 .b8 114 .b8 101 .b8 97 .b8 100 .b8 73 .b8 100 .b8 0 .b32 1 .b32 248 .b32 5855 .b8 6 .b8 144 .b8 180 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 0 .b32 1 .b32 249 .b32 5884 .b8 5 .b8 144 .b8 179 .b8 228 .b8 149 .b8 1 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 48 .b8 0 .b32 1 .b32 251 .b32 5884 .b8 6 .b8 144 .b8 185 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 0 .b32 1 .b32 252 .b32 5884 .b8 6 .b8 144 .b8 176 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 0 .b32 1 .b32 253 .b32 5884 .b8 6 .b8 144 .b8 177 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 53 .b8 0 .b32 1 .b32 254 .b32 5884 .b8 6 .b8 144 .b8 178 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 55 .b8 0 .b32 1 .b32 255 .b32 5884 .b8 6 .b8 144 .b8 179 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 57 .b8 0 .b32 1 .b32 256 .b32 5884 .b8 6 .b8 144 .b8 180 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 49 .b8 0 .b32 1 .b32 257 .b32 5884 .b8 6 .b8 144 .b8 181 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 51 .b8 0 .b32 1 .b32 258 .b32 5884 .b8 6 .b8 144 .b8 182 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 53 .b8 0 .b32 1 .b32 259 .b32 5884 .b8 6 .b8 144 .b8 183 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 55 .b8 0 .b32 1 .b32 260 .b32 5884 .b8 6 .b8 144 .b8 184 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 57 .b8 0 .b32 1 .b32 261 .b32 5884 .b8 6 .b8 144 .b8 185 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 49 .b8 0 .b32 1 .b32 262 .b32 5884 .b8 6 .b8 144 .b8 176 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 51 .b8 0 .b32 1 .b32 263 .b32 5884 .b8 6 .b8 144 .b8 177 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 53 .b8 0 .b32 1 .b32 264 .b32 5884 .b8 6 .b8 144 .b8 178 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 55 .b8 0 .b32 1 .b32 265 .b32 5884 .b8 6 .b8 144 .b8 179 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 57 .b8 0 .b32 1 .b32 266 .b32 5884 .b8 6 .b8 144 .b8 180 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 49 .b8 0 .b32 1 .b32 267 .b32 5884 .b8 6 .b8 144 .b8 181 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 51 .b8 0 .b32 1 .b32 268 .b32 5884 .b8 6 .b8 144 .b8 182 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 53 .b8 0 .b32 1 .b32 269 .b32 5884 .b8 6 .b8 144 .b8 183 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 48 .b8 0 .b32 1 .b32 270 .b32 378 .b8 5 .b8 144 .b8 178 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 0 .b32 1 .b32 271 .b32 378 .b8 5 .b8 144 .b8 180 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 0 .b32 1 .b32 272 .b32 378 .b8 5 .b8 144 .b8 181 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 0 .b32 1 .b32 273 .b32 378 .b8 5 .b8 144 .b8 183 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 0 .b32 1 .b32 274 .b32 378 .b8 5 .b8 144 .b8 184 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 53 .b8 0 .b32 1 .b32 275 .b32 378 .b8 6 .b8 144 .b8 176 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 54 .b8 0 .b32 1 .b32 276 .b32 378 .b8 6 .b8 144 .b8 177 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 55 .b8 0 .b32 1 .b32 277 .b32 378 .b8 6 .b8 144 .b8 179 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 56 .b8 0 .b32 1 .b32 278 .b32 378 .b8 6 .b8 144 .b8 180 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 57 .b8 0 .b32 1 .b32 279 .b32 378 .b8 6 .b8 144 .b8 182 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 48 .b8 0 .b32 1 .b32 280 .b32 378 .b8 6 .b8 144 .b8 183 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 49 .b8 0 .b32 1 .b32 281 .b32 378 .b8 6 .b8 144 .b8 185 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 50 .b8 0 .b32 1 .b32 282 .b32 378 .b8 6 .b8 144 .b8 176 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 51 .b8 0 .b32 1 .b32 283 .b32 378 .b8 6 .b8 144 .b8 178 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 52 .b8 0 .b32 1 .b32 284 .b32 378 .b8 6 .b8 144 .b8 179 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 53 .b8 0 .b32 1 .b32 285 .b32 378 .b8 6 .b8 144 .b8 181 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 54 .b8 0 .b32 1 .b32 286 .b32 378 .b8 6 .b8 144 .b8 182 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 55 .b8 0 .b32 1 .b32 287 .b32 378 .b8 6 .b8 144 .b8 184 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 56 .b8 0 .b32 1 .b32 288 .b32 378 .b8 6 .b8 144 .b8 185 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 57 .b8 0 .b32 1 .b32 289 .b32 378 .b8 6 .b8 144 .b8 177 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 48 .b8 0 .b32 1 .b32 290 .b32 378 .b8 6 .b8 144 .b8 178 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 49 .b8 0 .b32 1 .b32 291 .b32 378 .b8 6 .b8 144 .b8 180 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 50 .b8 0 .b32 1 .b32 292 .b32 378 .b8 6 .b8 144 .b8 181 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 51 .b8 0 .b32 1 .b32 293 .b32 378 .b8 6 .b8 144 .b8 183 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 52 .b8 0 .b32 1 .b32 294 .b32 378 .b8 6 .b8 144 .b8 184 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 53 .b8 0 .b32 1 .b32 295 .b32 378 .b8 6 .b8 144 .b8 176 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 54 .b8 0 .b32 1 .b32 296 .b32 378 .b8 6 .b8 144 .b8 177 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 55 .b8 0 .b32 1 .b32 297 .b32 378 .b8 6 .b8 144 .b8 179 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 56 .b8 0 .b32 1 .b32 298 .b32 378 .b8 6 .b8 144 .b8 180 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 57 .b8 0 .b32 1 .b32 299 .b32 378 .b8 6 .b8 144 .b8 182 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 48 .b8 0 .b32 1 .b32 300 .b32 378 .b8 6 .b8 144 .b8 183 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 49 .b8 0 .b32 1 .b32 301 .b32 378 .b8 6 .b8 144 .b8 185 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 50 .b8 0 .b32 1 .b32 302 .b32 378 .b8 6 .b8 144 .b8 176 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 51 .b8 0 .b32 1 .b32 303 .b32 378 .b8 6 .b8 144 .b8 178 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 52 .b8 0 .b32 1 .b32 304 .b32 378 .b8 6 .b8 144 .b8 179 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 53 .b8 0 .b32 1 .b32 305 .b32 378 .b8 6 .b8 144 .b8 181 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 54 .b8 0 .b32 1 .b32 306 .b32 378 .b8 6 .b8 144 .b8 182 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 0 .b8 0 .b8 0 .b8 0 .b8 0 .b8 11 .b8 118 .b8 111 .b8 105 .b8 100 .b8 0 .b8 6 .b32 5723 .b8 100 .b8 105 .b8 109 .b8 95 .b8 116 .b8 0 .b8 9 .b8 108 .b8 111 .b8 110 .b8 103 .b8 32 .b8 108 .b8 111 .b8 110 .b8 103 .b8 0 .b8 5 .b32 8 .b8 7 .b8 95 .b8 90 .b8 53 .b8 80 .b8 97 .b8 114 .b8 97 .b8 109 .b8 73 .b8 102 .b8 69 .b8 0 .b32 72 .b32 1 .b32 212 .b8 8 .b8 112 .b8 116 .b8 114 .b8 0 .b32 5827 .b32 1 .b32 214 .b8 0 .b8 1 .b8 8 .b8 100 .b8 105 .b8 109 .b8 115 .b8 0 .b32 5833 .b32 1 .b32 215 .b8 8 .b8 1 .b8 8 .b8 115 .b8 116 .b8 114 .b8 105 .b8 100 .b8 101 .b8 115 .b8 0 .b32 5833 .b32 1 .b32 216 .b8 40 .b8 1 .b8 0 .b8 12 .b32 378 .b8 12 .b8 13 .b32 5712 .b8 14 .b32 5845 .b8 3 .b8 0 .b8 15 .b8 105 .b8 110 .b8 116 .b8 0 .b32 4 .b8 5 .b8 6 .b32 5865 .b8 117 .b8 105 .b8 110 .b8 116 .b8 0 .b8 9 .b8 117 .b8 110 .b8 115 .b8 105 .b8 103 .b8 110 .b8 101 .b8 100 .b8 32 .b8 105 .b8 110 .b8 116 .b8 0 .b8 7 .b32 4 .b8 9 .b8 105 .b8 110 .b8 116 .b8 0 .b8 5 .b32 4 .b8 0 } .section .debug_abbrev { .b8 1 .b8 17 .b8 1 .b8 37 .b8 8 .b8 19 .b8 11 .b8 3 .b8 8 .b8 17 .b8 1 .b8 16 .b8 6 .b8 27 .b8 8 .b8 0 .b8 0 .b8 2 .b8 46 .b8 1 .b8 135 .b8 64 .b8 8 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 63 .b8 12 .b8 17 .b8 1 .b8 18 .b8 1 .b8 64 .b8 10 .b8 0 .b8 0 .b8 3 .b8 5 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 10 .b8 51 .b8 11 .b8 0 .b8 0 .b8 4 .b8 11 .b8 1 .b8 17 .b8 1 .b8 18 .b8 1 .b8 0 .b8 0 .b8 5 .b8 52 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 10 .b8 51 .b8 11 .b8 0 .b8 0 .b8 6 .b8 22 .b8 0 .b8 73 .b8 19 .b8 3 .b8 8 .b8 0 .b8 0 .b8 7 .b8 19 .b8 1 .b8 3 .b8 8 .b8 11 .b8 6 .b8 58 .b8 6 .b8 59 .b8 6 .b8 0 .b8 0 .b8 8 .b8 13 .b8 0 .b8 3 .b8 8 .b8 73 .b8 19 .b8 58 .b8 6 .b8 59 .b8 6 .b8 56 .b8 15 .b8 50 .b8 11 .b8 0 .b8 0 .b8 9 .b8 36 .b8 0 .b8 3 .b8 8 .b8 62 .b8 11 .b8 11 .b8 6 .b8 0 .b8 0 .b8 10 .b8 52 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 6 .b8 0 .b8 0 .b8 11 .b8 59 .b8 0 .b8 3 .b8 8 .b8 0 .b8 0 .b8 12 .b8 15 .b8 0 .b8 73 .b8 19 .b8 51 .b8 11 .b8 0 .b8 0 .b8 13 .b8 1 .b8 1 .b8 73 .b8 19 .b8 0 .b8 0 .b8 14 .b8 33 .b8 0 .b8 73 .b8 19 .b8 47 .b8 15 .b8 0 .b8 0 .b8 15 .b8 36 .b8 0 .b8 3 .b8 8 .b8 11 .b8 6 .b8 62 .b8 11 .b8 0 .b8 0 .b8 0 } .section .debug_loc { .b64 tmp42 .b64 tmp43 .b8 5 .b8 0 .b8 144 .b8 177 .b8 228 .b8 149 .b8 1 .b64 tmp43 .b64 tmp44 .b8 6 .b8 0 .b8 144 .b8 185 .b8 230 .b8 200 .b8 171 .b8 2 .b64 tmp44 .b64 tmp107 .b8 5 .b8 0 .b8 144 .b8 178 .b8 228 .b8 149 .b8 1 .b64 tmp107 .b64 tmp108 .b8 5 .b8 0 .b8 144 .b8 180 .b8 228 .b8 149 .b8 1 .b64 tmp108 .b64 func_end16 .b8 6 .b8 0 .b8 144 .b8 185 .b8 230 .b8 200 .b8 171 .b8 2 .b64 0 .b64 0 } .section .debug_ranges { } .section .debug_pubnames { .b32 410 .b8 2 .b8 0 .b32 .debug_info .b32 5891 .b32 390 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 1642 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b32 2602 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 126 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b32 1081 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1376 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1509 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2059 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 538 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 719 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 3034 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2240 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2421 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 900 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2901 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 3167 .b8 75 .b8 69 .b8 82 .b8 53 .b8 49 .b8 57 .b8 51 .b8 50 .b8 55 .b8 48 .b8 55 .b8 54 .b8 52 .b8 49 .b8 48 .b8 55 .b8 54 .b8 52 .b8 50 .b8 53 .b8 53 .b8 49 .b8 0 .b32 1911 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 0 } ] JIT_KERNEL:------------------------- typedef unsigned int uint; typedef long long dim_t; /******************************************************* * Copyright (c) 2014, ArrayFire * All rights reserved. * * This file is distributed under 3-clause BSD license. * The complete license agreement can be obtained at: * http://arrayfire.com/licenses/BSD-3-Clause ********************************************************/ typedef float2 cuFloatComplex; typedef cuFloatComplex cfloat; typedef double2 cuDoubleComplex; typedef cuDoubleComplex cdouble; // ---------------------------------------------- // REAL NUMBER OPERATIONS // ---------------------------------------------- #define sign(in) signbit((in)) #define __noop(a) (a) #define __add(lhs, rhs) (lhs) + (rhs) #define __sub(lhs, rhs) (lhs) - (rhs) #define __mul(lhs, rhs) (lhs) * (rhs) #define __div(lhs, rhs) (lhs) / (rhs) #define __and(lhs, rhs) (lhs) && (rhs) #define __or(lhs, rhs) (lhs) || (rhs) #define __lt(lhs, rhs) (lhs) < (rhs) #define __gt(lhs, rhs) (lhs) > (rhs) #define __le(lhs, rhs) (lhs) <= (rhs) #define __ge(lhs, rhs) (lhs) >= (rhs) #define __eq(lhs, rhs) (lhs) == (rhs) #define __neq(lhs, rhs) (lhs) != (rhs) #define __conj(in) (in) #define __real(in) (in) #define __imag(in) (0) #define __abs(in) abs(in) #define __sigmoid(in) (1.0/(1 + exp(-(in)))) #define __bitor(lhs, rhs) ((lhs) | (rhs)) #define __bitand(lhs, rhs) ((lhs) & (rhs)) #define __bitxor(lhs, rhs) ((lhs) ^ (rhs)) #define __bitshiftl(lhs, rhs) ((lhs) << (rhs)) #define __bitshiftr(lhs, rhs) ((lhs) >> (rhs)) #define __min(lhs, rhs) ((lhs) < (rhs)) ? (lhs) : (rhs) #define __max(lhs, rhs) ((lhs) > (rhs)) ? (lhs) : (rhs) #define __rem(lhs, rhs) ((lhs) % (rhs)) #define __mod(lhs, rhs) ((lhs) % (rhs)) #define __pow(lhs, rhs) fpow((float)lhs, (float)rhs) #define __convert_char(val) (char)((val) != 0) #define fpow(lhs, rhs) pow((lhs), (rhs)) #define frem(lhs, rhs) remainder((lhs), (rhs)) #define iszero(a) ((a) == 0) // ---------------------------------------------- // COMPLEX FLOAT OPERATIONS // ---------------------------------------------- #define __crealf(in) ((in).x) #define __cimagf(in) ((in).y) #define __cabsf(in) hypotf(in.x, in.y) __device__ cfloat __cplx2f(float x, float y) { cfloat res = {x, y}; return res; } __device__ cfloat __cconjf(cfloat in) { cfloat res = {in.x, -in.y}; return res; } __device__ cfloat __caddf(cfloat lhs, cfloat rhs) { cfloat res = {lhs.x + rhs.x, lhs.y + rhs.y}; return res; } __device__ cfloat __csubf(cfloat lhs, cfloat rhs) { cfloat res = {lhs.x - rhs.x, lhs.y - rhs.y}; return res; } __device__ cfloat __cmulf(cfloat lhs, cfloat rhs) { cfloat out; out.x = lhs.x * rhs.x - lhs.y * rhs.y; out.y = lhs.x * rhs.y + lhs.y * rhs.x; return out; } __device__ cfloat __cdivf(cfloat lhs, cfloat rhs) { // Normalize by absolute value and multiply float rhs_abs = __cabsf(rhs); float inv_rhs_abs = 1.0f / rhs_abs; float rhs_x = inv_rhs_abs * rhs.x; float rhs_y = inv_rhs_abs * rhs.y; cfloat out = {lhs.x * rhs_x + lhs.y * rhs_y, lhs.y * rhs_x - lhs.x * rhs_y}; out.x *= inv_rhs_abs; out.y *= inv_rhs_abs; return out; } __device__ cfloat __cminf(cfloat lhs, cfloat rhs) { return __cabsf(lhs) < __cabsf(rhs) ? lhs : rhs; } __device__ cfloat __cmaxf(cfloat lhs, cfloat rhs) { return __cabsf(lhs) > __cabsf(rhs) ? lhs : rhs; } #define __candf(lhs, rhs) __cabsf(lhs) && __cabsf(rhs) #define __corf(lhs, rhs) __cabsf(lhs) || __cabsf(rhs) #define __ceqf(lhs, rhs) (((lhs).x == (rhs).x) && ((lhs).y == (rhs).y)) #define __cneqf(lhs, rhs) !__ceqf((lhs), (rhs)) #define __cltf(lhs, rhs) (__cabsf(lhs) < __cabsf(rhs)) #define __clef(lhs, rhs) (__cabsf(lhs) <= __cabsf(rhs)) #define __cgtf(lhs, rhs) (__cabsf(lhs) > __cabsf(rhs)) #define __cgef(lhs, rhs) (__cabsf(lhs) >= __cabsf(rhs)) #define __convert_cfloat(real) __cplx2f(real, 0) #define __convert_c2c(in) (in) #define __convert_z2c(in) __cplx2f((float)in.x, (float)in.y) // ---------------------------------------------- // COMPLEX DOUBLE OPERATIONS // ---------------------------------------------- #define __creal(in) ((in).x) #define __cimag(in) ((in).y) #define __cabs(in) hypot(in.x, in.y) __device__ cdouble __cplx2(double x, double y) { cdouble res = {x, y}; return res; } __device__ cdouble __cconj(cdouble in) { cdouble res = {in.x, -in.y}; return res; } __device__ cdouble __cadd(cdouble lhs, cdouble rhs) { cdouble res = {lhs.x + rhs.x, lhs.y + rhs.y}; return res; } __device__ cdouble __csub(cdouble lhs, cdouble rhs) { cdouble res = {lhs.x - rhs.x, lhs.y - rhs.y}; return res; } __device__ cdouble __cmul(cdouble lhs, cdouble rhs) { cdouble out; out.x = lhs.x * rhs.x - lhs.y * rhs.y; out.y = lhs.x * rhs.y + lhs.y * rhs.x; return out; } __device__ cdouble __cdiv(cdouble lhs, cdouble rhs) { // Normalize by absolute value and multiply double rhs_abs = __cabs(rhs); double inv_rhs_abs = 1.0 / rhs_abs; double rhs_x = inv_rhs_abs * rhs.x; double rhs_y = inv_rhs_abs * rhs.y; cdouble out = {lhs.x * rhs_x + lhs.y * rhs_y, lhs.y * rhs_x - lhs.x * rhs_y}; out.x *= inv_rhs_abs; out.y *= inv_rhs_abs; return out; } __device__ cdouble __cmin(cdouble lhs, cdouble rhs) { return __cabs(lhs) < __cabs(rhs) ? lhs : rhs; } __device__ cdouble __cmax(cdouble lhs, cdouble rhs) { return __cabs(lhs) > __cabs(rhs) ? lhs : rhs; } #define __cand(lhs, rhs) __cabs(lhs) && __cabs(rhs) #define __cor(lhs, rhs) __cabs(lhs) || __cabs(rhs) #define __ceq(lhs, rhs) (((lhs).x == (rhs).x) && ((lhs).y == (rhs).y)) #define __cneq(lhs, rhs) !__ceq((lhs), (rhs)) #define __clt(lhs, rhs) (__cabs(lhs) < __cabs(rhs)) #define __cle(lhs, rhs) (__cabs(lhs) <= __cabs(rhs)) #define __cgt(lhs, rhs) (__cabs(lhs) > __cabs(rhs)) #define __cge(lhs, rhs) (__cabs(lhs) >= __cabs(rhs)) #define __convert_cdouble(real) __cplx2(real, 0) #define __convert_z2z(in) (in) #define __convert_c2z(in) __cplx2((double)in.x, (double)in.y) template struct Param { T *ptr; dim_t dims[4]; dim_t strides[4]; }; extern "C" __global__ void KER15393086489977147794( float *in0_ptr, float *in1_ptr, float *in3_ptr, float *in6_ptr, float *in9_ptr, float *in12_ptr, float *in15_ptr, float *in18_ptr, float *in21_ptr, float *in24_ptr, float *in27_ptr, float *in30_ptr, float *in33_ptr, float *in36_ptr, float *in39_ptr, float *in42_ptr, float *in45_ptr, float *in48_ptr, float *in51_ptr, Param out53, uint blocks_x, uint blocks_y, uint blocks_x_total, uint num_odims) { Param outref = out53; for (int blockIdx_x = blockIdx.x; blockIdx_x < blocks_x_total; blockIdx_x += gridDim.x) { uint threadId = threadIdx.x; int idx = blockIdx_x * blockDim.x * blockDim.y + threadId; if (idx >= outref.dims[3] * outref.strides[3]) return; int idx0 = idx; int idx1 = idx; int idx3 = idx; int idx6 = idx; int idx9 = idx; int idx12 = idx; int idx15 = idx; int idx18 = idx; int idx21 = idx; int idx24 = idx; int idx27 = idx; int idx30 = idx; int idx33 = idx; int idx36 = idx; int idx39 = idx; int idx42 = idx; int idx45 = idx; int idx48 = idx; int idx51 = idx; float val0 = in0_ptr[idx0]; float val1 = in1_ptr[idx1]; float val2 = __add(val0, val1); float val3 = in3_ptr[idx3]; float val4 = __add(val1, val3); float val5 = __add(val2, val4); float val6 = in6_ptr[idx6]; float val7 = __add(val4, val6); float val8 = __add(val5, val7); float val9 = in9_ptr[idx9]; float val10 = __add(val7, val9); float val11 = __add(val8, val10); float val12 = in12_ptr[idx12]; float val13 = __add(val10, val12); float val14 = __add(val11, val13); float val15 = in15_ptr[idx15]; float val16 = __add(val13, val15); float val17 = __add(val14, val16); float val18 = in18_ptr[idx18]; float val19 = __add(val16, val18); float val20 = __add(val17, val19); float val21 = in21_ptr[idx21]; float val22 = __add(val19, val21); float val23 = __add(val20, val22); float val24 = in24_ptr[idx24]; float val25 = __add(val22, val24); float val26 = __add(val23, val25); float val27 = in27_ptr[idx27]; float val28 = __add(val25, val27); float val29 = __add(val26, val28); float val30 = in30_ptr[idx30]; float val31 = __add(val28, val30); float val32 = __add(val29, val31); float val33 = in33_ptr[idx33]; float val34 = __add(val31, val33); float val35 = __add(val32, val34); float val36 = in36_ptr[idx36]; float val37 = __add(val34, val36); float val38 = __add(val35, val37); float val39 = in39_ptr[idx39]; float val40 = __add(val37, val39); float val41 = __add(val38, val40); float val42 = in42_ptr[idx42]; float val43 = __add(val40, val42); float val44 = __add(val41, val43); float val45 = in45_ptr[idx45]; float val46 = __add(val43, val45); float val47 = __add(val44, val46); float val48 = in48_ptr[idx48]; float val49 = __add(val46, val48); float val50 = __add(val47, val49); float val51 = in51_ptr[idx51]; float val52 = __add(val49, val51); float val53 = __add(val50, val52); out53.ptr[idx] = val53; } } ----------------------------- num_options=3 compiler_options: [--gpu-architecture=compute_62] compiler_options: [--device-debug] compiler_options: [--generate-line-info] compiledPTX size 76581 PTX [// // Generated by NVIDIA NVVM Compiler // // Compiler Build ID: CL-23162084 // Cuda compilation tools, release 9.0, V9.0.252 // Based on LLVM 3.4svn // .version 6.0 .target sm_62, debug .address_size 64 // .globl _Z8__cplx2fff .func (.param .b32 func_retval0) hypotf ( .param .b32 hypotf_param_0, .param .b32 hypotf_param_1 ) ; .func (.param .b64 func_retval0) hypot ( .param .b64 hypot_param_0, .param .b64 hypot_param_1 ) ; .visible .func (.param .align 8 .b8 func_retval0[8]) _Z8__cplx2fff( .param .b32 _Z8__cplx2fff_param_0, .param .b32 _Z8__cplx2fff_param_1 ) { .local .align 8 .b8 __local_depot0[8]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<5>; .reg .b64 %rd<2>; .loc 1 68 1 func_begin0: .loc 1 0 0 .loc 1 68 1 mov.u64 %rd1, __local_depot0; cvta.local.u64 %SP, %rd1; ld.param.f32 %f1, [_Z8__cplx2fff_param_0]; ld.param.f32 %f2, [_Z8__cplx2fff_param_1]; tmp0: func_exec_begin0: .loc 1 70 12 st.f32 [%SP+0], %f1; st.f32 [%SP+4], %f2; .loc 1 71 5 ld.f32 %f3, [%SP+4]; ld.f32 %f4, [%SP+0]; st.param.f32 [func_retval0+0], %f4; st.param.f32 [func_retval0+4], %f3; ret; tmp1: func_end0: } // .globl _Z8__cconjf6float2 .visible .func (.param .align 8 .b8 func_retval0[8]) _Z8__cconjf6float2( .param .align 8 .b8 _Z8__cconjf6float2_param_0[8] ) { .local .align 8 .b8 __local_depot1[16]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<8>; .reg .b64 %rd<2>; .loc 1 74 1 func_begin1: .loc 1 0 0 .loc 1 74 1 mov.u64 %rd1, __local_depot1; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z8__cconjf6float2_param_0+4]; ld.param.f32 %f1, [_Z8__cconjf6float2_param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; tmp2: func_exec_begin1: .loc 1 76 12 ld.f32 %f3, [%SP+0]; st.f32 [%SP+8], %f3; ld.f32 %f4, [%SP+4]; neg.f32 %f5, %f4; st.f32 [%SP+12], %f5; .loc 1 77 5 ld.f32 %f6, [%SP+12]; ld.f32 %f7, [%SP+8]; st.param.f32 [func_retval0+0], %f7; st.param.f32 [func_retval0+4], %f6; ret; tmp3: func_end1: } // .globl _Z7__caddf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__caddf6float2S_( .param .align 8 .b8 _Z7__caddf6float2S__param_0[8], .param .align 8 .b8 _Z7__caddf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot2[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<13>; .reg .b64 %rd<2>; .loc 1 80 1 func_begin2: .loc 1 0 0 .loc 1 80 1 mov.u64 %rd1, __local_depot2; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__caddf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__caddf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__caddf6float2S__param_1]; ld.param.f32 %f1, [_Z7__caddf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp4: func_exec_begin2: .loc 1 82 12 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; add.f32 %f7, %f5, %f6; st.f32 [%SP+16], %f7; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; add.f32 %f10, %f8, %f9; st.f32 [%SP+20], %f10; .loc 1 83 5 ld.f32 %f11, [%SP+20]; ld.f32 %f12, [%SP+16]; st.param.f32 [func_retval0+0], %f12; st.param.f32 [func_retval0+4], %f11; ret; tmp5: func_end2: } // .globl _Z7__csubf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__csubf6float2S_( .param .align 8 .b8 _Z7__csubf6float2S__param_0[8], .param .align 8 .b8 _Z7__csubf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot3[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<13>; .reg .b64 %rd<2>; .loc 1 86 1 func_begin3: .loc 1 0 0 .loc 1 86 1 mov.u64 %rd1, __local_depot3; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__csubf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__csubf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__csubf6float2S__param_1]; ld.param.f32 %f1, [_Z7__csubf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp6: func_exec_begin3: .loc 1 88 12 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; sub.f32 %f7, %f5, %f6; st.f32 [%SP+16], %f7; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; sub.f32 %f10, %f8, %f9; st.f32 [%SP+20], %f10; .loc 1 89 5 ld.f32 %f11, [%SP+20]; ld.f32 %f12, [%SP+16]; st.param.f32 [func_retval0+0], %f12; st.param.f32 [func_retval0+4], %f11; ret; tmp7: func_end3: } // .globl _Z7__cmulf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cmulf6float2S_( .param .align 8 .b8 _Z7__cmulf6float2S__param_0[8], .param .align 8 .b8 _Z7__cmulf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot4[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<21>; .reg .b64 %rd<2>; .loc 1 92 1 func_begin4: .loc 1 0 0 .loc 1 92 1 mov.u64 %rd1, __local_depot4; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cmulf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cmulf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cmulf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cmulf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp8: func_exec_begin4: .loc 1 95 5 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; mul.f32 %f7, %f5, %f6; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; mul.f32 %f10, %f8, %f9; sub.f32 %f11, %f7, %f10; st.f32 [%SP+16], %f11; .loc 1 96 5 ld.f32 %f12, [%SP+0]; ld.f32 %f13, [%SP+12]; mul.f32 %f14, %f12, %f13; ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+8]; mul.f32 %f17, %f15, %f16; add.f32 %f18, %f14, %f17; st.f32 [%SP+20], %f18; .loc 1 97 5 ld.f32 %f19, [%SP+20]; ld.f32 %f20, [%SP+16]; st.param.f32 [func_retval0+0], %f20; st.param.f32 [func_retval0+4], %f19; ret; tmp9: func_end4: } // .globl _Z7__cdivf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cdivf6float2S_( .param .align 8 .b8 _Z7__cdivf6float2S__param_0[8], .param .align 8 .b8 _Z7__cdivf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot5[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<29>; .reg .b64 %rd<2>; .loc 1 100 1 func_begin5: .loc 1 0 0 .loc 1 100 1 mov.u64 %rd1, __local_depot5; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cdivf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cdivf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cdivf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cdivf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp10: func_exec_begin5: .loc 1 103 19 ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 103 21 // Callseq Start 20 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 20 tmp11: .loc 1 104 23 rcp.rn.f32 %f8, %f7; tmp12: .loc 1 105 17 ld.f32 %f9, [%SP+8]; mul.f32 %f10, %f8, %f9; tmp13: .loc 1 106 17 ld.f32 %f11, [%SP+12]; mul.f32 %f12, %f8, %f11; tmp14: .loc 1 107 12 ld.f32 %f13, [%SP+0]; mul.f32 %f14, %f13, %f10; ld.f32 %f15, [%SP+4]; mul.f32 %f16, %f15, %f12; add.f32 %f17, %f14, %f16; st.f32 [%SP+16], %f17; ld.f32 %f18, [%SP+4]; mul.f32 %f19, %f18, %f10; ld.f32 %f20, [%SP+0]; mul.f32 %f21, %f20, %f12; sub.f32 %f22, %f19, %f21; st.f32 [%SP+20], %f22; .loc 1 109 5 ld.f32 %f23, [%SP+16]; mul.f32 %f24, %f23, %f8; st.f32 [%SP+16], %f24; .loc 1 110 5 ld.f32 %f25, [%SP+20]; mul.f32 %f26, %f25, %f8; st.f32 [%SP+20], %f26; .loc 1 111 5 ld.f32 %f27, [%SP+20]; ld.f32 %f28, [%SP+16]; st.param.f32 [func_retval0+0], %f28; st.param.f32 [func_retval0+4], %f27; ret; tmp15: func_end5: } // .globl _Z7__cminf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cminf6float2S_( .param .align 8 .b8 _Z7__cminf6float2S__param_0[8], .param .align 8 .b8 _Z7__cminf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot6[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f32 %f<17>; .reg .b64 %rd<2>; .loc 1 114 1 func_begin6: .loc 1 0 0 .loc 1 114 1 mov.u64 %rd1, __local_depot6; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cminf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cminf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cminf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cminf6float2S__param_0]; st.f32 [%SP+12], %f2; st.f32 [%SP+8], %f1; st.f32 [%SP+20], %f4; st.f32 [%SP+16], %f3; func_exec_begin6: .loc 1 116 5 tmp16: ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 116 12 // Callseq Start 21 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 21 ld.f32 %f8, [%SP+16]; ld.f32 %f9, [%SP+20]; .loc 1 116 27 // Callseq Start 22 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f8; .param .b32 param1; st.param.f32 [param1+0], %f9; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f10, [retval0+0]; //{ }// Callseq End 22 setp.lt.f32 %p1, %f7, %f10; not.pred %p2, %p1; @%p2 bra BB6_2; bra.uni BB6_1; BB6_1: ld.f32 %f13, [%SP+8]; ld.f32 %f14, [%SP+12]; st.f32 [%SP+4], %f14; st.f32 [%SP+0], %f13; bra.uni BB6_3; BB6_2: ld.f32 %f11, [%SP+16]; ld.f32 %f12, [%SP+20]; st.f32 [%SP+4], %f12; st.f32 [%SP+0], %f11; BB6_3: ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+0]; st.param.f32 [func_retval0+0], %f16; st.param.f32 [func_retval0+4], %f15; ret; tmp17: func_end6: } // .globl _Z7__cmaxf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cmaxf6float2S_( .param .align 8 .b8 _Z7__cmaxf6float2S__param_0[8], .param .align 8 .b8 _Z7__cmaxf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot7[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f32 %f<17>; .reg .b64 %rd<2>; .loc 1 119 1 func_begin7: .loc 1 0 0 .loc 1 119 1 mov.u64 %rd1, __local_depot7; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cmaxf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cmaxf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cmaxf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cmaxf6float2S__param_0]; st.f32 [%SP+12], %f2; st.f32 [%SP+8], %f1; st.f32 [%SP+20], %f4; st.f32 [%SP+16], %f3; func_exec_begin7: .loc 1 121 5 tmp18: ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 121 12 // Callseq Start 23 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 23 ld.f32 %f8, [%SP+16]; ld.f32 %f9, [%SP+20]; .loc 1 121 27 // Callseq Start 24 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f8; .param .b32 param1; st.param.f32 [param1+0], %f9; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f10, [retval0+0]; //{ }// Callseq End 24 setp.gt.f32 %p1, %f7, %f10; not.pred %p2, %p1; @%p2 bra BB7_2; bra.uni BB7_1; BB7_1: ld.f32 %f13, [%SP+8]; ld.f32 %f14, [%SP+12]; st.f32 [%SP+4], %f14; st.f32 [%SP+0], %f13; bra.uni BB7_3; BB7_2: ld.f32 %f11, [%SP+16]; ld.f32 %f12, [%SP+20]; st.f32 [%SP+4], %f12; st.f32 [%SP+0], %f11; BB7_3: ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+0]; st.param.f32 [func_retval0+0], %f16; st.param.f32 [func_retval0+4], %f15; ret; tmp19: func_end7: } // .globl _Z7__cplx2dd .visible .func (.param .align 16 .b8 func_retval0[16]) _Z7__cplx2dd( .param .b64 _Z7__cplx2dd_param_0, .param .b64 _Z7__cplx2dd_param_1 ) { .local .align 16 .b8 __local_depot8[16]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<5>; .reg .b64 %rd<2>; .loc 1 142 1 func_begin8: .loc 1 0 0 .loc 1 142 1 mov.u64 %rd1, __local_depot8; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd1, [_Z7__cplx2dd_param_0]; ld.param.f64 %fd2, [_Z7__cplx2dd_param_1]; tmp20: func_exec_begin8: .loc 1 144 13 st.f64 [%SP+0], %fd1; st.f64 [%SP+8], %fd2; .loc 1 145 5 ld.f64 %fd3, [%SP+8]; ld.f64 %fd4, [%SP+0]; st.param.f64 [func_retval0+0], %fd4; st.param.f64 [func_retval0+8], %fd3; ret; tmp21: func_end8: } // .globl _Z7__cconj7double2 .visible .func (.param .align 16 .b8 func_retval0[16]) _Z7__cconj7double2( .param .align 16 .b8 _Z7__cconj7double2_param_0[16] ) { .local .align 16 .b8 __local_depot9[32]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<8>; .reg .b64 %rd<2>; .loc 1 148 1 func_begin9: .loc 1 0 0 .loc 1 148 1 mov.u64 %rd1, __local_depot9; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z7__cconj7double2_param_0+8]; ld.param.f64 %fd1, [_Z7__cconj7double2_param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; tmp22: func_exec_begin9: .loc 1 150 13 ld.f64 %fd3, [%SP+0]; st.f64 [%SP+16], %fd3; ld.f64 %fd4, [%SP+8]; neg.f64 %fd5, %fd4; st.f64 [%SP+24], %fd5; .loc 1 151 5 ld.f64 %fd6, [%SP+24]; ld.f64 %fd7, [%SP+16]; st.param.f64 [func_retval0+0], %fd7; st.param.f64 [func_retval0+8], %fd6; ret; tmp23: func_end9: } // .globl _Z6__cadd7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cadd7double2S_( .param .align 16 .b8 _Z6__cadd7double2S__param_0[16], .param .align 16 .b8 _Z6__cadd7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot10[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<13>; .reg .b64 %rd<2>; .loc 1 154 1 func_begin10: .loc 1 0 0 .loc 1 154 1 mov.u64 %rd1, __local_depot10; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cadd7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cadd7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cadd7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cadd7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp24: func_exec_begin10: .loc 1 156 13 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; add.f64 %fd7, %fd5, %fd6; st.f64 [%SP+32], %fd7; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; add.f64 %fd10, %fd8, %fd9; st.f64 [%SP+40], %fd10; .loc 1 157 5 ld.f64 %fd11, [%SP+40]; ld.f64 %fd12, [%SP+32]; st.param.f64 [func_retval0+0], %fd12; st.param.f64 [func_retval0+8], %fd11; ret; tmp25: func_end10: } // .globl _Z6__csub7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__csub7double2S_( .param .align 16 .b8 _Z6__csub7double2S__param_0[16], .param .align 16 .b8 _Z6__csub7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot11[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<13>; .reg .b64 %rd<2>; .loc 1 160 1 func_begin11: .loc 1 0 0 .loc 1 160 1 mov.u64 %rd1, __local_depot11; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__csub7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__csub7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__csub7double2S__param_1]; ld.param.f64 %fd1, [_Z6__csub7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp26: func_exec_begin11: .loc 1 162 13 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; sub.f64 %fd7, %fd5, %fd6; st.f64 [%SP+32], %fd7; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; sub.f64 %fd10, %fd8, %fd9; st.f64 [%SP+40], %fd10; .loc 1 163 5 ld.f64 %fd11, [%SP+40]; ld.f64 %fd12, [%SP+32]; st.param.f64 [func_retval0+0], %fd12; st.param.f64 [func_retval0+8], %fd11; ret; tmp27: func_end11: } // .globl _Z6__cmul7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmul7double2S_( .param .align 16 .b8 _Z6__cmul7double2S__param_0[16], .param .align 16 .b8 _Z6__cmul7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot12[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<21>; .reg .b64 %rd<2>; .loc 1 166 1 func_begin12: .loc 1 0 0 .loc 1 166 1 mov.u64 %rd1, __local_depot12; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmul7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmul7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmul7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmul7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp28: func_exec_begin12: .loc 1 169 5 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; mul.f64 %fd7, %fd5, %fd6; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; mul.f64 %fd10, %fd8, %fd9; sub.f64 %fd11, %fd7, %fd10; st.f64 [%SP+32], %fd11; .loc 1 170 5 ld.f64 %fd12, [%SP+0]; ld.f64 %fd13, [%SP+24]; mul.f64 %fd14, %fd12, %fd13; ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+16]; mul.f64 %fd17, %fd15, %fd16; add.f64 %fd18, %fd14, %fd17; st.f64 [%SP+40], %fd18; .loc 1 171 5 ld.f64 %fd19, [%SP+40]; ld.f64 %fd20, [%SP+32]; st.param.f64 [func_retval0+0], %fd20; st.param.f64 [func_retval0+8], %fd19; ret; tmp29: func_end12: } // .globl _Z6__cdiv7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cdiv7double2S_( .param .align 16 .b8 _Z6__cdiv7double2S__param_0[16], .param .align 16 .b8 _Z6__cdiv7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot13[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<29>; .reg .b64 %rd<2>; .loc 1 174 1 func_begin13: .loc 1 0 0 .loc 1 174 1 mov.u64 %rd1, __local_depot13; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cdiv7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cdiv7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cdiv7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cdiv7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp30: func_exec_begin13: .loc 1 177 20 ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 177 22 // Callseq Start 25 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 25 tmp31: .loc 1 178 24 rcp.rn.f64 %fd8, %fd7; tmp32: .loc 1 179 18 ld.f64 %fd9, [%SP+16]; mul.f64 %fd10, %fd8, %fd9; tmp33: .loc 1 180 18 ld.f64 %fd11, [%SP+24]; mul.f64 %fd12, %fd8, %fd11; tmp34: .loc 1 181 13 ld.f64 %fd13, [%SP+0]; mul.f64 %fd14, %fd13, %fd10; ld.f64 %fd15, [%SP+8]; mul.f64 %fd16, %fd15, %fd12; add.f64 %fd17, %fd14, %fd16; st.f64 [%SP+32], %fd17; ld.f64 %fd18, [%SP+8]; mul.f64 %fd19, %fd18, %fd10; ld.f64 %fd20, [%SP+0]; mul.f64 %fd21, %fd20, %fd12; sub.f64 %fd22, %fd19, %fd21; st.f64 [%SP+40], %fd22; .loc 1 183 5 ld.f64 %fd23, [%SP+32]; mul.f64 %fd24, %fd23, %fd8; st.f64 [%SP+32], %fd24; .loc 1 184 5 ld.f64 %fd25, [%SP+40]; mul.f64 %fd26, %fd25, %fd8; st.f64 [%SP+40], %fd26; .loc 1 185 5 ld.f64 %fd27, [%SP+40]; ld.f64 %fd28, [%SP+32]; st.param.f64 [func_retval0+0], %fd28; st.param.f64 [func_retval0+8], %fd27; ret; tmp35: func_end13: } // .globl _Z6__cmin7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmin7double2S_( .param .align 16 .b8 _Z6__cmin7double2S__param_0[16], .param .align 16 .b8 _Z6__cmin7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot14[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f64 %fd<17>; .reg .b64 %rd<2>; .loc 1 188 1 func_begin14: .loc 1 0 0 .loc 1 188 1 mov.u64 %rd1, __local_depot14; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmin7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmin7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmin7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmin7double2S__param_0]; st.f64 [%SP+24], %fd2; st.f64 [%SP+16], %fd1; st.f64 [%SP+40], %fd4; st.f64 [%SP+32], %fd3; func_exec_begin14: .loc 1 190 5 tmp36: ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 190 12 // Callseq Start 26 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 26 ld.f64 %fd8, [%SP+32]; ld.f64 %fd9, [%SP+40]; .loc 1 190 26 // Callseq Start 27 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd8; .param .b64 param1; st.param.f64 [param1+0], %fd9; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd10, [retval0+0]; //{ }// Callseq End 27 setp.lt.f64 %p1, %fd7, %fd10; not.pred %p2, %p1; @%p2 bra BB14_2; bra.uni BB14_1; BB14_1: ld.f64 %fd13, [%SP+16]; ld.f64 %fd14, [%SP+24]; st.f64 [%SP+8], %fd14; st.f64 [%SP+0], %fd13; bra.uni BB14_3; BB14_2: ld.f64 %fd11, [%SP+32]; ld.f64 %fd12, [%SP+40]; st.f64 [%SP+8], %fd12; st.f64 [%SP+0], %fd11; BB14_3: ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+0]; st.param.f64 [func_retval0+0], %fd16; st.param.f64 [func_retval0+8], %fd15; ret; tmp37: func_end14: } // .globl _Z6__cmax7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmax7double2S_( .param .align 16 .b8 _Z6__cmax7double2S__param_0[16], .param .align 16 .b8 _Z6__cmax7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot15[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f64 %fd<17>; .reg .b64 %rd<2>; .loc 1 193 1 func_begin15: .loc 1 0 0 .loc 1 193 1 mov.u64 %rd1, __local_depot15; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmax7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmax7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmax7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmax7double2S__param_0]; st.f64 [%SP+24], %fd2; st.f64 [%SP+16], %fd1; st.f64 [%SP+40], %fd4; st.f64 [%SP+32], %fd3; func_exec_begin15: .loc 1 195 5 tmp38: ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 195 12 // Callseq Start 28 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 28 ld.f64 %fd8, [%SP+32]; ld.f64 %fd9, [%SP+40]; .loc 1 195 26 // Callseq Start 29 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd8; .param .b64 param1; st.param.f64 [param1+0], %fd9; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd10, [retval0+0]; //{ }// Callseq End 29 setp.gt.f64 %p1, %fd7, %fd10; not.pred %p2, %p1; @%p2 bra BB15_2; bra.uni BB15_1; BB15_1: ld.f64 %fd13, [%SP+16]; ld.f64 %fd14, [%SP+24]; st.f64 [%SP+8], %fd14; st.f64 [%SP+0], %fd13; bra.uni BB15_3; BB15_2: ld.f64 %fd11, [%SP+32]; ld.f64 %fd12, [%SP+40]; st.f64 [%SP+8], %fd12; st.f64 [%SP+0], %fd11; BB15_3: ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+0]; st.param.f64 [func_retval0+0], %fd16; st.param.f64 [func_retval0+8], %fd15; ret; tmp39: func_end15: } // .globl KER15393086489977147794 .visible .entry KER15393086489977147794( .param .u64 KER15393086489977147794_param_0, .param .u64 KER15393086489977147794_param_1, .param .u64 KER15393086489977147794_param_2, .param .u64 KER15393086489977147794_param_3, .param .u64 KER15393086489977147794_param_4, .param .u64 KER15393086489977147794_param_5, .param .u64 KER15393086489977147794_param_6, .param .u64 KER15393086489977147794_param_7, .param .u64 KER15393086489977147794_param_8, .param .u64 KER15393086489977147794_param_9, .param .u64 KER15393086489977147794_param_10, .param .u64 KER15393086489977147794_param_11, .param .u64 KER15393086489977147794_param_12, .param .u64 KER15393086489977147794_param_13, .param .u64 KER15393086489977147794_param_14, .param .u64 KER15393086489977147794_param_15, .param .u64 KER15393086489977147794_param_16, .param .u64 KER15393086489977147794_param_17, .param .u64 KER15393086489977147794_param_18, .param .align 8 .b8 KER15393086489977147794_param_19[72], .param .u32 KER15393086489977147794_param_20, .param .u32 KER15393086489977147794_param_21, .param .u32 KER15393086489977147794_param_22, .param .u32 KER15393086489977147794_param_23 ) { .local .align 8 .b8 __local_depot16[144]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<5>; .reg .f32 %f<74>; .reg .b32 %r<40>; .reg .b64 %rd<107>; .loc 1 220 1 func_begin16: .loc 1 0 0 .loc 1 220 1 mov.u64 %rd106, __local_depot16; cvta.local.u64 %SP, %rd106; ld.param.u64 %rd1, [KER15393086489977147794_param_0]; ld.param.u64 %rd2, [KER15393086489977147794_param_1]; ld.param.u64 %rd3, [KER15393086489977147794_param_2]; ld.param.u64 %rd4, [KER15393086489977147794_param_3]; ld.param.u64 %rd5, [KER15393086489977147794_param_4]; ld.param.u64 %rd6, [KER15393086489977147794_param_5]; ld.param.u64 %rd7, [KER15393086489977147794_param_6]; ld.param.u64 %rd8, [KER15393086489977147794_param_7]; ld.param.u64 %rd9, [KER15393086489977147794_param_8]; ld.param.u64 %rd10, [KER15393086489977147794_param_9]; ld.param.u64 %rd11, [KER15393086489977147794_param_10]; ld.param.u64 %rd12, [KER15393086489977147794_param_11]; ld.param.u64 %rd13, [KER15393086489977147794_param_12]; ld.param.u64 %rd14, [KER15393086489977147794_param_13]; ld.param.u64 %rd15, [KER15393086489977147794_param_14]; ld.param.u64 %rd16, [KER15393086489977147794_param_15]; ld.param.u64 %rd17, [KER15393086489977147794_param_16]; ld.param.u64 %rd18, [KER15393086489977147794_param_17]; ld.param.u64 %rd19, [KER15393086489977147794_param_18]; ld.param.u64 %rd21, [KER15393086489977147794_param_19+8]; ld.param.u64 %rd22, [KER15393086489977147794_param_19+16]; ld.param.u64 %rd23, [KER15393086489977147794_param_19+24]; ld.param.u64 %rd24, [KER15393086489977147794_param_19+32]; ld.param.u64 %rd25, [KER15393086489977147794_param_19+40]; ld.param.u64 %rd26, [KER15393086489977147794_param_19+48]; ld.param.u64 %rd27, [KER15393086489977147794_param_19+56]; ld.param.u64 %rd28, [KER15393086489977147794_param_19+64]; ld.param.u32 %r5, [KER15393086489977147794_param_20]; ld.param.u32 %r6, [KER15393086489977147794_param_21]; ld.param.u32 %r7, [KER15393086489977147794_param_22]; ld.param.u32 %r8, [KER15393086489977147794_param_23]; ld.param.u64 %rd20, [KER15393086489977147794_param_19]; st.u64 [%SP+64], %rd28; st.u64 [%SP+56], %rd27; st.u64 [%SP+48], %rd26; st.u64 [%SP+40], %rd25; st.u64 [%SP+32], %rd24; st.u64 [%SP+24], %rd23; st.u64 [%SP+16], %rd22; st.u64 [%SP+8], %rd21; st.u64 [%SP+0], %rd20; mov.b32 %r9, %r5; mov.b32 %r10, %r6; mov.b32 %r11, %r8; tmp40: func_exec_begin16: .loc 1 244 21 ld.u64 %rd29, [%SP+0]; ld.u64 %rd30, [%SP+8]; ld.u64 %rd31, [%SP+16]; ld.u64 %rd32, [%SP+24]; ld.u64 %rd33, [%SP+32]; ld.u64 %rd34, [%SP+40]; ld.u64 %rd35, [%SP+48]; ld.u64 %rd36, [%SP+56]; ld.u64 %rd37, [%SP+64]; st.u64 [%SP+136], %rd37; st.u64 [%SP+128], %rd36; st.u64 [%SP+120], %rd35; st.u64 [%SP+112], %rd34; st.u64 [%SP+104], %rd33; st.u64 [%SP+96], %rd32; st.u64 [%SP+88], %rd31; st.u64 [%SP+80], %rd30; st.u64 [%SP+72], %rd29; .loc 1 246 25 tmp41: mov.u32 %r12, %ctaid.x; mov.b32 %r1, %r12; tmp42: mov.u32 %r39, %r1; tmp43: BB16_1: .loc 1 246 5 mov.u32 %r2, %r39; tmp44: setp.lt.u32 %p1, %r2, %r7; not.pred %p2, %p1; @%p2 bra BB16_6; bra.uni BB16_2; BB16_2: .loc 1 248 23 tmp45: mov.u32 %r13, %tid.x; mov.b32 %r14, %r13; tmp46: .loc 1 249 17 mov.u32 %r15, %ntid.x; mul.lo.s32 %r16, %r2, %r15; mov.u32 %r17, %ntid.y; mul.lo.s32 %r18, %r16, %r17; add.s32 %r3, %r18, %r14; tmp47: .loc 1 250 9 cvt.s64.s32 %rd38, %r3; add.u64 %rd39, %SP, 72; add.s64 %rd40, %rd39, 8; ld.u64 %rd41, [%rd40+24]; add.s64 %rd42, %rd39, 40; ld.u64 %rd43, [%rd42+24]; mul.lo.s64 %rd44, %rd41, %rd43; setp.ge.s64 %p3, %rd38, %rd44; not.pred %p4, %p3; @%p4 bra BB16_4; bra.uni BB16_3; BB16_3: .loc 1 250 56 tmp48: bra.uni BB16_7; tmp49: BB16_4: .loc 1 251 18 mov.b32 %r19, %r3; tmp50: .loc 1 252 10 mov.b32 %r20, %r3; tmp51: .loc 1 253 10 mov.b32 %r21, %r3; tmp52: .loc 1 254 10 mov.b32 %r22, %r3; tmp53: .loc 1 255 10 mov.b32 %r23, %r3; tmp54: .loc 1 256 11 mov.b32 %r24, %r3; tmp55: .loc 1 257 11 mov.b32 %r25, %r3; tmp56: .loc 1 258 11 mov.b32 %r26, %r3; tmp57: .loc 1 259 11 mov.b32 %r27, %r3; tmp58: .loc 1 260 11 mov.b32 %r28, %r3; tmp59: .loc 1 261 11 mov.b32 %r29, %r3; tmp60: .loc 1 262 11 mov.b32 %r30, %r3; tmp61: .loc 1 263 11 mov.b32 %r31, %r3; tmp62: .loc 1 264 11 mov.b32 %r32, %r3; tmp63: .loc 1 265 11 mov.b32 %r33, %r3; tmp64: .loc 1 266 11 mov.b32 %r34, %r3; tmp65: .loc 1 267 11 mov.b32 %r35, %r3; tmp66: .loc 1 268 11 mov.b32 %r36, %r3; tmp67: .loc 1 269 11 mov.b32 %r37, %r3; tmp68: .loc 1 270 12 cvt.s64.s32 %rd45, %r19; shl.b64 %rd46, %rd45, 2; add.s64 %rd47, %rd1, %rd46; ld.f32 %f1, [%rd47]; mov.f32 %f2, %f1; tmp69: .loc 1 271 12 cvt.s64.s32 %rd48, %r20; shl.b64 %rd49, %rd48, 2; add.s64 %rd50, %rd2, %rd49; ld.f32 %f3, [%rd50]; mov.f32 %f4, %f3; tmp70: .loc 1 272 12 add.f32 %f5, %f2, %f4; tmp71: .loc 1 273 12 cvt.s64.s32 %rd51, %r21; shl.b64 %rd52, %rd51, 2; add.s64 %rd53, %rd3, %rd52; ld.f32 %f6, [%rd53]; mov.f32 %f7, %f6; tmp72: .loc 1 274 12 add.f32 %f8, %f4, %f7; tmp73: .loc 1 275 12 add.f32 %f9, %f5, %f8; tmp74: .loc 1 276 12 cvt.s64.s32 %rd54, %r22; shl.b64 %rd55, %rd54, 2; add.s64 %rd56, %rd4, %rd55; ld.f32 %f10, [%rd56]; mov.f32 %f11, %f10; tmp75: .loc 1 277 12 add.f32 %f12, %f8, %f11; tmp76: .loc 1 278 12 add.f32 %f13, %f9, %f12; tmp77: .loc 1 279 12 cvt.s64.s32 %rd57, %r23; shl.b64 %rd58, %rd57, 2; add.s64 %rd59, %rd5, %rd58; ld.f32 %f14, [%rd59]; mov.f32 %f15, %f14; tmp78: .loc 1 280 13 add.f32 %f16, %f12, %f15; tmp79: .loc 1 281 13 add.f32 %f17, %f13, %f16; tmp80: .loc 1 282 13 cvt.s64.s32 %rd60, %r24; shl.b64 %rd61, %rd60, 2; add.s64 %rd62, %rd6, %rd61; ld.f32 %f18, [%rd62]; mov.f32 %f19, %f18; tmp81: .loc 1 283 13 add.f32 %f20, %f16, %f19; tmp82: .loc 1 284 13 add.f32 %f21, %f17, %f20; tmp83: .loc 1 285 13 cvt.s64.s32 %rd63, %r25; shl.b64 %rd64, %rd63, 2; add.s64 %rd65, %rd7, %rd64; ld.f32 %f22, [%rd65]; mov.f32 %f23, %f22; tmp84: .loc 1 286 13 add.f32 %f24, %f20, %f23; tmp85: .loc 1 287 13 add.f32 %f25, %f21, %f24; tmp86: .loc 1 288 13 cvt.s64.s32 %rd66, %r26; shl.b64 %rd67, %rd66, 2; add.s64 %rd68, %rd8, %rd67; ld.f32 %f26, [%rd68]; mov.f32 %f27, %f26; tmp87: .loc 1 289 13 add.f32 %f28, %f24, %f27; tmp88: .loc 1 290 13 add.f32 %f29, %f25, %f28; tmp89: .loc 1 291 13 cvt.s64.s32 %rd69, %r27; shl.b64 %rd70, %rd69, 2; add.s64 %rd71, %rd9, %rd70; ld.f32 %f30, [%rd71]; mov.f32 %f31, %f30; tmp90: .loc 1 292 13 add.f32 %f32, %f28, %f31; tmp91: .loc 1 293 13 add.f32 %f33, %f29, %f32; tmp92: .loc 1 294 13 cvt.s64.s32 %rd72, %r28; shl.b64 %rd73, %rd72, 2; add.s64 %rd74, %rd10, %rd73; ld.f32 %f34, [%rd74]; mov.f32 %f35, %f34; tmp93: .loc 1 295 13 add.f32 %f36, %f32, %f35; tmp94: .loc 1 296 13 add.f32 %f37, %f33, %f36; tmp95: .loc 1 297 13 cvt.s64.s32 %rd75, %r29; shl.b64 %rd76, %rd75, 2; add.s64 %rd77, %rd11, %rd76; ld.f32 %f38, [%rd77]; mov.f32 %f39, %f38; tmp96: .loc 1 298 13 add.f32 %f40, %f36, %f39; tmp97: .loc 1 299 13 add.f32 %f41, %f37, %f40; tmp98: .loc 1 300 13 cvt.s64.s32 %rd78, %r30; shl.b64 %rd79, %rd78, 2; add.s64 %rd80, %rd12, %rd79; ld.f32 %f42, [%rd80]; mov.f32 %f43, %f42; tmp99: .loc 1 301 13 add.f32 %f44, %f40, %f43; tmp100: .loc 1 302 13 add.f32 %f45, %f41, %f44; tmp101: .loc 1 303 13 cvt.s64.s32 %rd81, %r31; shl.b64 %rd82, %rd81, 2; add.s64 %rd83, %rd13, %rd82; ld.f32 %f46, [%rd83]; mov.f32 %f47, %f46; tmp102: .loc 1 304 13 add.f32 %f48, %f44, %f47; tmp103: .loc 1 305 13 add.f32 %f49, %f45, %f48; tmp104: .loc 1 306 13 cvt.s64.s32 %rd84, %r32; shl.b64 %rd85, %rd84, 2; add.s64 %rd86, %rd14, %rd85; ld.f32 %f50, [%rd86]; mov.f32 %f51, %f50; tmp105: .loc 1 307 13 add.f32 %f52, %f48, %f51; tmp106: .loc 1 308 13 add.f32 %f53, %f49, %f52; tmp107: .loc 1 309 13 cvt.s64.s32 %rd87, %r33; shl.b64 %rd88, %rd87, 2; add.s64 %rd89, %rd15, %rd88; ld.f32 %f54, [%rd89]; mov.f32 %f55, %f54; tmp108: .loc 1 310 13 add.f32 %f56, %f52, %f55; tmp109: .loc 1 311 13 add.f32 %f57, %f53, %f56; tmp110: .loc 1 312 13 cvt.s64.s32 %rd90, %r34; shl.b64 %rd91, %rd90, 2; add.s64 %rd92, %rd16, %rd91; ld.f32 %f58, [%rd92]; mov.f32 %f59, %f58; tmp111: .loc 1 313 13 add.f32 %f60, %f56, %f59; tmp112: .loc 1 314 13 add.f32 %f61, %f57, %f60; tmp113: .loc 1 315 13 cvt.s64.s32 %rd93, %r35; shl.b64 %rd94, %rd93, 2; add.s64 %rd95, %rd17, %rd94; ld.f32 %f62, [%rd95]; mov.f32 %f63, %f62; tmp114: .loc 1 316 13 add.f32 %f64, %f60, %f63; tmp115: .loc 1 317 13 add.f32 %f65, %f61, %f64; tmp116: .loc 1 318 13 cvt.s64.s32 %rd96, %r36; shl.b64 %rd97, %rd96, 2; add.s64 %rd98, %rd18, %rd97; ld.f32 %f66, [%rd98]; mov.f32 %f67, %f66; tmp117: .loc 1 319 13 add.f32 %f68, %f64, %f67; tmp118: .loc 1 320 13 add.f32 %f69, %f65, %f68; tmp119: .loc 1 321 13 cvt.s64.s32 %rd99, %r37; shl.b64 %rd100, %rd99, 2; add.s64 %rd101, %rd19, %rd100; ld.f32 %f70, [%rd101]; mov.f32 %f71, %f70; tmp120: .loc 1 322 13 add.f32 %f72, %f68, %f71; tmp121: .loc 1 323 13 add.f32 %f73, %f69, %f72; tmp122: .loc 1 324 1 ld.u64 %rd102, [%SP+0]; cvt.s64.s32 %rd103, %r3; shl.b64 %rd104, %rd103, 2; add.s64 %rd105, %rd102, %rd104; st.f32 [%rd105], %f73; tmp123: .loc 1 246 68 mov.u32 %r38, %nctaid.x; add.s32 %r4, %r2, %r38; tmp124: mov.u32 %r39, %r4; tmp125: bra.uni BB16_1; tmp126: BB16_6: BB16_7: .loc 1 329 1 ret; tmp127: func_end16: } .func (.param .b32 func_retval0) hypotf( .param .b32 hypotf_param_0, .param .b32 hypotf_param_1 ) { .reg .pred %p<5>; .reg .f32 %f<20>; .reg .b32 %r<13>; ld.param.f32 %f7, [hypotf_param_0]; ld.param.f32 %f8, [hypotf_param_1]; abs.f32 %f9, %f7; abs.f32 %f10, %f8; mov.b32 %r1, %f10; mov.b32 %r2, %f9; min.s32 %r3, %r1, %r2; mov.b32 %f1, %r3; mov.b32 %r4, %f9; mov.b32 %r5, %f10; max.s32 %r6, %r4, %r5; mov.b32 %f2, %r6; and.b32 %r7, %r6, -33554432; sub.s32 %r8, %r7, 1065353216; add.s32 %r9, %r8, 8388608; mov.u32 %r10, 1065353216; sub.s32 %r11, %r10, %r9; mov.b32 %f11, %r11; mul.f32 %f12, %f1, %f11; mul.f32 %f13, %f2, %f11; mul.f32 %f14, %f12, %f12; fma.rn.f32 %f15, %f13, %f13, %f14; sqrt.rn.f32 %f16, %f15; add.s32 %r12, %r9, 1065353216; mov.b32 %f17, %r12; mul.f32 %f3, %f16, %f17; setp.eq.f32 %p1, %f1, 0f00000000; not.pred %p2, %p1; mov.f32 %f18, %f3; @%p2 bra BB17_2; bra.uni BB17_1; BB17_1: mov.f32 %f18, %f2; BB17_2: mov.f32 %f4, %f18; setp.eq.f32 %p3, %f1, 0f7F800000; not.pred %p4, %p3; mov.f32 %f19, %f4; @%p4 bra BB17_4; bra.uni BB17_3; BB17_3: mov.f32 %f5, 0f7F800000; mov.f32 %f19, %f5; BB17_4: mov.f32 %f6, %f19; st.param.f32 [func_retval0+0], %f6; ret; } .func (.param .b64 func_retval0) hypot( .param .b64 hypot_param_0, .param .b64 hypot_param_1 ) { .reg .pred %p<5>; .reg .b32 %r<11>; .reg .f64 %fd<32>; .reg .b64 %rd<7>; ld.param.f64 %fd6, [hypot_param_0]; ld.param.f64 %fd7, [hypot_param_1]; abs.f64 %fd10, %fd6; abs.f64 %fd11, %fd7; mov.b64 %rd1, %fd11; mov.b64 %rd2, %fd10; min.u64 %rd3, %rd1, %rd2; mov.b64 %fd1, %rd3; mov.b64 %rd4, %fd10; mov.b64 %rd5, %fd11; max.u64 %rd6, %rd4, %rd5; mov.b64 %fd2, %rd6; { .reg .b32 %temp; mov.b64 {%temp, %r1}, %fd2; } and.b32 %r2, %r1, -4194304; sub.s32 %r3, %r2, 1072693248; add.s32 %r4, %r3, 1048576; mov.u32 %r5, 1072693248; sub.s32 %r6, %r5, %r4; mov.u32 %r7, 0; mov.b64 %fd12, {%r7, %r6}; mul.f64 %fd13, %fd1, %fd12; mul.f64 %fd14, %fd2, %fd12; mul.f64 %fd15, %fd13, %fd13; fma.rn.f64 %fd16, %fd14, %fd14, %fd15; mov.f64 %fd17, 0d7FEFFFFFFFFFFFFF; min.f64 %fd9, %fd16, %fd17; // inline asm rsqrt.approx.ftz.f64 %fd8, %fd9; // inline asm mul.rn.f64 %fd18, %fd8, %fd8; neg.f64 %fd19, %fd18; mov.f64 %fd20, 0d3FF0000000000000; fma.rn.f64 %fd21, %fd9, %fd19, %fd20; mov.f64 %fd22, 0d3FE0000000000000; mov.f64 %fd23, 0d3FD8000000000000; fma.rn.f64 %fd24, %fd23, %fd21, %fd22; mul.rn.f64 %fd25, %fd21, %fd8; fma.rn.f64 %fd26, %fd24, %fd25, %fd8; mul.f64 %fd27, %fd16, %fd26; add.s32 %r8, %r4, 1072693248; mov.b64 %fd28, {%r7, %r8}; mul.f64 %fd3, %fd27, %fd28; setp.eq.f64 %p1, %fd1, 0d0000000000000000; not.pred %p2, %p1; mov.f64 %fd30, %fd3; @%p2 bra BB18_2; bra.uni BB18_1; BB18_1: mov.f64 %fd30, %fd2; BB18_2: mov.f64 %fd4, %fd30; { .reg .b32 %temp; mov.b64 {%temp, %r9}, %fd1; } mov.f64 %fd29, 0d7FF0000000000000; { .reg .b32 %temp; mov.b64 {%temp, %r10}, %fd29; } setp.ge.u32 %p3, %r9, %r10; not.pred %p4, %p3; mov.f64 %fd31, %fd4; @%p4 bra BB18_4; bra.uni BB18_3; BB18_3: mov.f64 %fd31, %fd1; BB18_4: mov.f64 %fd5, %fd31; st.param.f64 [func_retval0+0], %fd5; ret; } .file 1 "/media/nvidia/Data/arrayfire/github/build/TX2-R28.2-DP_Debug/KER15393086489977147794" .file 2 "/media/nvidia/Data/arrayfire/github/build/TX2-R28.2-DP_Debug/__nv_nvrtc_builtin_header.h" .section .debug_info { .b32 6354 .b8 2 .b8 0 .b32 .debug_abbrev .b8 8 .b8 1 .b8 108 .b8 103 .b8 101 .b8 110 .b8 102 .b8 101 .b8 58 .b8 32 .b8 69 .b8 68 .b8 71 .b8 32 .b8 52 .b8 46 .b8 49 .b8 50 .b8 0 .b8 4 .b8 75 .b8 69 .b8 82 .b8 49 .b8 53 .b8 51 .b8 57 .b8 51 .b8 48 .b8 56 .b8 54 .b8 52 .b8 56 .b8 57 .b8 57 .b8 55 .b8 55 .b8 49 .b8 52 .b8 55 .b8 55 .b8 57 .b8 52 .b8 0 .b64 0 .b32 .debug_line .b8 47 .b8 109 .b8 101 .b8 100 .b8 105 .b8 97 .b8 47 .b8 110 .b8 118 .b8 105 .b8 100 .b8 105 .b8 97 .b8 47 .b8 68 .b8 97 .b8 116 .b8 97 .b8 47 .b8 97 .b8 114 .b8 114 .b8 97 .b8 121 .b8 102 .b8 105 .b8 114 .b8 101 .b8 47 .b8 103 .b8 105 .b8 116 .b8 104 .b8 117 .b8 98 .b8 47 .b8 98 .b8 117 .b8 105 .b8 108 .b8 100 .b8 47 .b8 84 .b8 88 .b8 50 .b8 45 .b8 82 .b8 50 .b8 56 .b8 46 .b8 50 .b8 45 .b8 68 .b8 80 .b8 95 .b8 68 .b8 101 .b8 98 .b8 117 .b8 103 .b8 0 .b8 2 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b32 1 .b32 68 .b32 280 .b8 1 .b64 func_begin0 .b64 func_end0 .b8 1 .b8 156 .b8 3 .b8 120 .b8 0 .b32 1 .b32 68 .b32 379 .b8 5 .b8 144 .b8 177 .b8 204 .b8 149 .b8 1 .b8 2 .b8 3 .b8 121 .b8 0 .b32 1 .b32 68 .b32 379 .b8 5 .b8 144 .b8 178 .b8 204 .b8 149 .b8 1 .b8 2 .b8 4 .b64 tmp0 .b64 tmp1 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 70 .b32 280 .b8 11 .b8 3 .b64 __local_depot0 .b8 35 .b8 0 .b8 6 .b8 0 .b8 0 .b8 6 .b32 292 .b8 99 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 0 .b8 6 .b32 312 .b8 99 .b8 117 .b8 70 .b8 108 .b8 111 .b8 97 .b8 116 .b8 67 .b8 111 .b8 109 .b8 112 .b8 108 .b8 101 .b8 120 .b8 0 .b8 6 .b32 324 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b8 7 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 8 .b32 2 .b32 728 .b8 8 .b8 120 .b8 0 .b32 379 .b32 2 .b32 728 .b8 0 .b8 1 .b8 8 .b8 121 .b8 0 .b32 379 .b32 2 .b32 728 .b8 4 .b8 1 .b8 0 .b8 9 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 0 .b8 4 .b32 4 .b8 2 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 1 .b32 74 .b32 280 .b8 1 .b64 func_begin1 .b64 func_end1 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 0 .b32 1 .b32 74 .b32 280 .b8 11 .b8 3 .b64 __local_depot1 .b8 35 .b8 0 .b8 6 .b8 4 .b64 tmp2 .b64 tmp3 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 76 .b32 280 .b8 11 .b8 3 .b64 __local_depot1 .b8 35 .b8 8 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 80 .b32 280 .b8 1 .b64 func_begin2 .b64 func_end2 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 80 .b32 280 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 80 .b32 280 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp4 .b64 tmp5 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 82 .b32 280 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 86 .b32 280 .b8 1 .b64 func_begin3 .b64 func_end3 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 86 .b32 280 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 86 .b32 280 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp6 .b64 tmp7 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 88 .b32 280 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 92 .b32 280 .b8 1 .b64 func_begin4 .b64 func_end4 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 92 .b32 280 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 92 .b32 280 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp8 .b64 tmp9 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 94 .b32 280 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 100 .b32 280 .b8 1 .b64 func_begin5 .b64 func_end5 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 100 .b32 280 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 100 .b32 280 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp10 .b64 tmp15 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 107 .b32 280 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 16 .b8 6 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 103 .b32 379 .b8 5 .b8 144 .b8 183 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 105 .b8 110 .b8 118 .b8 95 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 104 .b32 379 .b8 5 .b8 144 .b8 184 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 105 .b32 379 .b8 6 .b8 144 .b8 176 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 106 .b32 379 .b8 6 .b8 144 .b8 178 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 114 .b32 280 .b8 1 .b64 func_begin6 .b64 func_end6 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 114 .b32 280 .b8 11 .b8 3 .b64 __local_depot6 .b8 35 .b8 8 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 114 .b32 280 .b8 11 .b8 3 .b64 __local_depot6 .b8 35 .b8 16 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 119 .b32 280 .b8 1 .b64 func_begin7 .b64 func_end7 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 119 .b32 280 .b8 11 .b8 3 .b64 __local_depot7 .b8 35 .b8 8 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 119 .b32 280 .b8 11 .b8 3 .b64 __local_depot7 .b8 35 .b8 16 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b32 1 .b32 142 .b32 1796 .b8 1 .b64 func_begin8 .b64 func_end8 .b8 1 .b8 156 .b8 3 .b8 120 .b8 0 .b32 1 .b32 142 .b32 1899 .b8 6 .b8 144 .b8 177 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 3 .b8 121 .b8 0 .b32 1 .b32 142 .b32 1899 .b8 6 .b8 144 .b8 178 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 4 .b64 tmp20 .b64 tmp21 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 144 .b32 1796 .b8 11 .b8 3 .b64 __local_depot8 .b8 35 .b8 0 .b8 6 .b8 0 .b8 0 .b8 6 .b32 1809 .b8 99 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 0 .b8 6 .b32 1830 .b8 99 .b8 117 .b8 68 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 67 .b8 111 .b8 109 .b8 112 .b8 108 .b8 101 .b8 120 .b8 0 .b8 6 .b32 1843 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b8 7 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 16 .b32 2 .b32 774 .b8 8 .b8 120 .b8 0 .b32 1899 .b32 2 .b32 776 .b8 0 .b8 1 .b8 8 .b8 121 .b8 0 .b32 1899 .b32 2 .b32 776 .b8 8 .b8 1 .b8 0 .b8 9 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 0 .b8 4 .b32 8 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 1 .b32 148 .b32 1796 .b8 1 .b64 func_begin9 .b64 func_end9 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 0 .b32 1 .b32 148 .b32 1796 .b8 11 .b8 3 .b64 __local_depot9 .b8 35 .b8 0 .b8 6 .b8 4 .b64 tmp22 .b64 tmp23 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 150 .b32 1796 .b8 11 .b8 3 .b64 __local_depot9 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 154 .b32 1796 .b8 1 .b64 func_begin10 .b64 func_end10 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 154 .b32 1796 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 154 .b32 1796 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp24 .b64 tmp25 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 156 .b32 1796 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 160 .b32 1796 .b8 1 .b64 func_begin11 .b64 func_end11 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 160 .b32 1796 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 160 .b32 1796 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp26 .b64 tmp27 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 162 .b32 1796 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 166 .b32 1796 .b8 1 .b64 func_begin12 .b64 func_end12 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 166 .b32 1796 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 166 .b32 1796 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp28 .b64 tmp29 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 168 .b32 1796 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 174 .b32 1796 .b8 1 .b64 func_begin13 .b64 func_end13 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 174 .b32 1796 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 174 .b32 1796 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp30 .b64 tmp35 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 181 .b32 1796 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 32 .b8 6 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 177 .b32 1899 .b8 6 .b8 144 .b8 183 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 110 .b8 118 .b8 95 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 178 .b32 1899 .b8 6 .b8 144 .b8 184 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 179 .b32 1899 .b8 7 .b8 144 .b8 176 .b8 226 .b8 144 .b8 179 .b8 214 .b8 4 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 180 .b32 1899 .b8 7 .b8 144 .b8 178 .b8 226 .b8 144 .b8 179 .b8 214 .b8 4 .b8 2 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 188 .b32 1796 .b8 1 .b64 func_begin14 .b64 func_end14 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 188 .b32 1796 .b8 11 .b8 3 .b64 __local_depot14 .b8 35 .b8 16 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 188 .b32 1796 .b8 11 .b8 3 .b64 __local_depot14 .b8 35 .b8 32 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 193 .b32 1796 .b8 1 .b64 func_begin15 .b64 func_end15 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 193 .b32 1796 .b8 11 .b8 3 .b64 __local_depot15 .b8 35 .b8 16 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 193 .b32 1796 .b8 11 .b8 3 .b64 __local_depot15 .b8 35 .b8 32 .b8 6 .b8 0 .b8 2 .b8 75 .b8 69 .b8 82 .b8 49 .b8 53 .b8 51 .b8 57 .b8 51 .b8 48 .b8 56 .b8 54 .b8 52 .b8 56 .b8 57 .b8 57 .b8 55 .b8 55 .b8 49 .b8 52 .b8 55 .b8 55 .b8 57 .b8 52 .b8 0 .b8 75 .b8 69 .b8 82 .b8 49 .b8 53 .b8 51 .b8 57 .b8 51 .b8 48 .b8 56 .b8 54 .b8 52 .b8 56 .b8 57 .b8 57 .b8 55 .b8 55 .b8 49 .b8 52 .b8 55 .b8 55 .b8 57 .b8 52 .b8 0 .b32 1 .b32 220 .b32 6169 .b8 1 .b64 func_begin16 .b64 func_end16 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 48 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 221 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_0 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 222 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_1 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 223 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_2 .b8 7 .b8 3 .b8 105 .b8 110 .b8 54 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 224 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_3 .b8 7 .b8 3 .b8 105 .b8 110 .b8 57 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 225 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_4 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 50 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 226 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_5 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 53 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 227 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_6 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 56 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 228 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_7 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 229 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_8 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 52 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 230 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_9 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 55 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 231 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_10 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 48 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 232 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_11 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 51 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 233 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_12 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 54 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 234 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_13 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 57 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 235 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_14 .b8 7 .b8 3 .b8 105 .b8 110 .b8 52 .b8 50 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 236 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_15 .b8 7 .b8 3 .b8 105 .b8 110 .b8 52 .b8 53 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 237 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_16 .b8 7 .b8 3 .b8 105 .b8 110 .b8 52 .b8 56 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 238 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_17 .b8 7 .b8 3 .b8 105 .b8 110 .b8 53 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 239 .b32 6290 .b8 9 .b8 3 .b64 KER15393086489977147794_param_18 .b8 7 .b8 3 .b8 111 .b8 117 .b8 116 .b8 53 .b8 51 .b8 0 .b32 1 .b32 240 .b32 6202 .b8 11 .b8 3 .b64 __local_depot16 .b8 35 .b8 0 .b8 6 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 241 .b32 6318 .b8 5 .b8 144 .b8 185 .b8 228 .b8 149 .b8 1 .b8 2 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 241 .b32 6318 .b8 6 .b8 144 .b8 176 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 120 .b8 95 .b8 116 .b8 111 .b8 116 .b8 97 .b8 108 .b8 0 .b32 1 .b32 241 .b32 6318 .b8 9 .b8 3 .b64 KER15393086489977147794_param_22 .b8 7 .b8 3 .b8 110 .b8 117 .b8 109 .b8 95 .b8 111 .b8 100 .b8 105 .b8 109 .b8 115 .b8 0 .b32 1 .b32 241 .b32 6318 .b8 6 .b8 144 .b8 177 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 4 .b64 tmp40 .b64 tmp127 .b8 5 .b8 111 .b8 117 .b8 116 .b8 114 .b8 101 .b8 102 .b8 0 .b32 1 .b32 244 .b32 6202 .b8 11 .b8 3 .b64 __local_depot16 .b8 35 .b8 72 .b8 6 .b8 4 .b64 tmp41 .b64 tmp126 .b8 10 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 73 .b8 100 .b8 120 .b8 95 .b8 120 .b8 0 .b32 1 .b32 246 .b32 6347 .b32 .debug_loc .b8 4 .b64 tmp45 .b64 tmp126 .b8 4 .b64 tmp45 .b64 tmp123 .b8 5 .b8 116 .b8 104 .b8 114 .b8 101 .b8 97 .b8 100 .b8 73 .b8 100 .b8 0 .b32 1 .b32 248 .b32 6318 .b8 6 .b8 144 .b8 180 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 0 .b32 1 .b32 249 .b32 6347 .b8 5 .b8 144 .b8 179 .b8 228 .b8 149 .b8 1 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 48 .b8 0 .b32 1 .b32 251 .b32 6347 .b8 6 .b8 144 .b8 185 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 0 .b32 1 .b32 252 .b32 6347 .b8 6 .b8 144 .b8 176 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 0 .b32 1 .b32 253 .b32 6347 .b8 6 .b8 144 .b8 177 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 54 .b8 0 .b32 1 .b32 254 .b32 6347 .b8 6 .b8 144 .b8 178 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 57 .b8 0 .b32 1 .b32 255 .b32 6347 .b8 6 .b8 144 .b8 179 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 50 .b8 0 .b32 1 .b32 256 .b32 6347 .b8 6 .b8 144 .b8 180 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 53 .b8 0 .b32 1 .b32 257 .b32 6347 .b8 6 .b8 144 .b8 181 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 56 .b8 0 .b32 1 .b32 258 .b32 6347 .b8 6 .b8 144 .b8 182 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 49 .b8 0 .b32 1 .b32 259 .b32 6347 .b8 6 .b8 144 .b8 183 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 52 .b8 0 .b32 1 .b32 260 .b32 6347 .b8 6 .b8 144 .b8 184 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 55 .b8 0 .b32 1 .b32 261 .b32 6347 .b8 6 .b8 144 .b8 185 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 48 .b8 0 .b32 1 .b32 262 .b32 6347 .b8 6 .b8 144 .b8 176 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 51 .b8 0 .b32 1 .b32 263 .b32 6347 .b8 6 .b8 144 .b8 177 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 54 .b8 0 .b32 1 .b32 264 .b32 6347 .b8 6 .b8 144 .b8 178 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 57 .b8 0 .b32 1 .b32 265 .b32 6347 .b8 6 .b8 144 .b8 179 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 52 .b8 50 .b8 0 .b32 1 .b32 266 .b32 6347 .b8 6 .b8 144 .b8 180 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 52 .b8 53 .b8 0 .b32 1 .b32 267 .b32 6347 .b8 6 .b8 144 .b8 181 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 52 .b8 56 .b8 0 .b32 1 .b32 268 .b32 6347 .b8 6 .b8 144 .b8 182 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 53 .b8 49 .b8 0 .b32 1 .b32 269 .b32 6347 .b8 6 .b8 144 .b8 183 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 48 .b8 0 .b32 1 .b32 270 .b32 379 .b8 5 .b8 144 .b8 178 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 0 .b32 1 .b32 271 .b32 379 .b8 5 .b8 144 .b8 180 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 0 .b32 1 .b32 272 .b32 379 .b8 5 .b8 144 .b8 181 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 0 .b32 1 .b32 273 .b32 379 .b8 5 .b8 144 .b8 183 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 0 .b32 1 .b32 274 .b32 379 .b8 5 .b8 144 .b8 184 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 53 .b8 0 .b32 1 .b32 275 .b32 379 .b8 5 .b8 144 .b8 185 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 54 .b8 0 .b32 1 .b32 276 .b32 379 .b8 6 .b8 144 .b8 177 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 55 .b8 0 .b32 1 .b32 277 .b32 379 .b8 6 .b8 144 .b8 178 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 56 .b8 0 .b32 1 .b32 278 .b32 379 .b8 6 .b8 144 .b8 179 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 57 .b8 0 .b32 1 .b32 279 .b32 379 .b8 6 .b8 144 .b8 181 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 48 .b8 0 .b32 1 .b32 280 .b32 379 .b8 6 .b8 144 .b8 182 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 49 .b8 0 .b32 1 .b32 281 .b32 379 .b8 6 .b8 144 .b8 183 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 50 .b8 0 .b32 1 .b32 282 .b32 379 .b8 6 .b8 144 .b8 185 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 51 .b8 0 .b32 1 .b32 283 .b32 379 .b8 6 .b8 144 .b8 176 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 52 .b8 0 .b32 1 .b32 284 .b32 379 .b8 6 .b8 144 .b8 177 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 53 .b8 0 .b32 1 .b32 285 .b32 379 .b8 6 .b8 144 .b8 179 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 54 .b8 0 .b32 1 .b32 286 .b32 379 .b8 6 .b8 144 .b8 180 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 55 .b8 0 .b32 1 .b32 287 .b32 379 .b8 6 .b8 144 .b8 181 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 56 .b8 0 .b32 1 .b32 288 .b32 379 .b8 6 .b8 144 .b8 183 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 57 .b8 0 .b32 1 .b32 289 .b32 379 .b8 6 .b8 144 .b8 184 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 48 .b8 0 .b32 1 .b32 290 .b32 379 .b8 6 .b8 144 .b8 185 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 49 .b8 0 .b32 1 .b32 291 .b32 379 .b8 6 .b8 144 .b8 177 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 50 .b8 0 .b32 1 .b32 292 .b32 379 .b8 6 .b8 144 .b8 178 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 51 .b8 0 .b32 1 .b32 293 .b32 379 .b8 6 .b8 144 .b8 179 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 52 .b8 0 .b32 1 .b32 294 .b32 379 .b8 6 .b8 144 .b8 181 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 53 .b8 0 .b32 1 .b32 295 .b32 379 .b8 6 .b8 144 .b8 182 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 54 .b8 0 .b32 1 .b32 296 .b32 379 .b8 6 .b8 144 .b8 183 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 55 .b8 0 .b32 1 .b32 297 .b32 379 .b8 6 .b8 144 .b8 185 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 56 .b8 0 .b32 1 .b32 298 .b32 379 .b8 6 .b8 144 .b8 176 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 57 .b8 0 .b32 1 .b32 299 .b32 379 .b8 6 .b8 144 .b8 177 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 48 .b8 0 .b32 1 .b32 300 .b32 379 .b8 6 .b8 144 .b8 179 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 49 .b8 0 .b32 1 .b32 301 .b32 379 .b8 6 .b8 144 .b8 180 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 50 .b8 0 .b32 1 .b32 302 .b32 379 .b8 6 .b8 144 .b8 181 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 51 .b8 0 .b32 1 .b32 303 .b32 379 .b8 6 .b8 144 .b8 183 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 52 .b8 0 .b32 1 .b32 304 .b32 379 .b8 6 .b8 144 .b8 184 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 53 .b8 0 .b32 1 .b32 305 .b32 379 .b8 6 .b8 144 .b8 185 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 54 .b8 0 .b32 1 .b32 306 .b32 379 .b8 6 .b8 144 .b8 177 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 55 .b8 0 .b32 1 .b32 307 .b32 379 .b8 6 .b8 144 .b8 178 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 56 .b8 0 .b32 1 .b32 308 .b32 379 .b8 6 .b8 144 .b8 179 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 57 .b8 0 .b32 1 .b32 309 .b32 379 .b8 6 .b8 144 .b8 181 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 48 .b8 0 .b32 1 .b32 310 .b32 379 .b8 6 .b8 144 .b8 182 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 49 .b8 0 .b32 1 .b32 311 .b32 379 .b8 6 .b8 144 .b8 183 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 50 .b8 0 .b32 1 .b32 312 .b32 379 .b8 6 .b8 144 .b8 185 .b8 234 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 51 .b8 0 .b32 1 .b32 313 .b32 379 .b8 6 .b8 144 .b8 176 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 52 .b8 0 .b32 1 .b32 314 .b32 379 .b8 6 .b8 144 .b8 177 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 53 .b8 0 .b32 1 .b32 315 .b32 379 .b8 6 .b8 144 .b8 179 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 54 .b8 0 .b32 1 .b32 316 .b32 379 .b8 6 .b8 144 .b8 180 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 55 .b8 0 .b32 1 .b32 317 .b32 379 .b8 6 .b8 144 .b8 181 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 56 .b8 0 .b32 1 .b32 318 .b32 379 .b8 6 .b8 144 .b8 183 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 57 .b8 0 .b32 1 .b32 319 .b32 379 .b8 6 .b8 144 .b8 184 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 53 .b8 48 .b8 0 .b32 1 .b32 320 .b32 379 .b8 6 .b8 144 .b8 185 .b8 236 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 53 .b8 49 .b8 0 .b32 1 .b32 321 .b32 379 .b8 6 .b8 144 .b8 177 .b8 238 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 53 .b8 50 .b8 0 .b32 1 .b32 322 .b32 379 .b8 6 .b8 144 .b8 178 .b8 238 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 53 .b8 51 .b8 0 .b32 1 .b32 323 .b32 379 .b8 6 .b8 144 .b8 179 .b8 238 .b8 152 .b8 171 .b8 2 .b8 2 .b8 0 .b8 0 .b8 0 .b8 0 .b8 0 .b8 11 .b8 118 .b8 111 .b8 105 .b8 100 .b8 0 .b8 6 .b32 6186 .b8 100 .b8 105 .b8 109 .b8 95 .b8 116 .b8 0 .b8 9 .b8 108 .b8 111 .b8 110 .b8 103 .b8 32 .b8 108 .b8 111 .b8 110 .b8 103 .b8 0 .b8 5 .b32 8 .b8 7 .b8 95 .b8 90 .b8 53 .b8 80 .b8 97 .b8 114 .b8 97 .b8 109 .b8 73 .b8 102 .b8 69 .b8 0 .b32 72 .b32 1 .b32 212 .b8 8 .b8 112 .b8 116 .b8 114 .b8 0 .b32 6290 .b32 1 .b32 214 .b8 0 .b8 1 .b8 8 .b8 100 .b8 105 .b8 109 .b8 115 .b8 0 .b32 6296 .b32 1 .b32 215 .b8 8 .b8 1 .b8 8 .b8 115 .b8 116 .b8 114 .b8 105 .b8 100 .b8 101 .b8 115 .b8 0 .b32 6296 .b32 1 .b32 216 .b8 40 .b8 1 .b8 0 .b8 12 .b32 379 .b8 12 .b8 13 .b32 6175 .b8 14 .b32 6308 .b8 3 .b8 0 .b8 15 .b8 105 .b8 110 .b8 116 .b8 0 .b32 4 .b8 5 .b8 6 .b32 6328 .b8 117 .b8 105 .b8 110 .b8 116 .b8 0 .b8 9 .b8 117 .b8 110 .b8 115 .b8 105 .b8 103 .b8 110 .b8 101 .b8 100 .b8 32 .b8 105 .b8 110 .b8 116 .b8 0 .b8 7 .b32 4 .b8 9 .b8 105 .b8 110 .b8 116 .b8 0 .b8 5 .b32 4 .b8 0 } .section .debug_abbrev { .b8 1 .b8 17 .b8 1 .b8 37 .b8 8 .b8 19 .b8 11 .b8 3 .b8 8 .b8 17 .b8 1 .b8 16 .b8 6 .b8 27 .b8 8 .b8 0 .b8 0 .b8 2 .b8 46 .b8 1 .b8 135 .b8 64 .b8 8 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 63 .b8 12 .b8 17 .b8 1 .b8 18 .b8 1 .b8 64 .b8 10 .b8 0 .b8 0 .b8 3 .b8 5 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 10 .b8 51 .b8 11 .b8 0 .b8 0 .b8 4 .b8 11 .b8 1 .b8 17 .b8 1 .b8 18 .b8 1 .b8 0 .b8 0 .b8 5 .b8 52 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 10 .b8 51 .b8 11 .b8 0 .b8 0 .b8 6 .b8 22 .b8 0 .b8 73 .b8 19 .b8 3 .b8 8 .b8 0 .b8 0 .b8 7 .b8 19 .b8 1 .b8 3 .b8 8 .b8 11 .b8 6 .b8 58 .b8 6 .b8 59 .b8 6 .b8 0 .b8 0 .b8 8 .b8 13 .b8 0 .b8 3 .b8 8 .b8 73 .b8 19 .b8 58 .b8 6 .b8 59 .b8 6 .b8 56 .b8 15 .b8 50 .b8 11 .b8 0 .b8 0 .b8 9 .b8 36 .b8 0 .b8 3 .b8 8 .b8 62 .b8 11 .b8 11 .b8 6 .b8 0 .b8 0 .b8 10 .b8 52 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 6 .b8 0 .b8 0 .b8 11 .b8 59 .b8 0 .b8 3 .b8 8 .b8 0 .b8 0 .b8 12 .b8 15 .b8 0 .b8 73 .b8 19 .b8 51 .b8 11 .b8 0 .b8 0 .b8 13 .b8 1 .b8 1 .b8 73 .b8 19 .b8 0 .b8 0 .b8 14 .b8 33 .b8 0 .b8 73 .b8 19 .b8 47 .b8 15 .b8 0 .b8 0 .b8 15 .b8 36 .b8 0 .b8 3 .b8 8 .b8 11 .b8 6 .b8 62 .b8 11 .b8 0 .b8 0 .b8 0 } .section .debug_loc { .b64 tmp42 .b64 tmp43 .b8 5 .b8 0 .b8 144 .b8 177 .b8 228 .b8 149 .b8 1 .b64 tmp43 .b64 tmp44 .b8 6 .b8 0 .b8 144 .b8 185 .b8 230 .b8 200 .b8 171 .b8 2 .b64 tmp44 .b64 tmp124 .b8 5 .b8 0 .b8 144 .b8 178 .b8 228 .b8 149 .b8 1 .b64 tmp124 .b64 tmp125 .b8 5 .b8 0 .b8 144 .b8 180 .b8 228 .b8 149 .b8 1 .b64 tmp125 .b64 func_end16 .b8 6 .b8 0 .b8 144 .b8 185 .b8 230 .b8 200 .b8 171 .b8 2 .b64 0 .b64 0 } .section .debug_ranges { } .section .debug_pubnames { .b32 411 .b8 2 .b8 0 .b32 .debug_info .b32 6354 .b32 391 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 1643 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b32 2603 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 127 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b32 1082 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1377 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1510 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2060 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 539 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 720 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 3035 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2241 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2422 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 901 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 3168 .b8 75 .b8 69 .b8 82 .b8 49 .b8 53 .b8 51 .b8 57 .b8 51 .b8 48 .b8 56 .b8 54 .b8 52 .b8 56 .b8 57 .b8 57 .b8 55 .b8 55 .b8 49 .b8 52 .b8 55 .b8 55 .b8 57 .b8 52 .b8 0 .b32 2902 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1912 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 0 } ] JIT_KERNEL:------------------------- typedef unsigned int uint; typedef long long dim_t; /******************************************************* * Copyright (c) 2014, ArrayFire * All rights reserved. * * This file is distributed under 3-clause BSD license. * The complete license agreement can be obtained at: * http://arrayfire.com/licenses/BSD-3-Clause ********************************************************/ typedef float2 cuFloatComplex; typedef cuFloatComplex cfloat; typedef double2 cuDoubleComplex; typedef cuDoubleComplex cdouble; // ---------------------------------------------- // REAL NUMBER OPERATIONS // ---------------------------------------------- #define sign(in) signbit((in)) #define __noop(a) (a) #define __add(lhs, rhs) (lhs) + (rhs) #define __sub(lhs, rhs) (lhs) - (rhs) #define __mul(lhs, rhs) (lhs) * (rhs) #define __div(lhs, rhs) (lhs) / (rhs) #define __and(lhs, rhs) (lhs) && (rhs) #define __or(lhs, rhs) (lhs) || (rhs) #define __lt(lhs, rhs) (lhs) < (rhs) #define __gt(lhs, rhs) (lhs) > (rhs) #define __le(lhs, rhs) (lhs) <= (rhs) #define __ge(lhs, rhs) (lhs) >= (rhs) #define __eq(lhs, rhs) (lhs) == (rhs) #define __neq(lhs, rhs) (lhs) != (rhs) #define __conj(in) (in) #define __real(in) (in) #define __imag(in) (0) #define __abs(in) abs(in) #define __sigmoid(in) (1.0/(1 + exp(-(in)))) #define __bitor(lhs, rhs) ((lhs) | (rhs)) #define __bitand(lhs, rhs) ((lhs) & (rhs)) #define __bitxor(lhs, rhs) ((lhs) ^ (rhs)) #define __bitshiftl(lhs, rhs) ((lhs) << (rhs)) #define __bitshiftr(lhs, rhs) ((lhs) >> (rhs)) #define __min(lhs, rhs) ((lhs) < (rhs)) ? (lhs) : (rhs) #define __max(lhs, rhs) ((lhs) > (rhs)) ? (lhs) : (rhs) #define __rem(lhs, rhs) ((lhs) % (rhs)) #define __mod(lhs, rhs) ((lhs) % (rhs)) #define __pow(lhs, rhs) fpow((float)lhs, (float)rhs) #define __convert_char(val) (char)((val) != 0) #define fpow(lhs, rhs) pow((lhs), (rhs)) #define frem(lhs, rhs) remainder((lhs), (rhs)) #define iszero(a) ((a) == 0) // ---------------------------------------------- // COMPLEX FLOAT OPERATIONS // ---------------------------------------------- #define __crealf(in) ((in).x) #define __cimagf(in) ((in).y) #define __cabsf(in) hypotf(in.x, in.y) __device__ cfloat __cplx2f(float x, float y) { cfloat res = {x, y}; return res; } __device__ cfloat __cconjf(cfloat in) { cfloat res = {in.x, -in.y}; return res; } __device__ cfloat __caddf(cfloat lhs, cfloat rhs) { cfloat res = {lhs.x + rhs.x, lhs.y + rhs.y}; return res; } __device__ cfloat __csubf(cfloat lhs, cfloat rhs) { cfloat res = {lhs.x - rhs.x, lhs.y - rhs.y}; return res; } __device__ cfloat __cmulf(cfloat lhs, cfloat rhs) { cfloat out; out.x = lhs.x * rhs.x - lhs.y * rhs.y; out.y = lhs.x * rhs.y + lhs.y * rhs.x; return out; } __device__ cfloat __cdivf(cfloat lhs, cfloat rhs) { // Normalize by absolute value and multiply float rhs_abs = __cabsf(rhs); float inv_rhs_abs = 1.0f / rhs_abs; float rhs_x = inv_rhs_abs * rhs.x; float rhs_y = inv_rhs_abs * rhs.y; cfloat out = {lhs.x * rhs_x + lhs.y * rhs_y, lhs.y * rhs_x - lhs.x * rhs_y}; out.x *= inv_rhs_abs; out.y *= inv_rhs_abs; return out; } __device__ cfloat __cminf(cfloat lhs, cfloat rhs) { return __cabsf(lhs) < __cabsf(rhs) ? lhs : rhs; } __device__ cfloat __cmaxf(cfloat lhs, cfloat rhs) { return __cabsf(lhs) > __cabsf(rhs) ? lhs : rhs; } #define __candf(lhs, rhs) __cabsf(lhs) && __cabsf(rhs) #define __corf(lhs, rhs) __cabsf(lhs) || __cabsf(rhs) #define __ceqf(lhs, rhs) (((lhs).x == (rhs).x) && ((lhs).y == (rhs).y)) #define __cneqf(lhs, rhs) !__ceqf((lhs), (rhs)) #define __cltf(lhs, rhs) (__cabsf(lhs) < __cabsf(rhs)) #define __clef(lhs, rhs) (__cabsf(lhs) <= __cabsf(rhs)) #define __cgtf(lhs, rhs) (__cabsf(lhs) > __cabsf(rhs)) #define __cgef(lhs, rhs) (__cabsf(lhs) >= __cabsf(rhs)) #define __convert_cfloat(real) __cplx2f(real, 0) #define __convert_c2c(in) (in) #define __convert_z2c(in) __cplx2f((float)in.x, (float)in.y) // ---------------------------------------------- // COMPLEX DOUBLE OPERATIONS // ---------------------------------------------- #define __creal(in) ((in).x) #define __cimag(in) ((in).y) #define __cabs(in) hypot(in.x, in.y) __device__ cdouble __cplx2(double x, double y) { cdouble res = {x, y}; return res; } __device__ cdouble __cconj(cdouble in) { cdouble res = {in.x, -in.y}; return res; } __device__ cdouble __cadd(cdouble lhs, cdouble rhs) { cdouble res = {lhs.x + rhs.x, lhs.y + rhs.y}; return res; } __device__ cdouble __csub(cdouble lhs, cdouble rhs) { cdouble res = {lhs.x - rhs.x, lhs.y - rhs.y}; return res; } __device__ cdouble __cmul(cdouble lhs, cdouble rhs) { cdouble out; out.x = lhs.x * rhs.x - lhs.y * rhs.y; out.y = lhs.x * rhs.y + lhs.y * rhs.x; return out; } __device__ cdouble __cdiv(cdouble lhs, cdouble rhs) { // Normalize by absolute value and multiply double rhs_abs = __cabs(rhs); double inv_rhs_abs = 1.0 / rhs_abs; double rhs_x = inv_rhs_abs * rhs.x; double rhs_y = inv_rhs_abs * rhs.y; cdouble out = {lhs.x * rhs_x + lhs.y * rhs_y, lhs.y * rhs_x - lhs.x * rhs_y}; out.x *= inv_rhs_abs; out.y *= inv_rhs_abs; return out; } __device__ cdouble __cmin(cdouble lhs, cdouble rhs) { return __cabs(lhs) < __cabs(rhs) ? lhs : rhs; } __device__ cdouble __cmax(cdouble lhs, cdouble rhs) { return __cabs(lhs) > __cabs(rhs) ? lhs : rhs; } #define __cand(lhs, rhs) __cabs(lhs) && __cabs(rhs) #define __cor(lhs, rhs) __cabs(lhs) || __cabs(rhs) #define __ceq(lhs, rhs) (((lhs).x == (rhs).x) && ((lhs).y == (rhs).y)) #define __cneq(lhs, rhs) !__ceq((lhs), (rhs)) #define __clt(lhs, rhs) (__cabs(lhs) < __cabs(rhs)) #define __cle(lhs, rhs) (__cabs(lhs) <= __cabs(rhs)) #define __cgt(lhs, rhs) (__cabs(lhs) > __cabs(rhs)) #define __cge(lhs, rhs) (__cabs(lhs) >= __cabs(rhs)) #define __convert_cdouble(real) __cplx2(real, 0) #define __convert_z2z(in) (in) #define __convert_c2z(in) __cplx2((double)in.x, (double)in.y) template struct Param { T *ptr; dim_t dims[4]; dim_t strides[4]; }; extern "C" __global__ void KER14507509769487725591( float *in0_ptr, float *in1_ptr, float *in3_ptr, float *in6_ptr, float *in9_ptr, float *in12_ptr, float *in15_ptr, float *in18_ptr, float *in21_ptr, float *in24_ptr, float *in27_ptr, float *in30_ptr, Param out32, uint blocks_x, uint blocks_y, uint blocks_x_total, uint num_odims) { Param outref = out32; for (int blockIdx_x = blockIdx.x; blockIdx_x < blocks_x_total; blockIdx_x += gridDim.x) { uint threadId = threadIdx.x; int idx = blockIdx_x * blockDim.x * blockDim.y + threadId; if (idx >= outref.dims[3] * outref.strides[3]) return; int idx0 = idx; int idx1 = idx; int idx3 = idx; int idx6 = idx; int idx9 = idx; int idx12 = idx; int idx15 = idx; int idx18 = idx; int idx21 = idx; int idx24 = idx; int idx27 = idx; int idx30 = idx; float val0 = in0_ptr[idx0]; float val1 = in1_ptr[idx1]; float val2 = __add(val0, val1); float val3 = in3_ptr[idx3]; float val4 = __add(val1, val3); float val5 = __add(val2, val4); float val6 = in6_ptr[idx6]; float val7 = __add(val4, val6); float val8 = __add(val5, val7); float val9 = in9_ptr[idx9]; float val10 = __add(val7, val9); float val11 = __add(val8, val10); float val12 = in12_ptr[idx12]; float val13 = __add(val10, val12); float val14 = __add(val11, val13); float val15 = in15_ptr[idx15]; float val16 = __add(val13, val15); float val17 = __add(val14, val16); float val18 = in18_ptr[idx18]; float val19 = __add(val16, val18); float val20 = __add(val17, val19); float val21 = in21_ptr[idx21]; float val22 = __add(val19, val21); float val23 = __add(val20, val22); float val24 = in24_ptr[idx24]; float val25 = __add(val22, val24); float val26 = __add(val23, val25); float val27 = in27_ptr[idx27]; float val28 = __add(val25, val27); float val29 = __add(val26, val28); float val30 = in30_ptr[idx30]; float val31 = __add(val28, val30); float val32 = __add(val29, val31); out32.ptr[idx] = val32; } } ----------------------------- num_options=3 compiler_options: [--gpu-architecture=compute_62] compiler_options: [--device-debug] compiler_options: [--generate-line-info] compiledPTX size 68242 PTX [// // Generated by NVIDIA NVVM Compiler // // Compiler Build ID: CL-23162084 // Cuda compilation tools, release 9.0, V9.0.252 // Based on LLVM 3.4svn // .version 6.0 .target sm_62, debug .address_size 64 // .globl _Z8__cplx2fff .func (.param .b32 func_retval0) hypotf ( .param .b32 hypotf_param_0, .param .b32 hypotf_param_1 ) ; .func (.param .b64 func_retval0) hypot ( .param .b64 hypot_param_0, .param .b64 hypot_param_1 ) ; .visible .func (.param .align 8 .b8 func_retval0[8]) _Z8__cplx2fff( .param .b32 _Z8__cplx2fff_param_0, .param .b32 _Z8__cplx2fff_param_1 ) { .local .align 8 .b8 __local_depot0[8]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<5>; .reg .b64 %rd<2>; .loc 1 68 1 func_begin0: .loc 1 0 0 .loc 1 68 1 mov.u64 %rd1, __local_depot0; cvta.local.u64 %SP, %rd1; ld.param.f32 %f1, [_Z8__cplx2fff_param_0]; ld.param.f32 %f2, [_Z8__cplx2fff_param_1]; tmp0: func_exec_begin0: .loc 1 70 12 st.f32 [%SP+0], %f1; st.f32 [%SP+4], %f2; .loc 1 71 5 ld.f32 %f3, [%SP+4]; ld.f32 %f4, [%SP+0]; st.param.f32 [func_retval0+0], %f4; st.param.f32 [func_retval0+4], %f3; ret; tmp1: func_end0: } // .globl _Z8__cconjf6float2 .visible .func (.param .align 8 .b8 func_retval0[8]) _Z8__cconjf6float2( .param .align 8 .b8 _Z8__cconjf6float2_param_0[8] ) { .local .align 8 .b8 __local_depot1[16]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<8>; .reg .b64 %rd<2>; .loc 1 74 1 func_begin1: .loc 1 0 0 .loc 1 74 1 mov.u64 %rd1, __local_depot1; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z8__cconjf6float2_param_0+4]; ld.param.f32 %f1, [_Z8__cconjf6float2_param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; tmp2: func_exec_begin1: .loc 1 76 12 ld.f32 %f3, [%SP+0]; st.f32 [%SP+8], %f3; ld.f32 %f4, [%SP+4]; neg.f32 %f5, %f4; st.f32 [%SP+12], %f5; .loc 1 77 5 ld.f32 %f6, [%SP+12]; ld.f32 %f7, [%SP+8]; st.param.f32 [func_retval0+0], %f7; st.param.f32 [func_retval0+4], %f6; ret; tmp3: func_end1: } // .globl _Z7__caddf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__caddf6float2S_( .param .align 8 .b8 _Z7__caddf6float2S__param_0[8], .param .align 8 .b8 _Z7__caddf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot2[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<13>; .reg .b64 %rd<2>; .loc 1 80 1 func_begin2: .loc 1 0 0 .loc 1 80 1 mov.u64 %rd1, __local_depot2; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__caddf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__caddf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__caddf6float2S__param_1]; ld.param.f32 %f1, [_Z7__caddf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp4: func_exec_begin2: .loc 1 82 12 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; add.f32 %f7, %f5, %f6; st.f32 [%SP+16], %f7; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; add.f32 %f10, %f8, %f9; st.f32 [%SP+20], %f10; .loc 1 83 5 ld.f32 %f11, [%SP+20]; ld.f32 %f12, [%SP+16]; st.param.f32 [func_retval0+0], %f12; st.param.f32 [func_retval0+4], %f11; ret; tmp5: func_end2: } // .globl _Z7__csubf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__csubf6float2S_( .param .align 8 .b8 _Z7__csubf6float2S__param_0[8], .param .align 8 .b8 _Z7__csubf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot3[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<13>; .reg .b64 %rd<2>; .loc 1 86 1 func_begin3: .loc 1 0 0 .loc 1 86 1 mov.u64 %rd1, __local_depot3; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__csubf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__csubf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__csubf6float2S__param_1]; ld.param.f32 %f1, [_Z7__csubf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp6: func_exec_begin3: .loc 1 88 12 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; sub.f32 %f7, %f5, %f6; st.f32 [%SP+16], %f7; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; sub.f32 %f10, %f8, %f9; st.f32 [%SP+20], %f10; .loc 1 89 5 ld.f32 %f11, [%SP+20]; ld.f32 %f12, [%SP+16]; st.param.f32 [func_retval0+0], %f12; st.param.f32 [func_retval0+4], %f11; ret; tmp7: func_end3: } // .globl _Z7__cmulf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cmulf6float2S_( .param .align 8 .b8 _Z7__cmulf6float2S__param_0[8], .param .align 8 .b8 _Z7__cmulf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot4[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<21>; .reg .b64 %rd<2>; .loc 1 92 1 func_begin4: .loc 1 0 0 .loc 1 92 1 mov.u64 %rd1, __local_depot4; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cmulf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cmulf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cmulf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cmulf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp8: func_exec_begin4: .loc 1 95 5 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; mul.f32 %f7, %f5, %f6; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; mul.f32 %f10, %f8, %f9; sub.f32 %f11, %f7, %f10; st.f32 [%SP+16], %f11; .loc 1 96 5 ld.f32 %f12, [%SP+0]; ld.f32 %f13, [%SP+12]; mul.f32 %f14, %f12, %f13; ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+8]; mul.f32 %f17, %f15, %f16; add.f32 %f18, %f14, %f17; st.f32 [%SP+20], %f18; .loc 1 97 5 ld.f32 %f19, [%SP+20]; ld.f32 %f20, [%SP+16]; st.param.f32 [func_retval0+0], %f20; st.param.f32 [func_retval0+4], %f19; ret; tmp9: func_end4: } // .globl _Z7__cdivf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cdivf6float2S_( .param .align 8 .b8 _Z7__cdivf6float2S__param_0[8], .param .align 8 .b8 _Z7__cdivf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot5[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<29>; .reg .b64 %rd<2>; .loc 1 100 1 func_begin5: .loc 1 0 0 .loc 1 100 1 mov.u64 %rd1, __local_depot5; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cdivf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cdivf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cdivf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cdivf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp10: func_exec_begin5: .loc 1 103 19 ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 103 21 // Callseq Start 30 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 30 tmp11: .loc 1 104 23 rcp.rn.f32 %f8, %f7; tmp12: .loc 1 105 17 ld.f32 %f9, [%SP+8]; mul.f32 %f10, %f8, %f9; tmp13: .loc 1 106 17 ld.f32 %f11, [%SP+12]; mul.f32 %f12, %f8, %f11; tmp14: .loc 1 107 12 ld.f32 %f13, [%SP+0]; mul.f32 %f14, %f13, %f10; ld.f32 %f15, [%SP+4]; mul.f32 %f16, %f15, %f12; add.f32 %f17, %f14, %f16; st.f32 [%SP+16], %f17; ld.f32 %f18, [%SP+4]; mul.f32 %f19, %f18, %f10; ld.f32 %f20, [%SP+0]; mul.f32 %f21, %f20, %f12; sub.f32 %f22, %f19, %f21; st.f32 [%SP+20], %f22; .loc 1 109 5 ld.f32 %f23, [%SP+16]; mul.f32 %f24, %f23, %f8; st.f32 [%SP+16], %f24; .loc 1 110 5 ld.f32 %f25, [%SP+20]; mul.f32 %f26, %f25, %f8; st.f32 [%SP+20], %f26; .loc 1 111 5 ld.f32 %f27, [%SP+20]; ld.f32 %f28, [%SP+16]; st.param.f32 [func_retval0+0], %f28; st.param.f32 [func_retval0+4], %f27; ret; tmp15: func_end5: } // .globl _Z7__cminf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cminf6float2S_( .param .align 8 .b8 _Z7__cminf6float2S__param_0[8], .param .align 8 .b8 _Z7__cminf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot6[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f32 %f<17>; .reg .b64 %rd<2>; .loc 1 114 1 func_begin6: .loc 1 0 0 .loc 1 114 1 mov.u64 %rd1, __local_depot6; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cminf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cminf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cminf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cminf6float2S__param_0]; st.f32 [%SP+12], %f2; st.f32 [%SP+8], %f1; st.f32 [%SP+20], %f4; st.f32 [%SP+16], %f3; func_exec_begin6: .loc 1 116 5 tmp16: ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 116 12 // Callseq Start 31 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 31 ld.f32 %f8, [%SP+16]; ld.f32 %f9, [%SP+20]; .loc 1 116 27 // Callseq Start 32 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f8; .param .b32 param1; st.param.f32 [param1+0], %f9; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f10, [retval0+0]; //{ }// Callseq End 32 setp.lt.f32 %p1, %f7, %f10; not.pred %p2, %p1; @%p2 bra BB6_2; bra.uni BB6_1; BB6_1: ld.f32 %f13, [%SP+8]; ld.f32 %f14, [%SP+12]; st.f32 [%SP+4], %f14; st.f32 [%SP+0], %f13; bra.uni BB6_3; BB6_2: ld.f32 %f11, [%SP+16]; ld.f32 %f12, [%SP+20]; st.f32 [%SP+4], %f12; st.f32 [%SP+0], %f11; BB6_3: ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+0]; st.param.f32 [func_retval0+0], %f16; st.param.f32 [func_retval0+4], %f15; ret; tmp17: func_end6: } // .globl _Z7__cmaxf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cmaxf6float2S_( .param .align 8 .b8 _Z7__cmaxf6float2S__param_0[8], .param .align 8 .b8 _Z7__cmaxf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot7[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f32 %f<17>; .reg .b64 %rd<2>; .loc 1 119 1 func_begin7: .loc 1 0 0 .loc 1 119 1 mov.u64 %rd1, __local_depot7; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cmaxf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cmaxf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cmaxf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cmaxf6float2S__param_0]; st.f32 [%SP+12], %f2; st.f32 [%SP+8], %f1; st.f32 [%SP+20], %f4; st.f32 [%SP+16], %f3; func_exec_begin7: .loc 1 121 5 tmp18: ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 121 12 // Callseq Start 33 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 33 ld.f32 %f8, [%SP+16]; ld.f32 %f9, [%SP+20]; .loc 1 121 27 // Callseq Start 34 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f8; .param .b32 param1; st.param.f32 [param1+0], %f9; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f10, [retval0+0]; //{ }// Callseq End 34 setp.gt.f32 %p1, %f7, %f10; not.pred %p2, %p1; @%p2 bra BB7_2; bra.uni BB7_1; BB7_1: ld.f32 %f13, [%SP+8]; ld.f32 %f14, [%SP+12]; st.f32 [%SP+4], %f14; st.f32 [%SP+0], %f13; bra.uni BB7_3; BB7_2: ld.f32 %f11, [%SP+16]; ld.f32 %f12, [%SP+20]; st.f32 [%SP+4], %f12; st.f32 [%SP+0], %f11; BB7_3: ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+0]; st.param.f32 [func_retval0+0], %f16; st.param.f32 [func_retval0+4], %f15; ret; tmp19: func_end7: } // .globl _Z7__cplx2dd .visible .func (.param .align 16 .b8 func_retval0[16]) _Z7__cplx2dd( .param .b64 _Z7__cplx2dd_param_0, .param .b64 _Z7__cplx2dd_param_1 ) { .local .align 16 .b8 __local_depot8[16]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<5>; .reg .b64 %rd<2>; .loc 1 142 1 func_begin8: .loc 1 0 0 .loc 1 142 1 mov.u64 %rd1, __local_depot8; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd1, [_Z7__cplx2dd_param_0]; ld.param.f64 %fd2, [_Z7__cplx2dd_param_1]; tmp20: func_exec_begin8: .loc 1 144 13 st.f64 [%SP+0], %fd1; st.f64 [%SP+8], %fd2; .loc 1 145 5 ld.f64 %fd3, [%SP+8]; ld.f64 %fd4, [%SP+0]; st.param.f64 [func_retval0+0], %fd4; st.param.f64 [func_retval0+8], %fd3; ret; tmp21: func_end8: } // .globl _Z7__cconj7double2 .visible .func (.param .align 16 .b8 func_retval0[16]) _Z7__cconj7double2( .param .align 16 .b8 _Z7__cconj7double2_param_0[16] ) { .local .align 16 .b8 __local_depot9[32]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<8>; .reg .b64 %rd<2>; .loc 1 148 1 func_begin9: .loc 1 0 0 .loc 1 148 1 mov.u64 %rd1, __local_depot9; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z7__cconj7double2_param_0+8]; ld.param.f64 %fd1, [_Z7__cconj7double2_param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; tmp22: func_exec_begin9: .loc 1 150 13 ld.f64 %fd3, [%SP+0]; st.f64 [%SP+16], %fd3; ld.f64 %fd4, [%SP+8]; neg.f64 %fd5, %fd4; st.f64 [%SP+24], %fd5; .loc 1 151 5 ld.f64 %fd6, [%SP+24]; ld.f64 %fd7, [%SP+16]; st.param.f64 [func_retval0+0], %fd7; st.param.f64 [func_retval0+8], %fd6; ret; tmp23: func_end9: } // .globl _Z6__cadd7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cadd7double2S_( .param .align 16 .b8 _Z6__cadd7double2S__param_0[16], .param .align 16 .b8 _Z6__cadd7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot10[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<13>; .reg .b64 %rd<2>; .loc 1 154 1 func_begin10: .loc 1 0 0 .loc 1 154 1 mov.u64 %rd1, __local_depot10; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cadd7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cadd7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cadd7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cadd7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp24: func_exec_begin10: .loc 1 156 13 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; add.f64 %fd7, %fd5, %fd6; st.f64 [%SP+32], %fd7; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; add.f64 %fd10, %fd8, %fd9; st.f64 [%SP+40], %fd10; .loc 1 157 5 ld.f64 %fd11, [%SP+40]; ld.f64 %fd12, [%SP+32]; st.param.f64 [func_retval0+0], %fd12; st.param.f64 [func_retval0+8], %fd11; ret; tmp25: func_end10: } // .globl _Z6__csub7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__csub7double2S_( .param .align 16 .b8 _Z6__csub7double2S__param_0[16], .param .align 16 .b8 _Z6__csub7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot11[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<13>; .reg .b64 %rd<2>; .loc 1 160 1 func_begin11: .loc 1 0 0 .loc 1 160 1 mov.u64 %rd1, __local_depot11; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__csub7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__csub7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__csub7double2S__param_1]; ld.param.f64 %fd1, [_Z6__csub7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp26: func_exec_begin11: .loc 1 162 13 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; sub.f64 %fd7, %fd5, %fd6; st.f64 [%SP+32], %fd7; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; sub.f64 %fd10, %fd8, %fd9; st.f64 [%SP+40], %fd10; .loc 1 163 5 ld.f64 %fd11, [%SP+40]; ld.f64 %fd12, [%SP+32]; st.param.f64 [func_retval0+0], %fd12; st.param.f64 [func_retval0+8], %fd11; ret; tmp27: func_end11: } // .globl _Z6__cmul7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmul7double2S_( .param .align 16 .b8 _Z6__cmul7double2S__param_0[16], .param .align 16 .b8 _Z6__cmul7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot12[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<21>; .reg .b64 %rd<2>; .loc 1 166 1 func_begin12: .loc 1 0 0 .loc 1 166 1 mov.u64 %rd1, __local_depot12; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmul7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmul7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmul7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmul7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp28: func_exec_begin12: .loc 1 169 5 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; mul.f64 %fd7, %fd5, %fd6; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; mul.f64 %fd10, %fd8, %fd9; sub.f64 %fd11, %fd7, %fd10; st.f64 [%SP+32], %fd11; .loc 1 170 5 ld.f64 %fd12, [%SP+0]; ld.f64 %fd13, [%SP+24]; mul.f64 %fd14, %fd12, %fd13; ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+16]; mul.f64 %fd17, %fd15, %fd16; add.f64 %fd18, %fd14, %fd17; st.f64 [%SP+40], %fd18; .loc 1 171 5 ld.f64 %fd19, [%SP+40]; ld.f64 %fd20, [%SP+32]; st.param.f64 [func_retval0+0], %fd20; st.param.f64 [func_retval0+8], %fd19; ret; tmp29: func_end12: } // .globl _Z6__cdiv7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cdiv7double2S_( .param .align 16 .b8 _Z6__cdiv7double2S__param_0[16], .param .align 16 .b8 _Z6__cdiv7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot13[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<29>; .reg .b64 %rd<2>; .loc 1 174 1 func_begin13: .loc 1 0 0 .loc 1 174 1 mov.u64 %rd1, __local_depot13; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cdiv7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cdiv7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cdiv7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cdiv7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp30: func_exec_begin13: .loc 1 177 20 ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 177 22 // Callseq Start 35 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 35 tmp31: .loc 1 178 24 rcp.rn.f64 %fd8, %fd7; tmp32: .loc 1 179 18 ld.f64 %fd9, [%SP+16]; mul.f64 %fd10, %fd8, %fd9; tmp33: .loc 1 180 18 ld.f64 %fd11, [%SP+24]; mul.f64 %fd12, %fd8, %fd11; tmp34: .loc 1 181 13 ld.f64 %fd13, [%SP+0]; mul.f64 %fd14, %fd13, %fd10; ld.f64 %fd15, [%SP+8]; mul.f64 %fd16, %fd15, %fd12; add.f64 %fd17, %fd14, %fd16; st.f64 [%SP+32], %fd17; ld.f64 %fd18, [%SP+8]; mul.f64 %fd19, %fd18, %fd10; ld.f64 %fd20, [%SP+0]; mul.f64 %fd21, %fd20, %fd12; sub.f64 %fd22, %fd19, %fd21; st.f64 [%SP+40], %fd22; .loc 1 183 5 ld.f64 %fd23, [%SP+32]; mul.f64 %fd24, %fd23, %fd8; st.f64 [%SP+32], %fd24; .loc 1 184 5 ld.f64 %fd25, [%SP+40]; mul.f64 %fd26, %fd25, %fd8; st.f64 [%SP+40], %fd26; .loc 1 185 5 ld.f64 %fd27, [%SP+40]; ld.f64 %fd28, [%SP+32]; st.param.f64 [func_retval0+0], %fd28; st.param.f64 [func_retval0+8], %fd27; ret; tmp35: func_end13: } // .globl _Z6__cmin7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmin7double2S_( .param .align 16 .b8 _Z6__cmin7double2S__param_0[16], .param .align 16 .b8 _Z6__cmin7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot14[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f64 %fd<17>; .reg .b64 %rd<2>; .loc 1 188 1 func_begin14: .loc 1 0 0 .loc 1 188 1 mov.u64 %rd1, __local_depot14; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmin7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmin7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmin7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmin7double2S__param_0]; st.f64 [%SP+24], %fd2; st.f64 [%SP+16], %fd1; st.f64 [%SP+40], %fd4; st.f64 [%SP+32], %fd3; func_exec_begin14: .loc 1 190 5 tmp36: ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 190 12 // Callseq Start 36 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 36 ld.f64 %fd8, [%SP+32]; ld.f64 %fd9, [%SP+40]; .loc 1 190 26 // Callseq Start 37 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd8; .param .b64 param1; st.param.f64 [param1+0], %fd9; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd10, [retval0+0]; //{ }// Callseq End 37 setp.lt.f64 %p1, %fd7, %fd10; not.pred %p2, %p1; @%p2 bra BB14_2; bra.uni BB14_1; BB14_1: ld.f64 %fd13, [%SP+16]; ld.f64 %fd14, [%SP+24]; st.f64 [%SP+8], %fd14; st.f64 [%SP+0], %fd13; bra.uni BB14_3; BB14_2: ld.f64 %fd11, [%SP+32]; ld.f64 %fd12, [%SP+40]; st.f64 [%SP+8], %fd12; st.f64 [%SP+0], %fd11; BB14_3: ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+0]; st.param.f64 [func_retval0+0], %fd16; st.param.f64 [func_retval0+8], %fd15; ret; tmp37: func_end14: } // .globl _Z6__cmax7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmax7double2S_( .param .align 16 .b8 _Z6__cmax7double2S__param_0[16], .param .align 16 .b8 _Z6__cmax7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot15[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f64 %fd<17>; .reg .b64 %rd<2>; .loc 1 193 1 func_begin15: .loc 1 0 0 .loc 1 193 1 mov.u64 %rd1, __local_depot15; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmax7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmax7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmax7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmax7double2S__param_0]; st.f64 [%SP+24], %fd2; st.f64 [%SP+16], %fd1; st.f64 [%SP+40], %fd4; st.f64 [%SP+32], %fd3; func_exec_begin15: .loc 1 195 5 tmp38: ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 195 12 // Callseq Start 38 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 38 ld.f64 %fd8, [%SP+32]; ld.f64 %fd9, [%SP+40]; .loc 1 195 26 // Callseq Start 39 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd8; .param .b64 param1; st.param.f64 [param1+0], %fd9; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd10, [retval0+0]; //{ }// Callseq End 39 setp.gt.f64 %p1, %fd7, %fd10; not.pred %p2, %p1; @%p2 bra BB15_2; bra.uni BB15_1; BB15_1: ld.f64 %fd13, [%SP+16]; ld.f64 %fd14, [%SP+24]; st.f64 [%SP+8], %fd14; st.f64 [%SP+0], %fd13; bra.uni BB15_3; BB15_2: ld.f64 %fd11, [%SP+32]; ld.f64 %fd12, [%SP+40]; st.f64 [%SP+8], %fd12; st.f64 [%SP+0], %fd11; BB15_3: ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+0]; st.param.f64 [func_retval0+0], %fd16; st.param.f64 [func_retval0+8], %fd15; ret; tmp39: func_end15: } // .globl KER14507509769487725591 .visible .entry KER14507509769487725591( .param .u64 KER14507509769487725591_param_0, .param .u64 KER14507509769487725591_param_1, .param .u64 KER14507509769487725591_param_2, .param .u64 KER14507509769487725591_param_3, .param .u64 KER14507509769487725591_param_4, .param .u64 KER14507509769487725591_param_5, .param .u64 KER14507509769487725591_param_6, .param .u64 KER14507509769487725591_param_7, .param .u64 KER14507509769487725591_param_8, .param .u64 KER14507509769487725591_param_9, .param .u64 KER14507509769487725591_param_10, .param .u64 KER14507509769487725591_param_11, .param .align 8 .b8 KER14507509769487725591_param_12[72], .param .u32 KER14507509769487725591_param_13, .param .u32 KER14507509769487725591_param_14, .param .u32 KER14507509769487725591_param_15, .param .u32 KER14507509769487725591_param_16 ) { .local .align 8 .b8 __local_depot16[144]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<5>; .reg .f32 %f<46>; .reg .b32 %r<33>; .reg .b64 %rd<79>; .loc 1 220 1 func_begin16: .loc 1 0 0 .loc 1 220 1 mov.u64 %rd78, __local_depot16; cvta.local.u64 %SP, %rd78; ld.param.u64 %rd1, [KER14507509769487725591_param_0]; ld.param.u64 %rd2, [KER14507509769487725591_param_1]; ld.param.u64 %rd3, [KER14507509769487725591_param_2]; ld.param.u64 %rd4, [KER14507509769487725591_param_3]; ld.param.u64 %rd5, [KER14507509769487725591_param_4]; ld.param.u64 %rd6, [KER14507509769487725591_param_5]; ld.param.u64 %rd7, [KER14507509769487725591_param_6]; ld.param.u64 %rd8, [KER14507509769487725591_param_7]; ld.param.u64 %rd9, [KER14507509769487725591_param_8]; ld.param.u64 %rd10, [KER14507509769487725591_param_9]; ld.param.u64 %rd11, [KER14507509769487725591_param_10]; ld.param.u64 %rd12, [KER14507509769487725591_param_11]; ld.param.u64 %rd14, [KER14507509769487725591_param_12+8]; ld.param.u64 %rd15, [KER14507509769487725591_param_12+16]; ld.param.u64 %rd16, [KER14507509769487725591_param_12+24]; ld.param.u64 %rd17, [KER14507509769487725591_param_12+32]; ld.param.u64 %rd18, [KER14507509769487725591_param_12+40]; ld.param.u64 %rd19, [KER14507509769487725591_param_12+48]; ld.param.u64 %rd20, [KER14507509769487725591_param_12+56]; ld.param.u64 %rd21, [KER14507509769487725591_param_12+64]; ld.param.u32 %r5, [KER14507509769487725591_param_13]; ld.param.u32 %r6, [KER14507509769487725591_param_14]; ld.param.u32 %r7, [KER14507509769487725591_param_15]; ld.param.u32 %r8, [KER14507509769487725591_param_16]; ld.param.u64 %rd13, [KER14507509769487725591_param_12]; st.u64 [%SP+64], %rd21; st.u64 [%SP+56], %rd20; st.u64 [%SP+48], %rd19; st.u64 [%SP+40], %rd18; st.u64 [%SP+32], %rd17; st.u64 [%SP+24], %rd16; st.u64 [%SP+16], %rd15; st.u64 [%SP+8], %rd14; st.u64 [%SP+0], %rd13; mov.b32 %r9, %r5; mov.b32 %r10, %r6; mov.b32 %r11, %r8; tmp40: func_exec_begin16: .loc 1 237 21 ld.u64 %rd22, [%SP+0]; ld.u64 %rd23, [%SP+8]; ld.u64 %rd24, [%SP+16]; ld.u64 %rd25, [%SP+24]; ld.u64 %rd26, [%SP+32]; ld.u64 %rd27, [%SP+40]; ld.u64 %rd28, [%SP+48]; ld.u64 %rd29, [%SP+56]; ld.u64 %rd30, [%SP+64]; st.u64 [%SP+136], %rd30; st.u64 [%SP+128], %rd29; st.u64 [%SP+120], %rd28; st.u64 [%SP+112], %rd27; st.u64 [%SP+104], %rd26; st.u64 [%SP+96], %rd25; st.u64 [%SP+88], %rd24; st.u64 [%SP+80], %rd23; st.u64 [%SP+72], %rd22; .loc 1 239 25 tmp41: mov.u32 %r12, %ctaid.x; mov.b32 %r1, %r12; tmp42: mov.u32 %r32, %r1; tmp43: BB16_1: .loc 1 239 5 mov.u32 %r2, %r32; tmp44: setp.lt.u32 %p1, %r2, %r7; not.pred %p2, %p1; @%p2 bra BB16_6; bra.uni BB16_2; BB16_2: .loc 1 241 23 tmp45: mov.u32 %r13, %tid.x; mov.b32 %r14, %r13; tmp46: .loc 1 242 17 mov.u32 %r15, %ntid.x; mul.lo.s32 %r16, %r2, %r15; mov.u32 %r17, %ntid.y; mul.lo.s32 %r18, %r16, %r17; add.s32 %r3, %r18, %r14; tmp47: .loc 1 243 9 cvt.s64.s32 %rd31, %r3; add.u64 %rd32, %SP, 72; add.s64 %rd33, %rd32, 8; ld.u64 %rd34, [%rd33+24]; add.s64 %rd35, %rd32, 40; ld.u64 %rd36, [%rd35+24]; mul.lo.s64 %rd37, %rd34, %rd36; setp.ge.s64 %p3, %rd31, %rd37; not.pred %p4, %p3; @%p4 bra BB16_4; bra.uni BB16_3; BB16_3: .loc 1 243 56 tmp48: bra.uni BB16_7; tmp49: BB16_4: .loc 1 244 18 mov.b32 %r19, %r3; tmp50: .loc 1 245 10 mov.b32 %r20, %r3; tmp51: .loc 1 246 10 mov.b32 %r21, %r3; tmp52: .loc 1 247 10 mov.b32 %r22, %r3; tmp53: .loc 1 248 10 mov.b32 %r23, %r3; tmp54: .loc 1 249 11 mov.b32 %r24, %r3; tmp55: .loc 1 250 11 mov.b32 %r25, %r3; tmp56: .loc 1 251 11 mov.b32 %r26, %r3; tmp57: .loc 1 252 11 mov.b32 %r27, %r3; tmp58: .loc 1 253 11 mov.b32 %r28, %r3; tmp59: .loc 1 254 11 mov.b32 %r29, %r3; tmp60: .loc 1 255 11 mov.b32 %r30, %r3; tmp61: .loc 1 256 12 cvt.s64.s32 %rd38, %r19; shl.b64 %rd39, %rd38, 2; add.s64 %rd40, %rd1, %rd39; ld.f32 %f1, [%rd40]; mov.f32 %f2, %f1; tmp62: .loc 1 257 12 cvt.s64.s32 %rd41, %r20; shl.b64 %rd42, %rd41, 2; add.s64 %rd43, %rd2, %rd42; ld.f32 %f3, [%rd43]; mov.f32 %f4, %f3; tmp63: .loc 1 258 12 add.f32 %f5, %f2, %f4; tmp64: .loc 1 259 12 cvt.s64.s32 %rd44, %r21; shl.b64 %rd45, %rd44, 2; add.s64 %rd46, %rd3, %rd45; ld.f32 %f6, [%rd46]; mov.f32 %f7, %f6; tmp65: .loc 1 260 12 add.f32 %f8, %f4, %f7; tmp66: .loc 1 261 12 add.f32 %f9, %f5, %f8; tmp67: .loc 1 262 12 cvt.s64.s32 %rd47, %r22; shl.b64 %rd48, %rd47, 2; add.s64 %rd49, %rd4, %rd48; ld.f32 %f10, [%rd49]; mov.f32 %f11, %f10; tmp68: .loc 1 263 12 add.f32 %f12, %f8, %f11; tmp69: .loc 1 264 12 add.f32 %f13, %f9, %f12; tmp70: .loc 1 265 12 cvt.s64.s32 %rd50, %r23; shl.b64 %rd51, %rd50, 2; add.s64 %rd52, %rd5, %rd51; ld.f32 %f14, [%rd52]; mov.f32 %f15, %f14; tmp71: .loc 1 266 13 add.f32 %f16, %f12, %f15; tmp72: .loc 1 267 13 add.f32 %f17, %f13, %f16; tmp73: .loc 1 268 13 cvt.s64.s32 %rd53, %r24; shl.b64 %rd54, %rd53, 2; add.s64 %rd55, %rd6, %rd54; ld.f32 %f18, [%rd55]; mov.f32 %f19, %f18; tmp74: .loc 1 269 13 add.f32 %f20, %f16, %f19; tmp75: .loc 1 270 13 add.f32 %f21, %f17, %f20; tmp76: .loc 1 271 13 cvt.s64.s32 %rd56, %r25; shl.b64 %rd57, %rd56, 2; add.s64 %rd58, %rd7, %rd57; ld.f32 %f22, [%rd58]; mov.f32 %f23, %f22; tmp77: .loc 1 272 13 add.f32 %f24, %f20, %f23; tmp78: .loc 1 273 13 add.f32 %f25, %f21, %f24; tmp79: .loc 1 274 13 cvt.s64.s32 %rd59, %r26; shl.b64 %rd60, %rd59, 2; add.s64 %rd61, %rd8, %rd60; ld.f32 %f26, [%rd61]; mov.f32 %f27, %f26; tmp80: .loc 1 275 13 add.f32 %f28, %f24, %f27; tmp81: .loc 1 276 13 add.f32 %f29, %f25, %f28; tmp82: .loc 1 277 13 cvt.s64.s32 %rd62, %r27; shl.b64 %rd63, %rd62, 2; add.s64 %rd64, %rd9, %rd63; ld.f32 %f30, [%rd64]; mov.f32 %f31, %f30; tmp83: .loc 1 278 13 add.f32 %f32, %f28, %f31; tmp84: .loc 1 279 13 add.f32 %f33, %f29, %f32; tmp85: .loc 1 280 13 cvt.s64.s32 %rd65, %r28; shl.b64 %rd66, %rd65, 2; add.s64 %rd67, %rd10, %rd66; ld.f32 %f34, [%rd67]; mov.f32 %f35, %f34; tmp86: .loc 1 281 13 add.f32 %f36, %f32, %f35; tmp87: .loc 1 282 13 add.f32 %f37, %f33, %f36; tmp88: .loc 1 283 13 cvt.s64.s32 %rd68, %r29; shl.b64 %rd69, %rd68, 2; add.s64 %rd70, %rd11, %rd69; ld.f32 %f38, [%rd70]; mov.f32 %f39, %f38; tmp89: .loc 1 284 13 add.f32 %f40, %f36, %f39; tmp90: .loc 1 285 13 add.f32 %f41, %f37, %f40; tmp91: .loc 1 286 13 cvt.s64.s32 %rd71, %r30; shl.b64 %rd72, %rd71, 2; add.s64 %rd73, %rd12, %rd72; ld.f32 %f42, [%rd73]; mov.f32 %f43, %f42; tmp92: .loc 1 287 13 add.f32 %f44, %f40, %f43; tmp93: .loc 1 288 13 add.f32 %f45, %f41, %f44; tmp94: .loc 1 289 1 ld.u64 %rd74, [%SP+0]; cvt.s64.s32 %rd75, %r3; shl.b64 %rd76, %rd75, 2; add.s64 %rd77, %rd74, %rd76; st.f32 [%rd77], %f45; tmp95: .loc 1 239 68 mov.u32 %r31, %nctaid.x; add.s32 %r4, %r2, %r31; tmp96: mov.u32 %r32, %r4; tmp97: bra.uni BB16_1; tmp98: BB16_6: BB16_7: .loc 1 294 1 ret; tmp99: func_end16: } .func (.param .b32 func_retval0) hypotf( .param .b32 hypotf_param_0, .param .b32 hypotf_param_1 ) { .reg .pred %p<5>; .reg .f32 %f<20>; .reg .b32 %r<13>; ld.param.f32 %f7, [hypotf_param_0]; ld.param.f32 %f8, [hypotf_param_1]; abs.f32 %f9, %f7; abs.f32 %f10, %f8; mov.b32 %r1, %f10; mov.b32 %r2, %f9; min.s32 %r3, %r1, %r2; mov.b32 %f1, %r3; mov.b32 %r4, %f9; mov.b32 %r5, %f10; max.s32 %r6, %r4, %r5; mov.b32 %f2, %r6; and.b32 %r7, %r6, -33554432; sub.s32 %r8, %r7, 1065353216; add.s32 %r9, %r8, 8388608; mov.u32 %r10, 1065353216; sub.s32 %r11, %r10, %r9; mov.b32 %f11, %r11; mul.f32 %f12, %f1, %f11; mul.f32 %f13, %f2, %f11; mul.f32 %f14, %f12, %f12; fma.rn.f32 %f15, %f13, %f13, %f14; sqrt.rn.f32 %f16, %f15; add.s32 %r12, %r9, 1065353216; mov.b32 %f17, %r12; mul.f32 %f3, %f16, %f17; setp.eq.f32 %p1, %f1, 0f00000000; not.pred %p2, %p1; mov.f32 %f18, %f3; @%p2 bra BB17_2; bra.uni BB17_1; BB17_1: mov.f32 %f18, %f2; BB17_2: mov.f32 %f4, %f18; setp.eq.f32 %p3, %f1, 0f7F800000; not.pred %p4, %p3; mov.f32 %f19, %f4; @%p4 bra BB17_4; bra.uni BB17_3; BB17_3: mov.f32 %f5, 0f7F800000; mov.f32 %f19, %f5; BB17_4: mov.f32 %f6, %f19; st.param.f32 [func_retval0+0], %f6; ret; } .func (.param .b64 func_retval0) hypot( .param .b64 hypot_param_0, .param .b64 hypot_param_1 ) { .reg .pred %p<5>; .reg .b32 %r<11>; .reg .f64 %fd<32>; .reg .b64 %rd<7>; ld.param.f64 %fd6, [hypot_param_0]; ld.param.f64 %fd7, [hypot_param_1]; abs.f64 %fd10, %fd6; abs.f64 %fd11, %fd7; mov.b64 %rd1, %fd11; mov.b64 %rd2, %fd10; min.u64 %rd3, %rd1, %rd2; mov.b64 %fd1, %rd3; mov.b64 %rd4, %fd10; mov.b64 %rd5, %fd11; max.u64 %rd6, %rd4, %rd5; mov.b64 %fd2, %rd6; { .reg .b32 %temp; mov.b64 {%temp, %r1}, %fd2; } and.b32 %r2, %r1, -4194304; sub.s32 %r3, %r2, 1072693248; add.s32 %r4, %r3, 1048576; mov.u32 %r5, 1072693248; sub.s32 %r6, %r5, %r4; mov.u32 %r7, 0; mov.b64 %fd12, {%r7, %r6}; mul.f64 %fd13, %fd1, %fd12; mul.f64 %fd14, %fd2, %fd12; mul.f64 %fd15, %fd13, %fd13; fma.rn.f64 %fd16, %fd14, %fd14, %fd15; mov.f64 %fd17, 0d7FEFFFFFFFFFFFFF; min.f64 %fd9, %fd16, %fd17; // inline asm rsqrt.approx.ftz.f64 %fd8, %fd9; // inline asm mul.rn.f64 %fd18, %fd8, %fd8; neg.f64 %fd19, %fd18; mov.f64 %fd20, 0d3FF0000000000000; fma.rn.f64 %fd21, %fd9, %fd19, %fd20; mov.f64 %fd22, 0d3FE0000000000000; mov.f64 %fd23, 0d3FD8000000000000; fma.rn.f64 %fd24, %fd23, %fd21, %fd22; mul.rn.f64 %fd25, %fd21, %fd8; fma.rn.f64 %fd26, %fd24, %fd25, %fd8; mul.f64 %fd27, %fd16, %fd26; add.s32 %r8, %r4, 1072693248; mov.b64 %fd28, {%r7, %r8}; mul.f64 %fd3, %fd27, %fd28; setp.eq.f64 %p1, %fd1, 0d0000000000000000; not.pred %p2, %p1; mov.f64 %fd30, %fd3; @%p2 bra BB18_2; bra.uni BB18_1; BB18_1: mov.f64 %fd30, %fd2; BB18_2: mov.f64 %fd4, %fd30; { .reg .b32 %temp; mov.b64 {%temp, %r9}, %fd1; } mov.f64 %fd29, 0d7FF0000000000000; { .reg .b32 %temp; mov.b64 {%temp, %r10}, %fd29; } setp.ge.u32 %p3, %r9, %r10; not.pred %p4, %p3; mov.f64 %fd31, %fd4; @%p4 bra BB18_4; bra.uni BB18_3; BB18_3: mov.f64 %fd31, %fd1; BB18_4: mov.f64 %fd5, %fd31; st.param.f64 [func_retval0+0], %fd5; ret; } .file 1 "/media/nvidia/Data/arrayfire/github/build/TX2-R28.2-DP_Debug/KER14507509769487725591" .file 2 "/media/nvidia/Data/arrayfire/github/build/TX2-R28.2-DP_Debug/__nv_nvrtc_builtin_header.h" .section .debug_info { .b32 5367 .b8 2 .b8 0 .b32 .debug_abbrev .b8 8 .b8 1 .b8 108 .b8 103 .b8 101 .b8 110 .b8 102 .b8 101 .b8 58 .b8 32 .b8 69 .b8 68 .b8 71 .b8 32 .b8 52 .b8 46 .b8 49 .b8 50 .b8 0 .b8 4 .b8 75 .b8 69 .b8 82 .b8 49 .b8 52 .b8 53 .b8 48 .b8 55 .b8 53 .b8 48 .b8 57 .b8 55 .b8 54 .b8 57 .b8 52 .b8 56 .b8 55 .b8 55 .b8 50 .b8 53 .b8 53 .b8 57 .b8 49 .b8 0 .b64 0 .b32 .debug_line .b8 47 .b8 109 .b8 101 .b8 100 .b8 105 .b8 97 .b8 47 .b8 110 .b8 118 .b8 105 .b8 100 .b8 105 .b8 97 .b8 47 .b8 68 .b8 97 .b8 116 .b8 97 .b8 47 .b8 97 .b8 114 .b8 114 .b8 97 .b8 121 .b8 102 .b8 105 .b8 114 .b8 101 .b8 47 .b8 103 .b8 105 .b8 116 .b8 104 .b8 117 .b8 98 .b8 47 .b8 98 .b8 117 .b8 105 .b8 108 .b8 100 .b8 47 .b8 84 .b8 88 .b8 50 .b8 45 .b8 82 .b8 50 .b8 56 .b8 46 .b8 50 .b8 45 .b8 68 .b8 80 .b8 95 .b8 68 .b8 101 .b8 98 .b8 117 .b8 103 .b8 0 .b8 2 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b32 1 .b32 68 .b32 280 .b8 1 .b64 func_begin0 .b64 func_end0 .b8 1 .b8 156 .b8 3 .b8 120 .b8 0 .b32 1 .b32 68 .b32 379 .b8 5 .b8 144 .b8 177 .b8 204 .b8 149 .b8 1 .b8 2 .b8 3 .b8 121 .b8 0 .b32 1 .b32 68 .b32 379 .b8 5 .b8 144 .b8 178 .b8 204 .b8 149 .b8 1 .b8 2 .b8 4 .b64 tmp0 .b64 tmp1 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 70 .b32 280 .b8 11 .b8 3 .b64 __local_depot0 .b8 35 .b8 0 .b8 6 .b8 0 .b8 0 .b8 6 .b32 292 .b8 99 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 0 .b8 6 .b32 312 .b8 99 .b8 117 .b8 70 .b8 108 .b8 111 .b8 97 .b8 116 .b8 67 .b8 111 .b8 109 .b8 112 .b8 108 .b8 101 .b8 120 .b8 0 .b8 6 .b32 324 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b8 7 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 8 .b32 2 .b32 728 .b8 8 .b8 120 .b8 0 .b32 379 .b32 2 .b32 728 .b8 0 .b8 1 .b8 8 .b8 121 .b8 0 .b32 379 .b32 2 .b32 728 .b8 4 .b8 1 .b8 0 .b8 9 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 0 .b8 4 .b32 4 .b8 2 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 1 .b32 74 .b32 280 .b8 1 .b64 func_begin1 .b64 func_end1 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 0 .b32 1 .b32 74 .b32 280 .b8 11 .b8 3 .b64 __local_depot1 .b8 35 .b8 0 .b8 6 .b8 4 .b64 tmp2 .b64 tmp3 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 76 .b32 280 .b8 11 .b8 3 .b64 __local_depot1 .b8 35 .b8 8 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 80 .b32 280 .b8 1 .b64 func_begin2 .b64 func_end2 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 80 .b32 280 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 80 .b32 280 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp4 .b64 tmp5 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 82 .b32 280 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 86 .b32 280 .b8 1 .b64 func_begin3 .b64 func_end3 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 86 .b32 280 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 86 .b32 280 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp6 .b64 tmp7 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 88 .b32 280 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 92 .b32 280 .b8 1 .b64 func_begin4 .b64 func_end4 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 92 .b32 280 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 92 .b32 280 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp8 .b64 tmp9 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 94 .b32 280 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 100 .b32 280 .b8 1 .b64 func_begin5 .b64 func_end5 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 100 .b32 280 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 100 .b32 280 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp10 .b64 tmp15 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 107 .b32 280 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 16 .b8 6 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 103 .b32 379 .b8 5 .b8 144 .b8 183 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 105 .b8 110 .b8 118 .b8 95 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 104 .b32 379 .b8 5 .b8 144 .b8 184 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 105 .b32 379 .b8 6 .b8 144 .b8 176 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 106 .b32 379 .b8 6 .b8 144 .b8 178 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 114 .b32 280 .b8 1 .b64 func_begin6 .b64 func_end6 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 114 .b32 280 .b8 11 .b8 3 .b64 __local_depot6 .b8 35 .b8 8 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 114 .b32 280 .b8 11 .b8 3 .b64 __local_depot6 .b8 35 .b8 16 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 119 .b32 280 .b8 1 .b64 func_begin7 .b64 func_end7 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 119 .b32 280 .b8 11 .b8 3 .b64 __local_depot7 .b8 35 .b8 8 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 119 .b32 280 .b8 11 .b8 3 .b64 __local_depot7 .b8 35 .b8 16 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b32 1 .b32 142 .b32 1796 .b8 1 .b64 func_begin8 .b64 func_end8 .b8 1 .b8 156 .b8 3 .b8 120 .b8 0 .b32 1 .b32 142 .b32 1899 .b8 6 .b8 144 .b8 177 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 3 .b8 121 .b8 0 .b32 1 .b32 142 .b32 1899 .b8 6 .b8 144 .b8 178 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 4 .b64 tmp20 .b64 tmp21 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 144 .b32 1796 .b8 11 .b8 3 .b64 __local_depot8 .b8 35 .b8 0 .b8 6 .b8 0 .b8 0 .b8 6 .b32 1809 .b8 99 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 0 .b8 6 .b32 1830 .b8 99 .b8 117 .b8 68 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 67 .b8 111 .b8 109 .b8 112 .b8 108 .b8 101 .b8 120 .b8 0 .b8 6 .b32 1843 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b8 7 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 16 .b32 2 .b32 774 .b8 8 .b8 120 .b8 0 .b32 1899 .b32 2 .b32 776 .b8 0 .b8 1 .b8 8 .b8 121 .b8 0 .b32 1899 .b32 2 .b32 776 .b8 8 .b8 1 .b8 0 .b8 9 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 0 .b8 4 .b32 8 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 1 .b32 148 .b32 1796 .b8 1 .b64 func_begin9 .b64 func_end9 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 0 .b32 1 .b32 148 .b32 1796 .b8 11 .b8 3 .b64 __local_depot9 .b8 35 .b8 0 .b8 6 .b8 4 .b64 tmp22 .b64 tmp23 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 150 .b32 1796 .b8 11 .b8 3 .b64 __local_depot9 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 154 .b32 1796 .b8 1 .b64 func_begin10 .b64 func_end10 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 154 .b32 1796 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 154 .b32 1796 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp24 .b64 tmp25 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 156 .b32 1796 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 160 .b32 1796 .b8 1 .b64 func_begin11 .b64 func_end11 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 160 .b32 1796 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 160 .b32 1796 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp26 .b64 tmp27 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 162 .b32 1796 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 166 .b32 1796 .b8 1 .b64 func_begin12 .b64 func_end12 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 166 .b32 1796 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 166 .b32 1796 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp28 .b64 tmp29 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 168 .b32 1796 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 174 .b32 1796 .b8 1 .b64 func_begin13 .b64 func_end13 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 174 .b32 1796 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 174 .b32 1796 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp30 .b64 tmp35 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 181 .b32 1796 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 32 .b8 6 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 177 .b32 1899 .b8 6 .b8 144 .b8 183 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 110 .b8 118 .b8 95 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 178 .b32 1899 .b8 6 .b8 144 .b8 184 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 179 .b32 1899 .b8 7 .b8 144 .b8 176 .b8 226 .b8 144 .b8 179 .b8 214 .b8 4 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 180 .b32 1899 .b8 7 .b8 144 .b8 178 .b8 226 .b8 144 .b8 179 .b8 214 .b8 4 .b8 2 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 188 .b32 1796 .b8 1 .b64 func_begin14 .b64 func_end14 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 188 .b32 1796 .b8 11 .b8 3 .b64 __local_depot14 .b8 35 .b8 16 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 188 .b32 1796 .b8 11 .b8 3 .b64 __local_depot14 .b8 35 .b8 32 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 193 .b32 1796 .b8 1 .b64 func_begin15 .b64 func_end15 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 193 .b32 1796 .b8 11 .b8 3 .b64 __local_depot15 .b8 35 .b8 16 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 193 .b32 1796 .b8 11 .b8 3 .b64 __local_depot15 .b8 35 .b8 32 .b8 6 .b8 0 .b8 2 .b8 75 .b8 69 .b8 82 .b8 49 .b8 52 .b8 53 .b8 48 .b8 55 .b8 53 .b8 48 .b8 57 .b8 55 .b8 54 .b8 57 .b8 52 .b8 56 .b8 55 .b8 55 .b8 50 .b8 53 .b8 53 .b8 57 .b8 49 .b8 0 .b8 75 .b8 69 .b8 82 .b8 49 .b8 52 .b8 53 .b8 48 .b8 55 .b8 53 .b8 48 .b8 57 .b8 55 .b8 54 .b8 57 .b8 52 .b8 56 .b8 55 .b8 55 .b8 50 .b8 53 .b8 53 .b8 57 .b8 49 .b8 0 .b32 1 .b32 220 .b32 5182 .b8 1 .b64 func_begin16 .b64 func_end16 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 48 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 221 .b32 5303 .b8 9 .b8 3 .b64 KER14507509769487725591_param_0 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 222 .b32 5303 .b8 9 .b8 3 .b64 KER14507509769487725591_param_1 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 223 .b32 5303 .b8 9 .b8 3 .b64 KER14507509769487725591_param_2 .b8 7 .b8 3 .b8 105 .b8 110 .b8 54 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 224 .b32 5303 .b8 9 .b8 3 .b64 KER14507509769487725591_param_3 .b8 7 .b8 3 .b8 105 .b8 110 .b8 57 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 225 .b32 5303 .b8 9 .b8 3 .b64 KER14507509769487725591_param_4 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 50 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 226 .b32 5303 .b8 9 .b8 3 .b64 KER14507509769487725591_param_5 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 53 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 227 .b32 5303 .b8 9 .b8 3 .b64 KER14507509769487725591_param_6 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 56 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 228 .b32 5303 .b8 9 .b8 3 .b64 KER14507509769487725591_param_7 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 229 .b32 5303 .b8 9 .b8 3 .b64 KER14507509769487725591_param_8 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 52 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 230 .b32 5303 .b8 9 .b8 3 .b64 KER14507509769487725591_param_9 .b8 7 .b8 3 .b8 105 .b8 110 .b8 50 .b8 55 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 231 .b32 5303 .b8 9 .b8 3 .b64 KER14507509769487725591_param_10 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 48 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 232 .b32 5303 .b8 9 .b8 3 .b64 KER14507509769487725591_param_11 .b8 7 .b8 3 .b8 111 .b8 117 .b8 116 .b8 51 .b8 50 .b8 0 .b32 1 .b32 233 .b32 5215 .b8 11 .b8 3 .b64 __local_depot16 .b8 35 .b8 0 .b8 6 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 234 .b32 5331 .b8 5 .b8 144 .b8 185 .b8 228 .b8 149 .b8 1 .b8 2 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 234 .b32 5331 .b8 6 .b8 144 .b8 176 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 120 .b8 95 .b8 116 .b8 111 .b8 116 .b8 97 .b8 108 .b8 0 .b32 1 .b32 234 .b32 5331 .b8 9 .b8 3 .b64 KER14507509769487725591_param_15 .b8 7 .b8 3 .b8 110 .b8 117 .b8 109 .b8 95 .b8 111 .b8 100 .b8 105 .b8 109 .b8 115 .b8 0 .b32 1 .b32 234 .b32 5331 .b8 6 .b8 144 .b8 177 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 4 .b64 tmp40 .b64 tmp99 .b8 5 .b8 111 .b8 117 .b8 116 .b8 114 .b8 101 .b8 102 .b8 0 .b32 1 .b32 237 .b32 5215 .b8 11 .b8 3 .b64 __local_depot16 .b8 35 .b8 72 .b8 6 .b8 4 .b64 tmp41 .b64 tmp98 .b8 10 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 73 .b8 100 .b8 120 .b8 95 .b8 120 .b8 0 .b32 1 .b32 239 .b32 5360 .b32 .debug_loc .b8 4 .b64 tmp45 .b64 tmp98 .b8 4 .b64 tmp45 .b64 tmp95 .b8 5 .b8 116 .b8 104 .b8 114 .b8 101 .b8 97 .b8 100 .b8 73 .b8 100 .b8 0 .b32 1 .b32 241 .b32 5331 .b8 6 .b8 144 .b8 180 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 0 .b32 1 .b32 242 .b32 5360 .b8 5 .b8 144 .b8 179 .b8 228 .b8 149 .b8 1 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 48 .b8 0 .b32 1 .b32 244 .b32 5360 .b8 6 .b8 144 .b8 185 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 0 .b32 1 .b32 245 .b32 5360 .b8 6 .b8 144 .b8 176 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 0 .b32 1 .b32 246 .b32 5360 .b8 6 .b8 144 .b8 177 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 54 .b8 0 .b32 1 .b32 247 .b32 5360 .b8 6 .b8 144 .b8 178 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 57 .b8 0 .b32 1 .b32 248 .b32 5360 .b8 6 .b8 144 .b8 179 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 50 .b8 0 .b32 1 .b32 249 .b32 5360 .b8 6 .b8 144 .b8 180 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 53 .b8 0 .b32 1 .b32 250 .b32 5360 .b8 6 .b8 144 .b8 181 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 56 .b8 0 .b32 1 .b32 251 .b32 5360 .b8 6 .b8 144 .b8 182 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 49 .b8 0 .b32 1 .b32 252 .b32 5360 .b8 6 .b8 144 .b8 183 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 52 .b8 0 .b32 1 .b32 253 .b32 5360 .b8 6 .b8 144 .b8 184 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 50 .b8 55 .b8 0 .b32 1 .b32 254 .b32 5360 .b8 6 .b8 144 .b8 185 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 48 .b8 0 .b32 1 .b32 255 .b32 5360 .b8 6 .b8 144 .b8 176 .b8 230 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 48 .b8 0 .b32 1 .b32 256 .b32 379 .b8 5 .b8 144 .b8 178 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 0 .b32 1 .b32 257 .b32 379 .b8 5 .b8 144 .b8 180 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 0 .b32 1 .b32 258 .b32 379 .b8 5 .b8 144 .b8 181 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 0 .b32 1 .b32 259 .b32 379 .b8 5 .b8 144 .b8 183 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 0 .b32 1 .b32 260 .b32 379 .b8 5 .b8 144 .b8 184 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 53 .b8 0 .b32 1 .b32 261 .b32 379 .b8 5 .b8 144 .b8 185 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 54 .b8 0 .b32 1 .b32 262 .b32 379 .b8 6 .b8 144 .b8 177 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 55 .b8 0 .b32 1 .b32 263 .b32 379 .b8 6 .b8 144 .b8 178 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 56 .b8 0 .b32 1 .b32 264 .b32 379 .b8 6 .b8 144 .b8 179 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 57 .b8 0 .b32 1 .b32 265 .b32 379 .b8 6 .b8 144 .b8 181 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 48 .b8 0 .b32 1 .b32 266 .b32 379 .b8 6 .b8 144 .b8 182 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 49 .b8 0 .b32 1 .b32 267 .b32 379 .b8 6 .b8 144 .b8 183 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 50 .b8 0 .b32 1 .b32 268 .b32 379 .b8 6 .b8 144 .b8 185 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 51 .b8 0 .b32 1 .b32 269 .b32 379 .b8 6 .b8 144 .b8 176 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 52 .b8 0 .b32 1 .b32 270 .b32 379 .b8 6 .b8 144 .b8 177 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 53 .b8 0 .b32 1 .b32 271 .b32 379 .b8 6 .b8 144 .b8 179 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 54 .b8 0 .b32 1 .b32 272 .b32 379 .b8 6 .b8 144 .b8 180 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 55 .b8 0 .b32 1 .b32 273 .b32 379 .b8 6 .b8 144 .b8 181 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 56 .b8 0 .b32 1 .b32 274 .b32 379 .b8 6 .b8 144 .b8 183 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 57 .b8 0 .b32 1 .b32 275 .b32 379 .b8 6 .b8 144 .b8 184 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 48 .b8 0 .b32 1 .b32 276 .b32 379 .b8 6 .b8 144 .b8 185 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 49 .b8 0 .b32 1 .b32 277 .b32 379 .b8 6 .b8 144 .b8 177 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 50 .b8 0 .b32 1 .b32 278 .b32 379 .b8 6 .b8 144 .b8 178 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 51 .b8 0 .b32 1 .b32 279 .b32 379 .b8 6 .b8 144 .b8 179 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 52 .b8 0 .b32 1 .b32 280 .b32 379 .b8 6 .b8 144 .b8 181 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 53 .b8 0 .b32 1 .b32 281 .b32 379 .b8 6 .b8 144 .b8 182 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 54 .b8 0 .b32 1 .b32 282 .b32 379 .b8 6 .b8 144 .b8 183 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 55 .b8 0 .b32 1 .b32 283 .b32 379 .b8 6 .b8 144 .b8 185 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 56 .b8 0 .b32 1 .b32 284 .b32 379 .b8 6 .b8 144 .b8 176 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 57 .b8 0 .b32 1 .b32 285 .b32 379 .b8 6 .b8 144 .b8 177 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 48 .b8 0 .b32 1 .b32 286 .b32 379 .b8 6 .b8 144 .b8 179 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 49 .b8 0 .b32 1 .b32 287 .b32 379 .b8 6 .b8 144 .b8 180 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 50 .b8 0 .b32 1 .b32 288 .b32 379 .b8 6 .b8 144 .b8 181 .b8 232 .b8 152 .b8 171 .b8 2 .b8 2 .b8 0 .b8 0 .b8 0 .b8 0 .b8 0 .b8 11 .b8 118 .b8 111 .b8 105 .b8 100 .b8 0 .b8 6 .b32 5199 .b8 100 .b8 105 .b8 109 .b8 95 .b8 116 .b8 0 .b8 9 .b8 108 .b8 111 .b8 110 .b8 103 .b8 32 .b8 108 .b8 111 .b8 110 .b8 103 .b8 0 .b8 5 .b32 8 .b8 7 .b8 95 .b8 90 .b8 53 .b8 80 .b8 97 .b8 114 .b8 97 .b8 109 .b8 73 .b8 102 .b8 69 .b8 0 .b32 72 .b32 1 .b32 212 .b8 8 .b8 112 .b8 116 .b8 114 .b8 0 .b32 5303 .b32 1 .b32 214 .b8 0 .b8 1 .b8 8 .b8 100 .b8 105 .b8 109 .b8 115 .b8 0 .b32 5309 .b32 1 .b32 215 .b8 8 .b8 1 .b8 8 .b8 115 .b8 116 .b8 114 .b8 105 .b8 100 .b8 101 .b8 115 .b8 0 .b32 5309 .b32 1 .b32 216 .b8 40 .b8 1 .b8 0 .b8 12 .b32 379 .b8 12 .b8 13 .b32 5188 .b8 14 .b32 5321 .b8 3 .b8 0 .b8 15 .b8 105 .b8 110 .b8 116 .b8 0 .b32 4 .b8 5 .b8 6 .b32 5341 .b8 117 .b8 105 .b8 110 .b8 116 .b8 0 .b8 9 .b8 117 .b8 110 .b8 115 .b8 105 .b8 103 .b8 110 .b8 101 .b8 100 .b8 32 .b8 105 .b8 110 .b8 116 .b8 0 .b8 7 .b32 4 .b8 9 .b8 105 .b8 110 .b8 116 .b8 0 .b8 5 .b32 4 .b8 0 } .section .debug_abbrev { .b8 1 .b8 17 .b8 1 .b8 37 .b8 8 .b8 19 .b8 11 .b8 3 .b8 8 .b8 17 .b8 1 .b8 16 .b8 6 .b8 27 .b8 8 .b8 0 .b8 0 .b8 2 .b8 46 .b8 1 .b8 135 .b8 64 .b8 8 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 63 .b8 12 .b8 17 .b8 1 .b8 18 .b8 1 .b8 64 .b8 10 .b8 0 .b8 0 .b8 3 .b8 5 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 10 .b8 51 .b8 11 .b8 0 .b8 0 .b8 4 .b8 11 .b8 1 .b8 17 .b8 1 .b8 18 .b8 1 .b8 0 .b8 0 .b8 5 .b8 52 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 10 .b8 51 .b8 11 .b8 0 .b8 0 .b8 6 .b8 22 .b8 0 .b8 73 .b8 19 .b8 3 .b8 8 .b8 0 .b8 0 .b8 7 .b8 19 .b8 1 .b8 3 .b8 8 .b8 11 .b8 6 .b8 58 .b8 6 .b8 59 .b8 6 .b8 0 .b8 0 .b8 8 .b8 13 .b8 0 .b8 3 .b8 8 .b8 73 .b8 19 .b8 58 .b8 6 .b8 59 .b8 6 .b8 56 .b8 15 .b8 50 .b8 11 .b8 0 .b8 0 .b8 9 .b8 36 .b8 0 .b8 3 .b8 8 .b8 62 .b8 11 .b8 11 .b8 6 .b8 0 .b8 0 .b8 10 .b8 52 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 6 .b8 0 .b8 0 .b8 11 .b8 59 .b8 0 .b8 3 .b8 8 .b8 0 .b8 0 .b8 12 .b8 15 .b8 0 .b8 73 .b8 19 .b8 51 .b8 11 .b8 0 .b8 0 .b8 13 .b8 1 .b8 1 .b8 73 .b8 19 .b8 0 .b8 0 .b8 14 .b8 33 .b8 0 .b8 73 .b8 19 .b8 47 .b8 15 .b8 0 .b8 0 .b8 15 .b8 36 .b8 0 .b8 3 .b8 8 .b8 11 .b8 6 .b8 62 .b8 11 .b8 0 .b8 0 .b8 0 } .section .debug_loc { .b64 tmp42 .b64 tmp43 .b8 5 .b8 0 .b8 144 .b8 177 .b8 228 .b8 149 .b8 1 .b64 tmp43 .b64 tmp44 .b8 6 .b8 0 .b8 144 .b8 178 .b8 230 .b8 200 .b8 171 .b8 2 .b64 tmp44 .b64 tmp96 .b8 5 .b8 0 .b8 144 .b8 178 .b8 228 .b8 149 .b8 1 .b64 tmp96 .b64 tmp97 .b8 5 .b8 0 .b8 144 .b8 180 .b8 228 .b8 149 .b8 1 .b64 tmp97 .b64 func_end16 .b8 6 .b8 0 .b8 144 .b8 178 .b8 230 .b8 200 .b8 171 .b8 2 .b64 0 .b64 0 } .section .debug_ranges { } .section .debug_pubnames { .b32 411 .b8 2 .b8 0 .b32 .debug_info .b32 5367 .b32 391 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 1643 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b32 3168 .b8 75 .b8 69 .b8 82 .b8 49 .b8 52 .b8 53 .b8 48 .b8 55 .b8 53 .b8 48 .b8 57 .b8 55 .b8 54 .b8 57 .b8 52 .b8 56 .b8 55 .b8 55 .b8 50 .b8 53 .b8 53 .b8 57 .b8 49 .b8 0 .b32 2603 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 127 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b32 1082 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1377 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1510 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2060 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 539 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 720 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 3035 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2241 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2422 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 901 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2902 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1912 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 0 } ] JIT_KERNEL:------------------------- typedef unsigned int uint; typedef long long dim_t; /******************************************************* * Copyright (c) 2014, ArrayFire * All rights reserved. * * This file is distributed under 3-clause BSD license. * The complete license agreement can be obtained at: * http://arrayfire.com/licenses/BSD-3-Clause ********************************************************/ typedef float2 cuFloatComplex; typedef cuFloatComplex cfloat; typedef double2 cuDoubleComplex; typedef cuDoubleComplex cdouble; // ---------------------------------------------- // REAL NUMBER OPERATIONS // ---------------------------------------------- #define sign(in) signbit((in)) #define __noop(a) (a) #define __add(lhs, rhs) (lhs) + (rhs) #define __sub(lhs, rhs) (lhs) - (rhs) #define __mul(lhs, rhs) (lhs) * (rhs) #define __div(lhs, rhs) (lhs) / (rhs) #define __and(lhs, rhs) (lhs) && (rhs) #define __or(lhs, rhs) (lhs) || (rhs) #define __lt(lhs, rhs) (lhs) < (rhs) #define __gt(lhs, rhs) (lhs) > (rhs) #define __le(lhs, rhs) (lhs) <= (rhs) #define __ge(lhs, rhs) (lhs) >= (rhs) #define __eq(lhs, rhs) (lhs) == (rhs) #define __neq(lhs, rhs) (lhs) != (rhs) #define __conj(in) (in) #define __real(in) (in) #define __imag(in) (0) #define __abs(in) abs(in) #define __sigmoid(in) (1.0/(1 + exp(-(in)))) #define __bitor(lhs, rhs) ((lhs) | (rhs)) #define __bitand(lhs, rhs) ((lhs) & (rhs)) #define __bitxor(lhs, rhs) ((lhs) ^ (rhs)) #define __bitshiftl(lhs, rhs) ((lhs) << (rhs)) #define __bitshiftr(lhs, rhs) ((lhs) >> (rhs)) #define __min(lhs, rhs) ((lhs) < (rhs)) ? (lhs) : (rhs) #define __max(lhs, rhs) ((lhs) > (rhs)) ? (lhs) : (rhs) #define __rem(lhs, rhs) ((lhs) % (rhs)) #define __mod(lhs, rhs) ((lhs) % (rhs)) #define __pow(lhs, rhs) fpow((float)lhs, (float)rhs) #define __convert_char(val) (char)((val) != 0) #define fpow(lhs, rhs) pow((lhs), (rhs)) #define frem(lhs, rhs) remainder((lhs), (rhs)) #define iszero(a) ((a) == 0) // ---------------------------------------------- // COMPLEX FLOAT OPERATIONS // ---------------------------------------------- #define __crealf(in) ((in).x) #define __cimagf(in) ((in).y) #define __cabsf(in) hypotf(in.x, in.y) __device__ cfloat __cplx2f(float x, float y) { cfloat res = {x, y}; return res; } __device__ cfloat __cconjf(cfloat in) { cfloat res = {in.x, -in.y}; return res; } __device__ cfloat __caddf(cfloat lhs, cfloat rhs) { cfloat res = {lhs.x + rhs.x, lhs.y + rhs.y}; return res; } __device__ cfloat __csubf(cfloat lhs, cfloat rhs) { cfloat res = {lhs.x - rhs.x, lhs.y - rhs.y}; return res; } __device__ cfloat __cmulf(cfloat lhs, cfloat rhs) { cfloat out; out.x = lhs.x * rhs.x - lhs.y * rhs.y; out.y = lhs.x * rhs.y + lhs.y * rhs.x; return out; } __device__ cfloat __cdivf(cfloat lhs, cfloat rhs) { // Normalize by absolute value and multiply float rhs_abs = __cabsf(rhs); float inv_rhs_abs = 1.0f / rhs_abs; float rhs_x = inv_rhs_abs * rhs.x; float rhs_y = inv_rhs_abs * rhs.y; cfloat out = {lhs.x * rhs_x + lhs.y * rhs_y, lhs.y * rhs_x - lhs.x * rhs_y}; out.x *= inv_rhs_abs; out.y *= inv_rhs_abs; return out; } __device__ cfloat __cminf(cfloat lhs, cfloat rhs) { return __cabsf(lhs) < __cabsf(rhs) ? lhs : rhs; } __device__ cfloat __cmaxf(cfloat lhs, cfloat rhs) { return __cabsf(lhs) > __cabsf(rhs) ? lhs : rhs; } #define __candf(lhs, rhs) __cabsf(lhs) && __cabsf(rhs) #define __corf(lhs, rhs) __cabsf(lhs) || __cabsf(rhs) #define __ceqf(lhs, rhs) (((lhs).x == (rhs).x) && ((lhs).y == (rhs).y)) #define __cneqf(lhs, rhs) !__ceqf((lhs), (rhs)) #define __cltf(lhs, rhs) (__cabsf(lhs) < __cabsf(rhs)) #define __clef(lhs, rhs) (__cabsf(lhs) <= __cabsf(rhs)) #define __cgtf(lhs, rhs) (__cabsf(lhs) > __cabsf(rhs)) #define __cgef(lhs, rhs) (__cabsf(lhs) >= __cabsf(rhs)) #define __convert_cfloat(real) __cplx2f(real, 0) #define __convert_c2c(in) (in) #define __convert_z2c(in) __cplx2f((float)in.x, (float)in.y) // ---------------------------------------------- // COMPLEX DOUBLE OPERATIONS // ---------------------------------------------- #define __creal(in) ((in).x) #define __cimag(in) ((in).y) #define __cabs(in) hypot(in.x, in.y) __device__ cdouble __cplx2(double x, double y) { cdouble res = {x, y}; return res; } __device__ cdouble __cconj(cdouble in) { cdouble res = {in.x, -in.y}; return res; } __device__ cdouble __cadd(cdouble lhs, cdouble rhs) { cdouble res = {lhs.x + rhs.x, lhs.y + rhs.y}; return res; } __device__ cdouble __csub(cdouble lhs, cdouble rhs) { cdouble res = {lhs.x - rhs.x, lhs.y - rhs.y}; return res; } __device__ cdouble __cmul(cdouble lhs, cdouble rhs) { cdouble out; out.x = lhs.x * rhs.x - lhs.y * rhs.y; out.y = lhs.x * rhs.y + lhs.y * rhs.x; return out; } __device__ cdouble __cdiv(cdouble lhs, cdouble rhs) { // Normalize by absolute value and multiply double rhs_abs = __cabs(rhs); double inv_rhs_abs = 1.0 / rhs_abs; double rhs_x = inv_rhs_abs * rhs.x; double rhs_y = inv_rhs_abs * rhs.y; cdouble out = {lhs.x * rhs_x + lhs.y * rhs_y, lhs.y * rhs_x - lhs.x * rhs_y}; out.x *= inv_rhs_abs; out.y *= inv_rhs_abs; return out; } __device__ cdouble __cmin(cdouble lhs, cdouble rhs) { return __cabs(lhs) < __cabs(rhs) ? lhs : rhs; } __device__ cdouble __cmax(cdouble lhs, cdouble rhs) { return __cabs(lhs) > __cabs(rhs) ? lhs : rhs; } #define __cand(lhs, rhs) __cabs(lhs) && __cabs(rhs) #define __cor(lhs, rhs) __cabs(lhs) || __cabs(rhs) #define __ceq(lhs, rhs) (((lhs).x == (rhs).x) && ((lhs).y == (rhs).y)) #define __cneq(lhs, rhs) !__ceq((lhs), (rhs)) #define __clt(lhs, rhs) (__cabs(lhs) < __cabs(rhs)) #define __cle(lhs, rhs) (__cabs(lhs) <= __cabs(rhs)) #define __cgt(lhs, rhs) (__cabs(lhs) > __cabs(rhs)) #define __cge(lhs, rhs) (__cabs(lhs) >= __cabs(rhs)) #define __convert_cdouble(real) __cplx2(real, 0) #define __convert_z2z(in) (in) #define __convert_c2z(in) __cplx2((double)in.x, (double)in.y) template struct Param { T *ptr; dim_t dims[4]; dim_t strides[4]; }; extern "C" __global__ void KER1894079773716380402( float *in0_ptr, float *in1_ptr, float *in3_ptr, float *in5_ptr, float *in7_ptr, float *in9_ptr, float *in11_ptr, float *in13_ptr, float *in15_ptr, float *in17_ptr, float *in19_ptr, Param out20, uint blocks_x, uint blocks_y, uint blocks_x_total, uint num_odims) { Param outref = out20; for (int blockIdx_x = blockIdx.x; blockIdx_x < blocks_x_total; blockIdx_x += gridDim.x) { uint threadId = threadIdx.x; int idx = blockIdx_x * blockDim.x * blockDim.y + threadId; if (idx >= outref.dims[3] * outref.strides[3]) return; int idx0 = idx; int idx1 = idx; int idx3 = idx; int idx5 = idx; int idx7 = idx; int idx9 = idx; int idx11 = idx; int idx13 = idx; int idx15 = idx; int idx17 = idx; int idx19 = idx; float val0 = in0_ptr[idx0]; float val1 = in1_ptr[idx1]; float val2 = __add(val0, val1); float val3 = in3_ptr[idx3]; float val4 = __add(val2, val3); float val5 = in5_ptr[idx5]; float val6 = __add(val4, val5); float val7 = in7_ptr[idx7]; float val8 = __add(val6, val7); float val9 = in9_ptr[idx9]; float val10 = __add(val8, val9); float val11 = in11_ptr[idx11]; float val12 = __add(val10, val11); float val13 = in13_ptr[idx13]; float val14 = __add(val12, val13); float val15 = in15_ptr[idx15]; float val16 = __add(val14, val15); float val17 = in17_ptr[idx17]; float val18 = __add(val16, val17); float val19 = in19_ptr[idx19]; float val20 = __add(val18, val19); out20.ptr[idx] = val20; } } ----------------------------- num_options=3 compiler_options: [--gpu-architecture=compute_62] compiler_options: [--device-debug] compiler_options: [--generate-line-info] compiledPTX size 65148 PTX [// // Generated by NVIDIA NVVM Compiler // // Compiler Build ID: CL-23162084 // Cuda compilation tools, release 9.0, V9.0.252 // Based on LLVM 3.4svn // .version 6.0 .target sm_62, debug .address_size 64 // .globl _Z8__cplx2fff .func (.param .b32 func_retval0) hypotf ( .param .b32 hypotf_param_0, .param .b32 hypotf_param_1 ) ; .func (.param .b64 func_retval0) hypot ( .param .b64 hypot_param_0, .param .b64 hypot_param_1 ) ; .visible .func (.param .align 8 .b8 func_retval0[8]) _Z8__cplx2fff( .param .b32 _Z8__cplx2fff_param_0, .param .b32 _Z8__cplx2fff_param_1 ) { .local .align 8 .b8 __local_depot0[8]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<5>; .reg .b64 %rd<2>; .loc 1 68 1 func_begin0: .loc 1 0 0 .loc 1 68 1 mov.u64 %rd1, __local_depot0; cvta.local.u64 %SP, %rd1; ld.param.f32 %f1, [_Z8__cplx2fff_param_0]; ld.param.f32 %f2, [_Z8__cplx2fff_param_1]; tmp0: func_exec_begin0: .loc 1 70 12 st.f32 [%SP+0], %f1; st.f32 [%SP+4], %f2; .loc 1 71 5 ld.f32 %f3, [%SP+4]; ld.f32 %f4, [%SP+0]; st.param.f32 [func_retval0+0], %f4; st.param.f32 [func_retval0+4], %f3; ret; tmp1: func_end0: } // .globl _Z8__cconjf6float2 .visible .func (.param .align 8 .b8 func_retval0[8]) _Z8__cconjf6float2( .param .align 8 .b8 _Z8__cconjf6float2_param_0[8] ) { .local .align 8 .b8 __local_depot1[16]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<8>; .reg .b64 %rd<2>; .loc 1 74 1 func_begin1: .loc 1 0 0 .loc 1 74 1 mov.u64 %rd1, __local_depot1; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z8__cconjf6float2_param_0+4]; ld.param.f32 %f1, [_Z8__cconjf6float2_param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; tmp2: func_exec_begin1: .loc 1 76 12 ld.f32 %f3, [%SP+0]; st.f32 [%SP+8], %f3; ld.f32 %f4, [%SP+4]; neg.f32 %f5, %f4; st.f32 [%SP+12], %f5; .loc 1 77 5 ld.f32 %f6, [%SP+12]; ld.f32 %f7, [%SP+8]; st.param.f32 [func_retval0+0], %f7; st.param.f32 [func_retval0+4], %f6; ret; tmp3: func_end1: } // .globl _Z7__caddf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__caddf6float2S_( .param .align 8 .b8 _Z7__caddf6float2S__param_0[8], .param .align 8 .b8 _Z7__caddf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot2[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<13>; .reg .b64 %rd<2>; .loc 1 80 1 func_begin2: .loc 1 0 0 .loc 1 80 1 mov.u64 %rd1, __local_depot2; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__caddf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__caddf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__caddf6float2S__param_1]; ld.param.f32 %f1, [_Z7__caddf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp4: func_exec_begin2: .loc 1 82 12 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; add.f32 %f7, %f5, %f6; st.f32 [%SP+16], %f7; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; add.f32 %f10, %f8, %f9; st.f32 [%SP+20], %f10; .loc 1 83 5 ld.f32 %f11, [%SP+20]; ld.f32 %f12, [%SP+16]; st.param.f32 [func_retval0+0], %f12; st.param.f32 [func_retval0+4], %f11; ret; tmp5: func_end2: } // .globl _Z7__csubf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__csubf6float2S_( .param .align 8 .b8 _Z7__csubf6float2S__param_0[8], .param .align 8 .b8 _Z7__csubf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot3[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<13>; .reg .b64 %rd<2>; .loc 1 86 1 func_begin3: .loc 1 0 0 .loc 1 86 1 mov.u64 %rd1, __local_depot3; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__csubf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__csubf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__csubf6float2S__param_1]; ld.param.f32 %f1, [_Z7__csubf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp6: func_exec_begin3: .loc 1 88 12 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; sub.f32 %f7, %f5, %f6; st.f32 [%SP+16], %f7; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; sub.f32 %f10, %f8, %f9; st.f32 [%SP+20], %f10; .loc 1 89 5 ld.f32 %f11, [%SP+20]; ld.f32 %f12, [%SP+16]; st.param.f32 [func_retval0+0], %f12; st.param.f32 [func_retval0+4], %f11; ret; tmp7: func_end3: } // .globl _Z7__cmulf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cmulf6float2S_( .param .align 8 .b8 _Z7__cmulf6float2S__param_0[8], .param .align 8 .b8 _Z7__cmulf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot4[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<21>; .reg .b64 %rd<2>; .loc 1 92 1 func_begin4: .loc 1 0 0 .loc 1 92 1 mov.u64 %rd1, __local_depot4; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cmulf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cmulf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cmulf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cmulf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp8: func_exec_begin4: .loc 1 95 5 ld.f32 %f5, [%SP+0]; ld.f32 %f6, [%SP+8]; mul.f32 %f7, %f5, %f6; ld.f32 %f8, [%SP+4]; ld.f32 %f9, [%SP+12]; mul.f32 %f10, %f8, %f9; sub.f32 %f11, %f7, %f10; st.f32 [%SP+16], %f11; .loc 1 96 5 ld.f32 %f12, [%SP+0]; ld.f32 %f13, [%SP+12]; mul.f32 %f14, %f12, %f13; ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+8]; mul.f32 %f17, %f15, %f16; add.f32 %f18, %f14, %f17; st.f32 [%SP+20], %f18; .loc 1 97 5 ld.f32 %f19, [%SP+20]; ld.f32 %f20, [%SP+16]; st.param.f32 [func_retval0+0], %f20; st.param.f32 [func_retval0+4], %f19; ret; tmp9: func_end4: } // .globl _Z7__cdivf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cdivf6float2S_( .param .align 8 .b8 _Z7__cdivf6float2S__param_0[8], .param .align 8 .b8 _Z7__cdivf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot5[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f32 %f<29>; .reg .b64 %rd<2>; .loc 1 100 1 func_begin5: .loc 1 0 0 .loc 1 100 1 mov.u64 %rd1, __local_depot5; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cdivf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cdivf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cdivf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cdivf6float2S__param_0]; st.f32 [%SP+4], %f2; st.f32 [%SP+0], %f1; st.f32 [%SP+12], %f4; st.f32 [%SP+8], %f3; tmp10: func_exec_begin5: .loc 1 103 19 ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 103 21 // Callseq Start 40 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 40 tmp11: .loc 1 104 23 rcp.rn.f32 %f8, %f7; tmp12: .loc 1 105 17 ld.f32 %f9, [%SP+8]; mul.f32 %f10, %f8, %f9; tmp13: .loc 1 106 17 ld.f32 %f11, [%SP+12]; mul.f32 %f12, %f8, %f11; tmp14: .loc 1 107 12 ld.f32 %f13, [%SP+0]; mul.f32 %f14, %f13, %f10; ld.f32 %f15, [%SP+4]; mul.f32 %f16, %f15, %f12; add.f32 %f17, %f14, %f16; st.f32 [%SP+16], %f17; ld.f32 %f18, [%SP+4]; mul.f32 %f19, %f18, %f10; ld.f32 %f20, [%SP+0]; mul.f32 %f21, %f20, %f12; sub.f32 %f22, %f19, %f21; st.f32 [%SP+20], %f22; .loc 1 109 5 ld.f32 %f23, [%SP+16]; mul.f32 %f24, %f23, %f8; st.f32 [%SP+16], %f24; .loc 1 110 5 ld.f32 %f25, [%SP+20]; mul.f32 %f26, %f25, %f8; st.f32 [%SP+20], %f26; .loc 1 111 5 ld.f32 %f27, [%SP+20]; ld.f32 %f28, [%SP+16]; st.param.f32 [func_retval0+0], %f28; st.param.f32 [func_retval0+4], %f27; ret; tmp15: func_end5: } // .globl _Z7__cminf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cminf6float2S_( .param .align 8 .b8 _Z7__cminf6float2S__param_0[8], .param .align 8 .b8 _Z7__cminf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot6[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f32 %f<17>; .reg .b64 %rd<2>; .loc 1 114 1 func_begin6: .loc 1 0 0 .loc 1 114 1 mov.u64 %rd1, __local_depot6; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cminf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cminf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cminf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cminf6float2S__param_0]; st.f32 [%SP+12], %f2; st.f32 [%SP+8], %f1; st.f32 [%SP+20], %f4; st.f32 [%SP+16], %f3; func_exec_begin6: .loc 1 116 5 tmp16: ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 116 12 // Callseq Start 41 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 41 ld.f32 %f8, [%SP+16]; ld.f32 %f9, [%SP+20]; .loc 1 116 27 // Callseq Start 42 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f8; .param .b32 param1; st.param.f32 [param1+0], %f9; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f10, [retval0+0]; //{ }// Callseq End 42 setp.lt.f32 %p1, %f7, %f10; not.pred %p2, %p1; @%p2 bra BB6_2; bra.uni BB6_1; BB6_1: ld.f32 %f13, [%SP+8]; ld.f32 %f14, [%SP+12]; st.f32 [%SP+4], %f14; st.f32 [%SP+0], %f13; bra.uni BB6_3; BB6_2: ld.f32 %f11, [%SP+16]; ld.f32 %f12, [%SP+20]; st.f32 [%SP+4], %f12; st.f32 [%SP+0], %f11; BB6_3: ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+0]; st.param.f32 [func_retval0+0], %f16; st.param.f32 [func_retval0+4], %f15; ret; tmp17: func_end6: } // .globl _Z7__cmaxf6float2S_ .visible .func (.param .align 8 .b8 func_retval0[8]) _Z7__cmaxf6float2S_( .param .align 8 .b8 _Z7__cmaxf6float2S__param_0[8], .param .align 8 .b8 _Z7__cmaxf6float2S__param_1[8] ) { .local .align 8 .b8 __local_depot7[24]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f32 %f<17>; .reg .b64 %rd<2>; .loc 1 119 1 func_begin7: .loc 1 0 0 .loc 1 119 1 mov.u64 %rd1, __local_depot7; cvta.local.u64 %SP, %rd1; ld.param.f32 %f2, [_Z7__cmaxf6float2S__param_0+4]; ld.param.f32 %f4, [_Z7__cmaxf6float2S__param_1+4]; ld.param.f32 %f3, [_Z7__cmaxf6float2S__param_1]; ld.param.f32 %f1, [_Z7__cmaxf6float2S__param_0]; st.f32 [%SP+12], %f2; st.f32 [%SP+8], %f1; st.f32 [%SP+20], %f4; st.f32 [%SP+16], %f3; func_exec_begin7: .loc 1 121 5 tmp18: ld.f32 %f5, [%SP+8]; ld.f32 %f6, [%SP+12]; .loc 1 121 12 // Callseq Start 43 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f5; .param .b32 param1; st.param.f32 [param1+0], %f6; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f7, [retval0+0]; //{ }// Callseq End 43 ld.f32 %f8, [%SP+16]; ld.f32 %f9, [%SP+20]; .loc 1 121 27 // Callseq Start 44 { .reg .b32 temp_param_reg; // } .param .b32 param0; st.param.f32 [param0+0], %f8; .param .b32 param1; st.param.f32 [param1+0], %f9; .param .b32 retval0; call.uni (retval0), hypotf, ( param0, param1 ); ld.param.f32 %f10, [retval0+0]; //{ }// Callseq End 44 setp.gt.f32 %p1, %f7, %f10; not.pred %p2, %p1; @%p2 bra BB7_2; bra.uni BB7_1; BB7_1: ld.f32 %f13, [%SP+8]; ld.f32 %f14, [%SP+12]; st.f32 [%SP+4], %f14; st.f32 [%SP+0], %f13; bra.uni BB7_3; BB7_2: ld.f32 %f11, [%SP+16]; ld.f32 %f12, [%SP+20]; st.f32 [%SP+4], %f12; st.f32 [%SP+0], %f11; BB7_3: ld.f32 %f15, [%SP+4]; ld.f32 %f16, [%SP+0]; st.param.f32 [func_retval0+0], %f16; st.param.f32 [func_retval0+4], %f15; ret; tmp19: func_end7: } // .globl _Z7__cplx2dd .visible .func (.param .align 16 .b8 func_retval0[16]) _Z7__cplx2dd( .param .b64 _Z7__cplx2dd_param_0, .param .b64 _Z7__cplx2dd_param_1 ) { .local .align 16 .b8 __local_depot8[16]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<5>; .reg .b64 %rd<2>; .loc 1 142 1 func_begin8: .loc 1 0 0 .loc 1 142 1 mov.u64 %rd1, __local_depot8; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd1, [_Z7__cplx2dd_param_0]; ld.param.f64 %fd2, [_Z7__cplx2dd_param_1]; tmp20: func_exec_begin8: .loc 1 144 13 st.f64 [%SP+0], %fd1; st.f64 [%SP+8], %fd2; .loc 1 145 5 ld.f64 %fd3, [%SP+8]; ld.f64 %fd4, [%SP+0]; st.param.f64 [func_retval0+0], %fd4; st.param.f64 [func_retval0+8], %fd3; ret; tmp21: func_end8: } // .globl _Z7__cconj7double2 .visible .func (.param .align 16 .b8 func_retval0[16]) _Z7__cconj7double2( .param .align 16 .b8 _Z7__cconj7double2_param_0[16] ) { .local .align 16 .b8 __local_depot9[32]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<8>; .reg .b64 %rd<2>; .loc 1 148 1 func_begin9: .loc 1 0 0 .loc 1 148 1 mov.u64 %rd1, __local_depot9; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z7__cconj7double2_param_0+8]; ld.param.f64 %fd1, [_Z7__cconj7double2_param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; tmp22: func_exec_begin9: .loc 1 150 13 ld.f64 %fd3, [%SP+0]; st.f64 [%SP+16], %fd3; ld.f64 %fd4, [%SP+8]; neg.f64 %fd5, %fd4; st.f64 [%SP+24], %fd5; .loc 1 151 5 ld.f64 %fd6, [%SP+24]; ld.f64 %fd7, [%SP+16]; st.param.f64 [func_retval0+0], %fd7; st.param.f64 [func_retval0+8], %fd6; ret; tmp23: func_end9: } // .globl _Z6__cadd7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cadd7double2S_( .param .align 16 .b8 _Z6__cadd7double2S__param_0[16], .param .align 16 .b8 _Z6__cadd7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot10[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<13>; .reg .b64 %rd<2>; .loc 1 154 1 func_begin10: .loc 1 0 0 .loc 1 154 1 mov.u64 %rd1, __local_depot10; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cadd7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cadd7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cadd7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cadd7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp24: func_exec_begin10: .loc 1 156 13 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; add.f64 %fd7, %fd5, %fd6; st.f64 [%SP+32], %fd7; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; add.f64 %fd10, %fd8, %fd9; st.f64 [%SP+40], %fd10; .loc 1 157 5 ld.f64 %fd11, [%SP+40]; ld.f64 %fd12, [%SP+32]; st.param.f64 [func_retval0+0], %fd12; st.param.f64 [func_retval0+8], %fd11; ret; tmp25: func_end10: } // .globl _Z6__csub7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__csub7double2S_( .param .align 16 .b8 _Z6__csub7double2S__param_0[16], .param .align 16 .b8 _Z6__csub7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot11[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<13>; .reg .b64 %rd<2>; .loc 1 160 1 func_begin11: .loc 1 0 0 .loc 1 160 1 mov.u64 %rd1, __local_depot11; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__csub7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__csub7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__csub7double2S__param_1]; ld.param.f64 %fd1, [_Z6__csub7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp26: func_exec_begin11: .loc 1 162 13 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; sub.f64 %fd7, %fd5, %fd6; st.f64 [%SP+32], %fd7; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; sub.f64 %fd10, %fd8, %fd9; st.f64 [%SP+40], %fd10; .loc 1 163 5 ld.f64 %fd11, [%SP+40]; ld.f64 %fd12, [%SP+32]; st.param.f64 [func_retval0+0], %fd12; st.param.f64 [func_retval0+8], %fd11; ret; tmp27: func_end11: } // .globl _Z6__cmul7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmul7double2S_( .param .align 16 .b8 _Z6__cmul7double2S__param_0[16], .param .align 16 .b8 _Z6__cmul7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot12[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<21>; .reg .b64 %rd<2>; .loc 1 166 1 func_begin12: .loc 1 0 0 .loc 1 166 1 mov.u64 %rd1, __local_depot12; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmul7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmul7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmul7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmul7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp28: func_exec_begin12: .loc 1 169 5 ld.f64 %fd5, [%SP+0]; ld.f64 %fd6, [%SP+16]; mul.f64 %fd7, %fd5, %fd6; ld.f64 %fd8, [%SP+8]; ld.f64 %fd9, [%SP+24]; mul.f64 %fd10, %fd8, %fd9; sub.f64 %fd11, %fd7, %fd10; st.f64 [%SP+32], %fd11; .loc 1 170 5 ld.f64 %fd12, [%SP+0]; ld.f64 %fd13, [%SP+24]; mul.f64 %fd14, %fd12, %fd13; ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+16]; mul.f64 %fd17, %fd15, %fd16; add.f64 %fd18, %fd14, %fd17; st.f64 [%SP+40], %fd18; .loc 1 171 5 ld.f64 %fd19, [%SP+40]; ld.f64 %fd20, [%SP+32]; st.param.f64 [func_retval0+0], %fd20; st.param.f64 [func_retval0+8], %fd19; ret; tmp29: func_end12: } // .globl _Z6__cdiv7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cdiv7double2S_( .param .align 16 .b8 _Z6__cdiv7double2S__param_0[16], .param .align 16 .b8 _Z6__cdiv7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot13[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .f64 %fd<29>; .reg .b64 %rd<2>; .loc 1 174 1 func_begin13: .loc 1 0 0 .loc 1 174 1 mov.u64 %rd1, __local_depot13; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cdiv7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cdiv7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cdiv7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cdiv7double2S__param_0]; st.f64 [%SP+8], %fd2; st.f64 [%SP+0], %fd1; st.f64 [%SP+24], %fd4; st.f64 [%SP+16], %fd3; tmp30: func_exec_begin13: .loc 1 177 20 ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 177 22 // Callseq Start 45 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 45 tmp31: .loc 1 178 24 rcp.rn.f64 %fd8, %fd7; tmp32: .loc 1 179 18 ld.f64 %fd9, [%SP+16]; mul.f64 %fd10, %fd8, %fd9; tmp33: .loc 1 180 18 ld.f64 %fd11, [%SP+24]; mul.f64 %fd12, %fd8, %fd11; tmp34: .loc 1 181 13 ld.f64 %fd13, [%SP+0]; mul.f64 %fd14, %fd13, %fd10; ld.f64 %fd15, [%SP+8]; mul.f64 %fd16, %fd15, %fd12; add.f64 %fd17, %fd14, %fd16; st.f64 [%SP+32], %fd17; ld.f64 %fd18, [%SP+8]; mul.f64 %fd19, %fd18, %fd10; ld.f64 %fd20, [%SP+0]; mul.f64 %fd21, %fd20, %fd12; sub.f64 %fd22, %fd19, %fd21; st.f64 [%SP+40], %fd22; .loc 1 183 5 ld.f64 %fd23, [%SP+32]; mul.f64 %fd24, %fd23, %fd8; st.f64 [%SP+32], %fd24; .loc 1 184 5 ld.f64 %fd25, [%SP+40]; mul.f64 %fd26, %fd25, %fd8; st.f64 [%SP+40], %fd26; .loc 1 185 5 ld.f64 %fd27, [%SP+40]; ld.f64 %fd28, [%SP+32]; st.param.f64 [func_retval0+0], %fd28; st.param.f64 [func_retval0+8], %fd27; ret; tmp35: func_end13: } // .globl _Z6__cmin7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmin7double2S_( .param .align 16 .b8 _Z6__cmin7double2S__param_0[16], .param .align 16 .b8 _Z6__cmin7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot14[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f64 %fd<17>; .reg .b64 %rd<2>; .loc 1 188 1 func_begin14: .loc 1 0 0 .loc 1 188 1 mov.u64 %rd1, __local_depot14; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmin7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmin7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmin7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmin7double2S__param_0]; st.f64 [%SP+24], %fd2; st.f64 [%SP+16], %fd1; st.f64 [%SP+40], %fd4; st.f64 [%SP+32], %fd3; func_exec_begin14: .loc 1 190 5 tmp36: ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 190 12 // Callseq Start 46 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 46 ld.f64 %fd8, [%SP+32]; ld.f64 %fd9, [%SP+40]; .loc 1 190 26 // Callseq Start 47 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd8; .param .b64 param1; st.param.f64 [param1+0], %fd9; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd10, [retval0+0]; //{ }// Callseq End 47 setp.lt.f64 %p1, %fd7, %fd10; not.pred %p2, %p1; @%p2 bra BB14_2; bra.uni BB14_1; BB14_1: ld.f64 %fd13, [%SP+16]; ld.f64 %fd14, [%SP+24]; st.f64 [%SP+8], %fd14; st.f64 [%SP+0], %fd13; bra.uni BB14_3; BB14_2: ld.f64 %fd11, [%SP+32]; ld.f64 %fd12, [%SP+40]; st.f64 [%SP+8], %fd12; st.f64 [%SP+0], %fd11; BB14_3: ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+0]; st.param.f64 [func_retval0+0], %fd16; st.param.f64 [func_retval0+8], %fd15; ret; tmp37: func_end14: } // .globl _Z6__cmax7double2S_ .visible .func (.param .align 16 .b8 func_retval0[16]) _Z6__cmax7double2S_( .param .align 16 .b8 _Z6__cmax7double2S__param_0[16], .param .align 16 .b8 _Z6__cmax7double2S__param_1[16] ) { .local .align 16 .b8 __local_depot15[48]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<3>; .reg .f64 %fd<17>; .reg .b64 %rd<2>; .loc 1 193 1 func_begin15: .loc 1 0 0 .loc 1 193 1 mov.u64 %rd1, __local_depot15; cvta.local.u64 %SP, %rd1; ld.param.f64 %fd2, [_Z6__cmax7double2S__param_0+8]; ld.param.f64 %fd4, [_Z6__cmax7double2S__param_1+8]; ld.param.f64 %fd3, [_Z6__cmax7double2S__param_1]; ld.param.f64 %fd1, [_Z6__cmax7double2S__param_0]; st.f64 [%SP+24], %fd2; st.f64 [%SP+16], %fd1; st.f64 [%SP+40], %fd4; st.f64 [%SP+32], %fd3; func_exec_begin15: .loc 1 195 5 tmp38: ld.f64 %fd5, [%SP+16]; ld.f64 %fd6, [%SP+24]; .loc 1 195 12 // Callseq Start 48 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd5; .param .b64 param1; st.param.f64 [param1+0], %fd6; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd7, [retval0+0]; //{ }// Callseq End 48 ld.f64 %fd8, [%SP+32]; ld.f64 %fd9, [%SP+40]; .loc 1 195 26 // Callseq Start 49 { .reg .b32 temp_param_reg; // } .param .b64 param0; st.param.f64 [param0+0], %fd8; .param .b64 param1; st.param.f64 [param1+0], %fd9; .param .b64 retval0; call.uni (retval0), hypot, ( param0, param1 ); ld.param.f64 %fd10, [retval0+0]; //{ }// Callseq End 49 setp.gt.f64 %p1, %fd7, %fd10; not.pred %p2, %p1; @%p2 bra BB15_2; bra.uni BB15_1; BB15_1: ld.f64 %fd13, [%SP+16]; ld.f64 %fd14, [%SP+24]; st.f64 [%SP+8], %fd14; st.f64 [%SP+0], %fd13; bra.uni BB15_3; BB15_2: ld.f64 %fd11, [%SP+32]; ld.f64 %fd12, [%SP+40]; st.f64 [%SP+8], %fd12; st.f64 [%SP+0], %fd11; BB15_3: ld.f64 %fd15, [%SP+8]; ld.f64 %fd16, [%SP+0]; st.param.f64 [func_retval0+0], %fd16; st.param.f64 [func_retval0+8], %fd15; ret; tmp39: func_end15: } // .globl KER1894079773716380402 .visible .entry KER1894079773716380402( .param .u64 KER1894079773716380402_param_0, .param .u64 KER1894079773716380402_param_1, .param .u64 KER1894079773716380402_param_2, .param .u64 KER1894079773716380402_param_3, .param .u64 KER1894079773716380402_param_4, .param .u64 KER1894079773716380402_param_5, .param .u64 KER1894079773716380402_param_6, .param .u64 KER1894079773716380402_param_7, .param .u64 KER1894079773716380402_param_8, .param .u64 KER1894079773716380402_param_9, .param .u64 KER1894079773716380402_param_10, .param .align 8 .b8 KER1894079773716380402_param_11[72], .param .u32 KER1894079773716380402_param_12, .param .u32 KER1894079773716380402_param_13, .param .u32 KER1894079773716380402_param_14, .param .u32 KER1894079773716380402_param_15 ) { .local .align 8 .b8 __local_depot16[144]; .reg .b64 %SP; .reg .b64 %SPL; .reg .pred %p<5>; .reg .f32 %f<33>; .reg .b32 %r<32>; .reg .b64 %rd<75>; .loc 1 220 1 func_begin16: .loc 1 0 0 .loc 1 220 1 mov.u64 %rd74, __local_depot16; cvta.local.u64 %SP, %rd74; ld.param.u64 %rd1, [KER1894079773716380402_param_0]; ld.param.u64 %rd2, [KER1894079773716380402_param_1]; ld.param.u64 %rd3, [KER1894079773716380402_param_2]; ld.param.u64 %rd4, [KER1894079773716380402_param_3]; ld.param.u64 %rd5, [KER1894079773716380402_param_4]; ld.param.u64 %rd6, [KER1894079773716380402_param_5]; ld.param.u64 %rd7, [KER1894079773716380402_param_6]; ld.param.u64 %rd8, [KER1894079773716380402_param_7]; ld.param.u64 %rd9, [KER1894079773716380402_param_8]; ld.param.u64 %rd10, [KER1894079773716380402_param_9]; ld.param.u64 %rd11, [KER1894079773716380402_param_10]; ld.param.u64 %rd13, [KER1894079773716380402_param_11+8]; ld.param.u64 %rd14, [KER1894079773716380402_param_11+16]; ld.param.u64 %rd15, [KER1894079773716380402_param_11+24]; ld.param.u64 %rd16, [KER1894079773716380402_param_11+32]; ld.param.u64 %rd17, [KER1894079773716380402_param_11+40]; ld.param.u64 %rd18, [KER1894079773716380402_param_11+48]; ld.param.u64 %rd19, [KER1894079773716380402_param_11+56]; ld.param.u64 %rd20, [KER1894079773716380402_param_11+64]; ld.param.u32 %r5, [KER1894079773716380402_param_12]; ld.param.u32 %r6, [KER1894079773716380402_param_13]; ld.param.u32 %r7, [KER1894079773716380402_param_14]; ld.param.u32 %r8, [KER1894079773716380402_param_15]; ld.param.u64 %rd12, [KER1894079773716380402_param_11]; st.u64 [%SP+64], %rd20; st.u64 [%SP+56], %rd19; st.u64 [%SP+48], %rd18; st.u64 [%SP+40], %rd17; st.u64 [%SP+32], %rd16; st.u64 [%SP+24], %rd15; st.u64 [%SP+16], %rd14; st.u64 [%SP+8], %rd13; st.u64 [%SP+0], %rd12; mov.b32 %r9, %r5; mov.b32 %r10, %r6; mov.b32 %r11, %r8; tmp40: func_exec_begin16: .loc 1 236 21 ld.u64 %rd21, [%SP+0]; ld.u64 %rd22, [%SP+8]; ld.u64 %rd23, [%SP+16]; ld.u64 %rd24, [%SP+24]; ld.u64 %rd25, [%SP+32]; ld.u64 %rd26, [%SP+40]; ld.u64 %rd27, [%SP+48]; ld.u64 %rd28, [%SP+56]; ld.u64 %rd29, [%SP+64]; st.u64 [%SP+136], %rd29; st.u64 [%SP+128], %rd28; st.u64 [%SP+120], %rd27; st.u64 [%SP+112], %rd26; st.u64 [%SP+104], %rd25; st.u64 [%SP+96], %rd24; st.u64 [%SP+88], %rd23; st.u64 [%SP+80], %rd22; st.u64 [%SP+72], %rd21; .loc 1 238 25 tmp41: mov.u32 %r12, %ctaid.x; mov.b32 %r1, %r12; tmp42: mov.u32 %r31, %r1; tmp43: BB16_1: .loc 1 238 5 mov.u32 %r2, %r31; tmp44: setp.lt.u32 %p1, %r2, %r7; not.pred %p2, %p1; @%p2 bra BB16_6; bra.uni BB16_2; BB16_2: .loc 1 240 23 tmp45: mov.u32 %r13, %tid.x; mov.b32 %r14, %r13; tmp46: .loc 1 241 17 mov.u32 %r15, %ntid.x; mul.lo.s32 %r16, %r2, %r15; mov.u32 %r17, %ntid.y; mul.lo.s32 %r18, %r16, %r17; add.s32 %r3, %r18, %r14; tmp47: .loc 1 242 9 cvt.s64.s32 %rd30, %r3; add.u64 %rd31, %SP, 72; add.s64 %rd32, %rd31, 8; ld.u64 %rd33, [%rd32+24]; add.s64 %rd34, %rd31, 40; ld.u64 %rd35, [%rd34+24]; mul.lo.s64 %rd36, %rd33, %rd35; setp.ge.s64 %p3, %rd30, %rd36; not.pred %p4, %p3; @%p4 bra BB16_4; bra.uni BB16_3; BB16_3: .loc 1 242 56 tmp48: bra.uni BB16_7; tmp49: BB16_4: .loc 1 243 18 mov.b32 %r19, %r3; tmp50: .loc 1 244 10 mov.b32 %r20, %r3; tmp51: .loc 1 245 10 mov.b32 %r21, %r3; tmp52: .loc 1 246 10 mov.b32 %r22, %r3; tmp53: .loc 1 247 10 mov.b32 %r23, %r3; tmp54: .loc 1 248 10 mov.b32 %r24, %r3; tmp55: .loc 1 249 11 mov.b32 %r25, %r3; tmp56: .loc 1 250 11 mov.b32 %r26, %r3; tmp57: .loc 1 251 11 mov.b32 %r27, %r3; tmp58: .loc 1 252 11 mov.b32 %r28, %r3; tmp59: .loc 1 253 11 mov.b32 %r29, %r3; tmp60: .loc 1 254 12 cvt.s64.s32 %rd37, %r19; shl.b64 %rd38, %rd37, 2; add.s64 %rd39, %rd1, %rd38; ld.f32 %f1, [%rd39]; mov.f32 %f2, %f1; tmp61: .loc 1 255 12 cvt.s64.s32 %rd40, %r20; shl.b64 %rd41, %rd40, 2; add.s64 %rd42, %rd2, %rd41; ld.f32 %f3, [%rd42]; mov.f32 %f4, %f3; tmp62: .loc 1 256 12 add.f32 %f5, %f2, %f4; tmp63: .loc 1 257 12 cvt.s64.s32 %rd43, %r21; shl.b64 %rd44, %rd43, 2; add.s64 %rd45, %rd3, %rd44; ld.f32 %f6, [%rd45]; mov.f32 %f7, %f6; tmp64: .loc 1 258 12 add.f32 %f8, %f5, %f7; tmp65: .loc 1 259 12 cvt.s64.s32 %rd46, %r22; shl.b64 %rd47, %rd46, 2; add.s64 %rd48, %rd4, %rd47; ld.f32 %f9, [%rd48]; mov.f32 %f10, %f9; tmp66: .loc 1 260 12 add.f32 %f11, %f8, %f10; tmp67: .loc 1 261 12 cvt.s64.s32 %rd49, %r23; shl.b64 %rd50, %rd49, 2; add.s64 %rd51, %rd5, %rd50; ld.f32 %f12, [%rd51]; mov.f32 %f13, %f12; tmp68: .loc 1 262 12 add.f32 %f14, %f11, %f13; tmp69: .loc 1 263 12 cvt.s64.s32 %rd52, %r24; shl.b64 %rd53, %rd52, 2; add.s64 %rd54, %rd6, %rd53; ld.f32 %f15, [%rd54]; mov.f32 %f16, %f15; tmp70: .loc 1 264 13 add.f32 %f17, %f14, %f16; tmp71: .loc 1 265 13 cvt.s64.s32 %rd55, %r25; shl.b64 %rd56, %rd55, 2; add.s64 %rd57, %rd7, %rd56; ld.f32 %f18, [%rd57]; mov.f32 %f19, %f18; tmp72: .loc 1 266 13 add.f32 %f20, %f17, %f19; tmp73: .loc 1 267 13 cvt.s64.s32 %rd58, %r26; shl.b64 %rd59, %rd58, 2; add.s64 %rd60, %rd8, %rd59; ld.f32 %f21, [%rd60]; mov.f32 %f22, %f21; tmp74: .loc 1 268 13 add.f32 %f23, %f20, %f22; tmp75: .loc 1 269 13 cvt.s64.s32 %rd61, %r27; shl.b64 %rd62, %rd61, 2; add.s64 %rd63, %rd9, %rd62; ld.f32 %f24, [%rd63]; mov.f32 %f25, %f24; tmp76: .loc 1 270 13 add.f32 %f26, %f23, %f25; tmp77: .loc 1 271 13 cvt.s64.s32 %rd64, %r28; shl.b64 %rd65, %rd64, 2; add.s64 %rd66, %rd10, %rd65; ld.f32 %f27, [%rd66]; mov.f32 %f28, %f27; tmp78: .loc 1 272 13 add.f32 %f29, %f26, %f28; tmp79: .loc 1 273 13 cvt.s64.s32 %rd67, %r29; shl.b64 %rd68, %rd67, 2; add.s64 %rd69, %rd11, %rd68; ld.f32 %f30, [%rd69]; mov.f32 %f31, %f30; tmp80: .loc 1 274 13 add.f32 %f32, %f29, %f31; tmp81: .loc 1 275 1 ld.u64 %rd70, [%SP+0]; cvt.s64.s32 %rd71, %r3; shl.b64 %rd72, %rd71, 2; add.s64 %rd73, %rd70, %rd72; st.f32 [%rd73], %f32; tmp82: .loc 1 238 68 mov.u32 %r30, %nctaid.x; add.s32 %r4, %r2, %r30; tmp83: mov.u32 %r31, %r4; tmp84: bra.uni BB16_1; tmp85: BB16_6: BB16_7: .loc 1 280 1 ret; tmp86: func_end16: } .func (.param .b32 func_retval0) hypotf( .param .b32 hypotf_param_0, .param .b32 hypotf_param_1 ) { .reg .pred %p<5>; .reg .f32 %f<20>; .reg .b32 %r<13>; ld.param.f32 %f7, [hypotf_param_0]; ld.param.f32 %f8, [hypotf_param_1]; abs.f32 %f9, %f7; abs.f32 %f10, %f8; mov.b32 %r1, %f10; mov.b32 %r2, %f9; min.s32 %r3, %r1, %r2; mov.b32 %f1, %r3; mov.b32 %r4, %f9; mov.b32 %r5, %f10; max.s32 %r6, %r4, %r5; mov.b32 %f2, %r6; and.b32 %r7, %r6, -33554432; sub.s32 %r8, %r7, 1065353216; add.s32 %r9, %r8, 8388608; mov.u32 %r10, 1065353216; sub.s32 %r11, %r10, %r9; mov.b32 %f11, %r11; mul.f32 %f12, %f1, %f11; mul.f32 %f13, %f2, %f11; mul.f32 %f14, %f12, %f12; fma.rn.f32 %f15, %f13, %f13, %f14; sqrt.rn.f32 %f16, %f15; add.s32 %r12, %r9, 1065353216; mov.b32 %f17, %r12; mul.f32 %f3, %f16, %f17; setp.eq.f32 %p1, %f1, 0f00000000; not.pred %p2, %p1; mov.f32 %f18, %f3; @%p2 bra BB17_2; bra.uni BB17_1; BB17_1: mov.f32 %f18, %f2; BB17_2: mov.f32 %f4, %f18; setp.eq.f32 %p3, %f1, 0f7F800000; not.pred %p4, %p3; mov.f32 %f19, %f4; @%p4 bra BB17_4; bra.uni BB17_3; BB17_3: mov.f32 %f5, 0f7F800000; mov.f32 %f19, %f5; BB17_4: mov.f32 %f6, %f19; st.param.f32 [func_retval0+0], %f6; ret; } .func (.param .b64 func_retval0) hypot( .param .b64 hypot_param_0, .param .b64 hypot_param_1 ) { .reg .pred %p<5>; .reg .b32 %r<11>; .reg .f64 %fd<32>; .reg .b64 %rd<7>; ld.param.f64 %fd6, [hypot_param_0]; ld.param.f64 %fd7, [hypot_param_1]; abs.f64 %fd10, %fd6; abs.f64 %fd11, %fd7; mov.b64 %rd1, %fd11; mov.b64 %rd2, %fd10; min.u64 %rd3, %rd1, %rd2; mov.b64 %fd1, %rd3; mov.b64 %rd4, %fd10; mov.b64 %rd5, %fd11; max.u64 %rd6, %rd4, %rd5; mov.b64 %fd2, %rd6; { .reg .b32 %temp; mov.b64 {%temp, %r1}, %fd2; } and.b32 %r2, %r1, -4194304; sub.s32 %r3, %r2, 1072693248; add.s32 %r4, %r3, 1048576; mov.u32 %r5, 1072693248; sub.s32 %r6, %r5, %r4; mov.u32 %r7, 0; mov.b64 %fd12, {%r7, %r6}; mul.f64 %fd13, %fd1, %fd12; mul.f64 %fd14, %fd2, %fd12; mul.f64 %fd15, %fd13, %fd13; fma.rn.f64 %fd16, %fd14, %fd14, %fd15; mov.f64 %fd17, 0d7FEFFFFFFFFFFFFF; min.f64 %fd9, %fd16, %fd17; // inline asm rsqrt.approx.ftz.f64 %fd8, %fd9; // inline asm mul.rn.f64 %fd18, %fd8, %fd8; neg.f64 %fd19, %fd18; mov.f64 %fd20, 0d3FF0000000000000; fma.rn.f64 %fd21, %fd9, %fd19, %fd20; mov.f64 %fd22, 0d3FE0000000000000; mov.f64 %fd23, 0d3FD8000000000000; fma.rn.f64 %fd24, %fd23, %fd21, %fd22; mul.rn.f64 %fd25, %fd21, %fd8; fma.rn.f64 %fd26, %fd24, %fd25, %fd8; mul.f64 %fd27, %fd16, %fd26; add.s32 %r8, %r4, 1072693248; mov.b64 %fd28, {%r7, %r8}; mul.f64 %fd3, %fd27, %fd28; setp.eq.f64 %p1, %fd1, 0d0000000000000000; not.pred %p2, %p1; mov.f64 %fd30, %fd3; @%p2 bra BB18_2; bra.uni BB18_1; BB18_1: mov.f64 %fd30, %fd2; BB18_2: mov.f64 %fd4, %fd30; { .reg .b32 %temp; mov.b64 {%temp, %r9}, %fd1; } mov.f64 %fd29, 0d7FF0000000000000; { .reg .b32 %temp; mov.b64 {%temp, %r10}, %fd29; } setp.ge.u32 %p3, %r9, %r10; not.pred %p4, %p3; mov.f64 %fd31, %fd4; @%p4 bra BB18_4; bra.uni BB18_3; BB18_3: mov.f64 %fd31, %fd1; BB18_4: mov.f64 %fd5, %fd31; st.param.f64 [func_retval0+0], %fd5; ret; } .file 1 "/media/nvidia/Data/arrayfire/github/build/TX2-R28.2-DP_Debug/KER1894079773716380402" .file 2 "/media/nvidia/Data/arrayfire/github/build/TX2-R28.2-DP_Debug/__nv_nvrtc_builtin_header.h" .section .debug_info { .b32 4979 .b8 2 .b8 0 .b32 .debug_abbrev .b8 8 .b8 1 .b8 108 .b8 103 .b8 101 .b8 110 .b8 102 .b8 101 .b8 58 .b8 32 .b8 69 .b8 68 .b8 71 .b8 32 .b8 52 .b8 46 .b8 49 .b8 50 .b8 0 .b8 4 .b8 75 .b8 69 .b8 82 .b8 49 .b8 56 .b8 57 .b8 52 .b8 48 .b8 55 .b8 57 .b8 55 .b8 55 .b8 51 .b8 55 .b8 49 .b8 54 .b8 51 .b8 56 .b8 48 .b8 52 .b8 48 .b8 50 .b8 0 .b64 0 .b32 .debug_line .b8 47 .b8 109 .b8 101 .b8 100 .b8 105 .b8 97 .b8 47 .b8 110 .b8 118 .b8 105 .b8 100 .b8 105 .b8 97 .b8 47 .b8 68 .b8 97 .b8 116 .b8 97 .b8 47 .b8 97 .b8 114 .b8 114 .b8 97 .b8 121 .b8 102 .b8 105 .b8 114 .b8 101 .b8 47 .b8 103 .b8 105 .b8 116 .b8 104 .b8 117 .b8 98 .b8 47 .b8 98 .b8 117 .b8 105 .b8 108 .b8 100 .b8 47 .b8 84 .b8 88 .b8 50 .b8 45 .b8 82 .b8 50 .b8 56 .b8 46 .b8 50 .b8 45 .b8 68 .b8 80 .b8 95 .b8 68 .b8 101 .b8 98 .b8 117 .b8 103 .b8 0 .b8 2 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b32 1 .b32 68 .b32 279 .b8 1 .b64 func_begin0 .b64 func_end0 .b8 1 .b8 156 .b8 3 .b8 120 .b8 0 .b32 1 .b32 68 .b32 378 .b8 5 .b8 144 .b8 177 .b8 204 .b8 149 .b8 1 .b8 2 .b8 3 .b8 121 .b8 0 .b32 1 .b32 68 .b32 378 .b8 5 .b8 144 .b8 178 .b8 204 .b8 149 .b8 1 .b8 2 .b8 4 .b64 tmp0 .b64 tmp1 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 70 .b32 279 .b8 11 .b8 3 .b64 __local_depot0 .b8 35 .b8 0 .b8 6 .b8 0 .b8 0 .b8 6 .b32 291 .b8 99 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 0 .b8 6 .b32 311 .b8 99 .b8 117 .b8 70 .b8 108 .b8 111 .b8 97 .b8 116 .b8 67 .b8 111 .b8 109 .b8 112 .b8 108 .b8 101 .b8 120 .b8 0 .b8 6 .b32 323 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b8 7 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 8 .b32 2 .b32 728 .b8 8 .b8 120 .b8 0 .b32 378 .b32 2 .b32 728 .b8 0 .b8 1 .b8 8 .b8 121 .b8 0 .b32 378 .b32 2 .b32 728 .b8 4 .b8 1 .b8 0 .b8 9 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 0 .b8 4 .b32 4 .b8 2 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 1 .b32 74 .b32 279 .b8 1 .b64 func_begin1 .b64 func_end1 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 0 .b32 1 .b32 74 .b32 279 .b8 11 .b8 3 .b64 __local_depot1 .b8 35 .b8 0 .b8 6 .b8 4 .b64 tmp2 .b64 tmp3 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 76 .b32 279 .b8 11 .b8 3 .b64 __local_depot1 .b8 35 .b8 8 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 80 .b32 279 .b8 1 .b64 func_begin2 .b64 func_end2 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 80 .b32 279 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 80 .b32 279 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp4 .b64 tmp5 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 82 .b32 279 .b8 11 .b8 3 .b64 __local_depot2 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 86 .b32 279 .b8 1 .b64 func_begin3 .b64 func_end3 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 86 .b32 279 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 86 .b32 279 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp6 .b64 tmp7 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 88 .b32 279 .b8 11 .b8 3 .b64 __local_depot3 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 92 .b32 279 .b8 1 .b64 func_begin4 .b64 func_end4 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 92 .b32 279 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 92 .b32 279 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp8 .b64 tmp9 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 94 .b32 279 .b8 11 .b8 3 .b64 __local_depot4 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 100 .b32 279 .b8 1 .b64 func_begin5 .b64 func_end5 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 100 .b32 279 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 100 .b32 279 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 8 .b8 6 .b8 4 .b64 tmp10 .b64 tmp15 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 107 .b32 279 .b8 11 .b8 3 .b64 __local_depot5 .b8 35 .b8 16 .b8 6 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 103 .b32 378 .b8 5 .b8 144 .b8 183 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 105 .b8 110 .b8 118 .b8 95 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 104 .b32 378 .b8 5 .b8 144 .b8 184 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 105 .b32 378 .b8 6 .b8 144 .b8 176 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 106 .b32 378 .b8 6 .b8 144 .b8 178 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 114 .b32 279 .b8 1 .b64 func_begin6 .b64 func_end6 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 114 .b32 279 .b8 11 .b8 3 .b64 __local_depot6 .b8 35 .b8 8 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 114 .b32 279 .b8 11 .b8 3 .b64 __local_depot6 .b8 35 .b8 16 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 119 .b32 279 .b8 1 .b64 func_begin7 .b64 func_end7 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 119 .b32 279 .b8 11 .b8 3 .b64 __local_depot7 .b8 35 .b8 8 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 119 .b32 279 .b8 11 .b8 3 .b64 __local_depot7 .b8 35 .b8 16 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b32 1 .b32 142 .b32 1795 .b8 1 .b64 func_begin8 .b64 func_end8 .b8 1 .b8 156 .b8 3 .b8 120 .b8 0 .b32 1 .b32 142 .b32 1898 .b8 6 .b8 144 .b8 177 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 3 .b8 121 .b8 0 .b32 1 .b32 142 .b32 1898 .b8 6 .b8 144 .b8 178 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 4 .b64 tmp20 .b64 tmp21 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 144 .b32 1795 .b8 11 .b8 3 .b64 __local_depot8 .b8 35 .b8 0 .b8 6 .b8 0 .b8 0 .b8 6 .b32 1808 .b8 99 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 0 .b8 6 .b32 1829 .b8 99 .b8 117 .b8 68 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 67 .b8 111 .b8 109 .b8 112 .b8 108 .b8 101 .b8 120 .b8 0 .b8 6 .b32 1842 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b8 7 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 16 .b32 2 .b32 774 .b8 8 .b8 120 .b8 0 .b32 1898 .b32 2 .b32 776 .b8 0 .b8 1 .b8 8 .b8 121 .b8 0 .b32 1898 .b32 2 .b32 776 .b8 8 .b8 1 .b8 0 .b8 9 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 0 .b8 4 .b32 8 .b8 2 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 1 .b32 148 .b32 1795 .b8 1 .b64 func_begin9 .b64 func_end9 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 0 .b32 1 .b32 148 .b32 1795 .b8 11 .b8 3 .b64 __local_depot9 .b8 35 .b8 0 .b8 6 .b8 4 .b64 tmp22 .b64 tmp23 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 150 .b32 1795 .b8 11 .b8 3 .b64 __local_depot9 .b8 35 .b8 16 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 154 .b32 1795 .b8 1 .b64 func_begin10 .b64 func_end10 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 154 .b32 1795 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 154 .b32 1795 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp24 .b64 tmp25 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 156 .b32 1795 .b8 11 .b8 3 .b64 __local_depot10 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 160 .b32 1795 .b8 1 .b64 func_begin11 .b64 func_end11 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 160 .b32 1795 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 160 .b32 1795 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp26 .b64 tmp27 .b8 5 .b8 114 .b8 101 .b8 115 .b8 0 .b32 1 .b32 162 .b32 1795 .b8 11 .b8 3 .b64 __local_depot11 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 166 .b32 1795 .b8 1 .b64 func_begin12 .b64 func_end12 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 166 .b32 1795 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 166 .b32 1795 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp28 .b64 tmp29 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 168 .b32 1795 .b8 11 .b8 3 .b64 __local_depot12 .b8 35 .b8 32 .b8 6 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 174 .b32 1795 .b8 1 .b64 func_begin13 .b64 func_end13 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 174 .b32 1795 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 0 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 174 .b32 1795 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 16 .b8 6 .b8 4 .b64 tmp30 .b64 tmp35 .b8 5 .b8 111 .b8 117 .b8 116 .b8 0 .b32 1 .b32 181 .b32 1795 .b8 11 .b8 3 .b64 __local_depot13 .b8 35 .b8 32 .b8 6 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 177 .b32 1898 .b8 6 .b8 144 .b8 183 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 110 .b8 118 .b8 95 .b8 114 .b8 104 .b8 115 .b8 95 .b8 97 .b8 98 .b8 115 .b8 0 .b32 1 .b32 178 .b32 1898 .b8 6 .b8 144 .b8 184 .b8 200 .b8 153 .b8 171 .b8 2 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 179 .b32 1898 .b8 7 .b8 144 .b8 176 .b8 226 .b8 144 .b8 179 .b8 214 .b8 4 .b8 2 .b8 5 .b8 114 .b8 104 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 180 .b32 1898 .b8 7 .b8 144 .b8 178 .b8 226 .b8 144 .b8 179 .b8 214 .b8 4 .b8 2 .b8 0 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 188 .b32 1795 .b8 1 .b64 func_begin14 .b64 func_end14 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 188 .b32 1795 .b8 11 .b8 3 .b64 __local_depot14 .b8 35 .b8 16 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 188 .b32 1795 .b8 11 .b8 3 .b64 __local_depot14 .b8 35 .b8 32 .b8 6 .b8 0 .b8 2 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1 .b32 193 .b32 1795 .b8 1 .b64 func_begin15 .b64 func_end15 .b8 1 .b8 156 .b8 3 .b8 108 .b8 104 .b8 115 .b8 0 .b32 1 .b32 193 .b32 1795 .b8 11 .b8 3 .b64 __local_depot15 .b8 35 .b8 16 .b8 6 .b8 3 .b8 114 .b8 104 .b8 115 .b8 0 .b32 1 .b32 193 .b32 1795 .b8 11 .b8 3 .b64 __local_depot15 .b8 35 .b8 32 .b8 6 .b8 0 .b8 2 .b8 75 .b8 69 .b8 82 .b8 49 .b8 56 .b8 57 .b8 52 .b8 48 .b8 55 .b8 57 .b8 55 .b8 55 .b8 51 .b8 55 .b8 49 .b8 54 .b8 51 .b8 56 .b8 48 .b8 52 .b8 48 .b8 50 .b8 0 .b8 75 .b8 69 .b8 82 .b8 49 .b8 56 .b8 57 .b8 52 .b8 48 .b8 55 .b8 57 .b8 55 .b8 55 .b8 51 .b8 55 .b8 49 .b8 54 .b8 51 .b8 56 .b8 48 .b8 52 .b8 48 .b8 50 .b8 0 .b32 1 .b32 220 .b32 4794 .b8 1 .b64 func_begin16 .b64 func_end16 .b8 1 .b8 156 .b8 3 .b8 105 .b8 110 .b8 48 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 221 .b32 4915 .b8 9 .b8 3 .b64 KER1894079773716380402_param_0 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 222 .b32 4915 .b8 9 .b8 3 .b64 KER1894079773716380402_param_1 .b8 7 .b8 3 .b8 105 .b8 110 .b8 51 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 223 .b32 4915 .b8 9 .b8 3 .b64 KER1894079773716380402_param_2 .b8 7 .b8 3 .b8 105 .b8 110 .b8 53 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 224 .b32 4915 .b8 9 .b8 3 .b64 KER1894079773716380402_param_3 .b8 7 .b8 3 .b8 105 .b8 110 .b8 55 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 225 .b32 4915 .b8 9 .b8 3 .b64 KER1894079773716380402_param_4 .b8 7 .b8 3 .b8 105 .b8 110 .b8 57 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 226 .b32 4915 .b8 9 .b8 3 .b64 KER1894079773716380402_param_5 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 49 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 227 .b32 4915 .b8 9 .b8 3 .b64 KER1894079773716380402_param_6 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 51 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 228 .b32 4915 .b8 9 .b8 3 .b64 KER1894079773716380402_param_7 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 53 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 229 .b32 4915 .b8 9 .b8 3 .b64 KER1894079773716380402_param_8 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 55 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 230 .b32 4915 .b8 9 .b8 3 .b64 KER1894079773716380402_param_9 .b8 7 .b8 3 .b8 105 .b8 110 .b8 49 .b8 57 .b8 95 .b8 112 .b8 116 .b8 114 .b8 0 .b32 1 .b32 231 .b32 4915 .b8 9 .b8 3 .b64 KER1894079773716380402_param_10 .b8 7 .b8 3 .b8 111 .b8 117 .b8 116 .b8 50 .b8 48 .b8 0 .b32 1 .b32 232 .b32 4827 .b8 11 .b8 3 .b64 __local_depot16 .b8 35 .b8 0 .b8 6 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 120 .b8 0 .b32 1 .b32 233 .b32 4943 .b8 5 .b8 144 .b8 185 .b8 228 .b8 149 .b8 1 .b8 2 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 121 .b8 0 .b32 1 .b32 233 .b32 4943 .b8 6 .b8 144 .b8 176 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 3 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 115 .b8 95 .b8 120 .b8 95 .b8 116 .b8 111 .b8 116 .b8 97 .b8 108 .b8 0 .b32 1 .b32 233 .b32 4943 .b8 9 .b8 3 .b64 KER1894079773716380402_param_14 .b8 7 .b8 3 .b8 110 .b8 117 .b8 109 .b8 95 .b8 111 .b8 100 .b8 105 .b8 109 .b8 115 .b8 0 .b32 1 .b32 233 .b32 4943 .b8 6 .b8 144 .b8 177 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 4 .b64 tmp40 .b64 tmp86 .b8 5 .b8 111 .b8 117 .b8 116 .b8 114 .b8 101 .b8 102 .b8 0 .b32 1 .b32 236 .b32 4827 .b8 11 .b8 3 .b64 __local_depot16 .b8 35 .b8 72 .b8 6 .b8 4 .b64 tmp41 .b64 tmp85 .b8 10 .b8 98 .b8 108 .b8 111 .b8 99 .b8 107 .b8 73 .b8 100 .b8 120 .b8 95 .b8 120 .b8 0 .b32 1 .b32 238 .b32 4972 .b32 .debug_loc .b8 4 .b64 tmp45 .b64 tmp85 .b8 4 .b64 tmp45 .b64 tmp82 .b8 5 .b8 116 .b8 104 .b8 114 .b8 101 .b8 97 .b8 100 .b8 73 .b8 100 .b8 0 .b32 1 .b32 240 .b32 4943 .b8 6 .b8 144 .b8 180 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 0 .b32 1 .b32 241 .b32 4972 .b8 5 .b8 144 .b8 179 .b8 228 .b8 149 .b8 1 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 48 .b8 0 .b32 1 .b32 243 .b32 4972 .b8 6 .b8 144 .b8 185 .b8 226 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 0 .b32 1 .b32 244 .b32 4972 .b8 6 .b8 144 .b8 176 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 51 .b8 0 .b32 1 .b32 245 .b32 4972 .b8 6 .b8 144 .b8 177 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 53 .b8 0 .b32 1 .b32 246 .b32 4972 .b8 6 .b8 144 .b8 178 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 55 .b8 0 .b32 1 .b32 247 .b32 4972 .b8 6 .b8 144 .b8 179 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 57 .b8 0 .b32 1 .b32 248 .b32 4972 .b8 6 .b8 144 .b8 180 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 49 .b8 0 .b32 1 .b32 249 .b32 4972 .b8 6 .b8 144 .b8 181 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 51 .b8 0 .b32 1 .b32 250 .b32 4972 .b8 6 .b8 144 .b8 182 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 53 .b8 0 .b32 1 .b32 251 .b32 4972 .b8 6 .b8 144 .b8 183 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 55 .b8 0 .b32 1 .b32 252 .b32 4972 .b8 6 .b8 144 .b8 184 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 105 .b8 100 .b8 120 .b8 49 .b8 57 .b8 0 .b32 1 .b32 253 .b32 4972 .b8 6 .b8 144 .b8 185 .b8 228 .b8 200 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 48 .b8 0 .b32 1 .b32 254 .b32 378 .b8 5 .b8 144 .b8 178 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 0 .b32 1 .b32 255 .b32 378 .b8 5 .b8 144 .b8 180 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 0 .b32 1 .b32 256 .b32 378 .b8 5 .b8 144 .b8 181 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 51 .b8 0 .b32 1 .b32 257 .b32 378 .b8 5 .b8 144 .b8 183 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 52 .b8 0 .b32 1 .b32 258 .b32 378 .b8 5 .b8 144 .b8 184 .b8 204 .b8 149 .b8 1 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 53 .b8 0 .b32 1 .b32 259 .b32 378 .b8 6 .b8 144 .b8 176 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 54 .b8 0 .b32 1 .b32 260 .b32 378 .b8 6 .b8 144 .b8 177 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 55 .b8 0 .b32 1 .b32 261 .b32 378 .b8 6 .b8 144 .b8 179 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 56 .b8 0 .b32 1 .b32 262 .b32 378 .b8 6 .b8 144 .b8 180 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 57 .b8 0 .b32 1 .b32 263 .b32 378 .b8 6 .b8 144 .b8 182 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 48 .b8 0 .b32 1 .b32 264 .b32 378 .b8 6 .b8 144 .b8 183 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 49 .b8 0 .b32 1 .b32 265 .b32 378 .b8 6 .b8 144 .b8 185 .b8 226 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 50 .b8 0 .b32 1 .b32 266 .b32 378 .b8 6 .b8 144 .b8 176 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 51 .b8 0 .b32 1 .b32 267 .b32 378 .b8 6 .b8 144 .b8 178 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 52 .b8 0 .b32 1 .b32 268 .b32 378 .b8 6 .b8 144 .b8 179 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 53 .b8 0 .b32 1 .b32 269 .b32 378 .b8 6 .b8 144 .b8 181 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 54 .b8 0 .b32 1 .b32 270 .b32 378 .b8 6 .b8 144 .b8 182 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 55 .b8 0 .b32 1 .b32 271 .b32 378 .b8 6 .b8 144 .b8 184 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 56 .b8 0 .b32 1 .b32 272 .b32 378 .b8 6 .b8 144 .b8 185 .b8 228 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 49 .b8 57 .b8 0 .b32 1 .b32 273 .b32 378 .b8 6 .b8 144 .b8 177 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 5 .b8 118 .b8 97 .b8 108 .b8 50 .b8 48 .b8 0 .b32 1 .b32 274 .b32 378 .b8 6 .b8 144 .b8 178 .b8 230 .b8 152 .b8 171 .b8 2 .b8 2 .b8 0 .b8 0 .b8 0 .b8 0 .b8 0 .b8 11 .b8 118 .b8 111 .b8 105 .b8 100 .b8 0 .b8 6 .b32 4811 .b8 100 .b8 105 .b8 109 .b8 95 .b8 116 .b8 0 .b8 9 .b8 108 .b8 111 .b8 110 .b8 103 .b8 32 .b8 108 .b8 111 .b8 110 .b8 103 .b8 0 .b8 5 .b32 8 .b8 7 .b8 95 .b8 90 .b8 53 .b8 80 .b8 97 .b8 114 .b8 97 .b8 109 .b8 73 .b8 102 .b8 69 .b8 0 .b32 72 .b32 1 .b32 212 .b8 8 .b8 112 .b8 116 .b8 114 .b8 0 .b32 4915 .b32 1 .b32 214 .b8 0 .b8 1 .b8 8 .b8 100 .b8 105 .b8 109 .b8 115 .b8 0 .b32 4921 .b32 1 .b32 215 .b8 8 .b8 1 .b8 8 .b8 115 .b8 116 .b8 114 .b8 105 .b8 100 .b8 101 .b8 115 .b8 0 .b32 4921 .b32 1 .b32 216 .b8 40 .b8 1 .b8 0 .b8 12 .b32 378 .b8 12 .b8 13 .b32 4800 .b8 14 .b32 4933 .b8 3 .b8 0 .b8 15 .b8 105 .b8 110 .b8 116 .b8 0 .b32 4 .b8 5 .b8 6 .b32 4953 .b8 117 .b8 105 .b8 110 .b8 116 .b8 0 .b8 9 .b8 117 .b8 110 .b8 115 .b8 105 .b8 103 .b8 110 .b8 101 .b8 100 .b8 32 .b8 105 .b8 110 .b8 116 .b8 0 .b8 7 .b32 4 .b8 9 .b8 105 .b8 110 .b8 116 .b8 0 .b8 5 .b32 4 .b8 0 } .section .debug_abbrev { .b8 1 .b8 17 .b8 1 .b8 37 .b8 8 .b8 19 .b8 11 .b8 3 .b8 8 .b8 17 .b8 1 .b8 16 .b8 6 .b8 27 .b8 8 .b8 0 .b8 0 .b8 2 .b8 46 .b8 1 .b8 135 .b8 64 .b8 8 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 63 .b8 12 .b8 17 .b8 1 .b8 18 .b8 1 .b8 64 .b8 10 .b8 0 .b8 0 .b8 3 .b8 5 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 10 .b8 51 .b8 11 .b8 0 .b8 0 .b8 4 .b8 11 .b8 1 .b8 17 .b8 1 .b8 18 .b8 1 .b8 0 .b8 0 .b8 5 .b8 52 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 10 .b8 51 .b8 11 .b8 0 .b8 0 .b8 6 .b8 22 .b8 0 .b8 73 .b8 19 .b8 3 .b8 8 .b8 0 .b8 0 .b8 7 .b8 19 .b8 1 .b8 3 .b8 8 .b8 11 .b8 6 .b8 58 .b8 6 .b8 59 .b8 6 .b8 0 .b8 0 .b8 8 .b8 13 .b8 0 .b8 3 .b8 8 .b8 73 .b8 19 .b8 58 .b8 6 .b8 59 .b8 6 .b8 56 .b8 15 .b8 50 .b8 11 .b8 0 .b8 0 .b8 9 .b8 36 .b8 0 .b8 3 .b8 8 .b8 62 .b8 11 .b8 11 .b8 6 .b8 0 .b8 0 .b8 10 .b8 52 .b8 0 .b8 3 .b8 8 .b8 58 .b8 6 .b8 59 .b8 6 .b8 73 .b8 19 .b8 2 .b8 6 .b8 0 .b8 0 .b8 11 .b8 59 .b8 0 .b8 3 .b8 8 .b8 0 .b8 0 .b8 12 .b8 15 .b8 0 .b8 73 .b8 19 .b8 51 .b8 11 .b8 0 .b8 0 .b8 13 .b8 1 .b8 1 .b8 73 .b8 19 .b8 0 .b8 0 .b8 14 .b8 33 .b8 0 .b8 73 .b8 19 .b8 47 .b8 15 .b8 0 .b8 0 .b8 15 .b8 36 .b8 0 .b8 3 .b8 8 .b8 11 .b8 6 .b8 62 .b8 11 .b8 0 .b8 0 .b8 0 } .section .debug_loc { .b64 tmp42 .b64 tmp43 .b8 5 .b8 0 .b8 144 .b8 177 .b8 228 .b8 149 .b8 1 .b64 tmp43 .b64 tmp44 .b8 6 .b8 0 .b8 144 .b8 177 .b8 230 .b8 200 .b8 171 .b8 2 .b64 tmp44 .b64 tmp83 .b8 5 .b8 0 .b8 144 .b8 178 .b8 228 .b8 149 .b8 1 .b64 tmp83 .b64 tmp84 .b8 5 .b8 0 .b8 144 .b8 180 .b8 228 .b8 149 .b8 1 .b64 tmp84 .b64 func_end16 .b8 6 .b8 0 .b8 144 .b8 177 .b8 230 .b8 200 .b8 171 .b8 2 .b64 0 .b64 0 } .section .debug_ranges { } .section .debug_pubnames { .b32 410 .b8 2 .b8 0 .b32 .debug_info .b32 4979 .b32 390 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 0 .b32 1642 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 100 .b8 100 .b8 0 .b32 3167 .b8 75 .b8 69 .b8 82 .b8 49 .b8 56 .b8 57 .b8 52 .b8 48 .b8 55 .b8 57 .b8 55 .b8 55 .b8 51 .b8 55 .b8 49 .b8 54 .b8 51 .b8 56 .b8 48 .b8 52 .b8 48 .b8 50 .b8 0 .b32 2602 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 126 .b8 95 .b8 90 .b8 56 .b8 95 .b8 95 .b8 99 .b8 112 .b8 108 .b8 120 .b8 50 .b8 102 .b8 102 .b8 102 .b8 0 .b32 1081 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 100 .b8 105 .b8 118 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1376 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1509 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2059 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 538 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 97 .b8 100 .b8 100 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 719 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 3034 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 97 .b8 120 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2240 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 115 .b8 117 .b8 98 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2421 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 900 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 109 .b8 117 .b8 108 .b8 102 .b8 54 .b8 102 .b8 108 .b8 111 .b8 97 .b8 116 .b8 50 .b8 83 .b8 95 .b8 0 .b32 2901 .b8 95 .b8 90 .b8 54 .b8 95 .b8 95 .b8 99 .b8 109 .b8 105 .b8 110 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 83 .b8 95 .b8 0 .b32 1911 .b8 95 .b8 90 .b8 55 .b8 95 .b8 95 .b8 99 .b8 99 .b8 111 .b8 110 .b8 106 .b8 55 .b8 100 .b8 111 .b8 117 .b8 98 .b8 108 .b8 101 .b8 50 .b8 0 .b32 0 } ] [ OK ] JIT.ISSUE_1646 (4657 ms) [----------] 1 test from JIT (4657 ms total) [----------] Global test environment tear-down [==========] 1 test from 1 test case ran. (4657 ms total) [ PASSED ] 1 test.