Author: ctopper Date: Tue Jul 5 23:24:29 2016 New Revision: 274603 URL: http://llvm.org/viewvc/llvm-project?rev=274603&view=rev Log: [AVX512] Use the generic ctlz intrinsic to implement the vplzcntd/q builtins.
Modified: cfe/trunk/lib/CodeGen/CGBuiltin.cpp cfe/trunk/test/CodeGen/avx512cdintrin.c cfe/trunk/test/CodeGen/avx512vlcd-builtins.c Modified: cfe/trunk/lib/CodeGen/CGBuiltin.cpp URL: http://llvm.org/viewvc/llvm-project/cfe/trunk/lib/CodeGen/CGBuiltin.cpp?rev=274603&r1=274602&r2=274603&view=diff ============================================================================== --- cfe/trunk/lib/CodeGen/CGBuiltin.cpp (original) +++ cfe/trunk/lib/CodeGen/CGBuiltin.cpp Tue Jul 5 23:24:29 2016 @@ -7163,6 +7163,18 @@ Value *CodeGenFunction::EmitX86BuiltinEx return EmitX86MaskedCompare(*this, CC, false, Ops); } + case X86::BI__builtin_ia32_vplzcntd_128_mask: + case X86::BI__builtin_ia32_vplzcntd_256_mask: + case X86::BI__builtin_ia32_vplzcntd_512_mask: + case X86::BI__builtin_ia32_vplzcntq_128_mask: + case X86::BI__builtin_ia32_vplzcntq_256_mask: + case X86::BI__builtin_ia32_vplzcntq_512_mask: { + Function *F = CGM.getIntrinsic(Intrinsic::ctlz, Ops[0]->getType()); + return EmitX86Select(*this, Ops[2], + Builder.CreateCall(F, {Ops[0],Builder.getInt1(false)}), + Ops[1]); + } + // TODO: Handle 64/512-bit vector widths of min/max. case X86::BI__builtin_ia32_pmaxsb128: case X86::BI__builtin_ia32_pmaxsw128: Modified: cfe/trunk/test/CodeGen/avx512cdintrin.c URL: http://llvm.org/viewvc/llvm-project/cfe/trunk/test/CodeGen/avx512cdintrin.c?rev=274603&r1=274602&r2=274603&view=diff ============================================================================== --- cfe/trunk/test/CodeGen/avx512cdintrin.c (original) +++ cfe/trunk/test/CodeGen/avx512cdintrin.c Tue Jul 5 23:24:29 2016 @@ -37,32 +37,36 @@ __m512i test_mm512_maskz_conflict_epi32( } __m512i test_mm512_lzcnt_epi32(__m512i __A) { // CHECK-LABEL: @test_mm512_lzcnt_epi32 - // CHECK: @llvm.x86.avx512.mask.lzcnt.d.512 + // CHECK: call <16 x i32> @llvm.ctlz.v16i32(<16 x i32> %{{.*}}, i1 false) return _mm512_lzcnt_epi32(__A); } __m512i test_mm512_mask_lzcnt_epi32(__m512i __W, __mmask16 __U, __m512i __A) { // CHECK-LABEL: @test_mm512_mask_lzcnt_epi32 - // CHECK: @llvm.x86.avx512.mask.lzcnt.d.512 + // CHECK: call <16 x i32> @llvm.ctlz.v16i32(<16 x i32> %{{.*}}, i1 false) + // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}} return _mm512_mask_lzcnt_epi32(__W,__U,__A); } __m512i test_mm512_maskz_lzcnt_epi32(__mmask16 __U, __m512i __A) { // CHECK-LABEL: @test_mm512_maskz_lzcnt_epi32 - // CHECK: @llvm.x86.avx512.mask.lzcnt.d.512 + // CHECK: call <16 x i32> @llvm.ctlz.v16i32(<16 x i32> %{{.*}}, i1 false) + // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}} return _mm512_maskz_lzcnt_epi32(__U,__A); } __m512i test_mm512_lzcnt_epi64(__m512i __A) { // CHECK-LABEL: @test_mm512_lzcnt_epi64 - // CHECK: @llvm.x86.avx512.mask.lzcnt.q.512 + // CHECK: call <8 x i64> @llvm.ctlz.v8i64(<8 x i64> %{{.*}}, i1 false) return _mm512_lzcnt_epi64(__A); } __m512i test_mm512_mask_lzcnt_epi64(__m512i __W, __mmask8 __U, __m512i __A) { // CHECK-LABEL: @test_mm512_mask_lzcnt_epi64 - // CHECK: @llvm.x86.avx512.mask.lzcnt.q.512 + // CHECK: call <8 x i64> @llvm.ctlz.v8i64(<8 x i64> %{{.*}}, i1 false) + // CHECK: select <8 x i1> %{{.*}}, <8 x i64> %{{.*}}, <8 x i64> %{{.*}} return _mm512_mask_lzcnt_epi64(__W,__U,__A); } __m512i test_mm512_maskz_lzcnt_epi64(__mmask8 __U, __m512i __A) { // CHECK-LABEL: @test_mm512_maskz_lzcnt_epi64 - // CHECK: @llvm.x86.avx512.mask.lzcnt.q.512 + // CHECK: call <8 x i64> @llvm.ctlz.v8i64(<8 x i64> %{{.*}}, i1 false) + // CHECK: select <8 x i1> %{{.*}}, <8 x i64> %{{.*}}, <8 x i64> %{{.*}} return _mm512_maskz_lzcnt_epi64(__U,__A); } Modified: cfe/trunk/test/CodeGen/avx512vlcd-builtins.c URL: http://llvm.org/viewvc/llvm-project/cfe/trunk/test/CodeGen/avx512vlcd-builtins.c?rev=274603&r1=274602&r2=274603&view=diff ============================================================================== --- cfe/trunk/test/CodeGen/avx512vlcd-builtins.c (original) +++ cfe/trunk/test/CodeGen/avx512vlcd-builtins.c Tue Jul 5 23:24:29 2016 @@ -103,72 +103,80 @@ __m256i test_mm256_maskz_conflict_epi32( __m128i test_mm_lzcnt_epi32(__m128i __A) { // CHECK-LABEL: @test_mm_lzcnt_epi32 - // CHECK: @llvm.x86.avx512.mask.lzcnt.d + // CHECK: call <4 x i32> @llvm.ctlz.v4i32(<4 x i32> %{{.*}}, i1 false) return _mm_lzcnt_epi32(__A); } __m128i test_mm_mask_lzcnt_epi32(__m128i __W, __mmask8 __U, __m128i __A) { // CHECK-LABEL: @test_mm_mask_lzcnt_epi32 - // CHECK: @llvm.x86.avx512.mask.lzcnt.d + // CHECK: call <4 x i32> @llvm.ctlz.v4i32(<4 x i32> %{{.*}}, i1 false) + // CHECK: select <4 x i1> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}} return _mm_mask_lzcnt_epi32(__W, __U, __A); } __m128i test_mm_maskz_lzcnt_epi32(__mmask8 __U, __m128i __A) { // CHECK-LABEL: @test_mm_maskz_lzcnt_epi32 - // CHECK: @llvm.x86.avx512.mask.lzcnt.d + // CHECK: call <4 x i32> @llvm.ctlz.v4i32(<4 x i32> %{{.*}}, i1 false) + // CHECK: select <4 x i1> %{{.*}}, <4 x i32> %{{.*}}, <4 x i32> %{{.*}} return _mm_maskz_lzcnt_epi32(__U, __A); } __m256i test_mm256_lzcnt_epi32(__m256i __A) { // CHECK-LABEL: @test_mm256_lzcnt_epi32 - // CHECK: @llvm.x86.avx512.mask.lzcnt.d + // CHECK: call <8 x i32> @llvm.ctlz.v8i32(<8 x i32> %{{.*}}, i1 false) return _mm256_lzcnt_epi32(__A); } __m256i test_mm256_mask_lzcnt_epi32(__m256i __W, __mmask8 __U, __m256i __A) { // CHECK-LABEL: @test_mm256_mask_lzcnt_epi32 - // CHECK: @llvm.x86.avx512.mask.lzcnt.d + // CHECK: call <8 x i32> @llvm.ctlz.v8i32(<8 x i32> %{{.*}}, i1 false) + // CHECK: select <8 x i1> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> %{{.*}} return _mm256_mask_lzcnt_epi32(__W, __U, __A); } __m256i test_mm256_maskz_lzcnt_epi32(__mmask8 __U, __m256i __A) { // CHECK-LABEL: @test_mm256_maskz_lzcnt_epi32 - // CHECK: @llvm.x86.avx512.mask.lzcnt.d + // CHECK: call <8 x i32> @llvm.ctlz.v8i32(<8 x i32> %{{.*}}, i1 false) + // CHECK: select <8 x i1> %{{.*}}, <8 x i32> %{{.*}}, <8 x i32> %{{.*}} return _mm256_maskz_lzcnt_epi32(__U, __A); } __m128i test_mm_lzcnt_epi64(__m128i __A) { // CHECK-LABEL: @test_mm_lzcnt_epi64 - // CHECK: @llvm.x86.avx512.mask.lzcnt.q + // CHECK: call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %{{.*}}, i1 false) return _mm_lzcnt_epi64(__A); } __m128i test_mm_mask_lzcnt_epi64(__m128i __W, __mmask8 __U, __m128i __A) { // CHECK-LABEL: @test_mm_mask_lzcnt_epi64 - // CHECK: @llvm.x86.avx512.mask.lzcnt.q + // CHECK: call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %{{.*}}, i1 false) + // CHECK: select <2 x i1> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}} return _mm_mask_lzcnt_epi64(__W, __U, __A); } __m128i test_mm_maskz_lzcnt_epi64(__mmask8 __U, __m128i __A) { // CHECK-LABEL: @test_mm_maskz_lzcnt_epi64 - // CHECK: @llvm.x86.avx512.mask.lzcnt.q + // CHECK: call <2 x i64> @llvm.ctlz.v2i64(<2 x i64> %{{.*}}, i1 false) + // CHECK: select <2 x i1> %{{.*}}, <2 x i64> %{{.*}}, <2 x i64> %{{.*}} return _mm_maskz_lzcnt_epi64(__U, __A); } __m256i test_mm256_lzcnt_epi64(__m256i __A) { // CHECK-LABEL: @test_mm256_lzcnt_epi64 - // CHECK: @llvm.x86.avx512.mask.lzcnt.q + // CHECK: call <4 x i64> @llvm.ctlz.v4i64(<4 x i64> %{{.*}}, i1 false) return _mm256_lzcnt_epi64(__A); } __m256i test_mm256_mask_lzcnt_epi64(__m256i __W, __mmask8 __U, __m256i __A) { // CHECK-LABEL: @test_mm256_mask_lzcnt_epi64 - // CHECK: @llvm.x86.avx512.mask.lzcnt.q + // CHECK: call <4 x i64> @llvm.ctlz.v4i64(<4 x i64> %{{.*}}, i1 false) + // CHECK: select <4 x i1> %{{.*}}, <4 x i64> %{{.*}}, <4 x i64> %{{.*}} return _mm256_mask_lzcnt_epi64(__W, __U, __A); } __m256i test_mm256_maskz_lzcnt_epi64(__mmask8 __U, __m256i __A) { // CHECK-LABEL: @test_mm256_maskz_lzcnt_epi64 - // CHECK: @llvm.x86.avx512.mask.lzcnt.q + // CHECK: call <4 x i64> @llvm.ctlz.v4i64(<4 x i64> %{{.*}}, i1 false) + // CHECK: select <4 x i1> %{{.*}}, <4 x i64> %{{.*}}, <4 x i64> %{{.*}} return _mm256_maskz_lzcnt_epi64(__U, __A); } _______________________________________________ cfe-commits mailing list cfe-commits@lists.llvm.org http://lists.llvm.org/cgi-bin/mailman/listinfo/cfe-commits