1// RUN: %clang_cc1 %s -triple=x86_64-apple-darwin -target-feature +avx -emit-llvm -o - | FileCheck %s
2
3// Don't include mm_malloc.h, it's system specific.
4#define __MM_MALLOC_H
5
6#include <immintrin.h>
7
8//
9// Test LLVM IR codegen of shuffle instructions
10//
11
12__m256 test__mm256_loadu_ps(void* p) {
13  // CHECK: load <8 x float>, <8 x float>* %{{.*}}, align 1
14  return _mm256_loadu_ps(p);
15}
16
17__m256d test__mm256_loadu_pd(void* p) {
18  // CHECK: load <4 x double>, <4 x double>* %{{.*}}, align 1
19  return _mm256_loadu_pd(p);
20}
21
22__m256i test__mm256_loadu_si256(void* p) {
23  // CHECK: load <4 x i64>, <4 x i64>* %{{.+}}, align 1
24  return _mm256_loadu_si256(p);
25}
26
27__m128i test_mm_cmpestrm(__m128i A, int LA, __m128i B, int LB) {
28  // CHECK: @llvm.x86.sse42.pcmpestrm128
29  return _mm_cmpestrm(A, LA, B, LB, 7);
30}
31
32int test_mm_cmpestri(__m128i A, int LA, __m128i B, int LB) {
33  // CHECK: @llvm.x86.sse42.pcmpestri128
34  return _mm_cmpestri(A, LA, B, LB, 7);
35}
36
37int test_mm_cmpestra(__m128i A, int LA, __m128i B, int LB) {
38  // CHECK: @llvm.x86.sse42.pcmpestria128
39  return _mm_cmpestra(A, LA, B, LB, 7);
40}
41
42int test_mm_cmpestrc(__m128i A, int LA, __m128i B, int LB) {
43  // CHECK: @llvm.x86.sse42.pcmpestric128
44  return _mm_cmpestrc(A, LA, B, LB, 7);
45}
46
47int test_mm_cmpestro(__m128i A, int LA, __m128i B, int LB) {
48  // CHECK: @llvm.x86.sse42.pcmpestrio128
49  return _mm_cmpestro(A, LA, B, LB, 7);
50}
51
52int test_mm_cmpestrs(__m128i A, int LA, __m128i B, int LB) {
53  // CHECK: @llvm.x86.sse42.pcmpestris128
54  return _mm_cmpestrs(A, LA, B, LB, 7);
55}
56
57int test_mm_cmpestrz(__m128i A, int LA, __m128i B, int LB) {
58  // CHECK: @llvm.x86.sse42.pcmpestriz128
59  return _mm_cmpestrz(A, LA, B, LB, 7);
60}
61
62__m128i test_mm_cmpistrm(__m128i A, __m128i B) {
63  // CHECK: @llvm.x86.sse42.pcmpistrm128
64  return _mm_cmpistrm(A, B, 7);
65}
66
67int test_mm_cmpistri(__m128i A, __m128i B) {
68  // CHECK: @llvm.x86.sse42.pcmpistri128
69  return _mm_cmpistri(A, B, 7);
70}
71
72int test_mm_cmpistra(__m128i A, __m128i B) {
73  // CHECK: @llvm.x86.sse42.pcmpistria128
74  return _mm_cmpistra(A, B, 7);
75}
76
77int test_mm_cmpistrc(__m128i A, __m128i B) {
78  // CHECK: @llvm.x86.sse42.pcmpistric128
79  return _mm_cmpistrc(A, B, 7);
80}
81
82int test_mm_cmpistro(__m128i A, __m128i B) {
83  // CHECK: @llvm.x86.sse42.pcmpistrio128
84  return _mm_cmpistro(A, B, 7);
85}
86
87int test_mm_cmpistrs(__m128i A, __m128i B) {
88  // CHECK: @llvm.x86.sse42.pcmpistris128
89  return _mm_cmpistrs(A, B, 7);
90}
91
92int test_mm_cmpistrz(__m128i A, __m128i B) {
93  // CHECK: @llvm.x86.sse42.pcmpistriz128
94  return _mm_cmpistrz(A, B, 7);
95}
96
97int test_extract_epi32(__m256i __a) {
98  // CHECK-LABEL: @test_extract_epi32
99  // CHECK: [[SHIFT1:%[^ ]+]] = and i32 %{{.*}}, 7
100  // CHECK: extractelement <8 x i32> %{{.*}}, i32 [[SHIFT1]]
101  return _mm256_extract_epi32(__a, 8);
102}
103
104int test_extract_epi16(__m256i __a) {
105  // CHECK-LABEL: @test_extract_epi16
106  // CHECK: [[SHIFT2:%[^ ]+]] = and i32 %{{.*}}, 15
107  // CHECK: extractelement <16 x i16> %{{.*}}, i32 [[SHIFT2]]
108  return _mm256_extract_epi16(__a, 16);
109}
110
111int test_extract_epi8(__m256i __a) {
112  // CHECK-LABEL: @test_extract_epi8
113  // CHECK: [[SHIFT3:%[^ ]+]] = and i32 %{{.*}}, 31
114  // CHECK: extractelement <32 x i8> %{{.*}}, i32 [[SHIFT3]]
115  return _mm256_extract_epi8(__a, 32);
116}
117
118__m256d test_256_blend_pd(__m256d __a, __m256d __b) {
119  // CHECK-LABEL: @test_256_blend_pd
120  // CHECK: shufflevector <4 x double> %{{.*}}, <4 x double> %{{.*}}, <4 x i32> <i32 4, i32 1, i32 6, i32 3>
121  return _mm256_blend_pd(__a, __b, 0x35);
122}
123
124__m256 test_256_blend_ps(__m256 __a, __m256 __b) {
125  // CHECK-LABEL: @test_256_blend_ps
126  // CHECK: shufflevector <8 x float> %{{.*}}, <8 x float> %{{.*}}, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 13, i32 6, i32 7>
127  return _mm256_blend_ps(__a, __b, 0x35);
128}
129
130__m256i test_256_insert_epi8(__m256i __a) {
131  // CHECK-LABEL: @test_256_insert_epi8
132  // CHECK: insertelement <32 x i8> {{.*}}, i8 {{.*}}, i32 {{.*}}
133  return _mm256_insert_epi8(__a, 42, 3);
134}
135
136__m256i test_256_insert_epi16(__m256i __a) {
137  // CHECK-LABEL: @test_256_insert_epi16
138  // CHECK: insertelement <16 x i16> {{.*}}, i16 {{.*}}, i32 {{.*}}
139  return _mm256_insert_epi16(__a, 42, 3);
140}
141
142__m256i test_256_insert_epi32(__m256i __a) {
143  // CHECK-LABEL: @test_256_insert_epi32
144  // CHECK: insertelement <8 x i32> {{.*}}, i32 {{.*}}, i32 {{.*}}
145  return _mm256_insert_epi32(__a, 42, 3);
146}
147
148__m256i test_256_insert_epi64(__m256i __a) {
149  // CHECK-LABEL: @test_256_insert_epi64
150  // CHECK: insertelement <4 x i64> {{.*}}, i64 {{.*}}, i32 {{.*}}
151  return _mm256_insert_epi64(__a, 42, 3);
152}
153
154__m256 test_mm256_undefined_ps() {
155  // CHECK-LABEL: @test_mm256_undefined_ps
156  // CHECK: ret <8 x float> undef
157  return _mm256_undefined_ps();
158}
159
160__m256d test_mm256_undefined_pd() {
161  // CHECK-LABEL: @test_mm256_undefined_pd
162  // CHECK: ret <4 x double> undef
163  return _mm256_undefined_pd();
164}
165
166__m256i test_mm256_undefined_si256() {
167  // CHECK-LABEL: @test_mm256_undefined_si256
168  // CHECK: ret <4 x i64> undef
169  return _mm256_undefined_si256();
170}
171