test/CodeGen/arm64_vfma.c

6bcf27bb9a4b5c3f79cb44c0e4654a6d7619ad89Stephen Hines// RUN: %clang_cc1 -O1 -triple arm64-apple-ios7 -target-feature +neon -ffreestanding -S -o - -emit-llvm %s | FileCheck %s
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines// Test ARM64 SIMD fused multiply add intrinsics
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines#include <arm_neon.h>
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat32x2_t test_vfma_f32(float32x2_t a1, float32x2_t a2, float32x2_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfma_f32
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfma_f32(a1, a2, a3);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v2f32({{.*a2, .*a3, .*a1}})
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat32x4_t test_vfmaq_f32(float32x4_t a1, float32x4_t a2, float32x4_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfmaq_f32
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfmaq_f32(a1, a2, a3);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v4f32({{.*a2, .*a3, .*a1}})
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat64x2_t test_vfmaq_f64(float64x2_t a1, float64x2_t a2, float64x2_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfmaq_f64
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfmaq_f64(a1, a2, a3);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v2f64({{.*a2, .*a3, .*a1}})
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat32x2_t test_vfma_lane_f32(float32x2_t a1, float32x2_t a2, float32x2_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfma_lane_f32
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfma_lane_f32(a1, a2, a3, 1);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // NB: the test below is deliberately lose, so that we don't depend too much
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // upon the exact IR used to select lane 1 (usually a shufflevector)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v2f32(<2 x float> %a2, <2 x float> {{.*}}, <2 x float> %a1)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat32x4_t test_vfmaq_lane_f32(float32x4_t a1, float32x4_t a2, float32x2_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfmaq_lane_f32
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfmaq_lane_f32(a1, a2, a3, 1);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // NB: the test below is deliberately lose, so that we don't depend too much
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // upon the exact IR used to select lane 1 (usually a shufflevector)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v4f32(<4 x float> %a2, <4 x float> {{.*}}, <4 x float> %a1)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat64x2_t test_vfmaq_lane_f64(float64x2_t a1, float64x2_t a2, float64x1_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfmaq_lane_f64
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfmaq_lane_f64(a1, a2, a3, 0);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // NB: the test below is deliberately lose, so that we don't depend too much
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // upon the exact IR used to select lane 1 (usually a shufflevector)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v2f64(<2 x double> %a2, <2 x double> {{.*}}, <2 x double> %a1)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat32x2_t test_vfma_n_f32(float32x2_t a1, float32x2_t a2, float32_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfma_n_f32
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfma_n_f32(a1, a2, a3);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // NB: the test below is deliberately lose, so that we don't depend too much
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // upon the exact IR used to select lane 0 (usually two insertelements)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v2f32
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat32x4_t test_vfmaq_n_f32(float32x4_t a1, float32x4_t a2, float32_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfmaq_n_f32
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfmaq_n_f32(a1, a2, a3);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // NB: the test below is deliberately lose, so that we don't depend too much
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // upon the exact IR used to select lane 0 (usually four insertelements)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v4f32
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat64x2_t test_vfmaq_n_f64(float64x2_t a1, float64x2_t a2, float64_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfmaq_n_f64
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfmaq_n_f64(a1, a2, a3);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // NB: the test below is deliberately lose, so that we don't depend too much
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // upon the exact IR used to select lane 0 (usually two insertelements)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v2f64
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat32x2_t test_vfms_f32(float32x2_t a1, float32x2_t a2, float32x2_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfms_f32
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfms_f32(a1, a2, a3);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: [[NEG:%.*]] = fsub <2 x float> {{.*}}, %a2
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v2f32(<2 x float> %a3, <2 x float> [[NEG]], <2 x float> %a1)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat32x4_t test_vfmsq_f32(float32x4_t a1, float32x4_t a2, float32x4_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfmsq_f32
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfmsq_f32(a1, a2, a3);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: [[NEG:%.*]] = fsub <4 x float> {{.*}}, %a2
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v4f32(<4 x float> %a3, <4 x float> [[NEG]], <4 x float> %a1)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat64x2_t test_vfmsq_f64(float64x2_t a1, float64x2_t a2, float64x2_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfmsq_f64
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfmsq_f64(a1, a2, a3);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: [[NEG:%.*]] = fsub <2 x double> {{.*}}, %a2
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v2f64(<2 x double> %a3, <2 x double> [[NEG]], <2 x double> %a1)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat32x2_t test_vfms_lane_f32(float32x2_t a1, float32x2_t a2, float32x2_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfms_lane_f32
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfms_lane_f32(a1, a2, a3, 1);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // NB: the test below is deliberately lose, so that we don't depend too much
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // upon the exact IR used to select lane 1 (usually a shufflevector)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: [[NEG:%.*]] = fsub <2 x float> {{.*}}, %a3
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: [[LANE:%.*]] = shufflevector <2 x float> [[NEG]]
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v2f32(<2 x float> {{.*}}, <2 x float> [[LANE]], <2 x float> %a1)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat32x4_t test_vfmsq_lane_f32(float32x4_t a1, float32x4_t a2, float32x2_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfmsq_lane_f32
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfmsq_lane_f32(a1, a2, a3, 1);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // NB: the test below is deliberately lose, so that we don't depend too much
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // upon the exact IR used to select lane 1 (usually a shufflevector)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: [[NEG:%.*]] = fsub <2 x float> {{.*}}, %a3
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: [[LANE:%.*]] = shufflevector <2 x float> [[NEG]]
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v4f32(<4 x float> {{.*}}, <4 x float> [[LANE]], <4 x float> %a1)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hinesfloat64x2_t test_vfmsq_lane_f64(float64x2_t a1, float64x2_t a2, float64x1_t a3) {
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: test_vfmsq_lane_f64
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  return vfmsq_lane_f64(a1, a2, a3, 0);
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // NB: the test below is deliberately lose, so that we don't depend too much
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // upon the exact IR used to select lane 1 (usually a shufflevector)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: [[NEG:%.*]] = fsub <1 x double> {{.*}}, %a3
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: [[LANE:%.*]] = shufflevector <1 x double> [[NEG]]
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK: llvm.fma.v2f64(<2 x double> {{.*}}, <2 x double> [[LANE]], <2 x double> %a1)
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines  // CHECK-NEXT: ret
651f13cea278ec967336033dd032faef0e9fc2ecStephen Hines}