Auto merge of #58304 - gnzlbg:simd_saturated, r=nagisa

Add generic simd saturated add/sub intrinsics r? @eddyb
rust-lang · Feb 24, 2019 · 7cb3ee4 · 7cb3ee4
2 parents f573049 + f0783d5
commit 7cb3ee4
Show file tree

Hide file tree

Showing 26 changed files with 895 additions and 9 deletions.
diff --git a/src/librustc_codegen_llvm/context.rs b/src/librustc_codegen_llvm/context.rs
@@ -515,14 +515,24 @@ impl CodegenCx<'b, 'tcx> {
         let t_f32 = self.type_f32();
         let t_f64 = self.type_f64();
 
-        let t_v2f32 = self.type_vector(t_f32, 2);
-        let t_v4f32 = self.type_vector(t_f32, 4);
-        let t_v8f32 = self.type_vector(t_f32, 8);
-        let t_v16f32 = self.type_vector(t_f32, 16);
-
-        let t_v2f64 = self.type_vector(t_f64, 2);
-        let t_v4f64 = self.type_vector(t_f64, 4);
-        let t_v8f64 = self.type_vector(t_f64, 8);
+        macro_rules! vector_types {
+            ($id_out:ident: $elem_ty:ident, $len:expr) => {
+                let $id_out = self.type_vector($elem_ty, $len);
+            };
+            ($($id_out:ident: $elem_ty:ident, $len:expr;)*) => {
+                $(vector_types!($id_out: $elem_ty, $len);)*
+            }
+        }
+        vector_types! {
+            t_v2f32: t_f32, 2;
+            t_v4f32: t_f32, 4;
+            t_v8f32: t_f32, 8;
+            t_v16f32: t_f32, 16;
+
+            t_v2f64: t_f64, 2;
+            t_v4f64: t_f64, 4;
+            t_v8f64: t_f64, 8;
+        }
 
         ifn!("llvm.memset.p0i8.i16", fn(i8p, t_i8, t_i16, t_i32, i1) -> void);
         ifn!("llvm.memset.p0i8.i32", fn(i8p, t_i8, t_i32, t_i32, i1) -> void);

diff --git a/src/librustc_codegen_llvm/intrinsic.rs b/src/librustc_codegen_llvm/intrinsic.rs
@@ -1848,7 +1848,52 @@ unsupported {} from `{}` with element `{}` of size `{}` to `{}`"#,
         simd_xor: Uint, Int => xor;
         simd_fmax: Float => maxnum;
         simd_fmin: Float => minnum;
+
+    }
+
+    if name == "simd_saturating_add" || name == "simd_saturating_sub" {
+        let lhs = args[0].immediate();
+        let rhs = args[1].immediate();
+        let is_add = name == "simd_saturating_add";
+        let ptr_bits = bx.tcx().data_layout.pointer_size.bits() as _;
+        let (signed, elem_width, elem_ty) = match in_elem.sty {
+            ty::Int(i) =>
+                (
+                    true,
+                    i.bit_width().unwrap_or(ptr_bits),
+                    bx.cx.type_int_from_ty(i)
+                ),
+            ty::Uint(i) =>
+                (
+                    false,
+                    i.bit_width().unwrap_or(ptr_bits),
+                    bx.cx.type_uint_from_ty(i)
+                ),
+            _ => {
+                return_error!(
+                    "expected element type `{}` of vector type `{}` \
+                     to be a signed or unsigned integer type",
+                    arg_tys[0].simd_type(tcx).sty, arg_tys[0]
+                );
+            }
+        };
+        let llvm_intrinsic = &format!(
+            "llvm.{}{}.sat.v{}i{}",
+            if signed { 's' } else { 'u' },
+            if is_add { "add" } else { "sub" },
+            in_len, elem_width
+        );
+        let vec_ty = bx.cx.type_vector(elem_ty, in_len as u64);
+
+        let f = bx.declare_cfn(
+            &llvm_intrinsic,
+            bx.type_func(&[vec_ty, vec_ty], vec_ty)
+        );
+        llvm::SetUnnamedAddr(f, false);
+        let v = bx.call(f, &[lhs, rhs], None);
+        return Ok(v);
     }
+
     span_bug!(span, "unknown SIMD intrinsic");
 }
 

diff --git a/src/librustc_typeck/check/intrinsic.rs b/src/librustc_typeck/check/intrinsic.rs
@@ -410,7 +410,8 @@ pub fn check_platform_intrinsic_type<'a, 'tcx>(tcx: TyCtxt<'a, 'tcx, 'tcx>,
         "simd_add" | "simd_sub" | "simd_mul" | "simd_rem" |
         "simd_div" | "simd_shl" | "simd_shr" |
         "simd_and" | "simd_or" | "simd_xor" |
-        "simd_fmin" | "simd_fmax" | "simd_fpow" => {
+        "simd_fmin" | "simd_fmax" | "simd_fpow" |
+        "simd_saturating_add" | "simd_saturating_sub" => {
             (1, vec![param(0), param(0)], param(0))
         }
         "simd_fsqrt" | "simd_fsin" | "simd_fcos" | "simd_fexp" | "simd_fexp2" |

diff --git a/src/test/codegen/simd-intrinsic-float-abs.rs → ...imd-intrinsic/simd-intrinsic-float-abs.rs b/src/test/codegen/simd-intrinsic-float-abs.rs → ...imd-intrinsic/simd-intrinsic-float-abs.rs
diff --git a/...test/codegen/simd-intrinsic-float-ceil.rs → ...md-intrinsic/simd-intrinsic-float-ceil.rs b/...test/codegen/simd-intrinsic-float-ceil.rs → ...md-intrinsic/simd-intrinsic-float-ceil.rs
diff --git a/src/test/codegen/simd-intrinsic-float-cos.rs → ...imd-intrinsic/simd-intrinsic-float-cos.rs b/src/test/codegen/simd-intrinsic-float-cos.rs → ...imd-intrinsic/simd-intrinsic-float-cos.rs
diff --git a/src/test/codegen/simd-intrinsic-float-exp.rs → ...imd-intrinsic/simd-intrinsic-float-exp.rs b/src/test/codegen/simd-intrinsic-float-exp.rs → ...imd-intrinsic/simd-intrinsic-float-exp.rs
diff --git a/...test/codegen/simd-intrinsic-float-exp2.rs → ...md-intrinsic/simd-intrinsic-float-exp2.rs b/...test/codegen/simd-intrinsic-float-exp2.rs → ...md-intrinsic/simd-intrinsic-float-exp2.rs
diff --git a/...est/codegen/simd-intrinsic-float-floor.rs → ...d-intrinsic/simd-intrinsic-float-floor.rs b/...est/codegen/simd-intrinsic-float-floor.rs → ...d-intrinsic/simd-intrinsic-float-floor.rs
diff --git a/src/test/codegen/simd-intrinsic-float-fma.rs → ...imd-intrinsic/simd-intrinsic-float-fma.rs b/src/test/codegen/simd-intrinsic-float-fma.rs → ...imd-intrinsic/simd-intrinsic-float-fma.rs
diff --git a/...est/codegen/simd-intrinsic-float-fsqrt.rs → ...d-intrinsic/simd-intrinsic-float-fsqrt.rs b/...est/codegen/simd-intrinsic-float-fsqrt.rs → ...d-intrinsic/simd-intrinsic-float-fsqrt.rs
diff --git a/src/test/codegen/simd-intrinsic-float-log.rs → ...imd-intrinsic/simd-intrinsic-float-log.rs b/src/test/codegen/simd-intrinsic-float-log.rs → ...imd-intrinsic/simd-intrinsic-float-log.rs
diff --git a/...est/codegen/simd-intrinsic-float-log10.rs → ...d-intrinsic/simd-intrinsic-float-log10.rs b/...est/codegen/simd-intrinsic-float-log10.rs → ...d-intrinsic/simd-intrinsic-float-log10.rs
diff --git a/...test/codegen/simd-intrinsic-float-log2.rs → ...md-intrinsic/simd-intrinsic-float-log2.rs b/...test/codegen/simd-intrinsic-float-log2.rs → ...md-intrinsic/simd-intrinsic-float-log2.rs
diff --git a/...st/codegen/simd-intrinsic-float-minmax.rs → ...-intrinsic/simd-intrinsic-float-minmax.rs b/...st/codegen/simd-intrinsic-float-minmax.rs → ...-intrinsic/simd-intrinsic-float-minmax.rs
diff --git a/src/test/codegen/simd-intrinsic-float-pow.rs → ...imd-intrinsic/simd-intrinsic-float-pow.rs b/src/test/codegen/simd-intrinsic-float-pow.rs → ...imd-intrinsic/simd-intrinsic-float-pow.rs
diff --git a/...test/codegen/simd-intrinsic-float-powi.rs → ...md-intrinsic/simd-intrinsic-float-powi.rs b/...test/codegen/simd-intrinsic-float-powi.rs → ...md-intrinsic/simd-intrinsic-float-powi.rs
diff --git a/src/test/codegen/simd-intrinsic-float-sin.rs → ...imd-intrinsic/simd-intrinsic-float-sin.rs b/src/test/codegen/simd-intrinsic-float-sin.rs → ...imd-intrinsic/simd-intrinsic-float-sin.rs