CodeGenCactus.m: Move vectoriseExpression into new Vectorisation.m pa…

…ckage
ianhinder · Sep 6, 2013 · ad2c738 · ad2c738
1 parent caf12dd
commit ad2c738
Show file tree

Hide file tree

Showing 2 changed files with 246 additions and 216 deletions.
diff --git a/Tools/CodeGen/CodeGenCactus.m b/Tools/CodeGen/CodeGenCactus.m
@@ -20,7 +20,7 @@
     Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
 *)
 
-BeginPackage["CodeGenCactus`", {"Errors`", "Kranc`", "CodeGenC`", "CodeGen`"}];
+BeginPackage["CodeGenCactus`", {"Errors`", "Kranc`", "CodeGenC`", "CodeGen`", "Vectorisation`"}];
 
 AssignVariableInLoop::usage = "AssignVariableInLoop[dest_, src_] returns a block of code " <>
   "that assigns 'src' to 'dest'.";
@@ -537,220 +537,6 @@
   setParametersForThorn[thorn_String, map_List] :=
   Map[setParameter[thorn, #[[1]], #[[2]]] &, map]];
 
-DefFn[
-  vectoriseExpression[exprp_] :=
-  Module[
-    {expr, undoVect, undoSomeVect},
-    expr = exprp;
-
-    (* Remove SQR etc. *)
-    expr = expr //. {
-      SQR[x_] -> x^2,
-      CUB[x_] -> x^3,
-      QAD[x_] -> x^4,
-      INV[x_] -> 1/x};
-    expr = expr //. Power[x_,y_] -> pow[x,y];
-
-    (* Handle division *)
-    expr = expr //. pow[x_,n_Integer] /; n<0 :> kdiv[1,pow[x,-n]];
-    (* Implement integer powers efficiently *)
-    expr = expr //. {
-      pow[x_,0] -> 1,
-      pow[x_,1] -> x,
-      pow[x_,n_Integer] /; n>1 && Mod[n,2]==0 :> kmul[pow[x,n/2],pow[x,n/2]],
-      pow[x_,n_Integer] /; n>1 && Mod[n,2]==1 :> kmul[x,pow[x,n-1]]};
-
-    (* Constants *)
-    expr = expr /. {
-      x_Integer  -> ToReal[x],
-      x_Rational -> ToReal[x],
-      x_Real     -> ToReal[x],
-      E          -> ToReal[E],
-      Pi         -> ToReal[Pi]};
-
-    ToRealQ[expr_] := Head[expr] == ToReal;
-    notToRealQ[expr_] := Head[expr] != ToReal;
-
-    (* Operators *)
-    expr = expr //. {
-      -x_ -> kneg[x],
-
-      x_ + y_ -> kadd[x,y],
-      x_ - y_ -> ksub[x,y],
-
-      x_ * y_ -> kmul[x,y],
-      x_ / y_ -> kdiv[x,y],
-
-      acos[xx_]  -> kacos[xx],
-      acosh[xx_] -> kacosh[xx],
-      asin[xx_]  -> kasin[xx],
-      asinh[xx_] -> kasinh[xx],
-      atan[xx_]  -> katan[xx],
-      atanh[xx_] -> katanh[xx],
-      cos[xx_]   -> kcos[xx],
-      cosh[xx_]  -> kcosh[xx],
-      sin[xx_]   -> ksin[xx],
-      sinh[xx_]  -> ksinh[xx],
-      tan[xx_]   -> ktan[xx],
-      tanh[xx_]  -> ktanh[xx],
-
-      exp[x_]     -> kexp[x],
-      fabs[x_]    -> kfabs[x],
-      fmax[x_,y_] -> kfmax[x,y],
-      fmin[x_,y_] -> kfmin[x,y],
-      isgn[x_]    -> kisgn[x],
-      log[x_]     -> klog[x],
-      pow[x_,y_]  -> kpow[x,y],
-      sgn[x_]     -> ksgn[x],
-      sqrt[x_]    -> ksqrt[x]};
-
-    (* Optimise *)
-    expr = expr //. {
-      kneg[ToReal[a_]]      -> ToReal[-a],
-      kmul[ToReal[-1],x_]   -> kneg[x],
-      kmul[ToReal[-1.0],x_] -> kneg[x],
-      kmul[x_,ToReal[-1]]   -> kneg[x],
-      kmul[x_,ToReal[-1.0]] -> kneg[x],
-      kneg[kneg[x_]]        -> x,
-
-      kadd[ToReal[0],x_]             -> x,
-      kadd[ToReal[0.0],x_]           -> x,
-      kadd[x_,ToReal[0]]             -> x,
-      kadd[x_,ToReal[0.0]]           -> x,
-      ksub[ToReal[0],x_]             -> kneg[x],
-      ksub[ToReal[0.0],x_]           -> kneg[x],
-      ksub[x_,ToReal[0]]             -> x,
-      ksub[x_,ToReal[0.0]]           -> x,
-      kadd[kneg[x_],y_]              -> ksub[y,x],
-      ksub[kneg[x_],y_]              -> kneg[kadd[x,y]],
-      kadd[x_,kneg[y_]]              -> ksub[x,y],
-      ksub[x_,kneg[y_]]              -> kadd[x,y],
-      kneg[ksub[x_,y_]]              -> ksub[y,x],
-      kadd[x_,x_]                    -> kmul[ToReal[2],x],
-      ksub[x_,x_]                    -> ToReal[0],
-      kadd[ToReal[a_],ToReal[b_]]    -> ToReal[kadd[a,b]],
-      ksub[ToReal[a_],ToReal[b_]]    -> ToReal[ksub[a,b]],
-      kadd[x_?notToRealQ,ToReal[a_]] -> kadd[ToReal[a],x],
-      kadd[kadd[ToReal[a_],x_],y_]   -> kadd[ToReal[a],kadd[x,y]],
-      kadd[kadd[ToReal[a_],x_],
-           kadd[ToReal[b_],y_]]      -> kadd[ToReal[kadd[a,b]],kadd[x,y]],
-      kadd[x_?notToRealQ,
-           kadd[ToReal[a_],y_]]      -> kadd[ToReal[a],kadd[x,y]],
-
-      kmul[ToReal[0],x_]             -> ToReal[0],
-      kmul[ToReal[0.0],x_]           -> ToReal[0],
-      kmul[x_,ToReal[0]]             -> ToReal[0],
-      kmul[x_,ToReal[0.0]]           -> ToReal[0],
-      kmul[ToReal[+1],x_]            -> x,
-      kmul[ToReal[+1.0],x_]          -> x,
-      kmul[x_,ToReal[+1]]            -> x,
-      kmul[x_,ToReal[+1.0]]          -> x,
-      kmul[ToReal[-1],x_]            -> kneg[x],
-      kmul[ToReal[-1.0],x_]          -> kneg[x],
-      kmul[x_,ToReal[-1]]            -> kneg[x],
-      kmul[x_,ToReal[-1.0]]          -> kneg[x],
-      kdiv[ToReal[0],x_]             -> ToReal[0],
-      kdiv[ToReal[0.0],x_]           -> ToReal[0],
-      (* kdiv[x_,ToReal[0]]           -> ToReal[nan], *)
-      (* kdiv[x_,ToReal[0.0]]         -> ToReal[nan], *)
-      kdiv[x_,ToReal[y_]]            -> kmul[x,ToReal[1/y]],
-      kdiv[x_,kdiv[y_,z_]]           -> kdiv[kmul[x,z],y],
-      kdiv[kdiv[x_,y_],z_]           -> kdiv[x,kmul[y,z]],
-      kmul[x_,kdiv[y_,z_]]           -> kdiv[kmul[x,y],z],
-      kmul[kdiv[x_,y_],z_]           -> kdiv[kmul[x,z],y],
-      kmul[kneg[x_],y_]              -> kneg[kmul[x,y]],
-      kmul[x_,kneg[y_]]              -> kneg[kmul[x,y]],
-      kdiv[kneg[x_],y_]              -> kneg[kdiv[x,y]],
-      kdiv[x_,kneg[y_]]              -> kneg[kdiv[x,y]],
-      kdiv[x_,x_]                    -> ToReal[1],
-      kmul[ToReal[a_],ToReal[b_]]    -> ToReal[kmul[a,b]],
-      kdev[ToReal[a_],ToReal[b_]]    -> ToReal[kdiv[a,b]],
-      kmul[x_?notToRealQ,ToReal[a_]] -> kmul[ToReal[a],x],
-      kdiv[x_?notToRealQ,ToReal[y_]] -> kmul[ToReal[kdiv[1,y]],x],
-      kmul[kmul[ToReal[a_],x_],y_]   -> kmul[ToReal[a],kmul[x,y]],
-      kmul[kmul[ToReal[a_],x_],
-           kmul[ToReal[b_],y_]]      -> kmul[ToReal[kmul[a,b]],kmul[x,y]],
-      kmul[x_?notToRealQ,
-           kmul[ToReal[a_],y_]]      -> kmul[ToReal[a],kmul[x,y]],
-
-      kasin[kneg[xx_]]           -> kneg[kasin[xx]],
-      kasinh[kneg[xx_]]          -> kneg[kasinh[xx]],
-      katan[kneg[xx_]]           -> kneg[katan[xx]],
-      katanh[kneg[xx_]]          -> kneg[katanh[xx]],
-      kcos[kneg[xx_]]            -> kcos[xx],
-      kcosh[kneg[xx_]]           -> kcosh[xx],
-      ksin[kneg[xx_]]            -> kneg[ksin[xx]],
-      ksinh[kneg[xx_]]           -> kneg[ksinh[xx]],
-      ktan[kneg[xx_]]            -> kneg[ktan[xx]],
-      ktanh[kneg[xx_]]           -> kneg[ktanh[xx]],
-      kfmax[kneg[xx_],kneg[yy_]] -> kneg[kfmin[xx,yy]],
-      kfmin[kneg[xx_],kneg[yy_]] -> kneg[kfmax[xx,yy]],
-      kfabs[kneg[xx_]]           -> kfabs[xx],
-      kfnabs[kneg[xx_]]          -> kfnabs[xx],
-      kneg[kfabs[xx_]]           -> kfnabs[xx],
-      kneg[kfnabs[xx_]]          -> kfabs[xx]};
-
-    (* FMA (fused multiply-add) *)
-    (* kmadd (x,y,z) =   xy+z
-       kmsub (x,y,z) =   xy-z
-       knmadd(x,y,z) = -(xy+z)
-       knmsub(x,y,z) = -(xy-z) *)
-    expr = expr //. {
-      kadd[kmul[x_,y_],z_] -> kmadd[x,y,z],
-      kadd[z_,kmul[x_,y_]] -> kmadd[x,y,z],
-      ksub[kmul[x_,y_],z_] -> kmsub[x,y,z],
-      ksub[z_,kmul[x_,y_]] -> knmsub[x,y,z],
-      kneg[kmadd [x_,y_,z_]] -> knmadd[x,y,z],
-      kneg[kmsub [x_,y_,z_]] -> knmsub[x,y,z],
-      kneg[knmadd[x_,y_,z_]] -> kmadd [x,y,z],
-      kneg[knmsub[x_,y_,z_]] -> kmsub [x,y,z]
-      (* we could match this and similar patterns
-         kmul[x_, kadd[y_, ToReal[+1]]] -> kmadd[x, y, x],
-         kmul[x_, kadd[y_, ToReal[-1]]] -> kmsub[x, y, x],
-         *)};
-
-    (* Undo some transformations *)
-    undoVect[expr_] := expr //. {
-      ToReal[x_] -> x,
-
-      (* don't generate large integer constants *)
-      x_Integer /; Abs[x]>10^10 :> 1.0*x,
-      (* generate sufficient precision *)
-      x_Rational :> N[x,30],
-      Pi -> N[Pi,30],
-      E  -> N[E,30],
-
-      kneg[x_] -> -x,
-
-      kadd[x_,y_] -> x+y,
-      ksub[x_,y_] -> x-y,
-      kmul[x_,y_] -> x*y,
-      kdiv[x_,y_] -> x*ScalarINV[y],
-
-      kmadd[x_,y_,z_]  -> x*y+z,
-      kmsub[x_,y_,z_]  -> x*y-z,
-      knmadd[x_,y_,z_] -> -(x*y+z),
-      knmsub[x_,y_,z_] -> -(x*y-z),
-
-      x_^2 -> ScalarSQR[x],
-      x_^3 -> ScalarCUB[x],
-      x_^4 -> ScalarQAD[x],
-      x_^-1 -> ScalarINV[x],
-      x_^-2 -> ScalarINV[ScalarSQR[x]],
-      x_^-3 -> ScalarINV[ScalarCUB[x]],
-      x_^-4 -> ScalarINV[ScalarQAD[x]]};
-
-    undoSomeVect[expr_] := (
-      expr
-      /. ToReal[a_] :> ToReal[undoVect[a]]
-      /. Scalar[a_] :> Scalar[undoVect[a]]
-      /. (IfThen[a_,x_,y_] :> 
-          IfThen[undoVect[a], undoSomeVect[x], undoSomeVect[y]])
-      /. kpow[x_,a_] :> kpow[undoSomeVect[x], undoVect[a]]);
-
-    expr = undoSomeVect[expr];
-
-    Return[expr]]];
 
 (* Take an expression x and replace occurrences of Powers with the C
   macros SQR, CUB, QAD *)
@@ -877,7 +663,7 @@
         rhs = rhs //. IntAbs[x_] -> abs[x];
 
         If[vectorise === True,
-           rhs = vectoriseExpression[rhs]];
+           rhs = VectoriseExpression[rhs]];
 
         (* Remove Scalar[] after vectorising *)
         rhs = rhs /. Scalar[xx_] -> xx},