add more writer test

yiheng-wang-intel · yiheng-wang-intel · commit 3a2f0242cf63 · 2017-06-12T17:57:07.000+08:00
diff --git a/spark/dl/src/main/scala/com/intel/analytics/bigdl/nn/Dropout.scala b/spark/dl/src/main/scala/com/intel/analytics/bigdl/nn/Dropout.scala
@@ -207,7 +207,7 @@ class Dropout[T: ClassTag](
 }
 
 object Dropout {
-  def apply[@specialized(Float, Double) T: ClassTag](
+  def apply[T: ClassTag](
     initP: Double = 0.5,
     inplace: Boolean = false,
     scale: Boolean = true)(implicit ev: TensorNumeric[T]) : Dropout[T] = {
diff --git a/spark/dl/src/main/scala/com/intel/analytics/bigdl/nn/Graph.scala b/spark/dl/src/main/scala/com/intel/analytics/bigdl/nn/Graph.scala
@@ -325,6 +325,12 @@ class Input[T: ClassTag]()(implicit ev: TensorNumeric[T]) extends TensorModule[T
     gradInput = gradOutput
     gradInput
   }
+  override def equals(other: Any): Boolean = {
+    if (!other.isInstanceOf[Input[_]]) return false
+    this.eq(other.asInstanceOf[Input[_]])
+  }
+
+  override def hashCode(): Int = System.identityHashCode(this)
 }
 
 object Input {
diff --git a/spark/dl/src/main/scala/com/intel/analytics/bigdl/nn/Padding.scala b/spark/dl/src/main/scala/com/intel/analytics/bigdl/nn/Padding.scala
@@ -116,7 +116,7 @@ class Padding[T: ClassTag](
 }
 
 object Padding{
-  def apply[@specialized(Float, Double) T: ClassTag](
+  def apply[T: ClassTag](
     dim: Int,
     pad: Int,
     nInputDim: Int,
diff --git a/spark/dl/src/main/scala/com/intel/analytics/bigdl/nn/Reshape.scala b/spark/dl/src/main/scala/com/intel/analytics/bigdl/nn/Reshape.scala
@@ -128,7 +128,7 @@ class Reshape[@specialized(Float, Double) T: ClassTag](
 }
 
 object Reshape {
-  def apply[@specialized(Float, Double) T: ClassTag](
+  def apply[T: ClassTag](
       size: Array[Int],
       batchMode: Option[Boolean] = None)(implicit ev: TensorNumeric[T]) : Reshape[T] = {
     new Reshape[T](size, batchMode)
diff --git a/spark/dl/src/main/scala/com/intel/analytics/bigdl/nn/Sigmoid.scala b/spark/dl/src/main/scala/com/intel/analytics/bigdl/nn/Sigmoid.scala
@@ -47,7 +47,7 @@ class Sigmoid[@specialized(Float, Double) T: ClassTag](
 }
 
 object Sigmoid {
-  def apply[@specialized(Float, Double) T: ClassTag]()
+  def apply[T: ClassTag]()
       (implicit ev: TensorNumeric[T]) : Sigmoid[T] = {
     new Sigmoid[T]()
   }
diff --git a/spark/dl/src/main/scala/com/intel/analytics/bigdl/tensor/DenseTensor.scala b/spark/dl/src/main/scala/com/intel/analytics/bigdl/tensor/DenseTensor.scala
@@ -1906,6 +1906,8 @@ private[tensor] class DenseTensor[@specialized(Float, Double) T: ClassTag](
         "corresponding module, please keep them same.")
     }
   }
+
+  override def getTensorNumeric(): TensorNumeric[T] = ev
 }
 
 object DenseTensor {
diff --git a/spark/dl/src/main/scala/com/intel/analytics/bigdl/tensor/Tensor.scala b/spark/dl/src/main/scala/com/intel/analytics/bigdl/tensor/Tensor.scala
@@ -646,6 +646,12 @@ trait Tensor[T] extends Serializable with TensorMath[T] with Activity {
    * @return false
    */
   override def isTable: Boolean = false
+
+  /**
+   * Return tensor numeric
+   * @return
+   */
+  def getTensorNumeric(): TensorNumeric[T]
 }
 
 /**
diff --git a/spark/dl/src/main/scala/com/intel/analytics/bigdl/utils/tf/BigDLToTensorflow.scala b/spark/dl/src/main/scala/com/intel/analytics/bigdl/utils/tf/BigDLToTensorflow.scala
@@ -25,6 +25,8 @@ import Tensorflow._
 import BigDLToTensorflow._
 import org.tensorflow.framework.{DataType, NodeDef}
 
+import scala.collection.mutable.ArrayBuffer
+
 /**
  * Wrapper of logic to convert module to tensorflow node definition
  */
@@ -51,6 +53,15 @@ object BigDLToTensorflow {
   }
 }
 
+object InputToTF extends BigDLToTensorflow {
+  override def toTFDef(module: AbstractModule[_, _, _], inputs: Seq[NodeDef],
+                       byteOrder: ByteOrder, dataFormat: TensorflowDataFormat): Seq[NodeDef] = {
+    require(inputs.length == 1, "Input only accept one input")
+
+    Seq(identity(inputs(0), module.getName()))
+  }
+}
+
 object ReLUToTF extends BigDLToTensorflow {
   override def toTFDef(module: AbstractModule[_, _, _], inputs: Seq[NodeDef],
                        byteOrder: ByteOrder, dataFormat: TensorflowDataFormat): Seq[NodeDef] = {
@@ -80,10 +91,16 @@ object SpatialConvolutionToTF extends BigDLToTensorflow {
                        byteOrder: ByteOrder, dataFormat: TensorflowDataFormat): Seq[NodeDef] = {
     require(inputs.length == 1, "SpatialConvolution only accept one input")
     val spatialConv = module.asInstanceOf[SpatialConvolution[_]]
-    val filter = const(spatialConv.weight, spatialConv.getName() + "/filter", byteOrder)
+    // squeeze will modify the weight tensor
+    // GOIHW -> HWIO
+    require(spatialConv.weight.size(1) == 1, "convolution group is not supported")
+    val filterTensor = spatialConv.weight.select(1, 1)
+      .transpose(2, 3).transpose(3, 4).transpose(1, 2).transpose(2, 3).transpose(3, 4).contiguous()
+
+    val filter = const(filterTensor, spatialConv.getName() + "/filter", byteOrder)
     val filterReader = identity(filter, spatialConv.getName() + "/filterReader")
-    val conv = conv2D(inputs(0), filterReader, spatialConv.strideH, spatialConv.strideW,
-      spatialConv.kernelW, spatialConv.kernelH, spatialConv.strideW, spatialConv.strideH,
+    val conv = conv2D(inputs(0), filterReader, spatialConv.strideW, spatialConv.strideH,
+      spatialConv.kernelW, spatialConv.kernelH, spatialConv.padW, spatialConv.padH,
       dataFormat, spatialConv.getName() + "/conv2D")
     val bias = const(spatialConv.bias, spatialConv.getName() + "/bias", byteOrder)
     val biasReader = identity(bias, spatialConv.getName() + "/biasReader")
@@ -121,7 +138,7 @@ object ReshapeToTF extends BigDLToTensorflow {
       size.setValue(i + 1, rh.size(i))
       i += 1
     }
-    val shape = const(size, rh.getName() + "/shape", byteOrder, DataType.DT_INT32)
+    val shape = const(size, rh.getName() + "/shape", byteOrder, false, DataType.DT_INT32)
     val reshapeNode = reshape(inputs(0), shape, rh.getName())
     Seq(reshapeNode, shape)
   }
@@ -138,7 +155,7 @@ object ViewToTF extends BigDLToTensorflow {
       size.setValue(i + 1, viewLayer.sizes(i))
       i += 1
     }
-    val shape = const(size, viewLayer.getName() + "/shape", byteOrder, DataType.DT_INT32)
+    val shape = const(size, viewLayer.getName() + "/shape", byteOrder, false, DataType.DT_INT32)
     val reshapeNode = reshape(inputs(0), shape, viewLayer.getName())
     Seq(reshapeNode, shape)
   }
@@ -168,7 +185,8 @@ object PaddingToTF extends BigDLToTensorflow {
       padding.setValue(1, 1, 0)
       padding.setValue(1, 2, layer.pad)
     }
-    val paddingsNode = const(padding, layer.getName() + "/padding", byteOrder, DataType.DT_INT32)
+    val paddingsNode = const(padding, layer.getName() + "/padding", byteOrder,
+      false, DataType.DT_INT32)
     val padNode = pad(inputs(0), paddingsNode, layer.getName() + "/output")
     Seq(padNode, paddingsNode)
   }
@@ -234,7 +252,12 @@ object JoinTableToTF extends BigDLToTensorflow {
   override def toTFDef(module: AbstractModule[_, _, _], inputs: Seq[NodeDef],
                        byteOrder: ByteOrder, dataFormat: TensorflowDataFormat): Seq[NodeDef] = {
     val layer = module.asInstanceOf[JoinTable[_]]
-    Seq(concat(inputs, layer.dimension - 1, layer.getName()))
+    val axis = const(Tensor[Float](T((layer.dimension - 1).toFloat)), layer.getName() + "/axis",
+      byteOrder, true, DataType.DT_INT32)
+    val updateInputs = new ArrayBuffer[NodeDef]()
+    updateInputs ++= inputs.reverse
+    updateInputs.append(axis)
+    Seq(concat(updateInputs, layer.dimension - 1, layer.getName()), axis)
   }
 }
 
@@ -268,7 +291,7 @@ object LogSoftMaxToTF extends BigDLToTensorflow {
   }
 }
 
-object BatchNormToTF extends BigDLToTensorflow {
+object BatchNorm2DToTF extends BigDLToTensorflow {
   override def toTFDef(module: AbstractModule[_, _, _], inputs: Seq[NodeDef],
                        byteOrder: ByteOrder, dataFormat: TensorflowDataFormat): Seq[NodeDef] = {
     require(inputs.length == 1, "BatchNorm only accept one input")
diff --git a/spark/dl/src/main/scala/com/intel/analytics/bigdl/utils/tf/Tensorflow.scala b/spark/dl/src/main/scala/com/intel/analytics/bigdl/utils/tf/Tensorflow.scala
@@ -103,7 +103,7 @@ object Tensorflow {
    * @return
    */
   def const[T: ClassTag](value : Tensor[T], name : String, byteOrder: ByteOrder,
-                         dataType: DataType = null): NodeDef = {
+                         isScalar: Boolean = false, dataType: DataType = null): NodeDef = {
     val dtype = if (dataType == null) {
       if (value.getType() == DoubleType) {
         DataType.DT_DOUBLE
@@ -118,7 +118,7 @@ object Tensorflow {
       .setName(name)
       .setOp("Const")
       .putAttr("dtype", AttrValue.newBuilder().setType(dtype).build())
-      .putAttr("value", tensorAttr(value, dtype, byteOrder))
+      .putAttr("value", tensorAttr(value, dtype, byteOrder, isScalar))
       .build()
   }
 
@@ -204,7 +204,7 @@ object Tensorflow {
       .putAttr("T", getDataType(input))
       .putAttr("data_format", dataFormat.value)
       .putAttr("padding", getPaddingType(pW, pH, kW, kH, sW, sH).value)
-      .putAttr("strides", listIntAttr(Seq(sH, sW)))
+      .putAttr("strides", strideAttr(sW, sH, dataFormat))
       .build()
   }
 
@@ -363,7 +363,7 @@ object Tensorflow {
     val node = NodeDef.newBuilder()
       .setName(name)
       .setOp("ConcatV2")
-      .putAttr("N", intAttr(axis))
+      .putAttr("N", intAttr(inputs.length - 1))
       .putAttr("T", getDataType(inputs(0)))
       .putAttr("Tidx", AttrValue.newBuilder().setType(DataType.DT_INT32).build())
 
@@ -379,6 +379,7 @@ object Tensorflow {
       .putAttr("T", getDataType(tensor))
       .putAttr("Tpaddings", getDataType(paddings))
       .addInput(tensor.getName)
+      .addInput(paddings.getName)
       .build()
   }
 
@@ -436,11 +437,27 @@ object Tensorflow {
   }
 
   private def tensorAttr[T: ClassTag](value: Tensor[T], dtype: DataType,
-                                      byteOrder: ByteOrder): AttrValue = {
+                                      byteOrder: ByteOrder, isScalar: Boolean): AttrValue = {
     val shape = TensorShapeProto.newBuilder()
-    value.size().foreach(dim => {
-      shape.addDim(Dim.newBuilder().setSize(dim))
-    })
+    if (!isScalar) {
+      value.size().foreach(dim => {
+        shape.addDim(Dim.newBuilder().setSize(dim))
+      })
+    }
+
+    /* if (value.nElement() == 1 && value.nDimension() == 1) {
+      val tfTensor = TensorProto.newBuilder().setTensorShape(shape).setDtype(dtype)
+      val tn = value.getTensorNumeric()
+      dtype match {
+        case DataType.DT_INT32 =>
+          tfTensor.set
+          tfTensor.setIntVal(0, tn.toType[Int](value.valueAt(1)))
+        case _ =>
+          throw new UnsupportedOperationException(
+            s"$dtype is not support to write to a scalar tensor")
+      }
+      return AttrValue.newBuilder().setTensor(tfTensor).build()
+    } */
 
     require(value.isContiguous(), "only support save a contiguous tensor")
 
diff --git a/spark/dl/src/main/scala/com/intel/analytics/bigdl/utils/tf/TensorflowSaver.scala b/spark/dl/src/main/scala/com/intel/analytics/bigdl/utils/tf/TensorflowSaver.scala
@@ -55,6 +55,7 @@ object TensorflowSaver {
       new mutable.HashMap[AbstractModule[Activity, Tensor[T], T], ArrayBuffer[NodeDef]]()
     model.inputs.zip(inputs).foreach(n => {
       inputNodeCache(n._1.element) = ArrayBuffer(n._2)
+      println()
     })
 
     val graphBuilder = GraphDef.newBuilder()
@@ -69,6 +70,7 @@ object TensorflowSaver {
       n.nextNodes.foreach(n => {
         val list = inputNodeCache.getOrElse(n.element, ArrayBuffer())
         list.append(nodeDefs(0))
+        inputNodeCache(n.element) = list
       })
     })
 
@@ -78,8 +80,8 @@ object TensorflowSaver {
     val os = new FileOutputStream(path)
     val output = CodedOutputStream.newInstance(os)
     val graph = graphBuilder.build()
-    logger.debug("Graph definition is:")
-    logger.debug(graph.toString)
+    logger.info("Graph definition is:")
+    logger.info(graph.toString)
     graph.writeTo(output)
     output.flush()
     os.close()
@@ -142,7 +144,9 @@ object TensorflowSaver {
     getNameFromObj(Mean.getClass.getName) -> MeanToTF,
     getNameFromObj(SoftMax.getClass.getName) -> SoftMaxToTF,
     getNameFromObj(LogSoftMax.getClass.getName) -> LogSoftMaxToTF,
-    getNameFromObj(SpatialBatchNormalization.getClass.getName) -> BatchNormToTF
+    getNameFromObj(SpatialBatchNormalization.getClass.getName) -> BatchNorm2DToTF,
+    getNameFromObj(Input.getClass.getName) -> InputToTF,
+    getNameFromObj(Sigmoid.getClass.getName) -> SigmoidToTF
   )
 
   private def getNameFromObj(name: String) : String = name.substring(0, name.length - 1)
diff --git a/spark/dl/src/test/scala/com/intel/analytics/bigdl/utils/tf/TensorflowSaverSpec.scala b/spark/dl/src/test/scala/com/intel/analytics/bigdl/utils/tf/TensorflowSaverSpec.scala

Original file line number	Diff line number	Diff line change
`@@ -207,7 +207,7 @@ class Dropout[T: ClassTag](`
`207`	`207`	`}`
`208`	`208`
`209`	`209`	`object Dropout {`
`210`		`- def apply[@specialized(Float, Double) T: ClassTag](`
	`210`	`+ def apply[T: ClassTag](`
`211`	`211`	`initP: Double = 0.5,`
`212`	`212`	`inplace: Boolean = false,`
`213`	`213`	`scale: Boolean = true)(implicit ev: TensorNumeric[T]) : Dropout[T] = {`
Original file line number	Diff line number	Diff line change
`@@ -325,6 +325,12 @@ class Input[T: ClassTag]()(implicit ev: TensorNumeric[T]) extends TensorModule[T`
`325`	`325`	`gradInput = gradOutput`
`326`	`326`	`gradInput`
`327`	`327`	`}`
	`328`	`+ override def equals(other: Any): Boolean = {`
	`329`	`+ if (!other.isInstanceOf[Input[_]]) return false`
	`330`	`+ this.eq(other.asInstanceOf[Input[_]])`
	`331`	`+ }`
	`332`	`+`
	`333`	`+ override def hashCode(): Int = System.identityHashCode(this)`
`328`	`334`	`}`
`329`	`335`
`330`	`336`	`object Input {`
Original file line number	Diff line number	Diff line change
`@@ -116,7 +116,7 @@ class Padding[T: ClassTag](`
`116`	`116`	`}`
`117`	`117`
`118`	`118`	`object Padding{`
`119`		`- def apply[@specialized(Float, Double) T: ClassTag](`
	`119`	`+ def apply[T: ClassTag](`
`120`	`120`	`dim: Int,`
`121`	`121`	`pad: Int,`
`122`	`122`	`nInputDim: Int,`
Original file line number	Diff line number	Diff line change
`@@ -128,7 +128,7 @@ class Reshape[@specialized(Float, Double) T: ClassTag](`
`128`	`128`	`}`
`129`	`129`
`130`	`130`	`object Reshape {`
`131`		`- def apply[@specialized(Float, Double) T: ClassTag](`
	`131`	`+ def apply[T: ClassTag](`
`132`	`132`	`size: Array[Int],`
`133`	`133`	`batchMode: Option[Boolean] = None)(implicit ev: TensorNumeric[T]) : Reshape[T] = {`
`134`	`134`	`new Reshape[T](size, batchMode)`
Original file line number	Diff line number	Diff line change
`@@ -47,7 +47,7 @@ class Sigmoid[@specialized(Float, Double) T: ClassTag](`
`47`	`47`	`}`
`48`	`48`
`49`	`49`	`object Sigmoid {`
`50`		`- def apply[@specialized(Float, Double) T: ClassTag]()`
	`50`	`+ def apply[T: ClassTag]()`
`51`	`51`	`(implicit ev: TensorNumeric[T]) : Sigmoid[T] = {`
`52`	`52`	`new Sigmoid[T]()`
`53`	`53`	`}`
Original file line number	Diff line number	Diff line change
`@@ -1906,6 +1906,8 @@ private[tensor] class DenseTensor[@specialized(Float, Double) T: ClassTag](`
`1906`	`1906`	`"corresponding module, please keep them same.")`
`1907`	`1907`	`}`
`1908`	`1908`	`}`
	`1909`	`+`
	`1910`	`+ override def getTensorNumeric(): TensorNumeric[T] = ev`
`1909`	`1911`	`}`
`1910`	`1912`
`1911`	`1913`	`object DenseTensor {`