mila-iqia · mducoffe · Mar 6, 2015 · Mar 9, 2015 · Mar 9, 2015 · Mar 10, 2015
diff --git a/fuel/transformers/__init__.py b/fuel/transformers/__init__.py
@@ -22,10 +22,14 @@ class Transformer(AbstractDataStream):
         this attribute. Use it to access data from the wrapped data stream
         by calling ``next(self.child_epoch_iterator)``.
 
+    batch : boolean
+        Determine wheter the model is working on examples or on batches
+
     """
-    def __init__(self, data_stream, **kwargs):
+    def __init__(self, data_stream, batch_input=False,  **kwargs):
         super(Transformer, self).__init__(**kwargs)
         self.data_stream = data_stream
+        self.batch_input = batch_input
 
     @property
     def sources(self):
@@ -60,6 +64,24 @@ def get_epoch_iterator(self, **kwargs):
         self.child_epoch_iterator = self.data_stream.get_epoch_iterator()
         return super(Transformer, self).get_epoch_iterator(**kwargs)
 
+    def get_data(self, request=None):
+        if self.batch_input:
+            return self.get_data_from_batch(request)
+        else:
+            return self.get_data_from_example(request)
+
+    def get_data_from_example(self, request=None):
+        raise NotImplementedError(
+            str(type(self)) +
+            "does not have an example method"
+        )
+
+    def get_data_from_batch(self, request=None):
+        raise NotImplementedError(
+            str(type(self)) +
+            "does not have a batch input method"
+        )
+
 
 class Mapping(Transformer):
     """Applies a mapping to the data of the wrapped data stream.
@@ -164,7 +186,7 @@ def __init__(self, data_stream, iteration_scheme):
             data_stream, iteration_scheme=iteration_scheme)
         self.cache = [[] for _ in self.sources]
 
-    def get_data(self, request=None):
+    def get_data_from_example(self, request=None):
         if request > len(self.cache[0]):
             self._cache()
         data = []
@@ -237,7 +259,7 @@ def __init__(self, data_stream, iteration_scheme, strictness=0):
             data_stream, iteration_scheme=iteration_scheme)
         self.strictness = strictness
 
-    def get_data(self, request=None):
+    def get_data_from_example(self, request=None):
         """Get data from the dataset."""
         if request is None:
             raise ValueError
@@ -261,20 +283,23 @@ def get_data(self, request=None):
 class Unpack(Transformer):
     """Unpacks batches to compose a stream of examples.
 
+
     This class is the inverse of the Batch class: it turns a minibatch into
     a stream of examples.
 
+
     Parameters
     ----------
     data_stream : :class:`AbstractDataStream` instance
         The data stream to unpack
 
+
     """
     def __init__(self, data_stream):
-        super(Unpack, self).__init__(data_stream)
+        super(Unpack, self).__init__(data_stream, batch_input=True)
         self.data = None
 
-    def get_data(self, request=None):
+    def get_data_from_batch(self, request=None):
         if not self.data:
             data = next(self.child_epoch_iterator)
             self.data = izip(*data)
@@ -311,7 +336,7 @@ class Padding(Transformer):
 
     """
     def __init__(self, data_stream, mask_sources=None, mask_dtype=None):
-        super(Padding, self).__init__(data_stream)
+        super(Padding, self).__init__(data_stream, batch_input=True)
         if mask_sources is None:
             mask_sources = self.data_stream.sources
         self.mask_sources = mask_sources
@@ -329,7 +354,7 @@ def sources(self):
                 sources.append(source + '_mask')
         return tuple(sources)
 
-    def get_data(self, request=None):
+    def get_data_from_batch(self, request=None):
         if request is not None:
             raise ValueError
         data = list(next(self.child_epoch_iterator))
@@ -459,13 +484,13 @@ class MultiProcessing(Transformer):
 
     """
     def __init__(self, data_stream, max_store=100):
-        super(MultiProcessing, self).__init__(data_stream)
+        super(MultiProcessing, self).__init__(data_stream, batch_input=True)
         self.background = BackgroundProcess(data_stream, max_store)
         self.proc = Process(target=self.background.main)
         self.proc.daemon = True
         self.proc.start()
 
-    def get_data(self, request=None):
+    def get_data_from_batch(self, request=None):
         if request is not None:
             raise ValueError
         data = self.background.get_next_data()