Apply Codensity transform on ConduitM type.

This greatly improves performance in some cases by forcing right-associativity. More importantly, it obviates the need for rewrite rules for many common cases, e.g. yield >>= foo no longer needs to be rewritten to be efficient. This was especially important, given that these rules would not fire reliably in do-notation, since do-notation associates to the left. Pinging @feuerbach I bet you thought I forgot about this entirely ;)
snoyberg · Aug 16, 2014 · 5cacdc3 · 5cacdc3 · snoyberg · Aug 16, 2014
1 parent 23b6c07
commit 5cacdc3
Show file tree

Hide file tree

Showing 8 changed files with 378 additions and 230 deletions.
diff --git a/conduit/Data/Conduit/Internal/Conduit.hs b/conduit/Data/Conduit/Internal/Conduit.hs
diff --git a/conduit/Data/Conduit/Internal/Fusion.hs b/conduit/Data/Conduit/Internal/Fusion.hs
@@ -34,25 +34,24 @@ data Stream m o = forall s. Stream
 
 streamProducerM :: Monad m => Stream m o -> Producer m o
 streamProducerM (Stream step ms0) =
-    ConduitM $ PipeM $ ms0 >>= loop
-  where
-    loop s = do
-        res <- step s
-        case res of
-            Emit s' o -> return $ HaveOutput (PipeM $ loop s') (return ()) o
-            Skip s' -> loop s'
-            Stop -> return $ Done ()
+    ConduitM $ \rest ->
+        let loop s = do
+                res <- step s
+                case res of
+                    Emit s' o -> return $ HaveOutput (PipeM $ loop s') (return ()) o
+                    Skip s' -> loop s'
+                    Stop -> return $ rest ()
+        in PipeM $ ms0 >>= loop
 {-# INLINE [0] streamProducerM #-}
 
 streamProducerId :: Monad m => Stream Identity o -> Producer m o
-streamProducerId (Stream step ms0) =
-    ConduitM $ loop $ runIdentity ms0
-  where
+streamProducerId (Stream step ms0) = ConduitM $ \rest -> let
     loop s =
         case runIdentity $ step s of
             Emit s' o -> HaveOutput (loop s') (return ()) o
             Skip s' -> loop s'
-            Stop -> Done ()
+            Stop -> rest ()
+    in loop $ runIdentity ms0
 {-# INLINE [0] streamProducerId #-}
 
 data Unstream i m r = forall s. Unstream
@@ -63,34 +62,33 @@ data Unstream i m r = forall s. Unstream
 streamConsumerM :: Monad m
                 => Unstream i m r
                 -> Consumer i m r
-streamConsumerM (Unstream step final ms0) =
-    ConduitM $ PipeM $ ms0 >>= return . loop
-  where
+streamConsumerM (Unstream step final ms0) = ConduitM $ \rest -> let
     loop s =
         NeedInput more done
       where
         more i = PipeM $ do
             res <- step s i
             case res of
                 Left s' -> return $ loop s'
-                Right r -> return $ Done r
-        done () = PipeM $ liftM Done $ final s
+                Right r -> return $ rest r
+        done () = PipeM $ liftM rest $ final s
+    in PipeM $ ms0 >>= return . loop
 {-# INLINE [0] streamConsumerM #-}
 
 streamConsumerId :: Monad m
                  => Unstream i Identity r
                  -> Consumer i m r
 streamConsumerId (Unstream step final ms0) =
-    ConduitM $ loop (runIdentity ms0)
-  where
-    loop s =
-        NeedInput more done
-      where
-        more i =
-            case runIdentity $ step s i of
-                Left s' -> loop s'
-                Right r -> Done r
-        done () = Done $ runIdentity $ final s
+    ConduitM $ \rest ->
+        let loop s =
+                NeedInput more done
+              where
+                more i =
+                    case runIdentity $ step s i of
+                        Left s' -> loop s'
+                        Right r -> rest r
+                done () = rest $ runIdentity $ final s
+         in loop (runIdentity ms0)
 {-# INLINE [0] streamConsumerId #-}
 
 {-

diff --git a/conduit/Data/Conduit/Internal/Pipe.hs b/conduit/Data/Conduit/Internal/Pipe.hs
@@ -170,7 +170,7 @@ instance MonadReader r m => MonadReader r (Pipe l i o u m) where
     local f (HaveOutput p c o) = HaveOutput (local f p) c o
     local f (NeedInput p c) = NeedInput (\i -> local f (p i)) (\u -> local f (c u))
     local _ (Done x) = Done x
-    local f (PipeM mp) = PipeM (local f mp)
+    local f (PipeM mp) = PipeM (liftM (local f) $ local f mp)
     local f (Leftover p i) = Leftover (local f p) i
 
 -- Provided for doctest
@@ -481,7 +481,7 @@ mapOutputMaybe :: Monad m => (o1 -> Maybe o2) -> Pipe l i o1 u m r -> Pipe l i o
 mapOutputMaybe f =
     go
   where
-    go (HaveOutput p c o) = maybe id (\o' p' -> HaveOutput p' c o') (f o) (mapOutputMaybe f p)
+    go (HaveOutput p c o) = maybe id (\o' p' -> HaveOutput p' c o') (f o) (go p)
     go (NeedInput p c) = NeedInput (go . p) (go . c)
     go (Done r) = Done r
     go (PipeM mp) = PipeM (liftM (go) mp)

diff --git a/conduit/Data/Conduit/Lift.hs b/conduit/Data/Conduit/Lift.hs
@@ -138,18 +138,18 @@ errorC p = do
 runErrorC
   :: (Monad m, E.Error e) =>
      ConduitM i o (E.ErrorT e m) r -> ConduitM i o m (Either e r)
-runErrorC =
-    ConduitM . go . unConduitM
-  where
-    go (Done r) = Done (Right r)
-    go (PipeM mp) = PipeM $ do
-        eres <- E.runErrorT mp
-        return $ case eres of
-            Left e -> Done $ Left e
-            Right p -> go p
-    go (Leftover p i) = Leftover (go p) i
-    go (HaveOutput p f o) = HaveOutput (go p) (E.runErrorT f >> return ()) o
-    go (NeedInput x y) = NeedInput (go . x) (go . y)
+runErrorC (ConduitM c0) =
+    ConduitM $ \rest ->
+        let go (Done r) = rest (Right r)
+            go (PipeM mp) = PipeM $ do
+                eres <- E.runErrorT mp
+                return $ case eres of
+                    Left e -> rest $ Left e
+                    Right p -> go p
+            go (Leftover p i) = Leftover (go p) i
+            go (HaveOutput p f o) = HaveOutput (go p) (E.runErrorT f >> return ()) o
+            go (NeedInput x y) = NeedInput (go . x) (go . y)
+         in go (c0 Done)
 {-# INLINABLE runErrorC #-}
 
 -- | Catch an error in the base monad
@@ -161,17 +161,18 @@ catchErrorC
      -> (e -> ConduitM i o (E.ErrorT e m) r)
      -> ConduitM i o (E.ErrorT e m) r
 catchErrorC c0 h =
-    ConduitM $ go $ unConduitM c0
+    ConduitM $ \rest ->
+        let go (Done r) = rest r
+            go (PipeM mp) = PipeM $ do
+                eres <- lift $ E.runErrorT mp
+                return $ case eres of
+                    Left e -> unConduitM (h e) rest
+                    Right p -> go p
+            go (Leftover p i) = Leftover (go p) i
+            go (HaveOutput p f o) = HaveOutput (go p) f o
+            go (NeedInput x y) = NeedInput (go . x) (go . y)
+         in go $ unConduitM c0 Done
   where
-    go (Done r) = Done r
-    go (PipeM mp) = PipeM $ do
-        eres <- lift $ E.runErrorT mp
-        return $ case eres of
-            Left e -> unConduitM $ h e
-            Right p -> go p
-    go (Leftover p i) = Leftover (go p) i
-    go (HaveOutput p f o) = HaveOutput (go p) f o
-    go (NeedInput x y) = NeedInput (go . x) (go . y)
 {-# INLINABLE catchErrorC #-}
 
 -- | Run 'CatchT' in the base monad
@@ -180,18 +181,18 @@ catchErrorC c0 h =
 runCatchC
   :: Monad m =>
      ConduitM i o (CatchT m) r -> ConduitM i o m (Either SomeException r)
-runCatchC =
-    ConduitM . go . unConduitM
-  where
-    go (Done r) = Done (Right r)
-    go (PipeM mp) = PipeM $ do
-        eres <- runCatchT mp
-        return $ case eres of
-            Left e -> Done $ Left e
-            Right p -> go p
-    go (Leftover p i) = Leftover (go p) i
-    go (HaveOutput p f o) = HaveOutput (go p) (runCatchT f >> return ()) o
-    go (NeedInput x y) = NeedInput (go . x) (go . y)
+runCatchC c0 =
+    ConduitM $ \rest ->
+        let go (Done r) = rest (Right r)
+            go (PipeM mp) = PipeM $ do
+                eres <- runCatchT mp
+                return $ case eres of
+                    Left e -> rest $ Left e
+                    Right p -> go p
+            go (Leftover p i) = Leftover (go p) i
+            go (HaveOutput p f o) = HaveOutput (go p) (runCatchT f >> return ()) o
+            go (NeedInput x y) = NeedInput (go . x) (go . y)
+         in go $ unConduitM c0 Done
 {-# INLINABLE runCatchC #-}
 
 -- | Catch an exception in the base monad
@@ -202,18 +203,18 @@ catchCatchC
      ConduitM i o (CatchT m) r
      -> (SomeException -> ConduitM i o (CatchT m) r)
      -> ConduitM i o (CatchT m) r
-catchCatchC c0 h =
-    ConduitM $ go $ unConduitM c0
-  where
-    go (Done r) = Done r
-    go (PipeM mp) = PipeM $ do
-        eres <- lift $ runCatchT mp
-        return $ case eres of
-            Left e -> unConduitM $ h e
-            Right p -> go p
-    go (Leftover p i) = Leftover (go p) i
-    go (HaveOutput p f o) = HaveOutput (go p) f o
-    go (NeedInput x y) = NeedInput (go . x) (go . y)
+catchCatchC (ConduitM c0) h =
+    ConduitM $ \rest ->
+        let go (Done r) = rest r
+            go (PipeM mp) = PipeM $ do
+                eres <- lift $ runCatchT mp
+                return $ case eres of
+                    Left e -> unConduitM (h e) rest
+                    Right p -> go p
+            go (Leftover p i) = Leftover (go p) i
+            go (HaveOutput p f o) = HaveOutput (go p) f o
+            go (NeedInput x y) = NeedInput (go . x) (go . y)
+         in go (c0 Done)
 {-# INLINABLE catchCatchC #-}
 
 -- | Wrap the base monad in 'M.MaybeT'
@@ -235,18 +236,18 @@ maybeC p = do
 runMaybeC
   :: Monad m =>
      ConduitM i o (M.MaybeT m) r -> ConduitM i o m (Maybe r)
-runMaybeC =
-    ConduitM . go . unConduitM
-  where
-    go (Done r) = Done (Just r)
-    go (PipeM mp) = PipeM $ do
-        mres <- M.runMaybeT mp
-        return $ case mres of
-            Nothing -> Done Nothing
-            Just p -> go p
-    go (Leftover p i) = Leftover (go p) i
-    go (HaveOutput p c o) = HaveOutput (go p) (M.runMaybeT c >> return ()) o
-    go (NeedInput x y) = NeedInput (go . x) (go . y)
+runMaybeC (ConduitM c0) =
+    ConduitM $ \rest ->
+        let go (Done r) = rest (Just r)
+            go (PipeM mp) = PipeM $ do
+                mres <- M.runMaybeT mp
+                return $ case mres of
+                    Nothing -> rest Nothing
+                    Just p -> go p
+            go (Leftover p i) = Leftover (go p) i
+            go (HaveOutput p c o) = HaveOutput (go p) (M.runMaybeT c >> return ()) o
+            go (NeedInput x y) = NeedInput (go . x) (go . y)
+         in go (c0 Done)
 {-# INLINABLE runMaybeC #-}
 
 -- | Wrap the base monad in 'R.ReaderT'
@@ -293,16 +294,16 @@ thread :: Monad m
        -> s
        -> ConduitM i o (t m) r
        -> ConduitM i o m res
-thread toRes runM s0 =
-    ConduitM . go s0 . unConduitM
-  where
-    go s (Done r) = Done (toRes r s)
-    go s (PipeM mp) = PipeM $ do
-        (p, s') <- runM mp s
-        return $ go s' p
-    go s (Leftover p i) = Leftover (go s p) i
-    go s (NeedInput x y) = NeedInput (go s . x) (go s . y)
-    go s (HaveOutput p f o) = HaveOutput (go s p) (runM f s >> return ()) o
+thread toRes runM s0 (ConduitM c0) =
+    ConduitM $ \rest ->
+        let go s (Done r) = rest (toRes r s)
+            go s (PipeM mp) = PipeM $ do
+                (p, s') <- runM mp s
+                return $ go s' p
+            go s (Leftover p i) = Leftover (go s p) i
+            go s (NeedInput x y) = NeedInput (go s . x) (go s . y)
+            go s (HaveOutput p f o) = HaveOutput (go s p) (runM f s >> return ()) o
+         in go s0 (c0 Done)
 {-# INLINABLE thread #-}
 
 -- | Run 'SL.StateT' in the base monad
@@ -568,4 +569,3 @@ execRWSC
 execRWSC i s p = fmap f $ runRWSC i s p
   where f x = let (_, s2, w2) = x in (s2, w2)
 {-# INLINABLE execRWSC #-}
-
diff --git a/conduit/Data/Conduit/List.hs b/conduit/Data/Conduit/List.hs
@@ -78,6 +78,7 @@ import Data.Monoid (Monoid, mempty, mappend)
 import qualified Data.Foldable as F
 import Data.Conduit
 import qualified Data.Conduit.Internal as CI
+import qualified Data.Conduit.Internal.Conduit as CIC
 import Control.Monad (when, (<=<), liftM, void)
 import Control.Monad.Trans.Class (lift)
 
@@ -126,7 +127,12 @@ enumFromTo :: (Enum a, Eq a, Monad m)
            => a
            -> a
            -> Producer m a
-enumFromTo x = CI.ConduitM . CI.enumFromTo x
+enumFromTo x0 y =
+    loop x0
+  where
+    loop x
+        | x == y = yield x
+        | otherwise = yield x >> loop (Prelude.succ x)
 {-# INLINE enumFromTo #-}
 
 enumFromToFold :: (Enum a, Eq a, Monad m) -- FIXME far too specific
@@ -174,7 +180,7 @@ fold f =
 
 connectFold :: Monad m => Source m a -> (b -> a -> b) -> b -> m b -- FIXME replace with better, more general function
 connectFold (CI.ConduitM src0) f =
-    go src0
+    go (src0 CI.Done)
   where
     go (CI.Done ()) b = return b
     go (CI.HaveOutput src _ a) b =
@@ -208,7 +214,7 @@ foldM f =
 
 connectFoldM :: Monad m => Source m a -> (b -> a -> m b) -> b -> m b -- FIXME replace with better, more general function
 connectFoldM (CI.ConduitM src0) f =
-    go src0
+    go (src0 CI.Done)
   where
     go (CI.Done ()) b = return b
     go (CI.HaveOutput src _ a) b = do
@@ -255,7 +261,7 @@ mapM_ f = awaitForever $ lift . f
 
 srcMapM_ :: Monad m => Source m a -> (a -> m ()) -> m ()
 srcMapM_ (CI.ConduitM src) f =
-    go src
+    go (src CI.Done)
   where
     go (CI.Done ()) = return ()
     go (CI.PipeM mp) = mp >>= go
@@ -325,7 +331,7 @@ map f = awaitForever $ yield . f
 {-# RULES "source/map fusion =$=" forall f src. src =$= map f = mapFuseRight src f #-}
 
 mapFuseRight :: Monad m => Source m a -> (a -> b) -> Source m b
-mapFuseRight (CI.ConduitM src) f = CI.ConduitM (CI.mapOutput f src)
+mapFuseRight src f = CIC.mapOutput f src
 {-# INLINE mapFuseRight #-}
 
 {-
@@ -576,16 +582,15 @@ filter :: Monad m => (a -> Bool) -> Conduit a m a
 filter f = awaitForever $ \i -> when (f i) (yield i)
 
 filterFuseRight :: Monad m => Source m a -> (a -> Bool) -> Source m a
-filterFuseRight (CI.ConduitM src) f =
-    CI.ConduitM (go src)
-  where
-    go (CI.Done ()) = CI.Done ()
+filterFuseRight (CI.ConduitM src) f = CI.ConduitM $ \rest -> let
+    go (CI.Done ()) = rest ()
     go (CI.PipeM mp) = CI.PipeM (liftM go mp)
     go (CI.Leftover p i) = CI.Leftover (go p) i
     go (CI.HaveOutput p c o)
         | f o = CI.HaveOutput (go p) c o
         | otherwise = go p
     go (CI.NeedInput p c) = CI.NeedInput (go . p) (go . c)
+    in go (src CI.Done)
 -- Intermediate finalizers are dropped, but this is acceptable: the next
 -- yielded value would be demanded by downstream in any event, and that new
 -- finalizer will always override the existing finalizer.
@@ -602,7 +607,7 @@ sinkNull = awaitForever $ \_ -> return ()
 
 srcSinkNull :: Monad m => Source m a -> m ()
 srcSinkNull (CI.ConduitM src) =
-    go src
+    go (src CI.Done)
   where
     go (CI.Done ()) = return ()
     go (CI.PipeM mp) = mp >>= go

diff --git a/conduit/benchmarks/optimize-201408.hs b/conduit/benchmarks/optimize-201408.hs
@@ -210,17 +210,17 @@ sourceRandomNBind cnt0 = lift (liftIO MWC.createSystemRandom) >>= \gen ->
      in loop cnt0
 
 sourceRandomNPipe :: (MWC.Variate a, MonadIO m) => Int -> Source m a
-sourceRandomNPipe cnt0 = ConduitM $ do
+sourceRandomNPipe cnt0 = ConduitM $ \rest -> do
     gen <- liftIO MWC.createSystemRandom
-    let loop 0 = return ()
+    let loop 0 = rest ()
         loop cnt = do
             liftIO (MWC.uniform gen) >>= CI.yield >> loop (cnt - 1)
     loop cnt0
 
 sourceRandomNConstr :: (MWC.Variate a, MonadIO m) => Int -> Source m a
-sourceRandomNConstr cnt0 = ConduitM $ PipeM $ do
+sourceRandomNConstr cnt0 = ConduitM $ \rest -> PipeM $ do
     gen <- liftIO MWC.createSystemRandom
-    let loop 0 = return $ Done ()
+    let loop 0 = return $ rest ()
         loop cnt = do
             x <- liftIO (MWC.uniform gen)
             return $ HaveOutput (PipeM $ loop (cnt - 1)) (return ()) x