lsst · yalsayyad · Feb 24, 2021 · Oct 30, 2020 · Feb 18, 2021 · Feb 18, 2021
diff --git a/pipelines/_Coaddition.yaml b/pipelines/_Coaddition.yaml
@@ -1,6 +1,10 @@
 description: Coaddition
 tasks:
-  makeWarp: lsst.pipe.tasks.makeCoaddTempExp.MakeWarpTask
+  makeWarp:
+    class: lsst.pipe.tasks.makeCoaddTempExp.MakeWarpTask
+    config:
+      makePsfMatched: true
+      doWriteEmptyWarps: true
   assembleCoadd: lsst.pipe.tasks.assembleCoadd.CompareWarpAssembleCoaddTask
 subsets:
   coaddition:

diff --git a/pipelines/_Forced.yaml b/pipelines/_Forced.yaml
@@ -8,4 +8,3 @@ subsets:
       - forcedPhotCcd
       - forcedPhotCoadd
     description: A set of tasks to run when doing forced measurements
-
diff --git a/pipelines/_SingleFrame.yaml b/pipelines/_SingleFrame.yaml
@@ -3,10 +3,28 @@ tasks:
   isr: lsst.ip.isr.IsrTask
   characterizeImage: lsst.pipe.tasks.characterizeImage.CharacterizeImageTask
   calibrate: lsst.pipe.tasks.calibrate.CalibrateTask
+  writeSourceTable: lsst.pipe.tasks.postprocess.WriteSourceTableTask
+  transformSourceTable: lsst.pipe.tasks.postprocess.TransformSourceTableTask
+  consolidateSourceTable: lsst.pipe.tasks.postprocess.ConsolidateSourceTableTask
 subsets:
   processCcd:
     subset:
       - isr
       - characterizeImage
       - calibrate
     description: A set of tasks to run when doing single frame processing
+  sourceTable:
+    subset:
+      - writeSourceTable
+      - transformSourceTable
+      - consolidateSourceTable
+    description: Set of tasks to generate parquet Source Tables from output of processCcd subset.
+  singleFrame:
+    subset:
+      - isr
+      - characterizeImage
+      - calibrate
+      - writeSourceTable
+      - transformSourceTable
+      - consolidateSourceTable
+    description: Set of tasks for complete single frame processing. Analogous to SingleFrameDriver.
diff --git a/python/lsst/pipe/tasks/functors.py b/python/lsst/pipe/tasks/functors.py
@@ -431,17 +431,22 @@ def multilevelColumns(self, data, **kwargs):
         )
 
     def __call__(self, data, **kwargs):
+        """Apply the functor to the data table
+
+        Parameters
+        ----------
+        data : `lsst.daf.butler.DeferredDatasetHandle`,
+               `lsst.pipe.tasks.parquetTable.MultilevelParquetTable`,
+               `lsst.pipe.tasks.parquetTable.ParquetTable`,
+               or `pandas.DataFrame`.
+            The table or a pointer to a table on disk from which columns can
+            be accessed
+        """
         columnIndex = self._get_columnIndex(data)
 
         # First, determine whether data has a multilevel index (either gen2 or gen3)
         is_multiLevel = isinstance(data, MultilevelParquetTable) or isinstance(columnIndex, pd.MultiIndex)
 
-        # Simple single-level column index, gen2
-        if isinstance(data, ParquetTable) and not is_multiLevel:
-            columns = self.columns
-            df = data.toDataFrame(columns=columns)
-            valDict = {k: f._func(df) for k, f in self.funcDict.items()}
-
         # Multilevel index, gen2 or gen3
         if is_multiLevel:
             columns = self.multilevelColumns(data, columnIndex=columnIndex)
@@ -463,10 +468,17 @@ def __call__(self, data, **kwargs):
                 except Exception:
                     valDict[k] = f.fail(subdf)
 
-        # non-multilevel, gen3 (TODO: this should work, but this case is not tested in test_functors.py)
-        elif isinstance(data, DeferredDatasetHandle):
-            columns = self.columns
-            df = data.get(parameters={"columns": columns})
+        else:
+            if isinstance(data, DeferredDatasetHandle):
+                # input if Gen3 deferLoad=True
+                df = data.get(columns=self.columns)
+            elif isinstance(data, pd.DataFrame):
+                # input if Gen3 deferLoad=False
+                df = data
+            else:
+                # Original Gen2 input is type ParquetTable and the fallback
+                df = data.toDataFrame(columns=self.columns)
+
             valDict = {k: f._func(df) for k, f in self.funcDict.items()}
 
         try:

diff --git a/python/lsst/pipe/tasks/postprocess.py b/python/lsst/pipe/tasks/postprocess.py
@@ -196,7 +196,25 @@ def writeMetadata(self, dataRefList):
         pass
 
 
-class WriteSourceTableConfig(pexConfig.Config):
+class WriteSourceTableConnections(pipeBase.PipelineTaskConnections,
+                                  dimensions=("instrument", "visit", "detector")):
+
+    catalog = connectionTypes.Input(
+        doc="Input full-depth catalog of sources produced by CalibrateTask",
+        name="src",
+        storageClass="SourceCatalog",
+        dimensions=("instrument", "visit", "detector")
+    )
+    outputCatalog = connectionTypes.Output(
+        doc="Catalog of sources, `src` in Parquet format",
+        name="source",
+        storageClass="DataFrame",
+        dimensions=("instrument", "visit", "detector")
+    )
+
+
+class WriteSourceTableConfig(pipeBase.PipelineTaskConfig,
+                             pipelineConnections=WriteSourceTableConnections):
     doApplyExternalPhotoCalib = pexConfig.Field(
         dtype=bool,
         default=False,
@@ -211,7 +229,7 @@ class WriteSourceTableConfig(pexConfig.Config):
     )
 
 
-class WriteSourceTableTask(CmdLineTask):
+class WriteSourceTableTask(CmdLineTask, pipeBase.PipelineTask):
     """Write source table to parquet
     """
     _DefaultName = "writeSourceTable"
@@ -226,6 +244,13 @@ def runDataRef(self, dataRef):
         result = self.run(src, ccdVisitId=ccdVisitId)
         dataRef.put(result.table, 'source')
 
+    def runQuantum(self, butlerQC, inputRefs, outputRefs):
+        inputs = butlerQC.get(inputRefs)
+        inputs['ccdVisitId'] = butlerQC.quantum.dataId.pack("visit_detector")
+        result = self.run(**inputs).table
+        outputs = pipeBase.Struct(outputCatalog=result.toDataFrame())
+        butlerQC.put(outputs, outputRefs)
+
     def run(self, catalog, ccdVisitId=None):
         """Convert `src` catalog to parquet
 
@@ -242,7 +267,7 @@ def run(self, catalog, ccdVisitId=None):
             ``table``
                 `ParquetTable` version of the input catalog
         """
-        self.log.info("Generating parquet table from src catalog")
+        self.log.info("Generating parquet table from src catalog %s", ccdVisitId)
         df = catalog.asAstropy().to_pandas().set_index('id', drop=True)
         df['ccdVisitId'] = ccdVisitId
         return pipeBase.Struct(table=ParquetTable(dataFrame=df))
@@ -428,7 +453,24 @@ def compute(self, dropna=False, pool=None):
         return self._df
 
 
-class TransformCatalogBaseConfig(pexConfig.Config):
+class TransformCatalogBaseConnections(pipeBase.PipelineTaskConnections,
+                                      dimensions=()):
+    """Expected Connections for subclasses of TransformCatalogBaseTask.
+
+    Must be subclassed.
+    """
+    inputCatalog = connectionTypes.Input(
+        name="",
+        storageClass="DataFrame",
+    )
+    outputCatalog = connectionTypes.Output(
+        name="",
+        storageClass="DataFrame",
+    )
+
+
+class TransformCatalogBaseConfig(pipeBase.PipelineTaskConfig,
+                                 pipelineConnections=TransformCatalogBaseConnections):
     functorFile = pexConfig.Field(
         dtype=str,
         doc='Path to YAML file specifying functors to be computed',
@@ -437,7 +479,7 @@ class TransformCatalogBaseConfig(pexConfig.Config):
     )
 
 
-class TransformCatalogBaseTask(CmdLineTask):
+class TransformCatalogBaseTask(CmdLineTask, pipeBase.PipelineTask):
     """Base class for transforming/standardizing a catalog
 
     by applying functors that convert units and apply calibrations.
@@ -520,10 +562,32 @@ def inputDataset(self):
     def ConfigClass(self):
         raise NotImplementedError('Subclass must define "ConfigClass" attribute')
 
+    def __init__(self, *args, **kwargs):
+        super().__init__(*args, **kwargs)
+        if self.config.functorFile:
+            self.log.info('Loading tranform functor definitions from %s',
+                          self.config.functorFile)
+            self.funcs = CompositeFunctor.from_file(self.config.functorFile)
+            self.funcs.update(dict(PostprocessAnalysis._defaultFuncs))
+        else:
+            self.funcs = None
+
+    def runQuantum(self, butlerQC, inputRefs, outputRefs):
+        inputs = butlerQC.get(inputRefs)
+        if self.funcs is None:
+            raise ValueError("config.functorFile is None. "
+                             "Must be a valid path to yaml in order to run Task as a PipelineTask.")
+        result = self.run(parq=inputs['inputCatalog'], funcs=self.funcs,
+                          dataId=outputRefs.outputCatalog.dataId.full)
+        outputs = pipeBase.Struct(outputCatalog=result)
+        butlerQC.put(outputs, outputRefs)
+
     def runDataRef(self, dataRef):
         parq = dataRef.get()
-        funcs = self.getFunctors()
-        df = self.run(parq, funcs=funcs, dataId=dataRef.dataId)
+        if self.funcs is None:
+            raise ValueError("config.functorFile is None. "
+                             "Must be a valid path to yaml in order to run as a CommandlineTask.")
+        df = self.run(parq, funcs=self.funcs, dataId=dataRef.dataId)
         self.write(df, dataRef)
         return df
 
@@ -556,14 +620,11 @@ def run(self, parq, funcs=None, dataId=None, band=None):
         return df
 
     def getFunctors(self):
-        funcs = CompositeFunctor.from_file(self.config.functorFile)
-        funcs.update(dict(PostprocessAnalysis._defaultFuncs))
-        return funcs
+        return self.funcs
 
     def getAnalysis(self, parq, funcs=None, band=None):
-        # Avoids disk access if funcs is passed
         if funcs is None:
-            funcs = self.getFunctors()
+            funcs = self.funcs
         analysis = PostprocessAnalysis(parq, funcs, filt=band)
         return analysis
 
@@ -765,7 +826,27 @@ def writeMetadata(self, dataRef):
         pass
 
 
-class TransformSourceTableConfig(TransformCatalogBaseConfig):
+class TransformSourceTableConnections(pipeBase.PipelineTaskConnections,
+                                      dimensions=("instrument", "visit", "detector")):
+
+    inputCatalog = connectionTypes.Input(
+        doc="Wide input catalog of sources produced by WriteSourceTableTask",
+        name="source",
+        storageClass="DataFrame",
+        dimensions=("instrument", "visit", "detector"),
+        deferLoad=True
+    )
+    outputCatalog = connectionTypes.Output(
+        doc="Narrower, per-detector Source Table transformed and converted per a "
+            "specified set of functors",
+        name="sourceTable",
+        storageClass="DataFrame",
+        dimensions=("instrument", "visit", "detector")
+    )
+
+
+class TransformSourceTableConfig(TransformCatalogBaseConfig,
+                                 pipelineConnections=TransformSourceTableConnections):
     pass
 
 
@@ -778,11 +859,6 @@ class TransformSourceTableTask(TransformCatalogBaseTask):
     inputDataset = 'source'
     outputDataset = 'sourceTable'
 
-    def writeMetadata(self, dataRef):
-        """No metadata to write.
-        """
-        pass
-
     @classmethod
     def _makeArgumentParser(cls):
         parser = ArgumentParser(name=cls._DefaultName)
@@ -1017,11 +1093,29 @@ def makeDataRefList(self, namespace):
         self.refList = outputRefList
 
 
-class ConsolidateSourceTableConfig(pexConfig.Config):
+class ConsolidateSourceTableConnections(pipeBase.PipelineTaskConnections,
+                                        dimensions=("instrument", "visit")):
+    inputCatalogs = connectionTypes.Input(
+        doc="Input per-detector Source Tables",
+        name="sourceTable",
+        storageClass="DataFrame",
+        dimensions=("instrument", "visit", "detector"),
+        multiple=True
+    )
+    outputCatalog = connectionTypes.Output(
+        doc="Per-visit concatenation of Source Table",
+        name="sourceTable_visit",
+        storageClass="DataFrame",
+        dimensions=("instrument", "visit")
+    )
+
+
+class ConsolidateSourceTableConfig(pipeBase.PipelineTaskConfig,
+                                   pipelineConnections=ConsolidateSourceTableConnections):
     pass
 
 
-class ConsolidateSourceTableTask(CmdLineTask):
+class ConsolidateSourceTableTask(CmdLineTask, pipeBase.PipelineTask):
     """Concatenate `sourceTable` list into a per-visit `sourceTable_visit`
     """
     _DefaultName = 'consolidateSourceTable'
@@ -1030,6 +1124,13 @@ class ConsolidateSourceTableTask(CmdLineTask):
     inputDataset = 'sourceTable'
     outputDataset = 'sourceTable_visit'
 
+    def runQuantum(self, butlerQC, inputRefs, outputRefs):
+        inputs = butlerQC.get(inputRefs)
+        self.log.info("Concatenating %s per-detector Source Tables",
+                      len(inputs['inputCatalogs']))
+        df = pd.concat(inputs['inputCatalogs'])
+        butlerQC.put(pipeBase.Struct(outputCatalog=df), outputRefs)
+
     def runDataRef(self, dataRefList):
         self.log.info("Concatenating %s per-detector Source Tables", len(dataRefList))
         df = pd.concat([dataRef.get().toDataFrame() for dataRef in dataRefList])