hammerlab · ryan-williams · Jul 2, 2015 · Jun 29, 2015 · danvk · Jul 1, 2015
diff --git a/pom.xml b/pom.xml
@@ -16,7 +16,7 @@
   <name>guacamole: variant caller</name>
 
   <properties>
-    <adam.version>0.16.0</adam.version>
+    <adam.version>0.17.0</adam.version>
     <bdg-formats.version>0.4.0</bdg-formats.version>
     <java.version>1.8</java.version>
     <scala.version>2.10.3</scala.version>
@@ -137,7 +137,7 @@
         <configuration>
           <scalaVersion>${scala.version}</scalaVersion>
           <recompileMode>incremental</recompileMode>
-          <useZincServer>true</useZincServer>
+          <useZincServer>false</useZincServer>
           <args>
             <arg>-unchecked</arg>
             <arg>-optimise</arg>
@@ -276,19 +276,24 @@
     </dependency>
     <dependency>
       <groupId>org.bdgenomics.adam</groupId>
-      <artifactId>adam-core</artifactId>
+      <artifactId>adam-core_${scala.version.prefix}</artifactId>
       <version>${adam.version}</version>
     </dependency>
     <dependency>
       <groupId>org.bdgenomics.adam</groupId>
-      <artifactId>adam-cli</artifactId>
+      <artifactId>adam-cli_${scala.version.prefix}</artifactId>
       <version>${adam.version}</version>
     </dependency>
     <dependency>
       <groupId>org.bdgenomics.bdg-formats</groupId>
       <artifactId>bdg-formats</artifactId>
       <version>${bdg-formats.version}</version>
     </dependency>
+    <dependency>
+      <groupId>org.bdgenomics.qc-metrics</groupId>
+      <artifactId>qc-metrics-core</artifactId>
+      <version>0.0.1-SNAPSHOT</version>
+    </dependency>
     <dependency>
       <groupId>colt</groupId>
       <artifactId>colt</artifactId>

diff --git a/src/main/scala/org/hammerlab/guacamole/Command.scala b/src/main/scala/org/hammerlab/guacamole/Command.scala
@@ -19,7 +19,7 @@
 package org.hammerlab.guacamole
 
 import org.apache.spark.{ SparkContext, Logging }
-import org.bdgenomics.adam.cli.{ Args4j, Args4jBase }
+import org.bdgenomics.utils.cli.{ Args4j, Args4jBase }
 
 /**
  * Interface for running a command from command line arguments.

diff --git a/src/main/scala/org/hammerlab/guacamole/Common.scala b/src/main/scala/org/hammerlab/guacamole/Common.scala
@@ -30,7 +30,7 @@ import org.apache.hadoop.fs.{ FileSystem, Path }
 import org.apache.hadoop.mapred.FileAlreadyExistsException
 import org.apache.spark.rdd.RDD
 import org.apache.spark.{ Logging, SparkConf, SparkContext }
-import org.bdgenomics.adam.cli.{ Args4jBase, ParquetArgs }
+import org.bdgenomics.utils.cli.{ Args4jBase, ParquetArgs }
 import org.bdgenomics.adam.rdd.ADAMContext._
 import org.bdgenomics.formats.avro.Genotype
 import org.hammerlab.guacamole.Concordance.ConcordanceArgs
@@ -126,7 +126,7 @@ object Common extends Logging {
     if (path.endsWith(".vcf")) {
       sc.loadGenotypes(path)
     } else {
-      sc.adamLoad(path)
+      sc.loadParquet(path)
     }
   }
 
@@ -266,7 +266,7 @@ object Common extends Logging {
     } else if (outputPath.toLowerCase.endsWith(".vcf")) {
       progress("Writing genotypes to VCF file: %s.".format(outputPath))
       val sc = subsetGenotypes.sparkContext
-      subsetGenotypes.toVariantContext.coalesce(1, shuffle = true).adamVCFSave(outputPath)
+      subsetGenotypes.toVariantContext.coalesce(1, shuffle = true).saveAsVcf(outputPath)
     } else {
       progress("Writing genotypes to: %s.".format(outputPath))
       subsetGenotypes.adamParquetSave(

diff --git a/src/main/scala/org/hammerlab/guacamole/Concordance.scala b/src/main/scala/org/hammerlab/guacamole/Concordance.scala
@@ -25,6 +25,7 @@ import org.apache.spark.rdd.RDD
 import org.bdgenomics.adam.rdd.ADAMContext._
 import org.apache.spark.SparkContext._
 import org.bdgenomics.adam.rdd.variation.ConcordanceTable
+import org.bdgenomics.adam.rdd.variation.GenotypeConcordanceRDDFunctions
 import org.bdgenomics.adam.rich.RichVariant
 import org.bdgenomics.formats.avro.{ GenotypeType, Genotype }
 
@@ -85,7 +86,8 @@ object Concordance {
     val filteredTrueGenotypes = trueGenotypes.filter(relevantVariants)
 
     val sampleName = filteredCalledAlleles.take(1)(0).getSampleId.toString
-    val sampleAccuracy = filteredCalledAlleles.concordanceWith(filteredTrueGenotypes).collectAsMap()(sampleName)
+
+    val sampleAccuracy = new GenotypeConcordanceRDDFunctions(filteredCalledAlleles).concordanceWith(filteredTrueGenotypes).collectAsMap()(sampleName)
 
     // We called AND it was called in truth
     val truePositives = sampleAccuracy.total(ConcordanceTable.CALLED, ConcordanceTable.CALLED)

diff --git a/src/main/scala/org/hammerlab/guacamole/reads/MappedRead.scala b/src/main/scala/org/hammerlab/guacamole/reads/MappedRead.scala
@@ -97,8 +97,8 @@ case class MappedRead(
   })
 
   override def toString(): String =
-    "MappedRead(%d, %s, %s, %s)".format(
-      start,
+    "MappedRead(%s:%d, %s, %s, %s)".format(
+      referenceContig, start,
       cigar.toString,
       mdTagString,
       Bases.basesToString(sequence)

diff --git a/src/main/scala/org/hammerlab/guacamole/reads/MappedReadSerializer.scala b/src/main/scala/org/hammerlab/guacamole/reads/MappedReadSerializer.scala
@@ -61,7 +61,7 @@ class MappedReadSerializer extends Serializer[MappedRead] with CanSerializeMateP
 
     val matePropertiesOpt = read(kryo, input)
 
-    val cigar = TextCigarCodec.getSingleton.decode(cigarString)
+    val cigar = TextCigarCodec.decode(cigarString)
     MappedRead(
       token,
       sequenceArray,

diff --git a/src/main/scala/org/hammerlab/guacamole/reads/Read.scala b/src/main/scala/org/hammerlab/guacamole/reads/Read.scala
@@ -124,7 +124,7 @@ object Read extends Logging {
     val sequenceArray = sequence.map(_.toByte).toArray
     val qualityScoresArray = baseQualityStringToArray(baseQualities, sequenceArray.length)
 
-    val cigar = TextCigarCodec.getSingleton.decode(cigarString)
+    val cigar = TextCigarCodec.decode(cigarString)
     MappedRead(
       token,
       sequenceArray,
@@ -356,7 +356,7 @@ object Read extends Logging {
       AlignmentRecordField.recordGroupPredictedMedianInsertSize
     )
 
-    val adamRecords: RDD[AlignmentRecord] = adamContext.adamLoad(filename, projection = Some(ADAMSpecificProjection))
+    val adamRecords: RDD[AlignmentRecord] = adamContext.loadParquet(filename, projection = Some(ADAMSpecificProjection))
     val sequenceDictionary = new ADAMSpecificRecordSequenceDictionaryRDDAggregator(adamRecords).adamGetSequenceDictionary()
 
     val reads: RDD[Read] = adamRecords.map(fromADAMRecord(_, token))
@@ -399,7 +399,7 @@ object Read extends Logging {
         referenceContig = alignmentRecord.getContig.getContigName.toString.intern(),
         alignmentQuality = alignmentRecord.getMapq,
         start = alignmentRecord.getStart,
-        cigar = TextCigarCodec.getSingleton.decode(alignmentRecord.getCigar.toString),
+        cigar = TextCigarCodec.decode(alignmentRecord.getCigar.toString),
         mdTagString = alignmentRecord.getMismatchingPositions.toString,
         failedVendorQualityChecks = alignmentRecord.getFailedVendorQualityChecks,
         isPositiveStrand = !alignmentRecord.getReadNegativeStrand,

diff --git a/src/test/scala/org/hammerlab/guacamole/reads/MappedReadSerializerSuite.scala b/src/test/scala/org/hammerlab/guacamole/reads/MappedReadSerializerSuite.scala
@@ -35,7 +35,7 @@ class MappedReadSerializerSuite extends GuacFunSuite with Matchers {
       "chr5",
       50,
       325352323,
-      TextCigarCodec.getSingleton.decode(""),
+      TextCigarCodec.decode(""),
       mdTagString = "11",
       false,
       isPositiveStrand = true,
@@ -85,7 +85,7 @@ class MappedReadSerializerSuite extends GuacFunSuite with Matchers {
       "chr5",
       50,
       325352323,
-      TextCigarCodec.getSingleton.decode(""),
+      TextCigarCodec.decode(""),
       mdTagString = "11",
       false,
       isPositiveStrand = true,
@@ -135,7 +135,7 @@ class MappedReadSerializerSuite extends GuacFunSuite with Matchers {
       "chr5",
       50,
       325352323,
-      TextCigarCodec.getSingleton.decode(""),
+      TextCigarCodec.decode(""),
       mdTagString = "11",
       false,
       isPositiveStrand = true,

diff --git a/src/test/scala/org/hammerlab/guacamole/reads/MappedReadSuite.scala b/src/test/scala/org/hammerlab/guacamole/reads/MappedReadSuite.scala
@@ -35,7 +35,7 @@ class MappedReadSuite extends GuacFunSuite with Matchers {
       "chr5",
       50,
       325352323,
-      TextCigarCodec.getSingleton.decode(""),
+      TextCigarCodec.decode(""),
       mdTagString = "11",
       false,
       isPositiveStrand = true,
@@ -86,7 +86,7 @@ class MappedReadSuite extends GuacFunSuite with Matchers {
       "chr5",
       50,
       325352323,
-      TextCigarCodec.getSingleton.decode(""),
+      TextCigarCodec.decode(""),
       mdTagString = "11",
       false,
       isPositiveStrand = true,

diff --git a/src/test/scala/org/hammerlab/guacamole/util/TestUtil.scala b/src/test/scala/org/hammerlab/guacamole/util/TestUtil.scala
@@ -78,8 +78,8 @@ object TestUtil extends Matchers {
       qualityScores.get.map(q => q + 33).map(_.toChar).mkString
     } else {
       sequence.map(x => '@').mkString
-    } 
-    
+    }
+
     Read(
       sequence,
       cigarString = cigar,