Merge remote-tracking branch 'upstream/master' into add-filter-for-in…

…nerjoin
apache · Mar 8, 2016 · 2c92f90 · 2c92f90
2 parents bf4777c + 46f25c2
commit 2c92f90
Show file tree

Hide file tree

Showing 841 changed files with 11,822 additions and 7,346 deletions.
diff --git a/.gitignore b/.gitignore
@@ -17,8 +17,6 @@ cache
 work/
 out/
 .DS_Store
-third_party/libmesos.so
-third_party/libmesos.dylib
 build/apache-maven*
 build/zinc*
 build/scala*
@@ -60,7 +58,6 @@ dev/create-release/*final
 spark-*-bin-*.tgz
 unit-tests.log
 /lib/
-rat-results.txt
 scalastyle.txt
 scalastyle-output.xml
 R-unit-tests.log

diff --git a/R/pkg/NAMESPACE b/R/pkg/NAMESPACE
@@ -111,6 +111,7 @@ exportMethods("%in%",
               "add_months",
               "alias",
               "approxCountDistinct",
+              "approxQuantile",
               "array_contains",
               "asc",
               "ascii",

diff --git a/R/pkg/R/generics.R b/R/pkg/R/generics.R
@@ -67,6 +67,13 @@ setGeneric("crosstab", function(x, col1, col2) { standardGeneric("crosstab") })
 # @export
 setGeneric("freqItems", function(x, cols, support = 0.01) { standardGeneric("freqItems") })
 
+# @rdname statfunctions
+# @export
+setGeneric("approxQuantile",
+           function(x, col, probabilities, relativeError) {
+             standardGeneric("approxQuantile")
+           })
+
 # @rdname distinct
 # @export
 setGeneric("distinct", function(x, numPartitions = 1) { standardGeneric("distinct") })

diff --git a/R/pkg/R/stats.R b/R/pkg/R/stats.R
@@ -130,6 +130,45 @@ setMethod("freqItems", signature(x = "DataFrame", cols = "character"),
             collect(dataFrame(sct))
           })
 
+#' approxQuantile
+#'
+#' Calculates the approximate quantiles of a numerical column of a DataFrame.
+#'
+#' The result of this algorithm has the following deterministic bound:
+#' If the DataFrame has N elements and if we request the quantile at probability `p` up to error
+#' `err`, then the algorithm will return a sample `x` from the DataFrame so that the *exact* rank
+#' of `x` is close to (p * N). More precisely,
+#'   floor((p - err) * N) <= rank(x) <= ceil((p + err) * N).
+#' This method implements a variation of the Greenwald-Khanna algorithm (with some speed
+#' optimizations). The algorithm was first present in [[http://dx.doi.org/10.1145/375663.375670
+#' Space-efficient Online Computation of Quantile Summaries]] by Greenwald and Khanna.
+#'
+#' @param x A SparkSQL DataFrame.
+#' @param col The name of the numerical column.
+#' @param probabilities A list of quantile probabilities. Each number must belong to [0, 1].
+#'                      For example 0 is the minimum, 0.5 is the median, 1 is the maximum.
+#' @param relativeError The relative target precision to achieve (>= 0). If set to zero,
+#'                      the exact quantiles are computed, which could be very expensive.
+#'                      Note that values greater than 1 are accepted but give the same result as 1.
+#' @return The approximate quantiles at the given probabilities.
+#'
+#' @rdname statfunctions
+#' @name approxQuantile
+#' @export
+#' @examples
+#' \dontrun{
+#' df <- jsonFile(sqlContext, "/path/to/file.json")
+#' quantiles <- approxQuantile(df, "key", c(0.5, 0.8), 0.0)
+#' }
+setMethod("approxQuantile",
+          signature(x = "DataFrame", col = "character",
+                    probabilities = "numeric", relativeError = "numeric"),
+          function(x, col, probabilities, relativeError) {
+            statFunctions <- callJMethod(x@sdf, "stat")
+            callJMethod(statFunctions, "approxQuantile", col,
+                        as.list(probabilities), relativeError)
+          })
+
 #' sampleBy
 #'
 #' Returns a stratified sample without replacement based on the fraction given on each stratum.

diff --git a/R/pkg/inst/tests/testthat/test_sparkSQL.R b/R/pkg/inst/tests/testthat/test_sparkSQL.R
@@ -1785,6 +1785,14 @@ test_that("sampleBy() on a DataFrame", {
   expect_identical(as.list(result[2, ]), list(key = "1", count = 7))
 })
 
+test_that("approxQuantile() on a DataFrame", {
+  l <- lapply(c(0:99), function(i) { i })
+  df <- createDataFrame(sqlContext, l, "key")
+  quantiles <- approxQuantile(df, "key", c(0.5, 0.8), 0.0)
+  expect_equal(quantiles[[1]], 50)
+  expect_equal(quantiles[[2]], 80)
+})
+
 test_that("SQL error message is returned from JVM", {
   retError <- tryCatch(sql(sqlContext, "select * from blah"), error = function(e) e)
   expect_equal(grepl("Table not found: blah", retError), TRUE)

diff --git a/bin/beeline.cmd b/bin/beeline.cmd
@@ -17,5 +17,4 @@ rem See the License for the specific language governing permissions and
 rem limitations under the License.
 rem
 
-set SPARK_HOME=%~dp0..
-cmd /V /E /C "%SPARK_HOME%\bin\spark-class.cmd" org.apache.hive.beeline.BeeLine %*
+cmd /V /E /C "%~dp0spark-class.cmd" org.apache.hive.beeline.BeeLine %*
diff --git a/bin/spark-submit.cmd b/bin/spark-submit.cmd
@@ -20,4 +20,4 @@ rem
 rem This is the entry point for running Spark submit. To avoid polluting the
 rem environment, it just launches a new cmd to do the real work.
 
-cmd /V /E /C spark-submit2.cmd %*
+cmd /V /E /C "%~dp0spark-submit2.cmd" %*
diff --git a/network/common/pom.xml → common/network-common/pom.xml b/network/common/pom.xml → common/network-common/pom.xml
diff --git a/...pache/spark/network/TransportContext.java → ...pache/spark/network/TransportContext.java b/...pache/spark/network/TransportContext.java → ...pache/spark/network/TransportContext.java
diff --git a/...work/buffer/FileSegmentManagedBuffer.java → ...work/buffer/FileSegmentManagedBuffer.java b/...work/buffer/FileSegmentManagedBuffer.java → ...work/buffer/FileSegmentManagedBuffer.java
diff --git a/.../spark/network/buffer/LazyFileRegion.java → .../spark/network/buffer/LazyFileRegion.java b/.../spark/network/buffer/LazyFileRegion.java → .../spark/network/buffer/LazyFileRegion.java
diff --git a/...e/spark/network/buffer/ManagedBuffer.java → ...e/spark/network/buffer/ManagedBuffer.java b/...e/spark/network/buffer/ManagedBuffer.java → ...e/spark/network/buffer/ManagedBuffer.java
diff --git a/...rk/network/buffer/NettyManagedBuffer.java → ...rk/network/buffer/NettyManagedBuffer.java b/...rk/network/buffer/NettyManagedBuffer.java → ...rk/network/buffer/NettyManagedBuffer.java
diff --git a/...park/network/buffer/NioManagedBuffer.java → ...park/network/buffer/NioManagedBuffer.java b/...park/network/buffer/NioManagedBuffer.java → ...park/network/buffer/NioManagedBuffer.java
diff --git a/...rk/client/ChunkFetchFailureException.java → ...rk/client/ChunkFetchFailureException.java b/...rk/client/ChunkFetchFailureException.java → ...rk/client/ChunkFetchFailureException.java
diff --git a/...network/client/ChunkReceivedCallback.java → ...network/client/ChunkReceivedCallback.java b/...network/client/ChunkReceivedCallback.java → ...network/client/ChunkReceivedCallback.java
diff --git a/...k/network/client/RpcResponseCallback.java → ...k/network/client/RpcResponseCallback.java b/...k/network/client/RpcResponseCallback.java → ...k/network/client/RpcResponseCallback.java
@@ -24,7 +24,12 @@
  * failure.
  */
 public interface RpcResponseCallback {
-  /** Successful serialized result from server. */
+  /**
+   * Successful serialized result from server.
+   *
+   * After `onSuccess` returns, `response` will be recycled and its content will become invalid.
+   * Please copy the content of `response` if you want to use it after `onSuccess` returns.
+   */
   void onSuccess(ByteBuffer response);
 
   /** Exception either propagated from server or raised on client side. */

diff --git a/.../spark/network/client/StreamCallback.java → .../spark/network/client/StreamCallback.java b/.../spark/network/client/StreamCallback.java → .../spark/network/client/StreamCallback.java
diff --git a/...ark/network/client/StreamInterceptor.java → ...ark/network/client/StreamInterceptor.java b/...ark/network/client/StreamInterceptor.java → ...ark/network/client/StreamInterceptor.java
diff --git a/...spark/network/client/TransportClient.java → ...spark/network/client/TransportClient.java b/...spark/network/client/TransportClient.java → ...spark/network/client/TransportClient.java
@@ -257,7 +257,11 @@ public ByteBuffer sendRpcSync(ByteBuffer message, long timeoutMs) {
     sendRpc(message, new RpcResponseCallback() {
       @Override
       public void onSuccess(ByteBuffer response) {
-        result.set(response);
+        ByteBuffer copy = ByteBuffer.allocate(response.remaining());
+        copy.put(response);
+        // flip "copy" to make it readable
+        copy.flip();
+        result.set(copy);
       }
 
       @Override

diff --git a/...work/client/TransportClientBootstrap.java → ...work/client/TransportClientBootstrap.java b/...work/client/TransportClientBootstrap.java → ...work/client/TransportClientBootstrap.java
diff --git a/...etwork/client/TransportClientFactory.java → ...etwork/client/TransportClientFactory.java b/...etwork/client/TransportClientFactory.java → ...etwork/client/TransportClientFactory.java
diff --git a/...work/client/TransportResponseHandler.java → ...work/client/TransportResponseHandler.java b/...work/client/TransportResponseHandler.java → ...work/client/TransportResponseHandler.java
diff --git a/...ark/network/protocol/AbstractMessage.java → ...ark/network/protocol/AbstractMessage.java b/...ark/network/protocol/AbstractMessage.java → ...ark/network/protocol/AbstractMessage.java
diff --git a/...ork/protocol/AbstractResponseMessage.java → ...ork/protocol/AbstractResponseMessage.java b/...ork/protocol/AbstractResponseMessage.java → ...ork/protocol/AbstractResponseMessage.java
diff --git a/...k/network/protocol/ChunkFetchFailure.java → ...k/network/protocol/ChunkFetchFailure.java b/...k/network/protocol/ChunkFetchFailure.java → ...k/network/protocol/ChunkFetchFailure.java
diff --git a/...k/network/protocol/ChunkFetchRequest.java → ...k/network/protocol/ChunkFetchRequest.java b/...k/network/protocol/ChunkFetchRequest.java → ...k/network/protocol/ChunkFetchRequest.java
diff --git a/...k/network/protocol/ChunkFetchSuccess.java → ...k/network/protocol/ChunkFetchSuccess.java b/...k/network/protocol/ChunkFetchSuccess.java → ...k/network/protocol/ChunkFetchSuccess.java
diff --git a/...che/spark/network/protocol/Encodable.java → ...che/spark/network/protocol/Encodable.java b/...che/spark/network/protocol/Encodable.java → ...che/spark/network/protocol/Encodable.java
diff --git a/...ache/spark/network/protocol/Encoders.java → ...ache/spark/network/protocol/Encoders.java b/...ache/spark/network/protocol/Encoders.java → ...ache/spark/network/protocol/Encoders.java
diff --git a/...pache/spark/network/protocol/Message.java → ...pache/spark/network/protocol/Message.java b/...pache/spark/network/protocol/Message.java → ...pache/spark/network/protocol/Message.java
diff --git a/...park/network/protocol/MessageDecoder.java → ...park/network/protocol/MessageDecoder.java b/...park/network/protocol/MessageDecoder.java → ...park/network/protocol/MessageDecoder.java
diff --git a/...park/network/protocol/MessageEncoder.java → ...park/network/protocol/MessageEncoder.java b/...park/network/protocol/MessageEncoder.java → ...park/network/protocol/MessageEncoder.java
diff --git a/...k/network/protocol/MessageWithHeader.java → ...k/network/protocol/MessageWithHeader.java b/...k/network/protocol/MessageWithHeader.java → ...k/network/protocol/MessageWithHeader.java
diff --git a/...spark/network/protocol/OneWayMessage.java → ...spark/network/protocol/OneWayMessage.java b/...spark/network/protocol/OneWayMessage.java → ...spark/network/protocol/OneWayMessage.java
@@ -19,7 +19,6 @@
 
 import com.google.common.base.Objects;
 import io.netty.buffer.ByteBuf;
-import io.netty.buffer.Unpooled;
 
 import org.apache.spark.network.buffer.ManagedBuffer;
 import org.apache.spark.network.buffer.NettyManagedBuffer;

diff --git a/...park/network/protocol/RequestMessage.java → ...park/network/protocol/RequestMessage.java b/...park/network/protocol/RequestMessage.java → ...park/network/protocol/RequestMessage.java
diff --git a/...ark/network/protocol/ResponseMessage.java → ...ark/network/protocol/ResponseMessage.java b/...ark/network/protocol/ResponseMessage.java → ...ark/network/protocol/ResponseMessage.java
diff --git a/...he/spark/network/protocol/RpcFailure.java → ...he/spark/network/protocol/RpcFailure.java b/...he/spark/network/protocol/RpcFailure.java → ...he/spark/network/protocol/RpcFailure.java
diff --git a/...he/spark/network/protocol/RpcRequest.java → ...he/spark/network/protocol/RpcRequest.java b/...he/spark/network/protocol/RpcRequest.java → ...he/spark/network/protocol/RpcRequest.java
@@ -19,7 +19,6 @@
 
 import com.google.common.base.Objects;
 import io.netty.buffer.ByteBuf;
-import io.netty.buffer.Unpooled;
 
 import org.apache.spark.network.buffer.ManagedBuffer;
 import org.apache.spark.network.buffer.NettyManagedBuffer;

diff --git a/...e/spark/network/protocol/RpcResponse.java → ...e/spark/network/protocol/RpcResponse.java b/...e/spark/network/protocol/RpcResponse.java → ...e/spark/network/protocol/RpcResponse.java
@@ -19,7 +19,6 @@
 
 import com.google.common.base.Objects;
 import io.netty.buffer.ByteBuf;
-import io.netty.buffer.Unpooled;
 
 import org.apache.spark.network.buffer.ManagedBuffer;
 import org.apache.spark.network.buffer.NettyManagedBuffer;

diff --git a/...spark/network/protocol/StreamChunkId.java → ...spark/network/protocol/StreamChunkId.java b/...spark/network/protocol/StreamChunkId.java → ...spark/network/protocol/StreamChunkId.java
diff --git a/...spark/network/protocol/StreamFailure.java → ...spark/network/protocol/StreamFailure.java b/...spark/network/protocol/StreamFailure.java → ...spark/network/protocol/StreamFailure.java
@@ -20,9 +20,6 @@
 import com.google.common.base.Objects;
 import io.netty.buffer.ByteBuf;
 
-import org.apache.spark.network.buffer.ManagedBuffer;
-import org.apache.spark.network.buffer.NettyManagedBuffer;
-
 /**
  * Message indicating an error when transferring a stream.
  */

diff --git a/...spark/network/protocol/StreamRequest.java → ...spark/network/protocol/StreamRequest.java b/...spark/network/protocol/StreamRequest.java → ...spark/network/protocol/StreamRequest.java
@@ -20,9 +20,6 @@
 import com.google.common.base.Objects;
 import io.netty.buffer.ByteBuf;
 
-import org.apache.spark.network.buffer.ManagedBuffer;
-import org.apache.spark.network.buffer.NettyManagedBuffer;
-
 /**
  * Request to stream data from the remote end.
  * <p>

diff --git a/...park/network/protocol/StreamResponse.java → ...park/network/protocol/StreamResponse.java b/...park/network/protocol/StreamResponse.java → ...park/network/protocol/StreamResponse.java
@@ -21,7 +21,6 @@
 import io.netty.buffer.ByteBuf;
 
 import org.apache.spark.network.buffer.ManagedBuffer;
-import org.apache.spark.network.buffer.NettyManagedBuffer;
 
 /**
  * Response to {@link StreamRequest} when the stream has been successfully opened.

diff --git a/...ark/network/sasl/SaslClientBootstrap.java → ...ark/network/sasl/SaslClientBootstrap.java b/...ark/network/sasl/SaslClientBootstrap.java → ...ark/network/sasl/SaslClientBootstrap.java
diff --git a/...he/spark/network/sasl/SaslEncryption.java → ...he/spark/network/sasl/SaslEncryption.java b/...he/spark/network/sasl/SaslEncryption.java → ...he/spark/network/sasl/SaslEncryption.java
@@ -33,7 +33,6 @@
 import io.netty.channel.FileRegion;
 import io.netty.handler.codec.MessageToMessageDecoder;
 import io.netty.util.AbstractReferenceCounted;
-import io.netty.util.ReferenceCountUtil;
 
 import org.apache.spark.network.util.ByteArrayWritableChannel;
 import org.apache.spark.network.util.NettyUtils;

diff --git a/...k/network/sasl/SaslEncryptionBackend.java → ...k/network/sasl/SaslEncryptionBackend.java b/...k/network/sasl/SaslEncryptionBackend.java → ...k/network/sasl/SaslEncryptionBackend.java
diff --git a/...pache/spark/network/sasl/SaslMessage.java → ...pache/spark/network/sasl/SaslMessage.java b/...pache/spark/network/sasl/SaslMessage.java → ...pache/spark/network/sasl/SaslMessage.java
diff --git a/...he/spark/network/sasl/SaslRpcHandler.java → ...he/spark/network/sasl/SaslRpcHandler.java b/...he/spark/network/sasl/SaslRpcHandler.java → ...he/spark/network/sasl/SaslRpcHandler.java
diff --git a/...ark/network/sasl/SaslServerBootstrap.java → ...ark/network/sasl/SaslServerBootstrap.java b/...ark/network/sasl/SaslServerBootstrap.java → ...ark/network/sasl/SaslServerBootstrap.java
diff --git a/...e/spark/network/sasl/SecretKeyHolder.java → ...e/spark/network/sasl/SecretKeyHolder.java b/...e/spark/network/sasl/SecretKeyHolder.java → ...e/spark/network/sasl/SecretKeyHolder.java
diff --git a/...e/spark/network/sasl/SparkSaslClient.java → ...e/spark/network/sasl/SparkSaslClient.java b/...e/spark/network/sasl/SparkSaslClient.java → ...e/spark/network/sasl/SparkSaslClient.java
diff --git a/...e/spark/network/sasl/SparkSaslServer.java → ...e/spark/network/sasl/SparkSaslServer.java b/...e/spark/network/sasl/SparkSaslServer.java → ...e/spark/network/sasl/SparkSaslServer.java
diff --git a/.../spark/network/server/MessageHandler.java → .../spark/network/server/MessageHandler.java b/.../spark/network/server/MessageHandler.java → .../spark/network/server/MessageHandler.java
diff --git a/.../spark/network/server/NoOpRpcHandler.java → .../spark/network/server/NoOpRpcHandler.java b/.../spark/network/server/NoOpRpcHandler.java → .../spark/network/server/NoOpRpcHandler.java
diff --git a/...etwork/server/OneForOneStreamManager.java → ...etwork/server/OneForOneStreamManager.java b/...etwork/server/OneForOneStreamManager.java → ...etwork/server/OneForOneStreamManager.java
diff --git a/...ache/spark/network/server/RpcHandler.java → ...ache/spark/network/server/RpcHandler.java b/...ache/spark/network/server/RpcHandler.java → ...ache/spark/network/server/RpcHandler.java
diff --git a/...e/spark/network/server/StreamManager.java → ...e/spark/network/server/StreamManager.java b/...e/spark/network/server/StreamManager.java → ...e/spark/network/server/StreamManager.java
diff --git a/...twork/server/TransportChannelHandler.java → ...twork/server/TransportChannelHandler.java b/...twork/server/TransportChannelHandler.java → ...twork/server/TransportChannelHandler.java
diff --git a/...twork/server/TransportRequestHandler.java → ...twork/server/TransportRequestHandler.java b/...twork/server/TransportRequestHandler.java → ...twork/server/TransportRequestHandler.java
@@ -19,7 +19,6 @@
 
 import java.nio.ByteBuffer;
 
-import com.google.common.base.Preconditions;
 import com.google.common.base.Throwables;
 import io.netty.channel.Channel;
 import io.netty.channel.ChannelFuture;

diff --git a/...spark/network/server/TransportServer.java → ...spark/network/server/TransportServer.java b/...spark/network/server/TransportServer.java → ...spark/network/server/TransportServer.java
diff --git a/...work/server/TransportServerBootstrap.java → ...work/server/TransportServerBootstrap.java b/...work/server/TransportServerBootstrap.java → ...work/server/TransportServerBootstrap.java
diff --git a/...etwork/util/ByteArrayWritableChannel.java → ...etwork/util/ByteArrayWritableChannel.java b/...etwork/util/ByteArrayWritableChannel.java → ...etwork/util/ByteArrayWritableChannel.java
diff --git a/...g/apache/spark/network/util/ByteUnit.java → ...g/apache/spark/network/util/ByteUnit.java b/...g/apache/spark/network/util/ByteUnit.java → ...g/apache/spark/network/util/ByteUnit.java
diff --git a/...he/spark/network/util/ConfigProvider.java → ...he/spark/network/util/ConfigProvider.java b/...he/spark/network/util/ConfigProvider.java → ...he/spark/network/util/ConfigProvider.java
diff --git a/...org/apache/spark/network/util/IOMode.java → ...org/apache/spark/network/util/IOMode.java b/...org/apache/spark/network/util/IOMode.java → ...org/apache/spark/network/util/IOMode.java
diff --git a/.../apache/spark/network/util/JavaUtils.java → .../apache/spark/network/util/JavaUtils.java b/.../apache/spark/network/util/JavaUtils.java → .../apache/spark/network/util/JavaUtils.java
@@ -159,10 +159,10 @@ private static boolean isSymlink(File file) throws IOException {
       .build();
 
   /**
-   * Convert a passed time string (e.g. 50s, 100ms, or 250us) to a time count for
-   * internal use. If no suffix is provided a direct conversion is attempted.
+   * Convert a passed time string (e.g. 50s, 100ms, or 250us) to a time count in the given unit.
+   * The unit is also considered the default if the given string does not specify a unit.
    */
-  private static long parseTimeString(String str, TimeUnit unit) {
+  public static long timeStringAs(String str, TimeUnit unit) {
     String lower = str.toLowerCase().trim();
 
     try {
@@ -195,23 +195,22 @@ private static long parseTimeString(String str, TimeUnit unit) {
    * no suffix is provided, the passed number is assumed to be in ms.
    */
   public static long timeStringAsMs(String str) {
-    return parseTimeString(str, TimeUnit.MILLISECONDS);
+    return timeStringAs(str, TimeUnit.MILLISECONDS);
   }
 
   /**
    * Convert a time parameter such as (50s, 100ms, or 250us) to seconds for internal use. If
    * no suffix is provided, the passed number is assumed to be in seconds.
    */
   public static long timeStringAsSec(String str) {
-    return parseTimeString(str, TimeUnit.SECONDS);
+    return timeStringAs(str, TimeUnit.SECONDS);
   }
 
   /**
-   * Convert a passed byte string (e.g. 50b, 100kb, or 250mb) to a ByteUnit for
-   * internal use. If no suffix is provided a direct conversion of the provided default is
-   * attempted.
+   * Convert a passed byte string (e.g. 50b, 100kb, or 250mb) to the given. If no suffix is
+   * provided, a direct conversion to the provided unit is attempted.
    */
-  private static long parseByteString(String str, ByteUnit unit) {
+  public static long byteStringAs(String str, ByteUnit unit) {
     String lower = str.toLowerCase().trim();
 
     try {
@@ -252,7 +251,7 @@ private static long parseByteString(String str, ByteUnit unit) {
    * If no suffix is provided, the passed number is assumed to be in bytes.
    */
   public static long byteStringAsBytes(String str) {
-    return parseByteString(str, ByteUnit.BYTE);
+    return byteStringAs(str, ByteUnit.BYTE);
   }
 
   /**
@@ -262,7 +261,7 @@ public static long byteStringAsBytes(String str) {
    * If no suffix is provided, the passed number is assumed to be in kibibytes.
    */
   public static long byteStringAsKb(String str) {
-    return parseByteString(str, ByteUnit.KiB);
+    return byteStringAs(str, ByteUnit.KiB);
   }
 
   /**
@@ -272,7 +271,7 @@ public static long byteStringAsKb(String str) {
    * If no suffix is provided, the passed number is assumed to be in mebibytes.
    */
   public static long byteStringAsMb(String str) {
-    return parseByteString(str, ByteUnit.MiB);
+    return byteStringAs(str, ByteUnit.MiB);
   }
 
   /**
@@ -282,7 +281,7 @@ public static long byteStringAsMb(String str) {
    * If no suffix is provided, the passed number is assumed to be in gibibytes.
    */
   public static long byteStringAsGb(String str) {
-    return parseByteString(str, ByteUnit.GiB);
+    return byteStringAs(str, ByteUnit.GiB);
   }
 
   /**

diff --git a/...park/network/util/LimitedInputStream.java → ...park/network/util/LimitedInputStream.java b/...park/network/util/LimitedInputStream.java → ...park/network/util/LimitedInputStream.java
diff --git a/...spark/network/util/MapConfigProvider.java → ...spark/network/util/MapConfigProvider.java b/...spark/network/util/MapConfigProvider.java → ...spark/network/util/MapConfigProvider.java
diff --git a/...apache/spark/network/util/NettyUtils.java → ...apache/spark/network/util/NettyUtils.java b/...apache/spark/network/util/NettyUtils.java → ...apache/spark/network/util/NettyUtils.java
@@ -31,8 +31,6 @@
 import io.netty.channel.nio.NioEventLoopGroup;
 import io.netty.channel.socket.nio.NioServerSocketChannel;
 import io.netty.channel.socket.nio.NioSocketChannel;
-import io.netty.handler.codec.ByteToMessageDecoder;
-import io.netty.handler.codec.LengthFieldBasedFrameDecoder;
 import io.netty.util.internal.PlatformDependent;
 
 /**

diff --git a/...rk/util/SystemPropertyConfigProvider.java → ...rk/util/SystemPropertyConfigProvider.java b/...rk/util/SystemPropertyConfigProvider.java → ...rk/util/SystemPropertyConfigProvider.java
diff --git a/...che/spark/network/util/TransportConf.java → ...che/spark/network/util/TransportConf.java b/...che/spark/network/util/TransportConf.java → ...che/spark/network/util/TransportConf.java
diff --git a/...k/network/util/TransportFrameDecoder.java → ...k/network/util/TransportFrameDecoder.java b/...k/network/util/TransportFrameDecoder.java → ...k/network/util/TransportFrameDecoder.java
@@ -17,7 +17,6 @@
 
 package org.apache.spark.network.util;
 
-import java.util.Iterator;
 import java.util.LinkedList;
 
 import com.google.common.base.Preconditions;

diff --git a/...k/network/ChunkFetchIntegrationSuite.java → ...k/network/ChunkFetchIntegrationSuite.java b/...k/network/ChunkFetchIntegrationSuite.java → ...k/network/ChunkFetchIntegrationSuite.java
@@ -132,7 +132,7 @@ public static void tearDown() {
     testFile.delete();
   }
 
-  class FetchResult {
+  static class FetchResult {
     public Set<Integer> successChunks;
     public Set<Integer> failedChunks;
     public List<ManagedBuffer> buffers;

diff --git a/...g/apache/spark/network/ProtocolSuite.java → ...g/apache/spark/network/ProtocolSuite.java b/...g/apache/spark/network/ProtocolSuite.java → ...g/apache/spark/network/ProtocolSuite.java
diff --git a/...twork/RequestTimeoutIntegrationSuite.java → ...twork/RequestTimeoutIntegrationSuite.java b/...twork/RequestTimeoutIntegrationSuite.java → ...twork/RequestTimeoutIntegrationSuite.java
@@ -124,8 +124,8 @@ public StreamManager getStreamManager() {
     synchronized (callback1) {
       client.sendRpc(ByteBuffer.allocate(0), callback1);
       callback1.wait(4 * 1000);
-      assert (callback1.failure != null);
-      assert (callback1.failure instanceof IOException);
+      assertNotNull(callback1.failure);
+      assertTrue(callback1.failure instanceof IOException);
     }
     semaphore.release();
   }
@@ -167,8 +167,8 @@ public StreamManager getStreamManager() {
     synchronized (callback0) {
       client0.sendRpc(ByteBuffer.allocate(0), callback0);
       callback0.wait(FOREVER);
-      assert (callback0.failure instanceof IOException);
-      assert (!client0.isActive());
+      assertTrue(callback0.failure instanceof IOException);
+      assertFalse(client0.isActive());
     }
 
     // Increment the semaphore and the second request should succeed quickly.
@@ -236,15 +236,15 @@ public StreamManager getStreamManager() {
 
     synchronized (callback1) {
       // failed at same time as previous
-      assert (callback0.failure instanceof IOException);
+      assertTrue(callback0.failure instanceof IOException);
     }
   }
 
   /**
    * Callback which sets 'success' or 'failure' on completion.
    * Additionally notifies all waiters on this callback when invoked.
    */
-  class TestCallback implements RpcResponseCallback, ChunkReceivedCallback {
+  static class TestCallback implements RpcResponseCallback, ChunkReceivedCallback {
 
     int successLength = -1;
     Throwable failure;

diff --git a/...he/spark/network/RpcIntegrationSuite.java → ...he/spark/network/RpcIntegrationSuite.java b/...he/spark/network/RpcIntegrationSuite.java → ...he/spark/network/RpcIntegrationSuite.java
@@ -91,7 +91,7 @@ public static void tearDown() {
     clientFactory.close();
   }
 
-  class RpcResult {
+  static class RpcResult {
     public Set<String> successMessages;
     public Set<String> errorMessages;
   }

diff --git a/...org/apache/spark/network/StreamSuite.java → ...org/apache/spark/network/StreamSuite.java b/...org/apache/spark/network/StreamSuite.java → ...org/apache/spark/network/StreamSuite.java
diff --git a/...ache/spark/network/TestManagedBuffer.java → ...ache/spark/network/TestManagedBuffer.java b/...ache/spark/network/TestManagedBuffer.java → ...ache/spark/network/TestManagedBuffer.java
diff --git a/...a/org/apache/spark/network/TestUtils.java → ...a/org/apache/spark/network/TestUtils.java b/...a/org/apache/spark/network/TestUtils.java → ...a/org/apache/spark/network/TestUtils.java
diff --git a/.../network/TransportClientFactorySuite.java → .../network/TransportClientFactorySuite.java b/.../network/TransportClientFactorySuite.java → .../network/TransportClientFactorySuite.java
@@ -27,6 +27,7 @@
 
 import com.google.common.collect.Maps;
 import org.junit.After;
+import org.junit.Assert;
 import org.junit.Before;
 import org.junit.Test;
 
@@ -95,7 +96,7 @@ public void run() {
           try {
             TransportClient client =
               factory.createClient(TestUtils.getLocalHost(), server1.getPort());
-            assert (client.isActive());
+            assertTrue(client.isActive());
             clients.add(client);
           } catch (IOException e) {
             failed.incrementAndGet();
@@ -115,8 +116,8 @@ public void run() {
       attempts[i].join();
     }
 
-    assert(failed.get() == 0);
-    assert(clients.size() == maxConnections);
+    Assert.assertEquals(0, failed.get());
+    Assert.assertEquals(clients.size(), maxConnections);
 
     for (TransportClient client : clients) {
       client.close();

diff --git a/...etwork/TransportResponseHandlerSuite.java → ...etwork/TransportResponseHandlerSuite.java b/...etwork/TransportResponseHandlerSuite.java → ...etwork/TransportResponseHandlerSuite.java