From 981be52976822c105f73a3b80493ef14645301cc Mon Sep 17 00:00:00 2001
From: Jacky Li <jacky.likun@huawei.com>
Date: Wed, 25 Feb 2015 21:15:15 +0800
Subject: [PATCH 1/5] add numRows param in DataFrame.show()

---
 python/pyspark/sql/dataframe.py                          | 6 +++---
 .../src/main/scala/org/apache/spark/sql/DataFrame.scala  | 9 ++++++---
 2 files changed, 9 insertions(+), 6 deletions(-)

diff --git a/python/pyspark/sql/dataframe.py b/python/pyspark/sql/dataframe.py
index 6d42410020b64..f0b0851674b32 100644
--- a/python/pyspark/sql/dataframe.py
+++ b/python/pyspark/sql/dataframe.py
@@ -272,9 +272,9 @@ def isLocal(self):
         """
         return self._jdf.isLocal()
 
-    def show(self):
+    def show(self, numRows=20):
         """
-        Print the first 20 rows.
+        Print the first n rows.
 
         >>> df
         DataFrame[age: int, name: string]
@@ -283,7 +283,7 @@ def show(self):
         2   Alice
         5   Bob
         """
-        print self._jdf.showString().encode('utf8', 'ignore')
+        print self._jdf.showString(numRows).encode('utf8', 'ignore')
 
     def __repr__(self):
         return "DataFrame[%s]" % (", ".join("%s: %s" % c for c in self.dtypes))
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala b/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala
index 04bf5d9b0f931..6cef8df197947 100644
--- a/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala
+++ b/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala
@@ -159,9 +159,11 @@ class DataFrame protected[sql](
 
   /**
    * Internal API for Python
+   * @param numRows Number of rows to show
    */
-  private[sql] def showString(): String = {
-    val data = take(20)
+  private[sql] def showString(numRows: Int = 20): String = {
+    val size = count()
+    val data = if (numRows > size) collect() else take(numRows)
     val numCols = schema.fieldNames.length
 
     // For cells that are beyond 20 characters, replace it with the first 17 and "..."
@@ -293,9 +295,10 @@ class DataFrame protected[sql](
    *   1983  03    0.410516        0.442194
    *   1984  04    0.450090        0.483521
    * }}}
+   * @param numRows Number of rows to show
    * @group basic
    */
-  def show(): Unit = println(showString())
+  def show(numRows: Int = 20): Unit = println(showString(numRows))
 
   /**
    * Cartesian join with another [[DataFrame]].

From d7acc18b409ba8f87925862659f3b5c75e3537ec Mon Sep 17 00:00:00 2001
From: Jacky Li <jacky.likun@huawei.com>
Date: Thu, 26 Feb 2015 12:09:46 +0800
Subject: [PATCH 2/5] modify according to comments

---
 python/pyspark/sql/dataframe.py                            | 4 ++--
 .../src/main/scala/org/apache/spark/sql/DataFrame.scala    | 5 ++---
 .../java/test/org/apache/spark/sql/JavaDataFrameSuite.java | 7 +++++++
 .../test/scala/org/apache/spark/sql/DataFrameSuite.scala   | 4 ++++
 4 files changed, 15 insertions(+), 5 deletions(-)

diff --git a/python/pyspark/sql/dataframe.py b/python/pyspark/sql/dataframe.py
index f0b0851674b32..aec99017fbdc1 100644
--- a/python/pyspark/sql/dataframe.py
+++ b/python/pyspark/sql/dataframe.py
@@ -272,7 +272,7 @@ def isLocal(self):
         """
         return self._jdf.isLocal()
 
-    def show(self, numRows=20):
+    def show(self, n=20):
         """
         Print the first n rows.
 
@@ -283,7 +283,7 @@ def show(self, numRows=20):
         2   Alice
         5   Bob
         """
-        print self._jdf.showString(numRows).encode('utf8', 'ignore')
+        print self._jdf.showString(n).encode('utf8', 'ignore')
 
     def __repr__(self):
         return "DataFrame[%s]" % (", ".join("%s: %s" % c for c in self.dtypes))
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala b/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala
index 6cef8df197947..3f188104fd547 100644
--- a/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala
+++ b/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala
@@ -161,9 +161,8 @@ class DataFrame protected[sql](
    * Internal API for Python
    * @param numRows Number of rows to show
    */
-  private[sql] def showString(numRows: Int = 20): String = {
-    val size = count()
-    val data = if (numRows > size) collect() else take(numRows)
+  private[sql] def showString(numRows: Int): String = {
+    val data = take(numRows)
     val numCols = schema.fieldNames.length
 
     // For cells that are beyond 20 characters, replace it with the first 17 and "..."
diff --git a/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java b/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java
index c1c51f80d6586..81fbfe1fdc407 100644
--- a/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java
+++ b/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java
@@ -81,4 +81,11 @@ public void testVarargMethods() {
     df.groupBy().agg(countDistinct(col("key"), col("value")));
     df.select(coalesce(col("key")));
   }
+
+  @Test
+  public void testShow() {
+    DataFrame df = context.table("testData");
+    df.show(10);
+    df.show(1000);
+  }
 }
diff --git a/sql/core/src/test/scala/org/apache/spark/sql/DataFrameSuite.scala b/sql/core/src/test/scala/org/apache/spark/sql/DataFrameSuite.scala
index c392a553c03f3..573de993f265c 100644
--- a/sql/core/src/test/scala/org/apache/spark/sql/DataFrameSuite.scala
+++ b/sql/core/src/test/scala/org/apache/spark/sql/DataFrameSuite.scala
@@ -441,4 +441,8 @@ class DataFrameSuite extends QueryTest {
     checkAnswer(df.select(df("key")), testData.select('key).collect().toSeq)
   }
 
+  test("show") {
+    testData.select($"*").show()
+    testData.select($"*").show(1000)
+  }
 }

From bb545378a5139671d07d2b57061a7e9719b69551 Mon Sep 17 00:00:00 2001
From: Jacky Li <jacky.likun@huawei.com>
Date: Thu, 26 Feb 2015 12:57:22 +0800
Subject: [PATCH 3/5] for Java compatibility

---
 sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala | 5 +++++
 .../java/test/org/apache/spark/sql/JavaDataFrameSuite.java   | 2 +-
 2 files changed, 6 insertions(+), 1 deletion(-)

diff --git a/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala b/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala
index 3f188104fd547..792fc60a51b67 100644
--- a/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala
+++ b/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala
@@ -299,6 +299,11 @@ class DataFrame protected[sql](
    */
   def show(numRows: Int = 20): Unit = println(showString(numRows))
 
+  /**
+   * Displays the [[DataFrame]] in a tabular form. (For Java compatibility)
+   */
+  def show(): Unit = println(showString(20))
+
   /**
    * Cartesian join with another [[DataFrame]].
    *
diff --git a/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java b/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java
index 81fbfe1fdc407..950fb868b1ddb 100644
--- a/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java
+++ b/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java
@@ -85,7 +85,7 @@ public void testVarargMethods() {
   @Test
   public void testShow() {
     DataFrame df = context.table("testData");
-    df.show(10);
+    df.show();
     df.show(1000);
   }
 }

From 7cdbe91ce1b0baea0cd0a224715b5835da7c28cd Mon Sep 17 00:00:00 2001
From: Jacky Li <jacky.likun@huawei.com>
Date: Thu, 26 Feb 2015 13:53:06 +0800
Subject: [PATCH 4/5] modify according to comment

---
 .../src/main/scala/org/apache/spark/sql/DataFrame.scala     | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala b/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala
index 792fc60a51b67..e205d9d2d3885 100644
--- a/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala
+++ b/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala
@@ -297,12 +297,12 @@ class DataFrame protected[sql](
    * @param numRows Number of rows to show
    * @group basic
    */
-  def show(numRows: Int = 20): Unit = println(showString(numRows))
+  def show(numRows: Int): Unit = println(showString(numRows))
 
   /**
-   * Displays the [[DataFrame]] in a tabular form. (For Java compatibility)
+   * Displays the top 20 rows of [[DataFrame]] in a tabular form.
    */
-  def show(): Unit = println(showString(20))
+  def show(): Unit = show(20)
 
   /**
    * Cartesian join with another [[DataFrame]].

From a0e0f4b6f9970ae39b3a6215036510926f5f2807 Mon Sep 17 00:00:00 2001
From: Jacky Li <jacky.likun@huawei.com>
Date: Thu, 26 Feb 2015 21:43:43 +0800
Subject: [PATCH 5/5] fix testcase

---
 .../java/test/org/apache/spark/sql/JavaDataFrameSuite.java    | 4 +++-
 .../src/test/scala/org/apache/spark/sql/DataFrameSuite.scala  | 3 ++-
 2 files changed, 5 insertions(+), 2 deletions(-)

diff --git a/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java b/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java
index 950fb868b1ddb..2d586f784ac5a 100644
--- a/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java
+++ b/sql/core/src/test/java/test/org/apache/spark/sql/JavaDataFrameSuite.java
@@ -20,6 +20,7 @@
 import org.junit.After;
 import org.junit.Assert;
 import org.junit.Before;
+import org.junit.Ignore;
 import org.junit.Test;
 
 import org.apache.spark.sql.*;
@@ -82,8 +83,9 @@ public void testVarargMethods() {
     df.select(coalesce(col("key")));
   }
 
-  @Test
+  @Ignore
   public void testShow() {
+    // This test case is intended ignored, but to make sure it compiles correctly
     DataFrame df = context.table("testData");
     df.show();
     df.show(1000);
diff --git a/sql/core/src/test/scala/org/apache/spark/sql/DataFrameSuite.scala b/sql/core/src/test/scala/org/apache/spark/sql/DataFrameSuite.scala
index 573de993f265c..ff441ef26f9c0 100644
--- a/sql/core/src/test/scala/org/apache/spark/sql/DataFrameSuite.scala
+++ b/sql/core/src/test/scala/org/apache/spark/sql/DataFrameSuite.scala
@@ -441,7 +441,8 @@ class DataFrameSuite extends QueryTest {
     checkAnswer(df.select(df("key")), testData.select('key).collect().toSeq)
   }
 
-  test("show") {
+  ignore("show") {
+    // This test case is intended ignored, but to make sure it compiles correctly
     testData.select($"*").show()
     testData.select($"*").show(1000)
   }