apache · grundprinzip · Dec 29, 2022 · Dec 31, 2022 · Dec 31, 2022 · HyukjinKwon
diff --git a/python/pyspark/sql/column.py b/python/pyspark/sql/column.py
@@ -182,9 +182,6 @@ def _(self: "Column", other: Union["LiteralType", "DecimalLiteral"]) -> "Column"
     return _
 
 
-# TODO(SPARK-41757): Compatibility of string representation for Column
-
-
 class Column:
 
     """
@@ -203,16 +200,16 @@ class Column:
     ...      [(2, "Alice"), (5, "Bob")], ["age", "name"])
 
     Select a column out of a DataFrame
-    >>> df.name   # doctest: +SKIP
+    >>> df.name
     Column<'name'>
-    >>> df["name"]  # doctest: +SKIP
+    >>> df["name"]
     Column<'name'>
 
     Create from an expression
 
-    >>> df.age + 1  # doctest: +SKIP
+    >>> df.age + 1
     Column<'(age + 1)'>
-    >>> 1 / df.age  # doctest: +SKIP
+    >>> 1 / df.age
     Column<'(1 / age)'>
     """
 

diff --git a/python/pyspark/sql/connect/expressions.py b/python/pyspark/sql/connect/expressions.py
@@ -152,7 +152,7 @@ def to_plan(self, session: "SparkConnectClient") -> "proto.Expression":
             return exp
 
     def __repr__(self) -> str:
-        return f"Alias({self._parent}, ({','.join(self._alias)}))"
+        return f"{self._parent} AS {','.join(self._alias)}"
 
 
 class LiteralExpression(Expression):
@@ -308,7 +308,7 @@ def to_plan(self, session: "SparkConnectClient") -> "proto.Expression":
         return expr
 
     def __repr__(self) -> str:
-        return f"Literal({self._value})"
+        return f"{self._value}"
 
 
 class ColumnReference(Expression):
@@ -333,7 +333,7 @@ def to_plan(self, session: "SparkConnectClient") -> proto.Expression:
         return expr
 
     def __repr__(self) -> str:
-        return f"ColumnReference({self._unparsed_identifier})"
+        return f"{self._unparsed_identifier}"
 
 
 class SQLExpression(Expression):
@@ -414,6 +414,12 @@ def to_plan(self, session: "SparkConnectClient") -> proto.Expression:
         return fun
 
     def __repr__(self) -> str:
+        # Special handling for certain infix operators that require slightly
+        # different printing.
+        if len(self._args) == 2 and len(self._name) == 1:
+            return f"{self._args[0]} {self._name} {self._args[1]}"
+
+        # Default print handling:
         if self._is_distinct:
             return f"{self._name}(distinct {', '.join([str(arg) for arg in self._args])})"
         else: