In [1]:
import polars as pl

In [2]:
s = pl.Series("s", [2, 3, 1, None], dtype=pl.Int64)
print(s)

shape: (4,)
Series: 's' [i64]
[
	2
	3
	1
	null
]


In [3]:
df = pl.DataFrame(
    {
        "col1": [3, 2, 2, 1],
        "col2": [6.0, 5.0, 7.0, 4.0],
        "col3": ["a", "c", "c", "b"],
    }
)
print(df)

shape: (4, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ f64  ┆ str  │
╞══════╪══════╪══════╡
│ 3    ┆ 6.0  ┆ a    │
│ 2    ┆ 5.0  ┆ c    │
│ 2    ┆ 7.0  ┆ c    │
│ 1    ┆ 4.0  ┆ b    │
└──────┴──────┴──────┘


In [4]:
df2 = pl.from_repr(
    """
    shape: (4, 3)
    ┌──────┬──────┬──────┐
    │ col1 ┆ col2 ┆ col3 │
    │ ---  ┆ ---  ┆ ---  │
    │ i64  ┆ f64  ┆ str  │
    ╞══════╪══════╪══════╡
    │ 12   ┆ 15.0 ┆ a    │
    │ 13   ┆ 14.0 ┆ c    │
    │ 12   ┆ 17.0 ┆ c    │
    │ 11   ┆ 16.0 ┆ b    │
    └──────┴──────┴──────┘
    """
)
print(df2)

shape: (4, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ f64  ┆ str  │
╞══════╪══════╪══════╡
│ 12   ┆ 15.0 ┆ a    │
│ 13   ┆ 14.0 ┆ c    │
│ 12   ┆ 17.0 ┆ c    │
│ 11   ┆ 16.0 ┆ b    │
└──────┴──────┴──────┘


## set_sorted() + pl.Series.is_sorted()

In [5]:
s.flags

{'SORTED_ASC': False, 'SORTED_DESC': False}

In [6]:
s1 = s.set_sorted()
s1.flags

{'SORTED_ASC': True, 'SORTED_DESC': False}

In [7]:
s1.max()

1

In [8]:
s.is_sorted()

False

## pl.Series

### pl.Series.sort()

In [9]:
print(s.sort())

shape: (4,)
Series: 's' [i64]
[
	null
	1
	2
	3
]


In [10]:
print(s.sort(nulls_last=True))

shape: (4,)
Series: 's' [i64]
[
	1
	2
	3
	null
]


### pl.Series.search_sorted()

In [11]:
s.sort().search_sorted(2, "right")

3

## pl.DataFrame

In [12]:
print(df.sort("col1"))

shape: (4, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ f64  ┆ str  │
╞══════╪══════╪══════╡
│ 1    ┆ 4.0  ┆ b    │
│ 2    ┆ 5.0  ┆ c    │
│ 2    ┆ 7.0  ┆ c    │
│ 3    ┆ 6.0  ┆ a    │
└──────┴──────┴──────┘


In [13]:
print(df.sort(pl.col("col1").add(pl.col("col2").mul(2))))

shape: (4, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ f64  ┆ str  │
╞══════╪══════╪══════╡
│ 1    ┆ 4.0  ┆ b    │
│ 2    ┆ 5.0  ┆ c    │
│ 3    ┆ 6.0  ┆ a    │
│ 2    ┆ 7.0  ┆ c    │
└──────┴──────┴──────┘


In [14]:
print(df.sort("col3", "col2", descending=[True, False]))

shape: (4, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ f64  ┆ str  │
╞══════╪══════╪══════╡
│ 2    ┆ 5.0  ┆ c    │
│ 2    ┆ 7.0  ┆ c    │
│ 1    ┆ 4.0  ┆ b    │
│ 3    ┆ 6.0  ┆ a    │
└──────┴──────┴──────┘


### df.merge_sorted()

In [15]:
print(df.sort("col3").merge_sorted(df2.sort("col3"), key="col3"))

shape: (8, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ f64  ┆ str  │
╞══════╪══════╪══════╡
│ 3    ┆ 6.0  ┆ a    │
│ 12   ┆ 15.0 ┆ a    │
│ 1    ┆ 4.0  ┆ b    │
│ 11   ┆ 16.0 ┆ b    │
│ 2    ┆ 5.0  ┆ c    │
│ 2    ┆ 7.0  ┆ c    │
│ 13   ┆ 14.0 ┆ c    │
│ 12   ┆ 17.0 ┆ c    │
└──────┴──────┴──────┘


In [16]:
df

col1,col2,col3
i64,f64,str
3,6.0,"""a"""
2,5.0,"""c"""
2,7.0,"""c"""
1,4.0,"""b"""


In [17]:
df2

col1,col2,col3
i64,f64,str
12,15.0,"""a"""
13,14.0,"""c"""
12,17.0,"""c"""
11,16.0,"""b"""


In [18]:
# df does not sort. Hence, the result doesn't make sense.
print(df.merge_sorted(df2.sort("col3"), key="col3"))

shape: (8, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ f64  ┆ str  │
╞══════╪══════╪══════╡
│ 3    ┆ 6.0  ┆ a    │
│ 12   ┆ 15.0 ┆ a    │
│ 11   ┆ 16.0 ┆ b    │
│ 2    ┆ 5.0  ┆ c    │
│ 2    ┆ 7.0  ┆ c    │
│ 1    ┆ 4.0  ┆ b    │
│ 13   ┆ 14.0 ┆ c    │
│ 12   ┆ 17.0 ┆ c    │
└──────┴──────┴──────┘


## pl.Expr.sort()

In [19]:
df

col1,col2,col3
i64,f64,str
3,6.0,"""a"""
2,5.0,"""c"""
2,7.0,"""c"""
1,4.0,"""b"""


In [20]:
print(df.with_columns(pl.col("col2").sort().alias("sorted_col2")))

shape: (4, 4)
┌──────┬──────┬──────┬─────────────┐
│ col1 ┆ col2 ┆ col3 ┆ sorted_col2 │
│ ---  ┆ ---  ┆ ---  ┆ ---         │
│ i64  ┆ f64  ┆ str  ┆ f64         │
╞══════╪══════╪══════╪═════════════╡
│ 3    ┆ 6.0  ┆ a    ┆ 4.0         │
│ 2    ┆ 5.0  ┆ c    ┆ 5.0         │
│ 2    ┆ 7.0  ┆ c    ┆ 6.0         │
│ 1    ┆ 4.0  ┆ b    ┆ 7.0         │
└──────┴──────┴──────┴─────────────┘


In [21]:
print(
    df.with_columns(
        pl.col("col2").sort_by("col3").alias("sorted_col2_by_col3")
    )
)

shape: (4, 4)
┌──────┬──────┬──────┬─────────────────────┐
│ col1 ┆ col2 ┆ col3 ┆ sorted_col2_by_col3 │
│ ---  ┆ ---  ┆ ---  ┆ ---                 │
│ i64  ┆ f64  ┆ str  ┆ f64                 │
╞══════╪══════╪══════╪═════════════════════╡
│ 3    ┆ 6.0  ┆ a    ┆ 6.0                 │
│ 2    ┆ 5.0  ┆ c    ┆ 4.0                 │
│ 2    ┆ 7.0  ┆ c    ┆ 5.0                 │
│ 1    ┆ 4.0  ┆ b    ┆ 7.0                 │
└──────┴──────┴──────┴─────────────────────┘
