In [1]:
from typing import Callable, Literal
import pandas as pd
import polars as pl

df = pl.DataFrame({"col1": [1, 2, 3], "col2": ["x", "y", "z"]})
print(df)

shape: (3, 2)
┌──────┬──────┐
│ col1 ┆ col2 │
│ ---  ┆ ---  │
│ i64  ┆ str  │
╞══════╪══════╡
│ 1    ┆ x    │
│ 2    ┆ y    │
│ 3    ┆ z    │
└──────┴──────┘


In [2]:
df2 = pl.DataFrame({"col 1": [1, 2, 3], "col 2": ["x", "y", "z"]})
print(df2)

shape: (3, 2)
┌───────┬───────┐
│ col 1 ┆ col 2 │
│ ---   ┆ ---   │
│ i64   ┆ str   │
╞═══════╪═══════╡
│ 1     ┆ x     │
│ 2     ┆ y     │
│ 3     ┆ z     │
└───────┴───────┘


## pl.when().then().otherwise()

In [3]:
print(
    df.with_columns(
        pl.when(pl.col("col1").le(1))
        .then(pl.col("col1").add(100))
        .when(pl.col("col1").ge(3))
        .then(pl.col("col1").add(300))
        .otherwise(pl.col("col1").add(200))
        .alias("col3")
    )
)

shape: (3, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ str  ┆ i64  │
╞══════╪══════╪══════╡
│ 1    ┆ x    ┆ 101  │
│ 2    ┆ y    ┆ 202  │
│ 3    ┆ z    ┆ 303  │
└──────┴──────┴──────┘


In [4]:
cond = (
    pl.when(pl.col("col1").le(1))
    .then(pl.col("col1").add(100))
    .when(pl.col("col1").ge(3))
    .then(pl.col("col1").add(300))
    .otherwise(pl.col("col1").add(200))
    .alias("col3")
)

In [5]:
print(df.with_columns(cond))

shape: (3, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ str  ┆ i64  │
╞══════╪══════╪══════╡
│ 1    ┆ x    ┆ 101  │
│ 2    ┆ y    ┆ 202  │
│ 3    ┆ z    ┆ 303  │
└──────┴──────┴──────┘


In [6]:
print(
    df.with_columns(
        pl.when(pl.col("col1").eq(1))
        .then(pl.lit("a"))
        .when(pl.col("col1").eq(2))
        .then(pl.lit("b"))
        .when(pl.col("col1").eq(3))
        .then(pl.lit("c"))
        .alias("col3")
    )
)

shape: (3, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ str  ┆ str  │
╞══════╪══════╪══════╡
│ 1    ┆ x    ┆ a    │
│ 2    ┆ y    ┆ b    │
│ 3    ┆ z    ┆ c    │
└──────┴──────┴──────┘


## replace(), replace_strict()

In [7]:
# replace
print(
    df.with_columns(
        pl.col("col2")
        .replace({"x": "a", "y": "b", "z": "c"})
        .alias("col3")
    )
)

shape: (3, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ str  ┆ str  │
╞══════╪══════╪══════╡
│ 1    ┆ x    ┆ a    │
│ 2    ┆ y    ┆ b    │
│ 3    ┆ z    ┆ c    │
└──────┴──────┴──────┘


In [8]:
# replace_strict
print(
    df.with_columns(
        pl.col("col2")
        .replace_strict({"x": 4, "y": 5}, default=6, return_dtype=pl.Int64)
        .alias("col3")
    )
)

shape: (3, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ str  ┆ i64  │
╞══════╪══════╪══════╡
│ 1    ┆ x    ┆ 4    │
│ 2    ┆ y    ┆ 5    │
│ 3    ┆ z    ┆ 6    │
└──────┴──────┴──────┘


## pl.concat_str()

In [9]:
print(df.with_columns(pl.concat_str(pl.all()).alias("col3")))

shape: (3, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ str  ┆ str  │
╞══════╪══════╪══════╡
│ 1    ┆ x    ┆ 1x   │
│ 2    ┆ y    ┆ 2y   │
│ 3    ┆ z    ┆ 3z   │
└──────┴──────┴──────┘


## pl.concat_list()

In [10]:
print(df.with_columns(pl.concat_list(pl.all()).alias("col3")))

shape: (3, 3)
┌──────┬──────┬────────────┐
│ col1 ┆ col2 ┆ col3       │
│ ---  ┆ ---  ┆ ---        │
│ i64  ┆ str  ┆ list[str]  │
╞══════╪══════╪════════════╡
│ 1    ┆ x    ┆ ["1", "x"] │
│ 2    ┆ y    ┆ ["2", "y"] │
│ 3    ┆ z    ┆ ["3", "z"] │
└──────┴──────┴────────────┘


In [11]:
print(
    df.with_columns(
        pl.concat_list(col) for col in df.columns
    ).with_columns(pl.concat_list(pl.all()).alias("col3"))
)

shape: (3, 3)
┌───────────┬───────────┬────────────┐
│ col1      ┆ col2      ┆ col3       │
│ ---       ┆ ---       ┆ ---        │
│ list[i64] ┆ list[str] ┆ list[str]  │
╞═══════════╪═══════════╪════════════╡
│ [1]       ┆ ["x"]     ┆ ["1", "x"] │
│ [2]       ┆ ["y"]     ┆ ["2", "y"] │
│ [3]       ┆ ["z"]     ┆ ["3", "z"] │
└───────────┴───────────┴────────────┘


In [12]:
print(
    df.select(pl.concat_str(pl.all()).alias("col3")).with_columns(
        pl.col("col3").str.split("").alias("col4")
    )
)

shape: (3, 2)
┌──────┬────────────┐
│ col3 ┆ col4       │
│ ---  ┆ ---        │
│ str  ┆ list[str]  │
╞══════╪════════════╡
│ 1x   ┆ ["1", "x"] │
│ 2y   ┆ ["2", "y"] │
│ 3z   ┆ ["3", "z"] │
└──────┴────────────┘


## df.pipe()

In [13]:
def fmt_col(df_: pl.DataFrame) -> pl.DataFrame:
    df_.columns = ["".join(c.split()).capitalize() for c in df_.columns]
    return df_


print(df2.pipe(fmt_col))

shape: (3, 2)
┌──────┬──────┐
│ Col1 ┆ Col2 │
│ ---  ┆ ---  │
│ i64  ┆ str  │
╞══════╪══════╡
│ 1    ┆ x    │
│ 2    ┆ y    │
│ 3    ┆ z    │
└──────┴──────┘


In [14]:
def fmt_col2(
    df_, fmt_type: Literal["upper", "lower", "capitalize"] | None = None
) -> pl.DataFrame:
    fmt_func: Callable[[str], str] = lambda x: x
    if fmt_type in {"upper", "lower", "capitalize"}:
        fmt_func = getattr(str, fmt_type)

    df_.columns = [fmt_func("".join(c.split())) for c in df_.columns]
    return df_


print(df2.pipe(fmt_col2, fmt_type="capitalize"))

shape: (3, 2)
┌──────┬──────┐
│ Col1 ┆ Col2 │
│ ---  ┆ ---  │
│ i64  ┆ str  │
╞══════╪══════╡
│ 1    ┆ x    │
│ 2    ┆ y    │
│ 3    ┆ z    │
└──────┴──────┘


## codepanda

### case_when()

In [15]:
df

col1,col2
i64,str
1,"""x"""
2,"""y"""
3,"""z"""


In [16]:
print(
    df.with_columns(
        pl.when(pl.col("col1").le(1))
        .then(pl.col("col1").add(100))
        .when(pl.col("col1").ge(3))
        .then(pl.col("col1").add(300))
        .otherwise(pl.col("col1").add(200))
        .alias("col3")
    )
)

shape: (3, 3)
┌──────┬──────┬──────┐
│ col1 ┆ col2 ┆ col3 │
│ ---  ┆ ---  ┆ ---  │
│ i64  ┆ str  ┆ i64  │
╞══════╪══════╪══════╡
│ 1    ┆ x    ┆ 101  │
│ 2    ┆ y    ┆ 202  │
│ 3    ┆ z    ┆ 303  │
└──────┴──────┴──────┘


In [17]:
df_pd = pd.DataFrame({"col1": [1, 2, 3], "col2": ["x", "y", "z"]})

print(
    df_pd.assign(
        col3=lambda df_: df_.col1.case_when(
            [
                (df_.col1.le(1), df_.col1.add(100)),
                (df_.col1.ge(3), df_.col1.add(300)),
                ((~df_.col1.le(1)) & (~df_.col1.ge(3)), df_.col1.add(200)),
            ]
        )
    )
)

   col1 col2  col3
0     1    x   101
1     2    y   202
2     3    z   303


## Remarks

### Remark1

In [18]:
print(
    df2.select(
        pl.all().name.map(lambda c: "".join(c.split()).capitalize())
    )
)

shape: (3, 2)
┌──────┬──────┐
│ Col1 ┆ Col2 │
│ ---  ┆ ---  │
│ i64  ┆ str  │
╞══════╪══════╡
│ 1    ┆ x    │
│ 2    ┆ y    │
│ 3    ┆ z    │
└──────┴──────┘
