In [5]:
import polars as pl

In [6]:
df = pl.DataFrame({
    "language": ["English", "Dutch", "Portuguese", "Finish"],
    "fruit": ["pear", "peer", "pêra", "päärynä"],
})

result = df.with_columns(
    pl.col('fruit').str.len_bytes().alias('byte_count'),
    pl.col('fruit').str.len_chars().alias('letter_count')
)
print(result)

shape: (4, 4)
┌────────────┬─────────┬────────────┬──────────────┐
│ language   ┆ fruit   ┆ byte_count ┆ letter_count │
│ ---        ┆ ---     ┆ ---        ┆ ---          │
│ str        ┆ str     ┆ u32        ┆ u32          │
╞════════════╪═════════╪════════════╪══════════════╡
│ English    ┆ pear    ┆ 4          ┆ 4            │
│ Dutch      ┆ peer    ┆ 4          ┆ 4            │
│ Portuguese ┆ pêra    ┆ 5          ┆ 4            │
│ Finish     ┆ päärynä ┆ 10         ┆ 7            │
└────────────┴─────────┴────────────┴──────────────┘


In [9]:
result = df.select(
    pl.col('fruit'),
    pl.col("fruit").str.starts_with("p").alias("starts_with_p"),
    pl.col('fruit').str.contains('p..r').alias('p..r'),
    pl.col('fruit').str.contains('e+').alias('e+'),
    pl.col('fruit').str.ends_with('r').alias('ends_with_r'),
)
print(result)

shape: (4, 5)
┌─────────┬───────────────┬───────┬───────┬─────────────┐
│ fruit   ┆ starts_with_p ┆ p..r  ┆ e+    ┆ ends_with_r │
│ ---     ┆ ---           ┆ ---   ┆ ---   ┆ ---         │
│ str     ┆ bool          ┆ bool  ┆ bool  ┆ bool        │
╞═════════╪═══════════════╪═══════╪═══════╪═════════════╡
│ pear    ┆ true          ┆ true  ┆ true  ┆ true        │
│ peer    ┆ true          ┆ true  ┆ true  ┆ true        │
│ pêra    ┆ true          ┆ false ┆ false ┆ false       │
│ päärynä ┆ true          ┆ true  ┆ false ┆ false       │
└─────────┴───────────────┴───────┴───────┴─────────────┘
