In [1]:
import polars as pl
import numpy as np

In [2]:
np.random.seed(42)

In [4]:
df = pl.DataFrame({
    "nrs": [1, 2, 3, None, 5],
    "names": ["foo", "ham", "spam", "egg", "spam"],
    "random": np.random.rand(5),
    "groups": ["A", "A", "B", "A", "B"],
})
print(df)

shape: (5, 4)
┌──────┬───────┬──────────┬────────┐
│ nrs  ┆ names ┆ random   ┆ groups │
│ ---  ┆ ---   ┆ ---      ┆ ---    │
│ i64  ┆ str   ┆ f64      ┆ str    │
╞══════╪═══════╪══════════╪════════╡
│ 1    ┆ foo   ┆ 0.155995 ┆ A      │
│ 2    ┆ ham   ┆ 0.058084 ┆ A      │
│ 3    ┆ spam  ┆ 0.866176 ┆ B      │
│ null ┆ egg   ┆ 0.601115 ┆ A      │
│ 5    ┆ spam  ┆ 0.708073 ┆ B      │
└──────┴───────┴──────────┴────────┘


In [5]:
result = df.select(
    (pl.col('nrs') + 5).alias("nrs + 5"),
    (pl.col('nrs') - 5).alias('nrs - 5'),
    (pl.col('nrs') * pl.col('random')).alias("nrs * random"),
    (pl.col('nrs') / pl.col('random')).alias("nrs / random"),
    (pl.col("nrs") ** 2).alias('nrs ** 2'),
    (pl.col("nrs") % 3).alias('nrs % 3')
)
print(result)

shape: (5, 6)
┌─────────┬─────────┬──────────────┬──────────────┬──────────┬─────────┐
│ nrs + 5 ┆ nrs - 5 ┆ nrs * random ┆ nrs / random ┆ nrs ** 2 ┆ nrs % 3 │
│ ---     ┆ ---     ┆ ---          ┆ ---          ┆ ---      ┆ ---     │
│ i64     ┆ i64     ┆ f64          ┆ f64          ┆ i64      ┆ i64     │
╞═════════╪═════════╪══════════════╪══════════════╪══════════╪═════════╡
│ 6       ┆ -4      ┆ 0.155995     ┆ 6.410482     ┆ 1        ┆ 1       │
│ 7       ┆ -3      ┆ 0.116167     ┆ 34.43312     ┆ 4        ┆ 2       │
│ 8       ┆ -2      ┆ 2.598528     ┆ 3.463499     ┆ 9        ┆ 0       │
│ null    ┆ null    ┆ null         ┆ null         ┆ null     ┆ null    │
│ 10      ┆ 0       ┆ 3.540363     ┆ 7.061423     ┆ 25       ┆ 2       │
└─────────┴─────────┴──────────────┴──────────────┴──────────┴─────────┘


In [6]:
result = df.select(
    (pl.col('nrs') > 1).alias('nrs > 1'),
    (pl.col('nrs') >= 3).alias('nrs >= 3'),
    (pl.col('random') < .2).alias('random < 0.2'),
    (pl.col('random') <= .5).alias('random <= 0.5'),
    (pl.col('nrs') != 1).alias('nrs != 1'),
    (pl.col('nrs') == 1).alias('nrs == 1'),
)
print(result)

shape: (5, 6)
┌─────────┬──────────┬──────────────┬───────────────┬──────────┬──────────┐
│ nrs > 1 ┆ nrs >= 3 ┆ random < 0.2 ┆ random <= 0.5 ┆ nrs != 1 ┆ nrs == 1 │
│ ---     ┆ ---      ┆ ---          ┆ ---           ┆ ---      ┆ ---      │
│ bool    ┆ bool     ┆ bool         ┆ bool          ┆ bool     ┆ bool     │
╞═════════╪══════════╪══════════════╪═══════════════╪══════════╪══════════╡
│ false   ┆ false    ┆ true         ┆ true          ┆ false    ┆ true     │
│ true    ┆ false    ┆ true         ┆ true          ┆ true     ┆ false    │
│ true    ┆ true     ┆ false        ┆ false         ┆ true     ┆ false    │
│ null    ┆ null     ┆ false        ┆ false         ┆ null     ┆ null     │
│ true    ┆ true     ┆ false        ┆ false         ┆ true     ┆ false    │
└─────────┴──────────┴──────────────┴───────────────┴──────────┴──────────┘


In [None]:
result = df.select(
    ((~pl.col('nrs').is_null()) & (pl.col('groups') == 'A')).alias('number not null and group A'),
    ((pl.col('random') < 0.5) | (pl.col('groups') == 'B')).alias("random < 0.5 or group B"),
)
print(result)

shape: (5, 2)
┌─────────────────────────────┬─────────────────────────┐
│ number not null and group A ┆ random < 0.5 or group B │
│ ---                         ┆ ---                     │
│ bool                        ┆ bool                    │
╞═════════════════════════════╪═════════════════════════╡
│ true                        ┆ true                    │
│ true                        ┆ true                    │
│ false                       ┆ true                    │
│ false                       ┆ false                   │
│ false                       ┆ true                    │
└─────────────────────────────┴─────────────────────────┘


In [10]:
result = df.select(
    pl.col('nrs'),
    (pl.col('nrs') & 6).alias('nrs & 6'),
    (pl.col('nrs') | 6).alias('nrs | 6'),
    (~pl.col('nrs')).alias("~ nrs"),
    (pl.col('nrs') ^ 6).alias('nrs ^ 6')
)
print(result)

shape: (5, 5)
┌──────┬─────────┬─────────┬───────┬─────────┐
│ nrs  ┆ nrs & 6 ┆ nrs | 6 ┆ ~ nrs ┆ nrs ^ 6 │
│ ---  ┆ ---     ┆ ---     ┆ ---   ┆ ---     │
│ i64  ┆ i64     ┆ i64     ┆ i64   ┆ i64     │
╞══════╪═════════╪═════════╪═══════╪═════════╡
│ 1    ┆ 0       ┆ 7       ┆ -2    ┆ 7       │
│ 2    ┆ 2       ┆ 6       ┆ -3    ┆ 4       │
│ 3    ┆ 2       ┆ 7       ┆ -4    ┆ 5       │
│ null ┆ null    ┆ null    ┆ null  ┆ null    │
│ 5    ┆ 4       ┆ 7       ┆ -6    ┆ 3       │
└──────┴─────────┴─────────┴───────┴─────────┘


In [11]:
long_df = pl.DataFrame({
    "numbers" : np.random.randint(0,1000,1000),
})
result = long_df.select(
    (pl.col('numbers').n_unique().alias("n_unique")),
    (pl.col('numbers').approx_n_unique().alias('approx_n_unique')),
)
print(result)

shape: (1, 2)
┌──────────┬─────────────────┐
│ n_unique ┆ approx_n_unique │
│ ---      ┆ ---             │
│ u32      ┆ u32             │
╞══════════╪═════════════════╡
│ 613      ┆ 614             │
└──────────┴─────────────────┘


In [12]:
result = df.select(
    (pl.col('names').value_counts()).alias('value_counts')
)
print(result)

shape: (4, 1)
┌──────────────┐
│ value_counts │
│ ---          │
│ struct[2]    │
╞══════════════╡
│ {"spam",2}   │
│ {"ham",1}    │
│ {"foo",1}    │
│ {"egg",1}    │
└──────────────┘


In [13]:
result = df.select(
    (pl.col('names').unique(maintain_order=True).alias('unique')),
    (pl.col('names').unique_counts()).alias('unique_counts')
)
print(result)

shape: (4, 2)
┌────────┬───────────────┐
│ unique ┆ unique_counts │
│ ---    ┆ ---           │
│ str    ┆ u32           │
╞════════╪═══════════════╡
│ foo    ┆ 1             │
│ ham    ┆ 1             │
│ spam   ┆ 2             │
│ egg    ┆ 1             │
└────────┴───────────────┘


In [14]:
result = df.select(
    pl.col('nrs'),
    pl.when(pl.col('nrs')%2 == 1).then(3 * pl.col("nrs") + 1).otherwise(pl.col('nrs') // 2).alias('Collatz')
)
print(result)

shape: (5, 2)
┌──────┬─────────┐
│ nrs  ┆ Collatz │
│ ---  ┆ ---     │
│ i64  ┆ i64     │
╞══════╪═════════╡
│ 1    ┆ 4       │
│ 2    ┆ 1       │
│ 3    ┆ 10      │
│ null ┆ null    │
│ 5    ┆ 16      │
└──────┴─────────┘
