In [1]:
import polars as pl

In [2]:
df = pl.DataFrame({
    "integers": [1, 2, 3],
    "big_integers": [10000002, 2, 30000003],
    "floats": [4.0, 5.8, -6.3],
})
print(df)

shape: (3, 3)
┌──────────┬──────────────┬────────┐
│ integers ┆ big_integers ┆ floats │
│ ---      ┆ ---          ┆ ---    │
│ i64      ┆ i64          ┆ f64    │
╞══════════╪══════════════╪════════╡
│ 1        ┆ 10000002     ┆ 4.0    │
│ 2        ┆ 2            ┆ 5.8    │
│ 3        ┆ 30000003     ┆ -6.3   │
└──────────┴──────────────┴────────┘


In [3]:
result = df.select(
    pl.col('integers').cast(pl.Float32).alias('integers_as_float'),
    pl.col('floats').cast(pl.Int32).alias('float_as_integers'),
)
print(result)

shape: (3, 2)
┌───────────────────┬───────────────────┐
│ integers_as_float ┆ float_as_integers │
│ ---               ┆ ---               │
│ f32               ┆ i32               │
╞═══════════════════╪═══════════════════╡
│ 1.0               ┆ 4                 │
│ 2.0               ┆ 5                 │
│ 3.0               ┆ -6                │
└───────────────────┴───────────────────┘


In [6]:
print(f"before downcasting: {df.estimated_size()} bytes")
resutl = df.with_columns(
    pl.col('integers').cast(pl.Int16),
    pl.col('floats').cast(pl.Float32),
)
print(f"After downcasting: {result.estimated_size()} bytes")

before downcasting: 72 bytes
After downcasting: 24 bytes


In [8]:
df = pl.DataFrame({
    "integers_as_strings": ["1", "2", "3"],
    "floats_as_strings": ["4.0", "5.8", "-6.3"],
    "floats": [4.0, 5.8, -6.3],
})
result = df.select(
    pl.col("integers_as_strings").cast(pl.Int32).alias("strings_converted_to_int"),
    pl.col('floats_as_strings').cast(pl.Float64).alias("strings_converted_to_float"),
    pl.col('floats').cast(pl.String).alias("floats_converted_to_string"),
)
print(result)

shape: (3, 3)
┌──────────────────────────┬────────────────────────────┬────────────────────────────┐
│ strings_converted_to_int ┆ strings_converted_to_float ┆ floats_converted_to_string │
│ ---                      ┆ ---                        ┆ ---                        │
│ i32                      ┆ f64                        ┆ str                        │
╞══════════════════════════╪════════════════════════════╪════════════════════════════╡
│ 1                        ┆ 4.0                        ┆ 4.0                        │
│ 2                        ┆ 5.8                        ┆ 5.8                        │
│ 3                        ┆ -6.3                       ┆ -6.3                       │
└──────────────────────────┴────────────────────────────┴────────────────────────────┘


In [11]:
df = pl.DataFrame(
    {
        "integers": [-1, 0, 2, 3, 4],
        "floats": [0.0, 1.0, 2.0, 3.0, 4.0],
        "bools": [True, False, True, False, True],
    }
)
result = df.select(
    pl.col('integers').cast(pl.Boolean).alias("integers_to_Boolean"),
    pl.col('floats').cast(pl.Boolean).alias("float_to_boolean"),
    pl.col("bools").cast(pl.Int8).alias("Boolean_to_Int8")
)
print(result)

shape: (5, 3)
┌─────────────────────┬──────────────────┬─────────────────┐
│ integers_to_Boolean ┆ float_to_boolean ┆ Boolean_to_Int8 │
│ ---                 ┆ ---              ┆ ---             │
│ bool                ┆ bool             ┆ i8              │
╞═════════════════════╪══════════════════╪═════════════════╡
│ true                ┆ false            ┆ 1               │
│ false               ┆ true             ┆ 0               │
│ true                ┆ true             ┆ 1               │
│ true                ┆ true             ┆ 0               │
│ true                ┆ true             ┆ 1               │
└─────────────────────┴──────────────────┴─────────────────┘


In [13]:
from datetime import date, time, datetime

df = pl.DataFrame({
    "date": [
        date(1970, 1, 1),  # epoch
        date(1970, 1, 10),  # 9 days later
    ],
    "datetime": [
        datetime(1970, 1, 1, 0, 0, 0),  # epoch
        datetime(1970, 1, 1, 0, 1, 0),  # 1 minute later
    ],
    "time": [
        time(0, 0, 0),  # reference time
        time(0, 0, 1),  # 1 second later
    ],
})

print(df)

shape: (2, 3)
┌────────────┬─────────────────────┬──────────┐
│ date       ┆ datetime            ┆ time     │
│ ---        ┆ ---                 ┆ ---      │
│ date       ┆ datetime[μs]        ┆ time     │
╞════════════╪═════════════════════╪══════════╡
│ 1970-01-01 ┆ 1970-01-01 00:00:00 ┆ 00:00:00 │
│ 1970-01-10 ┆ 1970-01-01 00:01:00 ┆ 00:00:01 │
└────────────┴─────────────────────┴──────────┘


In [14]:
result = df.select(
    pl.col('date').cast(pl.Int64).alias('days_since_epoch'),
    pl.col('datetime').cast(pl.Int64).alias('us_since_epoch'),
    pl.col('time').cast(pl.Int64).alias('ns_since_midnight'),
)
print(result)

shape: (2, 3)
┌──────────────────┬────────────────┬───────────────────┐
│ days_since_epoch ┆ us_since_epoch ┆ ns_since_midnight │
│ ---              ┆ ---            ┆ ---               │
│ i64              ┆ i64            ┆ i64               │
╞══════════════════╪════════════════╪═══════════════════╡
│ 0                ┆ 0              ┆ 0                 │
│ 9                ┆ 60000000       ┆ 1000000000        │
└──────────────────┴────────────────┴───────────────────┘


In [16]:
df = pl.DataFrame({
    "date": [date(2022, 1, 1), date(2022, 1, 2)],
    "string": ["2022-01-01", "2022-01-02"],
})
print(df)
result = df.select(
    pl.col("date").dt.to_string('%Y-%d-%d'),
    pl.col('string').str.to_datetime('%Y-%m-%d')
)
print(result)

shape: (2, 2)
┌────────────┬────────────┐
│ date       ┆ string     │
│ ---        ┆ ---        │
│ date       ┆ str        │
╞════════════╪════════════╡
│ 2022-01-01 ┆ 2022-01-01 │
│ 2022-01-02 ┆ 2022-01-02 │
└────────────┴────────────┘
shape: (2, 2)
┌────────────┬─────────────────────┐
│ date       ┆ string              │
│ ---        ┆ ---                 │
│ str        ┆ datetime[μs]        │
╞════════════╪═════════════════════╡
│ 2022-01-01 ┆ 2022-01-01 00:00:00 │
│ 2022-02-02 ┆ 2022-01-02 00:00:00 │
└────────────┴─────────────────────┘
