# Pandas és Polars mérközések
![Pandas vs Polars](assets/polars_pandas_arm_wrestling.png)



In [None]:
import pandas as pd
import polars as pl
import numpy as np

In [7]:
import time

verbose = True
#region-> Példa Polars és Pandas DataFrame létrehozására, feltöltése
number_of_rows = 1_000_000
max_fill_value = 1_0000
exclude_threshold = 100

values_x = np.random.randint(1, max_fill_value, number_of_rows)
values_y = np.random.randint(1, max_fill_value, number_of_rows)
values_z = np.random.randint(1, max_fill_value, number_of_rows)
group_values = np.random.choice(list("ABC"), number_of_rows)

df_pd = pd.DataFrame({
    "x": values_x,
    "y": values_y,
    "z": values_z,
    "group": group_values
})

df_pl = pl.from_pandas(df_pd)
#endregion

#region -> Műveletek Polars DataFrame-nél (szűrés, csoportosítás, aggregálás, rendezés)
start_time = time.time()
result_pl = (
    df_pl
    .filter(pl.col("x") > exclude_threshold)  # Filter rows where x > 100
    .group_by("group")
    .agg([
        pl.col("x").mean().alias("x_mean"),
        pl.col("y").mean().alias("y_mean"),
        pl.col("z").mean().alias("z_mean")
    ])
    .sort('group')
)
polars_time = time.time() - start_time
#enregion

if verbose:
    print(f"Az eredmény Polars dataframe esetén {polars_time:.4f} másodperc alatt készült.")
    print(result_pl)

#region -> Műveletek Pandas DataFrame-nél (szűrés, csoportosítás, aggregálás, rendezés)
start_time = time.time()
result_pd = (
    df_pd[df_pd["x"] > exclude_threshold]
    .groupby("group")[["x", "y", "z"]]
    .mean()
    .rename(columns={"x": "x_mean", "y": "y_mean", "z": "z_mean"})
    .reset_index()
    .sort_values(by="group")
)
pandas_time = time.time() - start_time
#endregion


if verbose:
    print(f"Az eredmény Polars dataframe esetén {pandas_time:.4f} másodperc alatt készült.")
    print(result_pl)

df_time_results = pl.DataFrame({
    "library": ["Polars", "Pandas"],
    "time": [polars_time, pandas_time]
})

df_time_results \
    .plot \
    .bar(x="library", y="time") \
    .properties(title="Mérési eredmények", width=400, height=300)


Az eredmény Polars dataframe esetén 0.0201 másodperc alatt készült.
shape: (3, 4)
┌───────┬─────────────┬─────────────┬─────────────┐
│ group ┆ x_mean      ┆ y_mean      ┆ z_mean      │
│ ---   ┆ ---         ┆ ---         ┆ ---         │
│ str   ┆ f64         ┆ f64         ┆ f64         │
╞═══════╪═════════════╪═════════════╪═════════════╡
│ A     ┆ 5046.9081   ┆ 5003.625313 ┆ 4998.472766 │
│ B     ┆ 5046.227244 ┆ 5003.773889 ┆ 5002.467616 │
│ C     ┆ 5056.391502 ┆ 5009.890756 ┆ 4991.336708 │
└───────┴─────────────┴─────────────┴─────────────┘
Az eredmény Polars dataframe esetén 0.0687 másodperc alatt készült.
shape: (3, 4)
┌───────┬─────────────┬─────────────┬─────────────┐
│ group ┆ x_mean      ┆ y_mean      ┆ z_mean      │
│ ---   ┆ ---         ┆ ---         ┆ ---         │
│ str   ┆ f64         ┆ f64         ┆ f64         │
╞═══════╪═════════════╪═════════════╪═════════════╡
│ A     ┆ 5046.9081   ┆ 5003.625313 ┆ 4998.472766 │
│ B     ┆ 5046.227244 ┆ 5003.773889 ┆ 5002.467616 │
│ C 