In [42]:
import polars as pl

df = pl.read_parquet("kjoretoyinfo_preppet.parquet")

In [43]:
df = df.with_columns([
    pl.col("tekn_reg_f_g_n").cast(str).str.strptime(pl.Date, "%Y%m%d").alias("tekn_reg_f_g_n_date")
])


In [44]:
 elbiler_2000 = df.filter(
    (pl.col("tekn_drivstoff") == "5") & 
    (pl.col("tekn_reg_f_g_n_date").dt.year() == 2000)
).count()

print(f"Antall elbiler førstegangsregistrert i 2000: {elbiler_2000}")


Antall elbiler førstegangsregistrert i 2000: shape: (1, 10)
┌────────────┬────────────┬────────────┬───────────┬───┬───────────┬───────────┬───────┬───────────┐
│ tekn_reg_f ┆ tekn_reg_e ┆ tekn_aksle ┆ tekn_merk ┆ … ┆ tekn_nest ┆ tekn_kjtg ┆ elbil ┆ tekn_reg_ │
│ _g_n       ┆ ier_dato   ┆ r_drift    ┆ e         ┆   ┆ e_pkk     ┆ rp        ┆ ---   ┆ f_g_n_dat │
│ ---        ┆ ---        ┆ ---        ┆ ---       ┆   ┆ ---       ┆ ---       ┆ u32   ┆ e         │
│ u32        ┆ u32        ┆ u32        ┆ u32       ┆   ┆ u32       ┆ u32       ┆       ┆ ---       │
│            ┆            ┆            ┆           ┆   ┆           ┆           ┆       ┆ u32       │
╞════════════╪════════════╪════════════╪═══════════╪═══╪═══════════╪═══════════╪═══════╪═══════════╡
│ 126        ┆ 126        ┆ 126        ┆ 126       ┆ … ┆ 50        ┆ 126       ┆ 126   ┆ 126       │
└────────────┴────────────┴────────────┴───────────┴───┴───────────┴───────────┴───────┴───────────┘


In [45]:
elbiler_2000 = df.filter(
    (pl.col("tekn_drivstoff") == "5") &
    (pl.col("tekn_reg_f_g_n_date").dt.year() == 2000)
).height

print(f"Antall elbiler førstegangsregistrert i 2000: {elbiler_2000}")



Antall elbiler førstegangsregistrert i 2000: 126


In [64]:
unique_kjtgrp = df.select(pl.col("tekn_kjtgrp")).unique().sort("tekn_kjtgrp")
print(unique_kjtgrp)


shape: (45, 1)
┌─────────────┐
│ tekn_kjtgrp │
│ ---         │
│ i64         │
╞═════════════╡
│ 101         │
│ 106         │
│ 107         │
│ 201         │
│ 210         │
│ …           │
│ 601         │
│ 610         │
│ 620         │
│ 621         │
│ 630         │
└─────────────┘


In [65]:
df.write_csv("kjoretoyinfo_preppet.csv")


In [69]:
totalt_kjoretoy_2000 = df.filter(pl.col("tekn_reg_f_g_n_date").dt.year() == 2000).height



In [70]:
elbiler_2000 = df.filter(
    (pl.col("tekn_drivstoff") == "5") &  
    (pl.col("tekn_reg_f_g_n_date").dt.year() == 2000)
).height


In [71]:
prosent_elbiler_2000 = (elbiler_2000 / totalt_kjoretoy_2000) * 100

print(f"Prosentandel av elbiler i 2000: {prosent_elbiler_2000:.2f}%")


Prosentandel av elbiler i 2000: 0.13%


In [82]:
mest_populaer_modell_2000 = populaere_modeller_2000.sort(by="antall").reverse().head(1)

print("Den mest populære bilmodellen i 2000 var:")
print(mest_populaer_modell_2000)


Den mest populære bilmodellen i 2000 var:
shape: (1, 2)
┌─────────────┬────────┐
│ tekn_modell ┆ antall │
│ ---         ┆ ---    │
│ str         ┆ u32    │
╞═════════════╪════════╡
│ GOLF        ┆ 3208   │
└─────────────┴────────┘


In [84]:
# Gruppere kjøretøyregistreringene etter måned og telle antall i hver måned
registreringer_per_maaned = df.with_columns(pl.col("tekn_reg_f_g_n_date").dt.month().alias("maaned")).group_by("maaned").agg(pl.count().alias("antall_registreringer"))

# Sortere resultatene for å finne måneden med flest registreringer
mest_registreringer = registreringer_per_maaned.sort(by="antall_registreringer", reverse=True).head(1)

print("Måneden med flest førstegangsregistreringer av biler:")
print(mest_registreringer)


  registreringer_per_maaned = df.with_columns(pl.col("tekn_reg_f_g_n_date").dt.month().alias("maaned")).group_by("maaned").agg(pl.count().alias("antall_registreringer"))


TypeError: DataFrame.sort() got an unexpected keyword argument 'reverse'

In [86]:
# Grupperer kjøretøyregistreringene etter måned og teller antall i hver måned
# Korreksjon for deprecation warning ved å bruke pl.len() og fjerning av reverse=True i sort()-metoden
registreringer_per_maaned = df.with_columns(
    pl.col("tekn_reg_f_g_n_date").dt.month().alias("maaned")
).group_by("maaned").agg(
    pl.len().alias("antall_registreringer")  # Oppdatert fra pl.count() til pl.len()
)

# For å sortere i synkende rekkefølge uten å bruke reverse=True, som forårsaket TypeError
mest_registreringer = registreringer_per_maaned.sort(
    by=pl.col("antall_registreringer").sort(ascending=False)
).head(1)

print("Måneden med flest førstegangsregistreringer av biler:")
print(mest_registreringer)


TypeError: Expr.sort() got an unexpected keyword argument 'ascending'

In [90]:
registreringer_per_maaned = df.with_columns(
    pl.col("tekn_reg_f_g_n_date").dt.month().alias("maaned")
).group_by("maaned").agg(
    pl.len().alias("antall_registreringer")  # Bruker pl.len() for telling
)


mest_registreringer = registreringer_per_maaned.sort(
    by="antall_registreringer", descending=True  
).head(1)

print("Måneden med flest førstegangsregistreringer av biler:")
print(mest_registreringer)


Måneden med flest førstegangsregistreringer av biler:
shape: (1, 2)
┌────────┬───────────────────────┐
│ maaned ┆ antall_registreringer │
│ ---    ┆ ---                   │
│ i8     ┆ u32                   │
╞════════╪═══════════════════════╡
│ 6      ┆ 248455                │
└────────┴───────────────────────┘


In [93]:
# Filtrer datasettet for kjøretøy førstegangsregistrert i 2000
kjoretoy_2000 = df.filter(pl.col("tekn_reg_f_g_n_date").dt.year() == 2000)

mest_populaere_merker_2000 = (
    kjoretoy_2000
    .group_by("tekn_merke")
    .agg(pl.len().alias("antall"))
    .sort(by="antall", descending=True)
    .head(5)
)

print("De fem mest populære bilmerkene i 2000 var:")
print(mest_populaere_merker_2000)


De fem mest populære bilmerkene i 2000 var:
shape: (5, 2)
┌────────────┬────────┐
│ tekn_merke ┆ antall │
│ ---        ┆ ---    │
│ i64        ┆ u32    │
╞════════════╪════════╡
│ 5750       ┆ 10729  │
│ 5480       ┆ 9562   │
│ 3900       ┆ 7195   │
│ 4350       ┆ 5329   │
│ 1230       ┆ 4751   │
└────────────┴────────┘


In [95]:
# Filtrer datasettet for kjøretøy førstegangsregistrert i 2000
kjoretoy_2000 = df.filter(pl.col("tekn_reg_f_g_n_date").dt.year() == 2000)

mest_populaere_merker_2000 = (
    kjoretoy_2000
    .group_by("tekn_modell")
    .agg(pl.len().alias("antall"))
    .sort(by="antall", descending=True)
    .head(5)
)

print("De fem mest populære bilmerkene i 2000 var:")
print(mest_populaere_merker_2000)

De fem mest populære bilmerkene i 2000 var:
shape: (5, 2)
┌─────────────┬────────┐
│ tekn_modell ┆ antall │
│ ---         ┆ ---    │
│ str         ┆ u32    │
╞═════════════╪════════╡
│ GOLF        ┆ 3208   │
│ -           ┆ 2499   │
│ PASSAT      ┆ 2342   │
│ FOCUS       ┆ 1922   │
│ YARIS       ┆ 1863   │
└─────────────┴────────┘
