In [0]:
# Installer Excel-støtte
%pip install openpyxl

import pandas as pd
import io

# Les Excel direkte fra Workspace-opplastet bytes (hvis tilgjengelig)
workspace_path = "/Workspace/Users/sushant.nmbu@gmail.com/befolkning.xlsx"

# Åpne Excel-filen som bytes
with open(workspace_path, "rb") as f:
    bytes_data = f.read()

# Hopp over topp-rader med metadata (3 første rader)
pdf = pd.read_excel(io.BytesIO(bytes_data), skiprows=3)

# Fjern rader uten kommuneinfo
pdf = pdf[pdf.iloc[:, 0].notnull()]

# Hvis du ønsker å bruke den som Spark DataFrame:
df = spark.createDataFrame(pdf)

# Gi kolonnene riktige navn (basert på det du viste i bildet)
kolonner = [
    "Kommune",
    "Kjønn",
    "Alder",
    "2022",
    "2023",
    "2024",
    "2025"
]

# Gi nytt navn til kolonnene
df = df.toDF(*kolonner)

# Vis for kontroll
display(df)



[43mNote: you may need to restart the kernel using %restart_python or dbutils.library.restartPython() to use updated packages.[0m


Kommune,Kjønn,Alder,2022,2023,2024,2025
K-3116 Skiptvet,Kvinner,0 år,8.0,17.0,11.0,14.0
K-3118 Indre Østfold,Kvinner,0 år,195.0,199.0,205.0,211.0
K-3120 Rakkestad,Kvinner,0 år,39.0,32.0,35.0,53.0
K-3122 Marker,Kvinner,0 år,12.0,19.0,16.0,11.0
K-3124 Aremark,Kvinner,0 år,9.0,4.0,9.0,6.0
K-3201 Bærum,Kvinner,0 år,668.0,581.0,607.0,659.0
K-3203 Asker,Kvinner,0 år,472.0,430.0,413.0,431.0
K-3205 Lillestrøm,Kvinner,0 år,464.0,438.0,443.0,478.0
K-3207 Nordre Follo,Kvinner,0 år,315.0,311.0,276.0,324.0
K-3209 Ullensaker,Kvinner,0 år,225.0,219.0,210.0,218.0


In [0]:
from pyspark.sql.functions import sum as spark_sum

# Sørg for at 2025-kolonnen er numerisk
df = df.withColumn("Innbyggere_2025", df["2025"].cast("int"))

# Gruppér og summer innbyggertall per kommune
top_kommuner = (
    df.groupBy("Kommune")
    .agg(spark_sum("Innbyggere_2025").alias("Totalt_2025"))
    .orderBy("Totalt_2025", ascending=False)
    .limit(10)
)

# Vis
display(top_kommuner)


Kommune,Totalt_2025
K-0301 Oslo,4359
K-4601 Bergen,1431
K-5001 Trondheim - Tråante,1018
K-1103 Stavanger,692
K-3201 Bærum,659
K-4204 Kristiansand,573
K-3301 Drammen,486
K-3205 Lillestrøm,478
K-1108 Sandnes,448
K-3203 Asker,431
