In [1]:
import pandas as pd

url = "https://www.ine.es/jaxi/files/tpx/es/csv_bdsc/72948.csv"

df = pd.read_csv(url, sep=";", encoding="utf-8-sig")

# Quedarnos solo con el PIB a precios de mercado
df = df[df["Ramas de actividad"].eq("PRODUCTO INTERIOR BRUTO A PRECIOS DE MERCADO")].copy()

# Filtrar años que necesitas
periodos = ["2017", "2020", "2023 (A)"]
df = df[df["Periodo"].isin(periodos)].copy()

# Limpiar "Total" (viene con puntos de miles)
df["PIB_miles_euros"] = (
    df["Total"].astype(str)
      .str.replace(".", "", regex=False)   # 199.951.794 -> 199951794
      .str.replace(",", ".", regex=False)
      .astype("float")
)

# Extraer año numérico
df["año"] = df["Periodo"].str.extract(r"(\d{4})").astype(int)

# Output final (formato simple para Power BI)
out = df[["Comunidades y ciudades autónomas", "año", "PIB_miles_euros"]].rename(
    columns={"Comunidades y ciudades autónomas": "CCAA"}
)

out.to_csv("PIB_CCAA_2017_2020_2023.csv", index=False, encoding="utf-8-sig")
out.head()


Unnamed: 0,CCAA,año,PIB_miles_euros
0,Andalucía,2023,199951794.0
3,Andalucía,2020,150452909.0
6,Andalucía,2017,156789484.0
336,Andalucía,2023,199951794.0
339,Andalucía,2020,150452909.0


In [2]:
df.duplicated(subset=["Comunidades y ciudades autónomas", "año", "PIB_miles_euros"]).sum()


np.int64(60)

In [3]:
df_clean = df.drop_duplicates(
    subset=["Comunidades y ciudades autónomas", "año", "PIB_miles_euros"]
)


In [4]:
df_clean.duplicated(
    subset=["Comunidades y ciudades autónomas", "año", "PIB_miles_euros"]
).sum()


np.int64(0)

In [7]:
df_final = df_clean[
    ["Comunidades y ciudades autónomas", "año", "PIB_miles_euros"]
].rename(columns={
    "Comunidades y ciudades autónomas": "CCAA"
})

df_final = df_final.drop_duplicates()

df_final.to_csv(
    "PIB_CCAA_2017_2020_2023_FINAL.csv",
    index=False,
    encoding="utf-8-sig"
)

df_final


Unnamed: 0,CCAA,año,PIB_miles_euros
0,Andalucía,2023,199951800.0
3,Andalucía,2020,150452900.0
6,Andalucía,2017,156789500.0
360,Aragón,2023,46673640.0
363,Aragón,2020,35955570.0
366,Aragón,2017,35983540.0
720,"Asturias, Principado de",2023,28325520.0
723,"Asturias, Principado de",2020,21376390.0
726,"Asturias, Principado de",2017,22538270.0
1080,"Balears, Illes",2023,42083950.0
