![title](./pic/aditional_functions/replace_split/1_title.png)

In [439]:
import pandas as pd
from tqdm.notebook import tqdm, trange

In [440]:
cars = pd.DataFrame({'marke': ['Bmw', 
                               'Audi', 
                               'Mercedes'
                                ], 
                    'preis': ['19.999 €', 
                              '12.456 €', 
                              '23.189 €'
                             ]
                    })

Meist kommen die Daten nicht in dem Format an, in dem wir sie brauchen könnnen. So zum Beispiel auch Preise von gecrawlten Webseiten. In diesem Beispiel kümmern wir uns Darum, wie wir einzelne Daten bereitigen können. Hierzu zählt das entfernen von etwaigen Trennzeichen und das aufsplitten von Strings um letzten Endes eine für uns vorteilhafte Darstellung der Daten zu erlangen.

---

In [441]:
cars['preis']

0    19.999 €
1    12.456 €
2    23.189 €
Name: preis, dtype: object

In [442]:
type(cars.loc[0, 'preis'])

str

<br>

Die `.replace`-Methode in `Pandas` ermöglicht es dir, die Werte in einer bestimmten `Series` in deinem `DataFrame` nach einem Wert oder einer Teilzeichenkette zu durchsuchen, die du dann ändern kannst.

![title](./pic/aditional_functions/replace_split/2_replace.png)

In [443]:
cars.loc[0, 'preis']

'19.999 €'

Mit der `.replace()`-Methode, können wir einzelne (oder auch mehrere) Chars ersetzten oder gar ganz entfernen. So auch in diesem Beispiel, wobei hier ein Tausend-Trennpunkt eingefügt ist. Für Kalkulationen ist diese Art der Trennung schlecht, da es sich hierbei um einen `String` und nicht um einen `int` oder `float` Wert handelt. Daher ersetzten wir den `.` mit nichts.

In [444]:
cars.loc[0, 'preis'].replace('.', '')

'19999 €'

Nachdem die Überprüfung erfolgreich war, können wir diese Methode auf das komplette `DataFrame` anwenden.

In [445]:
cars["preis"] = cars["preis"].str.replace('.', '')

  """Entry point for launching an IPython kernel.


In [446]:
cars

Unnamed: 0,marke,preis
0,Bmw,19999 €
1,Audi,12456 €
2,Mercedes,23189 €


<br>

Die Python-Methode `.split()` unterteilt einen `String` in eine `list`. Die Werte in der resultierenden Liste werden anhand eines Trennzeichens getrennt. Das Trennzeichen ist standardmäßig ein Leerzeichen. Übliche Trennzeichen sind **Leerzeichen** und **Kommas**.

![title](./pic/aditional_functions/replace_split/3_split.png)

Als nächstes können wir die Methode `.split()` verwenden. Dieser Methode übergeben wir einen `Char`, andem ein `String` aufgespalten werden soll. Resultierend daraus erhalten wir eine `list` zurück, die die jeweils getrennten Elemente beinhaltet.

In [447]:
cars.loc[0, 'preis']

'19999 €'

In [448]:
cars.loc[0, 'preis'].split(' ')

['19999', '€']

Abschließend können wir mit dem einfach `[]`-Operator, auf das von uns gewünschte Element zugreifen und erhalten dadurch genau die Zahl, die wir für weitere Analyse benötigen.

In [449]:
cars.loc[0, 'preis'].split(' ')[0]

'19999'

In [450]:
for i in trange(len(cars)):
    cars.loc[i, 'preis'] = cars.loc[i, 'preis'].split(' ')[0]

  0%|          | 0/3 [00:00<?, ?it/s]

In [451]:
cars

Unnamed: 0,marke,preis
0,Bmw,19999
1,Audi,12456
2,Mercedes,23189


---

## Real-Word Dataset: Cars Datensatz Feature `Preis` Preprocessing

In [452]:
df = pd.read_csv('./csv/replace_split/cars.csv', index_col=0)
df.head()

Unnamed: 0,marke,modell,preis,kilometer,erstzulassung,kraftstoffart,getriebe,leistung,hubraum,hu,...,anzahlSitzplaetze,anzahlderTueren,schadstoffklasse,umweltplakette,klimatisierung,einparkhilfe,airbags,innenausstattung,ausstattung,Unnamed: 23
0,Volkswagen,Golf,9.797 €,79.449 km,04/2011,Benzin,Schaltgetriebe,63 kW (86 PS),1.197 cm³,Neu,...,5.0,4/5,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Alcantara, Schwarz","ABS,Alarmanlage,Armlehne,Bordcomputer,CD-Spiel...",
1,Volkswagen,Golf,13.890 €,76.486 km,01/2015,"Benzin, E10-geeignet",Schaltgetriebe,92 kW (125 PS),1.395 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),2-Zonen-Klimaautomatik,Hinten,"Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Ambiente-Beleuchtung,Armlehne,Berganfahras...",
2,Mercedes-Benz,SLK 300,19.990 €,84.000 km,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
3,Mercedes-Benz,SLK 350,19.990 €,84.000 km,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
4,Mercedes-Benz,A 220,17.450 €,109.252 km,12/2012,Diesel,Automatik,125 kW (170 PS),2.143 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),Klimaanlage,"Vorne, Hinten, Kamera, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Abstandswarner,Armlehne,Berganfahrassisten...",


---

In [453]:
df['preis']

0        9.797 €
1       13.890 €
2       19.990 €
3       19.990 €
4       17.450 €
          ...   
9995    14.900 €
9996    17.990 €
9997    16.490 €
9998    14.749 €
9999    12.950 €
Name: preis, Length: 10000, dtype: object

In [454]:
type(df.loc[0, 'preis'])

str

In [455]:
df["preis"] = df["preis"].str.replace('.', '')

  """Entry point for launching an IPython kernel.


In [456]:
df.head()

Unnamed: 0,marke,modell,preis,kilometer,erstzulassung,kraftstoffart,getriebe,leistung,hubraum,hu,...,anzahlSitzplaetze,anzahlderTueren,schadstoffklasse,umweltplakette,klimatisierung,einparkhilfe,airbags,innenausstattung,ausstattung,Unnamed: 23
0,Volkswagen,Golf,9797 €,79.449 km,04/2011,Benzin,Schaltgetriebe,63 kW (86 PS),1.197 cm³,Neu,...,5.0,4/5,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Alcantara, Schwarz","ABS,Alarmanlage,Armlehne,Bordcomputer,CD-Spiel...",
1,Volkswagen,Golf,13890 €,76.486 km,01/2015,"Benzin, E10-geeignet",Schaltgetriebe,92 kW (125 PS),1.395 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),2-Zonen-Klimaautomatik,Hinten,"Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Ambiente-Beleuchtung,Armlehne,Berganfahras...",
2,Mercedes-Benz,SLK 300,19990 €,84.000 km,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
3,Mercedes-Benz,SLK 350,19990 €,84.000 km,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
4,Mercedes-Benz,A 220,17450 €,109.252 km,12/2012,Diesel,Automatik,125 kW (170 PS),2.143 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),Klimaanlage,"Vorne, Hinten, Kamera, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Abstandswarner,Armlehne,Berganfahrassisten...",


In [457]:
df.shape

(10000, 24)

In [458]:
df.count(0)

marke                      9541
modell                     9541
preis                      9523
kilometer                  9501
erstzulassung              9466
kraftstoffart              9523
getriebe                   9522
leistung                   9523
hubraum                    9494
hu                         8530
plz                        9541
farbe                      9517
anzahlderFahrzeughalter    7927
kategorie                  9523
anzahlSitzplaetze          9508
anzahlderTueren            9520
schadstoffklasse           8589
umweltplakette             9014
klimatisierung             9087
einparkhilfe               9444
airbags                    9500
innenausstattung           9521
ausstattung                9522
Unnamed: 23                   0
dtype: int64

In [459]:
type(df.preis[0])

str

In [460]:
df.loc[0, 'preis']

'9797 €'

In [461]:
df.loc[0, 'preis'].split(' ')

['9797', '€']

In [462]:
df.loc[0, 'preis'].split(' ')[0]

'9797'

In [463]:
type(df.loc[0, 'preis'].split(' ')[0])

str

In [464]:
int(df.loc[0, 'preis'].split(' ')[0])

9797

In [465]:
for i in trange(len(df)):
    try:
        df.loc[i, 'preis'] = int(df.loc[i, 'preis'].split(' ')[0])
    except:
        df.loc[i, 'preis'] = 'Nan'

  0%|          | 0/10000 [00:00<?, ?it/s]

In [466]:
df.preis.head()

0     9797
1    13890
2    19990
3    19990
4    17450
Name: preis, dtype: object

In [467]:
type(df.preis[0])

int

---

## `for-loop` vermeiden

In [468]:
df = pd.read_csv('./csv/replace_split/cars.csv', index_col=0)

In [469]:
df["preis"] = df["preis"].str.replace('.', '')

  """Entry point for launching an IPython kernel.


In [470]:
df.head(3)

Unnamed: 0,marke,modell,preis,kilometer,erstzulassung,kraftstoffart,getriebe,leistung,hubraum,hu,...,anzahlSitzplaetze,anzahlderTueren,schadstoffklasse,umweltplakette,klimatisierung,einparkhilfe,airbags,innenausstattung,ausstattung,Unnamed: 23
0,Volkswagen,Golf,9797 €,79.449 km,04/2011,Benzin,Schaltgetriebe,63 kW (86 PS),1.197 cm³,Neu,...,5.0,4/5,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Alcantara, Schwarz","ABS,Alarmanlage,Armlehne,Bordcomputer,CD-Spiel...",
1,Volkswagen,Golf,13890 €,76.486 km,01/2015,"Benzin, E10-geeignet",Schaltgetriebe,92 kW (125 PS),1.395 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),2-Zonen-Klimaautomatik,Hinten,"Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Ambiente-Beleuchtung,Armlehne,Berganfahras...",
2,Mercedes-Benz,SLK 300,19990 €,84.000 km,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",


In [471]:
df_preis_null = df[df['preis'].isna()]
df_preis_null

Unnamed: 0,marke,modell,preis,kilometer,erstzulassung,kraftstoffart,getriebe,leistung,hubraum,hu,...,anzahlSitzplaetze,anzahlderTueren,schadstoffklasse,umweltplakette,klimatisierung,einparkhilfe,airbags,innenausstattung,ausstattung,Unnamed: 23
10,,,,,,,,,,,...,,,,,,,,,,
75,Mercedes-Benz,A 180,,,,,,,,,...,,,,,,,,,,
87,,,,,,,,,,,...,,,,,,,,,,
90,,,,,,,,,,,...,,,,,,,,,,
117,,,,,,,,,,,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
9902,,,,,,,,,,,...,,,,,,,,,,
9923,,,,,,,,,,,...,,,,,,,,,,
9944,,,,,,,,,,,...,,,,,,,,,,
9965,,,,,,,,,,,...,,,,,,,,,,


In [472]:
df = df.dropna(subset=['preis'])
df.shape

(9523, 24)

In [473]:
df["preis"] = df.preis.str.split(" ", expand=True)[0].astype(int)

In [474]:
df.head()

Unnamed: 0,marke,modell,preis,kilometer,erstzulassung,kraftstoffart,getriebe,leistung,hubraum,hu,...,anzahlSitzplaetze,anzahlderTueren,schadstoffklasse,umweltplakette,klimatisierung,einparkhilfe,airbags,innenausstattung,ausstattung,Unnamed: 23
0,Volkswagen,Golf,9797,79.449 km,04/2011,Benzin,Schaltgetriebe,63 kW (86 PS),1.197 cm³,Neu,...,5.0,4/5,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Alcantara, Schwarz","ABS,Alarmanlage,Armlehne,Bordcomputer,CD-Spiel...",
1,Volkswagen,Golf,13890,76.486 km,01/2015,"Benzin, E10-geeignet",Schaltgetriebe,92 kW (125 PS),1.395 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),2-Zonen-Klimaautomatik,Hinten,"Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Ambiente-Beleuchtung,Armlehne,Berganfahras...",
2,Mercedes-Benz,SLK 300,19990,84.000 km,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
3,Mercedes-Benz,SLK 350,19990,84.000 km,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
4,Mercedes-Benz,A 220,17450,109.252 km,12/2012,Diesel,Automatik,125 kW (170 PS),2.143 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),Klimaanlage,"Vorne, Hinten, Kamera, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Abstandswarner,Armlehne,Berganfahrassisten...",


In [475]:
df_final = pd.concat([df, df_preis_null])

In [476]:
df_final

Unnamed: 0,marke,modell,preis,kilometer,erstzulassung,kraftstoffart,getriebe,leistung,hubraum,hu,...,anzahlSitzplaetze,anzahlderTueren,schadstoffklasse,umweltplakette,klimatisierung,einparkhilfe,airbags,innenausstattung,ausstattung,Unnamed: 23
0,Volkswagen,Golf,9797,79.449 km,04/2011,Benzin,Schaltgetriebe,63 kW (86 PS),1.197 cm³,Neu,...,5.0,4/5,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Alcantara, Schwarz","ABS,Alarmanlage,Armlehne,Bordcomputer,CD-Spiel...",
1,Volkswagen,Golf,13890,76.486 km,01/2015,"Benzin, E10-geeignet",Schaltgetriebe,92 kW (125 PS),1.395 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),2-Zonen-Klimaautomatik,Hinten,"Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Ambiente-Beleuchtung,Armlehne,Berganfahras...",
2,Mercedes-Benz,SLK 300,19990,84.000 km,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
3,Mercedes-Benz,SLK 350,19990,84.000 km,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
4,Mercedes-Benz,A 220,17450,109.252 km,12/2012,Diesel,Automatik,125 kW (170 PS),2.143 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),Klimaanlage,"Vorne, Hinten, Kamera, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Abstandswarner,Armlehne,Berganfahrassisten...",
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
9902,,,,,,,,,,,...,,,,,,,,,,
9923,,,,,,,,,,,...,,,,,,,,,,
9944,,,,,,,,,,,...,,,,,,,,,,
9965,,,,,,,,,,,...,,,,,,,,,,


In [477]:
df_final.sort_index()

Unnamed: 0,marke,modell,preis,kilometer,erstzulassung,kraftstoffart,getriebe,leistung,hubraum,hu,...,anzahlSitzplaetze,anzahlderTueren,schadstoffklasse,umweltplakette,klimatisierung,einparkhilfe,airbags,innenausstattung,ausstattung,Unnamed: 23
0,Volkswagen,Golf,9797,79.449 km,04/2011,Benzin,Schaltgetriebe,63 kW (86 PS),1.197 cm³,Neu,...,5.0,4/5,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Alcantara, Schwarz","ABS,Alarmanlage,Armlehne,Bordcomputer,CD-Spiel...",
1,Volkswagen,Golf,13890,76.486 km,01/2015,"Benzin, E10-geeignet",Schaltgetriebe,92 kW (125 PS),1.395 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),2-Zonen-Klimaautomatik,Hinten,"Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Ambiente-Beleuchtung,Armlehne,Berganfahras...",
2,Mercedes-Benz,SLK 300,19990,84.000 km,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
3,Mercedes-Benz,SLK 350,19990,84.000 km,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
4,Mercedes-Benz,A 220,17450,109.252 km,12/2012,Diesel,Automatik,125 kW (170 PS),2.143 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),Klimaanlage,"Vorne, Hinten, Kamera, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Abstandswarner,Armlehne,Berganfahrassisten...",
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
9995,Volkswagen,Golf,14900,93.500 km,09/2013,Benzin,Automatik,90 kW (122 PS),1.395 cm³,Neu,...,5.0,4/5,Euro5,4 (Grün),2-Zonen-Klimaautomatik,"Vorne, Hinten, Kamera, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Teilleder, Schwarz","Abstandstempomat,Alarmanlage,Ambiente-Beleucht...",
9996,Audi,A4,17990,96.500 km,07/2013,Benzin,Automatik,165 kW (224 PS),1.984 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),3-Zonen-Klimaautomatik,"Vorne, Hinten","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Armlehne,Bi-Xenon Scheinwerfer,Bluetooth,B...",
9997,Volkswagen,Golf,16490,103.000 km,02/2014,Benzin,Schaltgetriebe,162 kW (220 PS),1.984 cm³,06/2023,...,5.0,2/3,Euro6,4 (Grün),Klimaautomatik,"Vorne, Hinten","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Alarmanlage,Ambiente-Beleuchtung,Armlehne,...",
9998,BMW,320,14749,94.505 km,11/2011,Diesel,Automatik,135 kW (184 PS),1.995 cm³,01/2024,...,5.0,4/5,Euro5,4 (Grün),2-Zonen-Klimaautomatik,Hinten,"Front-, Seiten- und weitere Airbags","Vollleder, Schwarz","ABS,Adaptives Kurvenlicht,Armlehne,Bluetooth,B...",


---

## Übung: Cars Datensatz Feature `Kilometer` Preprocessing

In [478]:
df = df_final.copy()

### 1) Values checken

In [479]:
df.count(0)

marke                      9541
modell                     9541
preis                      9523
kilometer                  9501
erstzulassung              9466
kraftstoffart              9523
getriebe                   9522
leistung                   9523
hubraum                    9494
hu                         8530
plz                        9541
farbe                      9517
anzahlderFahrzeughalter    7927
kategorie                  9523
anzahlSitzplaetze          9508
anzahlderTueren            9520
schadstoffklasse           8589
umweltplakette             9014
klimatisierung             9087
einparkhilfe               9444
airbags                    9500
innenausstattung           9521
ausstattung                9522
Unnamed: 23                   0
dtype: int64

### 2) `.replace()`

In [480]:
df["kilometer"] = df["kilometer"].str.replace('.', '')

  """Entry point for launching an IPython kernel.


In [481]:
df.head()

Unnamed: 0,marke,modell,preis,kilometer,erstzulassung,kraftstoffart,getriebe,leistung,hubraum,hu,...,anzahlSitzplaetze,anzahlderTueren,schadstoffklasse,umweltplakette,klimatisierung,einparkhilfe,airbags,innenausstattung,ausstattung,Unnamed: 23
0,Volkswagen,Golf,9797,79449 km,04/2011,Benzin,Schaltgetriebe,63 kW (86 PS),1.197 cm³,Neu,...,5.0,4/5,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Alcantara, Schwarz","ABS,Alarmanlage,Armlehne,Bordcomputer,CD-Spiel...",
1,Volkswagen,Golf,13890,76486 km,01/2015,"Benzin, E10-geeignet",Schaltgetriebe,92 kW (125 PS),1.395 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),2-Zonen-Klimaautomatik,Hinten,"Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Ambiente-Beleuchtung,Armlehne,Berganfahras...",
2,Mercedes-Benz,SLK 300,19990,84000 km,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
3,Mercedes-Benz,SLK 350,19990,84000 km,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
4,Mercedes-Benz,A 220,17450,109252 km,12/2012,Diesel,Automatik,125 kW (170 PS),2.143 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),Klimaanlage,"Vorne, Hinten, Kamera, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Abstandswarner,Armlehne,Berganfahrassisten...",


### 3) `.split()`

In [482]:
df_km_nan = df[df['kilometer'].isnull()]
# df_km_nan

In [483]:
df = df.dropna(subset=['kilometer'])
df.shape

(9501, 24)

In [484]:
df.loc[0, 'kilometer']

'79449\xa0km'

In [485]:
df.loc[0, 'kilometer'].split("\xa0")

['79449', 'km']

In [486]:
df.loc[0, 'kilometer'].split("\xa0")[0]

'79449'

In [487]:
df["kilometer"] = df.kilometer.str.split("\xa0", expand=True)[0].astype(int)

In [488]:
df

Unnamed: 0,marke,modell,preis,kilometer,erstzulassung,kraftstoffart,getriebe,leistung,hubraum,hu,...,anzahlSitzplaetze,anzahlderTueren,schadstoffklasse,umweltplakette,klimatisierung,einparkhilfe,airbags,innenausstattung,ausstattung,Unnamed: 23
0,Volkswagen,Golf,9797,79449,04/2011,Benzin,Schaltgetriebe,63 kW (86 PS),1.197 cm³,Neu,...,5.0,4/5,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Alcantara, Schwarz","ABS,Alarmanlage,Armlehne,Bordcomputer,CD-Spiel...",
1,Volkswagen,Golf,13890,76486,01/2015,"Benzin, E10-geeignet",Schaltgetriebe,92 kW (125 PS),1.395 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),2-Zonen-Klimaautomatik,Hinten,"Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Ambiente-Beleuchtung,Armlehne,Berganfahras...",
2,Mercedes-Benz,SLK 300,19990,84000,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
3,Mercedes-Benz,SLK 350,19990,84000,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
4,Mercedes-Benz,A 220,17450,109252,12/2012,Diesel,Automatik,125 kW (170 PS),2.143 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),Klimaanlage,"Vorne, Hinten, Kamera, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Abstandswarner,Armlehne,Berganfahrassisten...",
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
9995,Volkswagen,Golf,14900,93500,09/2013,Benzin,Automatik,90 kW (122 PS),1.395 cm³,Neu,...,5.0,4/5,Euro5,4 (Grün),2-Zonen-Klimaautomatik,"Vorne, Hinten, Kamera, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Teilleder, Schwarz","Abstandstempomat,Alarmanlage,Ambiente-Beleucht...",
9996,Audi,A4,17990,96500,07/2013,Benzin,Automatik,165 kW (224 PS),1.984 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),3-Zonen-Klimaautomatik,"Vorne, Hinten","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Armlehne,Bi-Xenon Scheinwerfer,Bluetooth,B...",
9997,Volkswagen,Golf,16490,103000,02/2014,Benzin,Schaltgetriebe,162 kW (220 PS),1.984 cm³,06/2023,...,5.0,2/3,Euro6,4 (Grün),Klimaautomatik,"Vorne, Hinten","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Alarmanlage,Ambiente-Beleuchtung,Armlehne,...",
9998,BMW,320,14749,94505,11/2011,Diesel,Automatik,135 kW (184 PS),1.995 cm³,01/2024,...,5.0,4/5,Euro5,4 (Grün),2-Zonen-Klimaautomatik,Hinten,"Front-, Seiten- und weitere Airbags","Vollleder, Schwarz","ABS,Adaptives Kurvenlicht,Armlehne,Bluetooth,B...",


In [489]:
df_final = pd.concat([df, df_km_nan])
df_final

Unnamed: 0,marke,modell,preis,kilometer,erstzulassung,kraftstoffart,getriebe,leistung,hubraum,hu,...,anzahlSitzplaetze,anzahlderTueren,schadstoffklasse,umweltplakette,klimatisierung,einparkhilfe,airbags,innenausstattung,ausstattung,Unnamed: 23
0,Volkswagen,Golf,9797,79449,04/2011,Benzin,Schaltgetriebe,63 kW (86 PS),1.197 cm³,Neu,...,5.0,4/5,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Alcantara, Schwarz","ABS,Alarmanlage,Armlehne,Bordcomputer,CD-Spiel...",
1,Volkswagen,Golf,13890,76486,01/2015,"Benzin, E10-geeignet",Schaltgetriebe,92 kW (125 PS),1.395 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),2-Zonen-Klimaautomatik,Hinten,"Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Ambiente-Beleuchtung,Armlehne,Berganfahras...",
2,Mercedes-Benz,SLK 300,19990,84000,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
3,Mercedes-Benz,SLK 350,19990,84000,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
4,Mercedes-Benz,A 220,17450,109252,12/2012,Diesel,Automatik,125 kW (170 PS),2.143 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),Klimaanlage,"Vorne, Hinten, Kamera, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Abstandswarner,Armlehne,Berganfahrassisten...",
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
9902,,,,,,,,,,,...,,,,,,,,,,
9923,,,,,,,,,,,...,,,,,,,,,,
9944,,,,,,,,,,,...,,,,,,,,,,
9965,,,,,,,,,,,...,,,,,,,,,,


In [490]:
df_final.sort_index()

Unnamed: 0,marke,modell,preis,kilometer,erstzulassung,kraftstoffart,getriebe,leistung,hubraum,hu,...,anzahlSitzplaetze,anzahlderTueren,schadstoffklasse,umweltplakette,klimatisierung,einparkhilfe,airbags,innenausstattung,ausstattung,Unnamed: 23
0,Volkswagen,Golf,9797,79449,04/2011,Benzin,Schaltgetriebe,63 kW (86 PS),1.197 cm³,Neu,...,5.0,4/5,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Alcantara, Schwarz","ABS,Alarmanlage,Armlehne,Bordcomputer,CD-Spiel...",
1,Volkswagen,Golf,13890,76486,01/2015,"Benzin, E10-geeignet",Schaltgetriebe,92 kW (125 PS),1.395 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),2-Zonen-Klimaautomatik,Hinten,"Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Ambiente-Beleuchtung,Armlehne,Berganfahras...",
2,Mercedes-Benz,SLK 300,19990,84000,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
3,Mercedes-Benz,SLK 350,19990,84000,07/2009,Benzin,Automatik,170 kW (231 PS),2.997 cm³,08/2023,...,2.0,2/3,Euro5,4 (Grün),Klimaautomatik,"Vorne, Hinten",Front- und Seiten-Airbags,"Vollleder, Schwarz","ABS,Armlehne,Berganfahrassistent,Bi-Xenon Sche...",
4,Mercedes-Benz,A 220,17450,109252,12/2012,Diesel,Automatik,125 kW (170 PS),2.143 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),Klimaanlage,"Vorne, Hinten, Kamera, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Abstandswarner,Armlehne,Berganfahrassisten...",
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
9995,Volkswagen,Golf,14900,93500,09/2013,Benzin,Automatik,90 kW (122 PS),1.395 cm³,Neu,...,5.0,4/5,Euro5,4 (Grün),2-Zonen-Klimaautomatik,"Vorne, Hinten, Kamera, Selbstlenkende Systeme","Front-, Seiten- und weitere Airbags","Teilleder, Schwarz","Abstandstempomat,Alarmanlage,Ambiente-Beleucht...",
9996,Audi,A4,17990,96500,07/2013,Benzin,Automatik,165 kW (224 PS),1.984 cm³,Neu,...,5.0,4/5,Euro6,4 (Grün),3-Zonen-Klimaautomatik,"Vorne, Hinten","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Armlehne,Bi-Xenon Scheinwerfer,Bluetooth,B...",
9997,Volkswagen,Golf,16490,103000,02/2014,Benzin,Schaltgetriebe,162 kW (220 PS),1.984 cm³,06/2023,...,5.0,2/3,Euro6,4 (Grün),Klimaautomatik,"Vorne, Hinten","Front-, Seiten- und weitere Airbags","Stoff, Schwarz","ABS,Alarmanlage,Ambiente-Beleuchtung,Armlehne,...",
9998,BMW,320,14749,94505,11/2011,Diesel,Automatik,135 kW (184 PS),1.995 cm³,01/2024,...,5.0,4/5,Euro5,4 (Grün),2-Zonen-Klimaautomatik,Hinten,"Front-, Seiten- und weitere Airbags","Vollleder, Schwarz","ABS,Adaptives Kurvenlicht,Armlehne,Bluetooth,B...",


In [493]:
df.preis.mean()

19071.815177349752

In [494]:
df.kilometer.mean()

91602.25870960951