<div style="text-align: right"> Prepared by Fanny Giroud for   
<a href="https://www.cfjm.ch/course/coder-pour-enqueter-niveau-1/">CFJM data workshop 2021</a> </div>

# Tips for Data Cleaning

1. Get column names
2. Recognize the data
3. Slicing the data
4. Check duplicates
5. NaN values
6. Check data types of variables
7. Working with dates
8. Get answers
9. Export results
10. More transformations


## How many CH council members with age over 64 ?


In [186]:
import pandas as pd
import datetime
pd.options.display.max_columns = None

In [187]:
df = pd.read_excel('parlementaires.xlsx')

In [188]:
df.head()

Unnamed: 0,Active,FirstName,LastName,GenderAsString,CantonName,CantonAbbreviation,CouncilName,ParlGroupName,ParlGroupAbbreviation,PartyName,PartyAbbreviation,MaritalStatusText,BirthPlace_City,BirthPlace_Canton,Mandates,DateJoining,DateLeaving,Citizenship,DateOfBirth,DateOfDeath
0,False,Giuseppe,a Marca,m,Grisons,GR,Conseil des Etats,Centre,MC,Conservateurs,Cons*,,,,,01/12/1849,01/07/1851,Soazza (GR),29/07/1799,16/07/1866
1,False,Alois,Ab Yberg,m,Schwyz,SZ,Conseil national,Groupe radical-démocratique,R,Parti radical-démocratique suisse,PRD,,,,,03/12/1928,01/12/1935,Schwyz (SZ),06/10/1878,17/10/1959
2,False,Fabio,Abate,m,Tessin,TI,Conseil national,Groupe radical-libéral,RL,Parti radical-démocratique suisse,PRD,,Locarno,Tessin,incarichi esecutivi presso il comune di Locarn...,03/12/2007,04/12/2011,Cabbio (TI),04/01/1966,
3,False,Fabio,Abate,m,Tessin,TI,Conseil national,Groupe radical-libéral,R,Parti radical-démocratique suisse,PRD,,Locarno,Tessin,incarichi esecutivi presso il comune di Locarn...,25/09/2000,30/11/2003,Cabbio (TI),04/01/1966,
4,False,Fabio,Abate,m,Tessin,TI,Conseil des Etats,Groupe libéral-radical,RL,PLR.Les Libéraux-Radicaux,PLR,,Locarno,Tessin,incarichi esecutivi presso il comune di Locarn...,05/12/2011,29/11/2015,Cabbio (TI),04/01/1966,


#### 1. Get column names

In [189]:
list(df)

['Active',
 'FirstName',
 'LastName',
 'GenderAsString',
 'CantonName',
 'CantonAbbreviation',
 'CouncilName',
 'ParlGroupName',
 'ParlGroupAbbreviation',
 'PartyName',
 'PartyAbbreviation',
 'MaritalStatusText',
 'BirthPlace_City',
 'BirthPlace_Canton',
 'Mandates',
 'DateJoining',
 'DateLeaving',
 'Citizenship',
 'DateOfBirth',
 'DateOfDeath']

#### 2. Quick look to recognize the data


In [190]:
df['CouncilName'].value_counts()

Conseil national     4587
Conseil des Etats    1481
Conseil fédéral       350
Name: CouncilName, dtype: int64

In [191]:
df['Active'].value_counts()

False    6150
True      273
Name: Active, dtype: int64

#### 3. Slice up the data  

In [192]:
df = df[df['Active'] == True]

In [193]:
200 + 46 + 7

253

In [194]:
len(df)

# Still 20 extra lines

273

#### 4. Check for duplicates and drop duplicates

In [195]:
df[df.duplicated()]

Unnamed: 0,Active,FirstName,LastName,GenderAsString,CantonName,CantonAbbreviation,CouncilName,ParlGroupName,ParlGroupAbbreviation,PartyName,PartyAbbreviation,MaritalStatusText,BirthPlace_City,BirthPlace_Canton,Mandates,DateJoining,DateLeaving,Citizenship,DateOfBirth,DateOfDeath
2264,True,Andrea,Gmür-Schönenberger,f,Lucerne,LU,Conseil des Etats,Le groupe du centre. PDC-PEV-PBD.,M-CEB,Parti démocrate-chrétien suisse,PDC,,Wattwil,St-Gall,Legislative des Kantons Luzern: von 2007 bis 2...,02/12/2019,,"Lucerne (LU),Amden (SG),Kirchberg (SG)",17/07/1964,
4003,True,Leo,Müller,m,Lucerne,LU,Conseil national,Le groupe du centre. PDC-PEV-PBD.,M-CEB,Parti démocrate-chrétien suisse,PDC,marié(e),Ruswil,Lucerne,Legislative des Kantons (Kantonsrat): 21. Apri...,02/12/2019,,"Ruswil (LU),Schüpfheim (LU)",04/07/1958,


In [196]:
df[df['LastName']=='Gmür-Schönenberger']

Unnamed: 0,Active,FirstName,LastName,GenderAsString,CantonName,CantonAbbreviation,CouncilName,ParlGroupName,ParlGroupAbbreviation,PartyName,PartyAbbreviation,MaritalStatusText,BirthPlace_City,BirthPlace_Canton,Mandates,DateJoining,DateLeaving,Citizenship,DateOfBirth,DateOfDeath
2263,True,Andrea,Gmür-Schönenberger,f,Lucerne,LU,Conseil des Etats,Le groupe du centre. PDC-PEV-PBD.,M-CEB,Parti démocrate-chrétien suisse,PDC,,Wattwil,St-Gall,Legislative des Kantons Luzern: von 2007 bis 2...,02/12/2019,,"Lucerne (LU),Amden (SG),Kirchberg (SG)",17/07/1964,
2264,True,Andrea,Gmür-Schönenberger,f,Lucerne,LU,Conseil des Etats,Le groupe du centre. PDC-PEV-PBD.,M-CEB,Parti démocrate-chrétien suisse,PDC,,Wattwil,St-Gall,Legislative des Kantons Luzern: von 2007 bis 2...,02/12/2019,,"Lucerne (LU),Amden (SG),Kirchberg (SG)",17/07/1964,


In [197]:
df[df['LastName']=='Müller']

Unnamed: 0,Active,FirstName,LastName,GenderAsString,CantonName,CantonAbbreviation,CouncilName,ParlGroupName,ParlGroupAbbreviation,PartyName,PartyAbbreviation,MaritalStatusText,BirthPlace_City,BirthPlace_Canton,Mandates,DateJoining,DateLeaving,Citizenship,DateOfBirth,DateOfDeath
4002,True,Leo,Müller,m,Lucerne,LU,Conseil national,Le groupe du centre. PDC-PEV-PBD.,M-CEB,Parti démocrate-chrétien suisse,PDC,marié(e),Ruswil,Lucerne,Legislative des Kantons (Kantonsrat): 21. Apri...,02/12/2019,,"Ruswil (LU),Schüpfheim (LU)",04/07/1958,
4003,True,Leo,Müller,m,Lucerne,LU,Conseil national,Le groupe du centre. PDC-PEV-PBD.,M-CEB,Parti démocrate-chrétien suisse,PDC,marié(e),Ruswil,Lucerne,Legislative des Kantons (Kantonsrat): 21. Apri...,02/12/2019,,"Ruswil (LU),Schüpfheim (LU)",04/07/1958,
4004,True,Damian,Müller,m,Lucerne,LU,Conseil des Etats,Groupe libéral-radical,RL,PLR.Les Libéraux-Radicaux,PLR,,Ermensee,Lucerne,,02/12/2019,,Ermensee (LU),25/10/1984,


In [198]:
df = df.drop_duplicates()
len(df)

271

In [199]:
df[df['LastName']=='Gmür-Schönenberger']

Unnamed: 0,Active,FirstName,LastName,GenderAsString,CantonName,CantonAbbreviation,CouncilName,ParlGroupName,ParlGroupAbbreviation,PartyName,PartyAbbreviation,MaritalStatusText,BirthPlace_City,BirthPlace_Canton,Mandates,DateJoining,DateLeaving,Citizenship,DateOfBirth,DateOfDeath
2263,True,Andrea,Gmür-Schönenberger,f,Lucerne,LU,Conseil des Etats,Le groupe du centre. PDC-PEV-PBD.,M-CEB,Parti démocrate-chrétien suisse,PDC,,Wattwil,St-Gall,Legislative des Kantons Luzern: von 2007 bis 2...,02/12/2019,,"Lucerne (LU),Amden (SG),Kirchberg (SG)",17/07/1964,


In [200]:
df['CouncilName'].value_counts()

Conseil national     200
Conseil des Etats     46
Conseil fédéral       24
Name: CouncilName, dtype: int64

In [201]:
df[df['CouncilName'] == 'Conseil fédéral']

# DateJoining differs!

Unnamed: 0,Active,FirstName,LastName,GenderAsString,CantonName,CantonAbbreviation,CouncilName,ParlGroupName,ParlGroupAbbreviation,PartyName,PartyAbbreviation,MaritalStatusText,BirthPlace_City,BirthPlace_Canton,Mandates,DateJoining,DateLeaving,Citizenship,DateOfBirth,DateOfDeath
122,True,Viola,Amherd,f,Valais,VS,Conseil fédéral,,,Parti démocrate-chrétien suisse,PDC,,Brigue,Valais,Exekutive der Gemeinde (Stadträtin) Brig-Glis:...,01/01/2019,,"Mund (VS),Brigue (VS),Zwischbergen (VS),Naters...",07/06/1962,
417,True,Alain,Berset,m,Fribourg,FR,Conseil fédéral,,,Parti socialiste suisse,PSS,,Fribourg,Fribourg,Législatif communal (conseil général) de Belfa...,01/01/2012,31/12/2016,Misery-Courtion (FR),09/04/1972,
418,True,Alain,Berset,m,Fribourg,FR,Conseil fédéral,,,Parti socialiste suisse,PSS,,Fribourg,Fribourg,Législatif communal (conseil général) de Belfa...,01/01/2017,31/12/2017,Misery-Courtion (FR),09/04/1972,
419,True,Alain,Berset,m,Fribourg,FR,Conseil fédéral,,,Parti socialiste suisse,PSS,,Fribourg,Fribourg,Législatif communal (conseil général) de Belfa...,01/01/2018,31/12/2018,Misery-Courtion (FR),09/04/1972,
420,True,Alain,Berset,m,Fribourg,FR,Conseil fédéral,,,Parti socialiste suisse,PSS,,Fribourg,Fribourg,Législatif communal (conseil général) de Belfa...,01/01/2019,,Misery-Courtion (FR),09/04/1972,
1033,True,Ignazio,Cassis,m,Tessin,TI,Conseil fédéral,,,PLR.Les Libéraux-Radicaux,PLR,,Sessa,Tessin,Legislativo del comune Collina d'Oro: da april...,01/11/2017,,"Biasca (TI),Sessa (TI)",13/04/1961,
3140,True,Karin,Keller-Sutter,f,St-Gall,SG,Conseil fédéral,,,PLR.Les Libéraux-Radicaux,PLR,marié(e),Niederuzwil,St-Gall,Legislative der Gemeinde Wil (SG): von Januar ...,01/01/2019,,"Kirchberg (SG),Jonschwil (SG)",22/12/1963,
3680,True,Ueli,Maurer,m,Zurich,ZH,Conseil fédéral,,,Union Démocratique du Centre,UDC,marié(e),Wetzikon (ZH),Zurich,Exekutive der Gemeinde (Gemeinderat Hinwil): v...,01/01/2012,31/12/2012,"Hinwil (ZH),Adelboden (BE)",01/12/1950,
3681,True,Ueli,Maurer,m,Zurich,ZH,Conseil fédéral,,,Union Démocratique du Centre,UDC,marié(e),Wetzikon (ZH),Zurich,Exekutive der Gemeinde (Gemeinderat Hinwil): v...,01/01/2013,31/12/2013,"Hinwil (ZH),Adelboden (BE)",01/12/1950,
3682,True,Ueli,Maurer,m,Zurich,ZH,Conseil fédéral,,,Union Démocratique du Centre,UDC,marié(e),Wetzikon (ZH),Zurich,Exekutive der Gemeinde (Gemeinderat Hinwil): v...,01/01/2014,31/12/2015,"Hinwil (ZH),Adelboden (BE)",01/12/1950,


#### 5. What are NaN values

In [202]:
# See columns with missing values

df[df.isnull().any(axis=1)]

Unnamed: 0,Active,FirstName,LastName,GenderAsString,CantonName,CantonAbbreviation,CouncilName,ParlGroupName,ParlGroupAbbreviation,PartyName,PartyAbbreviation,MaritalStatusText,BirthPlace_City,BirthPlace_Canton,Mandates,DateJoining,DateLeaving,Citizenship,DateOfBirth,DateOfDeath
22,True,Jean-Luc,Addor,m,Valais,VS,Conseil national,Groupe de l'Union démocratique du Centre,V,Union Démocratique du Centre,UDC,marié(e),Lausanne,Vaud,Député au Grand Conseil: 2005-2015; Conseiller...,02/12/2019,,"Ste-Croix (VD),Savièse (VS)",22/04/1964,
33,True,Andreas,Aebi,m,Berne,BE,Conseil national,Groupe de l'Union démocratique du Centre,V,Union Démocratique du Centre,UDC,marié(e),Burgdorf,Berne,Gemeindepräsident von Alchenstorf: von 1998 bi...,02/12/2019,,Wynigen (BE),26/11/1958,
38,True,Matthias,Aebischer,m,Berne,BE,Conseil national,Groupe socialiste,S,Parti socialiste suisse,PSS,,Schwarzenburg,Berne,,02/12/2019,,Guggisberg (BE),18/10/1967,
66,True,Thomas,Aeschi,m,Zoug,ZG,Conseil national,Groupe de l'Union démocratique du Centre,V,Union Démocratique du Centre,UDC,,Zoug,Zoug,Zuger Kantonsrat: 2010 - 2012,02/12/2019,,"Himmelried (SO),Baar (ZG),Bâle (BS)",13/01/1979,
114,True,Céline,Amaudruz,f,Genève,GE,Conseil national,Groupe de l'Union démocratique du Centre,V,Union Démocratique du Centre,UDC,,Genève,Genève,Organe législatif cantonal: depuis octobre 200...,02/12/2019,,Lutry (VD),15/03/1979,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
6268,True,Benedikt,Würth,m,St-Gall,SG,Conseil des Etats,Le groupe du centre. PDC-PEV-PBD.,M-CEB,Parti démocrate-chrétien suisse,PDC,,St. Gall,St-Gall,Regierungsrat des Kantons St. Gallen; Präsiden...,02/12/2019,,"Berg (SG),Rapperswil-Jona (SG)",20/01/1968,
6303,True,Roberto,Zanetti,m,Soleure,SO,Conseil des Etats,Groupe socialiste,S,Parti socialiste suisse,PSS,célibataire,Soleure,Soleure,Gemeinderat: von 1977 bis April 1980; Gemeinde...,02/12/2019,,Poschiavo (GR),14/12/1954,
6342,True,Heidi,Z'graggen,f,Uri,UR,Conseil des Etats,Le groupe du centre. PDC-PEV-PBD.,M-CEB,Parti démocrate-chrétien suisse,PDC,,Silenen,Uri,Regierungsrätin Kanton Uri: seit Juni 2004,02/12/2019,,Gurtnellen (UR),01/02/1966,
6375,True,Mathias,Zopfi,m,Glaris,GL,Conseil des Etats,Groupe des Verts,G,Parti écologiste suisse,PES,,Glarus Süd,Glaris,Gemeinderat Glarus Süd: seit Januar 2010; Land...,02/12/2019,,Glarus Süd (GL),14/12/1983,


In [203]:
len(df)

271

In [204]:
df = df[df['DateLeaving'].isnull()]

# Delete multiple entries for Conseil fédéral
# nb # pour retirer les duplicates si le champ date de fin est complet, on ne garde que les NaN (on garde car la valeur est nulle.)

len(df)

254

In [205]:
df = df[-df['CouncilName'].isnull()]
# nb # pour retirer la ligne avec CouncilName est NaN (on elimine car la valeur est nulle.)

In [206]:
len(df)

253

In [207]:
200+46+7

253

In [208]:
df['CouncilName'].value_counts()

Conseil national     200
Conseil des Etats     46
Conseil fédéral        7
Name: CouncilName, dtype: int64

#### 6. Check data types of variables

In [209]:
# We're interested in calculating age

In [210]:
type("skdjh")
# là il dit que c'est un string chaîne de caractère

str

In [211]:
df.dtypes
# pour connaître la nature des données 

Active                     bool
FirstName                object
LastName                 object
GenderAsString           object
CantonName               object
CantonAbbreviation       object
CouncilName              object
ParlGroupName            object
ParlGroupAbbreviation    object
PartyName                object
PartyAbbreviation        object
MaritalStatusText        object
BirthPlace_City          object
BirthPlace_Canton        object
Mandates                 object
DateJoining              object
DateLeaving              object
Citizenship              object
DateOfBirth              object
DateOfDeath              object
dtype: object

#### 7. Working with dates

In [212]:
# La library datetime a déjà été importée.
now = datetime.datetime.now()
now

datetime.datetime(2021, 6, 10, 11, 5, 10, 230919)

In [213]:
# Transform the data type to a date object

df['DateOfBirth'] = pd.to_datetime(df['DateOfBirth'])

df['DateOfBirth'].head()

# pour changer le format des dates de naissance

22    1964-04-22
33    1958-11-26
38    1967-10-18
66    1979-01-13
114   1979-03-15
Name: DateOfBirth, dtype: datetime64[ns]

In [214]:
# Calculate age en jour 

df['age'] = (now - df['DateOfBirth']) 

df['age'].head()

22    20868 days 11:05:10.230919
33    22842 days 11:05:10.230919
38    19594 days 11:05:10.230919
66    15489 days 11:05:10.230919
114   15428 days 11:05:10.230919
Name: age, dtype: timedelta64[ns]

In [215]:
# creation de la colonne age avec une division 365 pour avoir l'âge
df['age'] = df['age'].dt.days/365

df['age'].head()

22     57.172603
33     62.580822
38     53.682192
66     42.435616
114    42.268493
Name: age, dtype: float64

In [216]:
# la fonction 
df['age'] = round(df['age'])

df['age'].head()

22     57.0
33     63.0
38     54.0
66     42.0
114    42.0
Name: age, dtype: float64

In [217]:
df.sample()
# pour avoir un exemple

Unnamed: 0,Active,FirstName,LastName,GenderAsString,CantonName,CantonAbbreviation,CouncilName,ParlGroupName,ParlGroupAbbreviation,PartyName,PartyAbbreviation,MaritalStatusText,BirthPlace_City,BirthPlace_Canton,Mandates,DateJoining,DateLeaving,Citizenship,DateOfBirth,DateOfDeath,age
114,True,Céline,Amaudruz,f,Genève,GE,Conseil national,Groupe de l'Union démocratique du Centre,V,Union Démocratique du Centre,UDC,,Genève,Genève,Organe législatif cantonal: depuis octobre 200...,02/12/2019,,Lutry (VD),1979-03-15,,42.0


#### 8. Get answers

In [218]:
len(df)

253

In [219]:
len(df[df['age'] > 64])
#pour savoir qui a plus de 64

19

In [220]:
# Proportion of council members older that 64

len(df[df['age'] > 64]) / len(df) * 100

7.5098814229249005

In [221]:
# List of parlement members older than 64 yo (pour retirer conseil des états)

In [222]:
df = df[(df['CouncilName'] == 'Conseil national') | (df['CouncilName'] == 'Conseil des Etats')]
len(df)

246

In [223]:
len(df[df['age'] > 64])

18

In [224]:
len(df[df['age'] > 64]) / len(df) * 100

7.317073170731707

In [225]:
df[df['age'] > 64]
# avec [] on a un tableau
# copie coller dans excel du résulat ou  faire un export 

Unnamed: 0,Active,FirstName,LastName,GenderAsString,CantonName,CantonAbbreviation,CouncilName,ParlGroupName,ParlGroupAbbreviation,PartyName,PartyAbbreviation,MaritalStatusText,BirthPlace_City,BirthPlace_Canton,Mandates,DateJoining,DateLeaving,Citizenship,DateOfBirth,DateOfDeath,age
718,True,Daniel,Brélaz,m,Vaud,VD,Conseil national,Groupe des Verts,G,Parti écologiste suisse,PES,,Lausanne,Vaud,Législatif communal: depuis 1986 jusqu'en 1989...,02/12/2019,,Lutry (VD),1950-04-01,,71.0
1599,True,Kurt,Egger,m,Thurgovie,TG,Conseil national,Groupe des Verts,G,Parti écologiste suisse,PES,marié(e),St. Gall,St-Gall,Legislative des Kantons Thurgau: vom Mai 2012 ...,02/12/2019,,Eggersriet (SG),1956-01-19,,65.0
1717,True,Christoph,Eymann,m,Bâle-Ville,BS,Conseil national,Groupe libéral-radical,RL,Parti libéral démocrate,PLD,,Bâle,Bâle-Ville,Weiterer Bürgerrat: von 1989 bis 1991; Grosser...,02/12/2019,,Bâle (BS),1951-01-15,,70.0
1784,True,Laurence,Fehlmann Rielle,f,Genève,GE,Conseil national,Groupe socialiste,S,Parti socialiste suisse,PSS,marié(e),Chêne-Bougeries,Genève,Députée au Grand Conseil genevois: 1997-2009; ...,02/12/2019,,Genève (GE),1955-11-09,,66.0
1887,True,Kurt,Fluri,m,Soleure,SO,Conseil national,Groupe libéral-radical,RL,PLR.Les Libéraux-Radicaux,PLR,,Soleure,Soleure,Exekutive der Gemeinde: seit Juni 1985; Legisl...,02/12/2019,,"Soleure (SO),Herbetswil (SO)",1955-08-19,,66.0
1943,True,Olivier,Français,m,Vaud,VD,Conseil des Etats,Groupe libéral-radical,RL,PLR.Les Libéraux-Radicaux,PLR,,Metz,,Législatif communal: Conseiller communal depui...,02/12/2019,,Lausanne (VD),1955-01-10,,66.0
2180,True,Hannes,Germann,m,Schaffhouse,SH,Conseil des Etats,Groupe de l'Union démocratique du Centre,V,Union Démocratique du Centre,UDC,,Schaffhouse,Schaffhouse,Exekutive der Gemeinde: Präsident von Januar 1...,02/12/2019,,Merishausen (SH),1956-01-07,,65.0
2260,True,Alois,Gmür,m,Schwyz,SZ,Conseil national,Le groupe du centre. PDC-PEV-PBD.,M-CEB,Parti démocrate-chrétien suisse,PDC,marié(e),Einsiedeln,Schwyz,Bezirksrat Einsiedeln: von 1986 bis 2000; Bezi...,02/12/2019,,Amden (SG),1955-03-04,,66.0
2371,True,Jean-Pierre,Grin,m,Vaud,VD,Conseil national,Groupe de l'Union démocratique du Centre,V,Union Démocratique du Centre,UDC,,Valeyres-sous-Rances,Vaud,Législatif communal: depuis avril 1967 jusqu'à...,02/12/2019,,Belmont-sur-Yverdon (VD),1947-03-16,,74.0
2417,True,Jean-Paul,Gschwind,m,Jura,JU,Conseil national,Le groupe du centre. PDC-PEV-PBD.,M-CEB,Parti démocrate-chrétien suisse,PDC,,Porrentruy,Jura,Député au Parlement jurassien: depuis janvier ...,02/12/2019,,Damphreux (JU),1952-10-31,,69.0


In [229]:
df[df['age'].idxmax() == df.index]

Unnamed: 0,Active,FirstName,LastName,GenderAsString,CantonName,CantonAbbreviation,CouncilName,ParlGroupName,ParlGroupAbbreviation,PartyName,PartyAbbreviation,MaritalStatusText,BirthPlace_City,BirthPlace_Canton,Mandates,DateJoining,DateLeaving,Citizenship,DateOfBirth,DateOfDeath,age
2371,True,Jean-Pierre,Grin,m,Vaud,VD,Conseil national,Groupe de l'Union démocratique du Centre,V,Union Démocratique du Centre,UDC,,Valeyres-sous-Rances,Vaud,Législatif communal: depuis avril 1967 jusqu'à...,02/12/2019,,Belmont-sur-Yverdon (VD),1947-03-16,,74.0


In [None]:
df.sort_values( 'age')
# classement par age

In [None]:
df['age'].max()
# maximum dans la colonne age

#### 9. Export results


In [None]:
#df[df['age'] > 64][['FirstName', 'LastName', 'CantonName', 'CouncilName', 'age', 'DateOfBirth']].to_csv('export.csv')

In [None]:
df[df['age'] > 64][['FirstName', 'LastName', 'CantonName', 'CouncilName', 'age', 'DateOfBirth']].to_clipboard()

#### 10. More transformations


In [None]:
# Replace values
#df = df.replace("Vaud", "Waadt")

# Categorize
#df['group'] = 1
#df.loc[df['age'] > 64,'group'] = '2'

# Fill nan values with the value of your choice
#df.fillna()

# Change data type to numeric
#df['age'] = pd.to_numeric(df['age'])