# Project: Prediction of conclave result

Started: 18-01-2020
Authors: Jakub Kozlowski, Szymon Klepacki

---

## 1. Get data about past conclaves
Data for the project was scraped from Wikipedia's articles about past conclaves and currently living cardinals.

In [136]:
import pandas as pd
import numpy as np
from dateutil.relativedelta import relativedelta

In [137]:
col_names = ['Name', 'Country', 'Title', 'Title2', 'Date_of_birth', 'Date_of_election']

In [138]:
url_1922 = "https://it.wikipedia.org/wiki/Conclave_del_1922"
participants_1922 = pd.read_html(url_1922, parse_dates = True)[2]
participants_1922 = participants_1922[participants_1922.index.isin(participants_1922.index[1:])]
participants_1922.columns = col_names
participants_1922['Date'] = pd.to_datetime('02/02/1922', format = '%d/%m/%Y')

In [139]:
def select_new_pope(data):
    """
    Function applying '1' to the cardinal elected pope during a conclave
    
    :param x: str
    :return: 
    
    """
    data1 = data
    
    data1['Elected'] = data1['Name'].apply(lambda x: 1 if x[-13:] == '(eletto papa)' else 0)
    data1['Name'] = data1['Name'].apply(lambda x: x[:-14] if x[-13:] == '(eletto papa)' else x)

    return data1
    
select_new_pope(participants_1922)

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
1,Karl Joseph Schulte,Repubblica di Weimar,Cardinale presbitero dei Santi Quattro Coronati,Arcivescovo metropolita di Colonia,14/09/1871,07/03/1921,1922-02-02,0
2,Edmund Dalbor,Repubblica di Polonia,Cardinale presbitero di San Giovanni a Porta L...,Arcivescovo metropolita di Gniezno e Poznań,30/10/1869,15/12/1919,1922-02-02,0
3,Michael von Faulhaber,Repubblica di Weimar,Cardinale presbitero di Sant'Anastasia,Arcivescovo metropolita di Monaco e Frisinga,05/03/1869,07/03/1921,1922-02-02,0
4,Francisco de Asís Vidal y Barraquer,Regno di Spagna,Cardinale presbitero di Santa Sabina,Arcivescovo metropolita di Tarragona,03/10/1868,07/03/1921,1922-02-02,0
5,Rafael Merry del Val y Zulueta,Regno di Spagna,Cardinale presbitero di Santa Prassede,Arciprete della Basilica di San Pietro in Vati...,10/10/1865,09/11/1903,1922-02-02,0
6,Juan Benlloch y Vivó,Regno di Spagna,Cardinale presbitero di Santa Maria in Ara Coeli,Arcivescovo metropolita di Burgos,29/12/1864,07/03/1921,1922-02-02,0
7,Friedrich Gustav Piffl,Repubblica Austriaca,Cardinale presbitero di San Marco,Arcivescovo metropolita di Vienna,15/10/1864,25/05/1914,1922-02-02,0
8,Giovanni Tacci Porcelli,Italia,Cardinale presbitero di Santa Maria in Trastevere,Maestro di Camera emerito della Corte Pontificia,12/11/1863,13/06/1921,1922-02-02,0
9,Tommaso Pio Boggiani,Italia,Cardinale presbitero dei Santi Quirico e Giulitta,Arcivescovo emerito di Genova,19/01/1863,04/12/1916,1922-02-02,0
10,Aleksander Kakowski,Repubblica di Polonia,Cardinale presbitero di Sant'Agostino,Arcivescovo metropolita di Varsavia,05/02/1862,15/12/1919,1922-02-02,0


In [140]:
participants_1922.head()

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
1,Karl Joseph Schulte,Repubblica di Weimar,Cardinale presbitero dei Santi Quattro Coronati,Arcivescovo metropolita di Colonia,14/09/1871,07/03/1921,1922-02-02,0
2,Edmund Dalbor,Repubblica di Polonia,Cardinale presbitero di San Giovanni a Porta L...,Arcivescovo metropolita di Gniezno e Poznań,30/10/1869,15/12/1919,1922-02-02,0
3,Michael von Faulhaber,Repubblica di Weimar,Cardinale presbitero di Sant'Anastasia,Arcivescovo metropolita di Monaco e Frisinga,05/03/1869,07/03/1921,1922-02-02,0
4,Francisco de Asís Vidal y Barraquer,Regno di Spagna,Cardinale presbitero di Santa Sabina,Arcivescovo metropolita di Tarragona,03/10/1868,07/03/1921,1922-02-02,0
5,Rafael Merry del Val y Zulueta,Regno di Spagna,Cardinale presbitero di Santa Prassede,Arciprete della Basilica di San Pietro in Vati...,10/10/1865,09/11/1903,1922-02-02,0


In [141]:
url_1939 = "https://it.wikipedia.org/wiki/Conclave_del_1939"
participants_1939 = pd.read_html(url_1939, parse_dates = True)[2]
participants_1939 = participants_1939[participants_1939.index.isin(participants_1939.index[1:])]
participants_1939.columns = col_names
participants_1939['Date'] = pd.to_datetime('01/03/1939', format = '%d/%m/%Y')
select_new_pope(participants_1939)

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
1,Adeodato Giovanni Piazza,Italia,Cardinale presbitero di Santa Prisca,Patriarca di Venezia,20/09/1884,13/12/1937,1939-03-01,0
2,Jusztinián György Serédi,Ungheria,Cardinale presbitero dei Santi Andrea e Gregor...,Arcivescovo metropolita di Strigonio,23/04/1884,19/12/1927,1939-03-01,0
3,Eugène Tisserant,Francia,"Cardinale presbitero dei Santi Vito, Modesto e...",Segretario della Congregazione per le Chiese O...,24/03/1884,15/06/1936,1939-03-01,0
4,Achille Liénart,Francia,Cardinale presbitero di San Sisto,Vescovo di Lilla,07/02/1884,30/06/1930,1939-03-01,0
5,Jean-Marie-Rodrigue Villeneuve,Canada,Cardinale presbitero di Santa Maria degli Angeli,Arcivescovo metropolita di Québec,02/11/1883,13/03/1933,1939-03-01,0
...,...,...,...,...,...,...,...,...
57,Adolf Bertram,Germania,Cardinale presbitero di Sant'Agnese fuori le mura,Arcivescovo metropolita di Breslavia,14/03/1859,04/12/1916,1939-03-01,0
58,Alfred-Henri-Marie Baudrillart,Francia,Cardinale presbitero di San Bernardo alle Term...,Rettore dell'Istituto Cattolico di Parigi; Ves...,06/01/1859,16/12/1935,1939-03-01,0
59,Donato Raffaele Sbarretti Tazza,Italia,Cardinale vescovo di Sabina e Poggio Mirteto,Sottodecano del Collegio Cardinalizio; Segreta...,12/11/1856,04/12/1916,1939-03-01,0
60,Federico Cattani Amadori,Italia,Cardinale diacono di Santa Maria in Aquiro,Segretario emerito del Supremo Tribunale della...,17/04/1856,16/12/1935,1939-03-01,0


In [142]:
participants_1939.head()

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
1,Adeodato Giovanni Piazza,Italia,Cardinale presbitero di Santa Prisca,Patriarca di Venezia,20/09/1884,13/12/1937,1939-03-01,0
2,Jusztinián György Serédi,Ungheria,Cardinale presbitero dei Santi Andrea e Gregor...,Arcivescovo metropolita di Strigonio,23/04/1884,19/12/1927,1939-03-01,0
3,Eugène Tisserant,Francia,"Cardinale presbitero dei Santi Vito, Modesto e...",Segretario della Congregazione per le Chiese O...,24/03/1884,15/06/1936,1939-03-01,0
4,Achille Liénart,Francia,Cardinale presbitero di San Sisto,Vescovo di Lilla,07/02/1884,30/06/1930,1939-03-01,0
5,Jean-Marie-Rodrigue Villeneuve,Canada,Cardinale presbitero di Santa Maria degli Angeli,Arcivescovo metropolita di Québec,02/11/1883,13/03/1933,1939-03-01,0


In [143]:
url_1958 = "https://it.wikipedia.org/wiki/Conclave_del_1958"
participants_1958 = pd.read_html(url_1958, parse_dates = True)[2]
participants_1958 = participants_1958[participants_1958.index.isin(participants_1958.index[1:])]
participants_1958.columns = col_names
participants_1958['Date'] = pd.to_datetime('25/10/1958', format = '%d/%m/%Y')
select_new_pope(participants_1958)

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
1,Paul-Émile Léger,Canada,Cardinale presbitero di Santa Maria degli Angeli,Arcivescovo metropolita di Montréal,26/04/1904,12/01/1953,1958-10-25,0
2,Stefan Wyszyński,Polonia,Cardinale presbitero di Santa Maria in Trastevere,Arcivescovo metropolita di Gniezno; Arcivescov...,03/08/1901,12/01/1953,1958-10-25,0
3,Joseph Wendel,Germania Ovest,Cardinale presbitero di Santa Maria Nuova,Arcivescovo metropolita di Monaco e Frisinga; ...,27/05/1901,12/01/1953,1958-10-25,0
4,Valerian Gracias,India,Cardinale presbitero di Santa Maria in Via Lata,Arcivescovo metropolita di Bombay,23/10/1900,12/01/1953,1958-10-25,0
5,Fernando Quiroga y Palacios,Spagna,Cardinale presbitero di Sant'Agostino,Arcivescovo metropolita di Santiago di Compostela,21/01/1900,12/01/1953,1958-10-25,0
6,Norman Thomas Gilroy,Australia,Cardinale presbitero dei Santi Quattro Coronati,Arcivescovo metropolita di Sydney,22/01/1896,18/02/1946,1958-10-25,0
7,Krikor Bedros XV Aghagianian,Libano,Cardinale presbitero di San Bartolomeo all'Isola,Patriarca di Cilicia degli Armeni; Presidente ...,18/09/1895,18/02/1946,1958-10-25,0
8,James Charles McGuigan,Canada,Cardinale presbitero di Santa Maria del Popolo,Arcivescovo metropolita di Toronto,26/11/1894,18/02/1946,1958-10-25,0
9,Jaime de Barros Câmara,Brasile,Cardinale presbitero dei Santi Bonifacio e Ale...,Arcivescovo metropolita di São Sebastião do Ri...,03/07/1894,18/02/1946,1958-10-25,0
10,Giacomo Lercaro,Italia,Cardinale presbitero di Santa Maria in Traspon...,Arcivescovo metropolita di Bologna,28/10/1891,12/01/1953,1958-10-25,0


In [144]:
participants_1958.head()

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
1,Paul-Émile Léger,Canada,Cardinale presbitero di Santa Maria degli Angeli,Arcivescovo metropolita di Montréal,26/04/1904,12/01/1953,1958-10-25,0
2,Stefan Wyszyński,Polonia,Cardinale presbitero di Santa Maria in Trastevere,Arcivescovo metropolita di Gniezno; Arcivescov...,03/08/1901,12/01/1953,1958-10-25,0
3,Joseph Wendel,Germania Ovest,Cardinale presbitero di Santa Maria Nuova,Arcivescovo metropolita di Monaco e Frisinga; ...,27/05/1901,12/01/1953,1958-10-25,0
4,Valerian Gracias,India,Cardinale presbitero di Santa Maria in Via Lata,Arcivescovo metropolita di Bombay,23/10/1900,12/01/1953,1958-10-25,0
5,Fernando Quiroga y Palacios,Spagna,Cardinale presbitero di Sant'Agostino,Arcivescovo metropolita di Santiago di Compostela,21/01/1900,12/01/1953,1958-10-25,0


In [145]:
url_1963 = "https://it.wikipedia.org/wiki/Conclave_del_1963"
participants_1963 = pd.read_html(url_1963, parse_dates = True)[2]
participants_1963 = participants_1963[participants_1963.index.isin(participants_1963.index[1:])]
participants_1963.columns = col_names
participants_1963['Date'] = pd.to_datetime('19/06/1963', format = '%d/%m/%Y')
participants_1963['Elected'] = participants_1963['Name'].apply(lambda x: 1 if x == 'Giovanni Battista Montini' else 0)

In [146]:
url_1978_2 = "https://it.wikipedia.org/wiki/Conclave_dell%27ottobre_1978"
participants_1978_2 = pd.read_html(url_1978_2, parse_dates = True)[3]
participants_1978_2 = participants_1978_2[participants_1978_2.index.isin(participants_1978_2.index[1:])]
participants_1978_2.columns = col_names
participants_1978_1 = participants_1978_2
participants_1978_2['Date'] = pd.to_datetime('14/10/1978', format = '%d/%m/%Y')
participants_1978_2['Elected'] = participants_1978_2['Name'].apply(lambda x: 1 if x == 'Karol Wojtyła' else 0)

In [147]:
luciani_in = pd.DataFrame([{'Name': 'Albino Luciani', 
                            'Country': 'Italia', 
                            'Title': 'Cardinale presbitero di San Marco', 
                            'Title2': 'Patriarca di Venezia', 
                            'Date_of_birth': '17/10/1912',
                            'Date_of_election': '05/03/1973',
                            'Date': pd.to_datetime('25/08/1978'),
                            'Elected': 1}])


In [148]:
participants_1978_1 = pd.concat([participants_1978_1.loc[participants_1978_1.Name != 'John Joseph Wright', :],
                                 luciani_in]).sort_index()

In [149]:
participants_1978_1['Date'] =  pd.to_datetime('25/08/1978', format = '%d/%m/%Y')

In [150]:
participants_1978_1['Elected'] = participants_1978_1['Name'].apply(lambda x: 1 if x == 'Albino Luciani' else 0)

In [151]:
url_2005 = "https://it.wikipedia.org/wiki/Conclave_del_2005"
participants_2005 = pd.read_html(url_2005)[9]
participants_2005 = participants_2005[participants_2005.index.isin(participants_2005.index[1:])]
participants_2005.columns = col_names
participants_2005['Date'] = pd.to_datetime('19/04/2005', format = '%d/%m/%Y')
participants_2005['Elected'] = participants_2005['Name'].apply(lambda x: 1 if x == 'Joseph Ratzinger' else 0)

In [152]:
url_2013 = "https://it.wikipedia.org/wiki/Conclave_del_2013"
participants_2013 = pd.read_html(url_2013)[2]
participants_2013 = participants_2013[participants_2013.index.isin(participants_2013.index[1:])]
participants_2013.columns = col_names
participants_2013['Date'] = pd.to_datetime('12/03/2013', format = '%d/%m/%Y')
participants_2013['Elected'] = participants_2013['Name'].apply(lambda x: 1 if x == 'Jorge Mario Bergoglio' else 0)

In [153]:
participants_2013.head()

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
1,Luis Antonio Tagle,Filippine,Cardinale presbitero di San Felice da Cantalic...,Arcivescovo di Manila,21/06/1957,24/11/2012,2013-03-12,0
2,Rainer Maria Woelki,Germania,Cardinale presbitero di San Giovanni Maria Via...,Arcivescovo di Berlino,18/08/1956,18/02/2012,2013-03-12,0
3,Reinhard Marx,Germania,Cardinale presbitero di San Corbiniano,Arcivescovo di Monaco e Frisinga,21/09/1953,20/11/2010,2013-03-12,0
4,Willem Jacobus Eijk,Paesi Bassi,Cardinale presbitero di San Callisto,Arcivescovo di Utrecht,22/06/1953,18/02/2012,2013-03-12,0
5,Péter Erdő,Ungheria,Cardinale presbitero di Santa Balbina,Arcivescovo di Esztergom-Budapest,25/06/1952,21/10/2003,2013-03-12,0


In [154]:
conclave_part_list = [participants_1922, participants_1939, participants_1958, participants_1963, participants_1978_1,
                      participants_1978_2, participants_2005, participants_2013]

In [155]:
participants = pd.concat(conclave_part_list, axis=0).reset_index(drop=True)
participants.head(2)

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
0,Karl Joseph Schulte,Repubblica di Weimar,Cardinale presbitero dei Santi Quattro Coronati,Arcivescovo metropolita di Colonia,14/09/1871,07/03/1921,1922-02-02,0
1,Edmund Dalbor,Repubblica di Polonia,Cardinale presbitero di San Giovanni a Porta L...,Arcivescovo metropolita di Gniezno e Poznań,30/10/1869,15/12/1919,1922-02-02,0


In [156]:
participants.to_pickle('Data/conclave_participants_raw.pkl')

In [157]:
participants['Italian'] = 0
participants.loc[participants.Country == 'Italia', 'Italian'] = 1

In [158]:
participants.Date_of_birth = pd.to_datetime(participants.Date_of_birth)
participants.Date_of_election = pd.to_datetime(participants.Date_of_election)
participants.head(2)

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected,Italian
0,Karl Joseph Schulte,Repubblica di Weimar,Cardinale presbitero dei Santi Quattro Coronati,Arcivescovo metropolita di Colonia,1871-09-14,1921-07-03,1922-02-02,0,0
1,Edmund Dalbor,Repubblica di Polonia,Cardinale presbitero di San Giovanni a Porta L...,Arcivescovo metropolita di Gniezno e Poznań,1869-10-30,1919-12-15,1922-02-02,0,0


In [159]:
participants['Rank'] = participants.Title.apply(lambda x: 'CP' if x.split()[1] == 'presbitero' else 'CB' if x.split()[1] == 'vescovo' else 'CD')

In [160]:
participants['Emeritus'] = participants.Title2.apply(lambda x: 1 if x.split()[1] == 'emerito' else 0)

In [161]:
participants['Office'] = participants.Title2.apply(lambda x: 'Archbishop' if (x.split()[0] == 'Arcivescovo' or x.split()[0] == 'Vescovo' or x.split()[0] == 'Patriarca')else 'Prefect' if x.split()[0] == 'Prefetto' else 'Other_curia')

In [162]:
participants['Age_at_conclave'] = [relativedelta(a, b).years for a, b in zip(participants['Date'], participants['Date_of_birth'])]

In [163]:
# ((participants['Date_of_election'] - participants['Date'])/np.timedelta64(1, 'M')).astype(int)

In [164]:
participants['Card_seniority'] = [12 - relativedelta(a, b).months + relativedelta(a, b).years*12 for a, b in zip(participants['Date'], participants['Date_of_election'])]

In [165]:
participants1 = participants.copy()
participants1 = participants1.drop(['Country', 'Title', 'Title2', 'Date_of_birth', 'Date_of_election'], 1)

In [166]:
participants1 = pd.concat([participants1.drop('Office', axis=1),
                           pd.get_dummies(participants1['Office'])], axis=1)
participants1 = pd.concat([participants1.drop('Rank', axis=1),
                           pd.get_dummies(participants1['Rank'])], axis=1)
participants1.head(3)

Unnamed: 0,Name,Date,Elected,Italian,Emeritus,Age_at_conclave,Card_seniority,Archbishop,Other_curia,Prefect,CB,CD,CP
0,Karl Joseph Schulte,1922-02-02,0,0,0,50,6,1,0,0,0,0,1
1,Edmund Dalbor,1922-02-02,0,0,0,52,35,1,0,0,0,0,1
2,Michael von Faulhaber,1922-02-02,0,0,0,52,6,1,0,0,0,0,1


In [167]:
participants1.to_pickle('Data/conclave_participants_features.pkl')

# 2. Get data about currently living cardinals

In [168]:
from feature_engineering_utils import del_pope, del_index, delete_latin_encoding

In [169]:
# Get the list of current cardinals
url_cardinals = "https://en.wikipedia.org/wiki/List_of_living_cardinals"
living_cardinals = pd.read_html(url_cardinals, parse_dates=True)[0]

# Remove cardinals who already are over 80 years old - they are marked with '*'
living_cardinals.drop(living_cardinals[living_cardinals.iloc[:, 1].str.strip().str[-1] == "*"].index, inplace=True)

# Remove not necessary columns
living_cardinals = living_cardinals.drop(['No.', 'Ref.'], axis=1).reset_index(drop=True)

# Obtain date of birth
living_cardinals['Born'] = living_cardinals['Born'].str[:-8]

# Apply deleting popes' names
living_cardinals['Consistory'] = living_cardinals['Consistory'].apply(lambda x: del_pope(x))

# Apply deleting redundant indices
living_cardinals['Consistory'] = living_cardinals['Consistory'].apply(lambda x: del_index(x))

# Apply deleting 'latin' encoding to 'Born', 'Name' and 'Office' variables
# Delete 'latin' encoded spaces from given variable
living_cardinals['Born'] = living_cardinals['Born'].apply(lambda x: delete_latin_encoding(x))
living_cardinals['Name'] = living_cardinals['Name'].apply(lambda x: delete_latin_encoding(x))
living_cardinals['Office'] = living_cardinals['Office'].apply(lambda x: delete_latin_encoding(x))

# Day and month of birth of Archbishop of Nairobi is unknown. hence it was set to 1st January
living_cardinals.loc[living_cardinals['Name'] == 'John Njue', "Born"] = '1 January 1944'

# Convert 'Born' variable to data format
living_cardinals['Born'] = pd.to_datetime(living_cardinals['Born'], format="%d %B %Y")

# Convert 'Consistory' variable to data format
living_cardinals['Consistory'] = pd.to_datetime(living_cardinals['Consistory'], format="%d %B %Y")

# Get dummie variables of cardinals' ranks (Bishop, Priest, Deacon)
living_cardinals = pd.concat([living_cardinals.drop('Order', 1), pd.get_dummies(living_cardinals['Order'])], axis=1)

# Get binary variable - Italian or not
living_cardinals['Italian'] = living_cardinals['Country'].apply(lambda x: 1 if x == 'Italy' else 0)

# Transform 'Office' variable into cardinal's offices: Archbishop, Prefect or Other Vatican curia post
living_cardinals['Office_add'] = living_cardinals['Office'].apply(lambda x: 'Archbishop' if (
            x.split()[0] == 'Archbishop' or x.split()[0] == 'Bishop' or x.split()[0] == 'Patriarch' or x.split()[
        1] == 'Archbishop' or x.split()[1] == 'Bishop') else 'Prefect' if x.split()[
                                                                              0] == 'Prefect' else 'Other_curia')

# Get binary checking whether cardinal is an emeritus
living_cardinals['Emeritus'] = living_cardinals['Office'].apply(lambda x: 1 if x.split()[1] == 'emeritus' else 0)

# Get dummy variables of cardinals offices and drop unnecessary columns
living_cardinals = pd.concat(
    [living_cardinals.drop(['Country', 'Office_add', 'Office'], 1),
     pd.get_dummies(living_cardinals['Office_add'])
     ],
    axis=1)

In [170]:
living_cardinals.head()

Unnamed: 0,Name,Born,Consistory,CB,CD,CP,Italian,Emeritus,Archbishop,Other_curia,Prefect
0,Leonardo Sandri,1943-11-18,2007-11-24,1,0,0,0,0,0,0,1
1,Pietro Parolin,1955-01-17,2014-02-22,1,0,0,1,0,0,1,0
2,Marc Ouellet PSS,1944-06-08,2003-10-21,1,0,0,0,0,0,0,1
3,Fernando Filoni,1946-04-15,2012-02-18,1,0,0,1,0,0,1,0
4,Beniamino Stella,1941-08-18,2014-02-22,1,0,0,1,0,0,0,1


In [171]:
living_cardinals.to_pickle('Data/living_participants.pkl')