# Project: Prediction of conclave result

Started: 18-01-2020
Authors: Jakub Kozlowski, Szymon Klepacki

-----

## 1. Prepare data

In [1]:
import pandas as pd
import numpy as np
from dateutil.relativedelta import relativedelta

In [2]:
col_names = ['Name', 'Country', 'Title', 'Title2', 'Date_of_birth', 'Date_of_election']

In [4]:
url_1922 = "https://it.wikipedia.org/wiki/Conclave_del_1922"
participants_1922 = pd.read_html(url_1922, parse_dates = True)[2]
participants_1922 = participants_1922[participants_1922.index.isin(participants_1922.index[1:])]
participants_1922.columns = col_names
participants_1922['Date'] = pd.to_datetime('02/02/1922', format = '%d/%m/%Y')

In [5]:
def select_new_pope(set):
    set['Elected'] = set['Name'].apply(lambda x: 1 if x[-13:] == '(eletto papa)' else 0)
    set['Name'] = set['Name'].apply(lambda x: x[:-14] if x[-13:] == '(eletto papa)' else x)
    
select_new_pope(participants_1922)

In [6]:
participants_1922

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
1,Karl Joseph Schulte,Repubblica di Weimar,Cardinale presbitero dei Santi Quattro Coronati,Arcivescovo metropolita di Colonia,14/09/1871,07/03/1921,1922-02-02,0
2,Edmund Dalbor,Repubblica di Polonia,Cardinale presbitero di San Giovanni a Porta L...,Arcivescovo metropolita di Gniezno e Poznań,30/10/1869,15/12/1919,1922-02-02,0
3,Michael von Faulhaber,Repubblica di Weimar,Cardinale presbitero di Sant'Anastasia,Arcivescovo metropolita di Monaco e Frisinga,05/03/1869,07/03/1921,1922-02-02,0
4,Francisco de Asís Vidal y Barraquer,Regno di Spagna,Cardinale presbitero di Santa Sabina,Arcivescovo metropolita di Tarragona,03/10/1868,07/03/1921,1922-02-02,0
5,Rafael Merry del Val y Zulueta,Regno di Spagna,Cardinale presbitero di Santa Prassede,Arciprete della Basilica di San Pietro in Vati...,10/10/1865,09/11/1903,1922-02-02,0
6,Juan Benlloch y Vivó,Regno di Spagna,Cardinale presbitero di Santa Maria in Ara Coeli,Arcivescovo metropolita di Burgos,29/12/1864,07/03/1921,1922-02-02,0
7,Friedrich Gustav Piffl,Repubblica Austriaca,Cardinale presbitero di San Marco,Arcivescovo metropolita di Vienna,15/10/1864,25/05/1914,1922-02-02,0
8,Giovanni Tacci Porcelli,Italia,Cardinale presbitero di Santa Maria in Trastevere,Maestro di Camera emerito della Corte Pontificia,12/11/1863,13/06/1921,1922-02-02,0
9,Tommaso Pio Boggiani,Italia,Cardinale presbitero dei Santi Quirico e Giulitta,Arcivescovo emerito di Genova,19/01/1863,04/12/1916,1922-02-02,0
10,Aleksander Kakowski,Repubblica di Polonia,Cardinale presbitero di Sant'Agostino,Arcivescovo metropolita di Varsavia,05/02/1862,15/12/1919,1922-02-02,0


In [7]:
url_1939 = "https://it.wikipedia.org/wiki/Conclave_del_1939"
participants_1939 = pd.read_html(url_1939, parse_dates = True)[2]
participants_1939 = participants_1939[participants_1939.index.isin(participants_1939.index[1:])]
participants_1939.columns = col_names
participants_1939['Date'] = pd.to_datetime('01/03/1939', format = '%d/%m/%Y')
select_new_pope(participants_1939)

In [8]:
participants_1939.head()

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
1,Adeodato Giovanni Piazza,Italia,Cardinale presbitero di Santa Prisca,Patriarca di Venezia,20/09/1884,13/12/1937,1939-03-01,0
2,Jusztinián György Serédi,Ungheria,Cardinale presbitero dei Santi Andrea e Gregor...,Arcivescovo metropolita di Strigonio,23/04/1884,19/12/1927,1939-03-01,0
3,Eugène Tisserant,Francia,"Cardinale presbitero dei Santi Vito, Modesto e...",Segretario della Congregazione per le Chiese O...,24/03/1884,15/06/1936,1939-03-01,0
4,Achille Liénart,Francia,Cardinale presbitero di San Sisto,Vescovo di Lilla,07/02/1884,30/06/1930,1939-03-01,0
5,Jean-Marie-Rodrigue Villeneuve,Canada,Cardinale presbitero di Santa Maria degli Angeli,Arcivescovo metropolita di Québec,02/11/1883,13/03/1933,1939-03-01,0


In [9]:
url_1958 = "https://it.wikipedia.org/wiki/Conclave_del_1958"
participants_1958 = pd.read_html(url_1958, parse_dates = True)[2]
participants_1958 = participants_1958[participants_1958.index.isin(participants_1958.index[1:])]
participants_1958.columns = col_names
participants_1958['Date'] = pd.to_datetime('25/10/1958', format = '%d/%m/%Y')
select_new_pope(participants_1958)

In [10]:
participants_1958.head()

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
1,Paul-Émile Léger,Canada,Cardinale presbitero di Santa Maria degli Angeli,Arcivescovo metropolita di Montréal,26/04/1904,12/01/1953,1958-10-25,0
2,Stefan Wyszyński,Polonia,Cardinale presbitero di Santa Maria in Trastevere,Arcivescovo metropolita di Gniezno; Arcivescov...,03/08/1901,12/01/1953,1958-10-25,0
3,Joseph Wendel,Germania Ovest,Cardinale presbitero di Santa Maria Nuova,Arcivescovo metropolita di Monaco e Frisinga; ...,27/05/1901,12/01/1953,1958-10-25,0
4,Valerian Gracias,India,Cardinale presbitero di Santa Maria in Via Lata,Arcivescovo metropolita di Bombay,23/10/1900,12/01/1953,1958-10-25,0
5,Fernando Quiroga y Palacios,Spagna,Cardinale presbitero di Sant'Agostino,Arcivescovo metropolita di Santiago di Compostela,21/01/1900,12/01/1953,1958-10-25,0


In [11]:
url_1978_2 = "https://it.wikipedia.org/wiki/Conclave_dell%27ottobre_1978"
participants_1978_2 = pd.read_html(url_1978_2, parse_dates = True)[3]
participants_1978_2 = participants_1978_2[participants_1978_2.index.isin(participants_1978_2.index[1:])]
participants_1978_2.columns = col_names
participants_1978_1 = participants_1978_2
participants_1978_2['Date'] = pd.to_datetime('14/10/1978', format = '%d/%m/%Y')
participants_1978_2['Elected'] = participants_1978_2['Name'].apply(lambda x: 1 if x == 'Karol Wojtyła' else 0)

In [12]:
participants_1978_2.head()

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
1,Sebastiano Baggio,Italia,Cardinale vescovo di Velletri,Prefetto della Congregazione per i vescovi,16/05/1913,28/04/1969,1978-10-14,0
2,Paolo Bertoli,Italia,Cardinale presbitero di San Girolamo dei Croati,Prefetto emerito della Congregazione per le ca...,01/02/1908,28/04/1969,1978-10-14,0
3,Mario Luigi Ciappi,Italia,Cardinale presbitero di Nostra Signora del Sac...,Pro-teologo della Casa Pontificia,06/10/1909,27/06/1977,1978-10-14,0
4,Francesco Carpino,Italia,Cardinale vescovo di Albano,Arcivescovo emerito di Palermo,18/05/1905,26/06/1967,1978-10-14,0
5,Pericle Felici,Italia,Cardinale diacono e presbitero di Sant'Apollin...,Prefetto del Supremo Tribunale della Segnatura...,01/08/1911,26/06/1967,1978-10-14,0


In [13]:
luciani_in = pd.DataFrame([{'Name': 'Albino Luciani', 
                            'Country': 'Italia', 
                            'Title': 'Cardinale presbitero di San Marco', 
                            'Title2': 'Patriarca di Venezia', 
                            'Date_of_birth': '17/10/1912',
                            'Date_of_election': '05/03/1973',
                            'Date': pd.to_datetime('25/08/1978'),
                            'Elected': 1}])


In [14]:
participants_1978_1 = pd.concat([participants_1978_1.loc[participants_1978_1.Name != 'John Joseph Wright', :], luciani_in]).sort_index()

In [15]:
url_2005 = "https://it.wikipedia.org/wiki/Conclave_del_2005"
participants_2005 = pd.read_html(url_2005)[9]
participants_2005 = participants_2005[participants_2005.index.isin(participants_2005.index[1:])]
participants_2005.columns = col_names
participants_2005['Date'] = pd.to_datetime('19/04/2005', format = '%d/%m/%Y')
participants_2005['Elected'] = participants_2005['Name'].apply(lambda x: 1 if x == 'Joseph Ratzinger' else 0)

In [16]:
url_2013 = "https://it.wikipedia.org/wiki/Conclave_del_2013"
participants_2013 = pd.read_html(url_2013)[2]
participants_2013 = participants_2013[participants_2013.index.isin(participants_2013.index[1:])]
participants_2013.columns = col_names
participants_2013['Date'] = pd.to_datetime('12/03/2013', format = '%d/%m/%Y')
participants_2013['Elected'] = participants_2013['Name'].apply(lambda x: 1 if x == 'Jorge Mario Bergoglio' else 0)

In [17]:
participants_2013.head()

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
1,Luis Antonio Tagle,Filippine,Cardinale presbitero di San Felice da Cantalic...,Arcivescovo di Manila,21/06/1957,24/11/2012,2013-03-12,0
2,Rainer Maria Woelki,Germania,Cardinale presbitero di San Giovanni Maria Via...,Arcivescovo di Berlino,18/08/1956,18/02/2012,2013-03-12,0
3,Reinhard Marx,Germania,Cardinale presbitero di San Corbiniano,Arcivescovo di Monaco e Frisinga,21/09/1953,20/11/2010,2013-03-12,0
4,Willem Jacobus Eijk,Paesi Bassi,Cardinale presbitero di San Callisto,Arcivescovo di Utrecht,22/06/1953,18/02/2012,2013-03-12,0
5,Péter Erdő,Ungheria,Cardinale presbitero di Santa Balbina,Arcivescovo di Esztergom-Budapest,25/06/1952,21/10/2003,2013-03-12,0


In [18]:
conclave_part_list = [participants_1922, participants_1939, participants_1958, participants_1978_2, participants_2005, participants_2013]

In [19]:
participants = pd.concat(conclave_part_list, axis=0).reset_index(drop=True)
participants

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected
0,Karl Joseph Schulte,Repubblica di Weimar,Cardinale presbitero dei Santi Quattro Coronati,Arcivescovo metropolita di Colonia,14/09/1871,07/03/1921,1922-02-02,0
1,Edmund Dalbor,Repubblica di Polonia,Cardinale presbitero di San Giovanni a Porta L...,Arcivescovo metropolita di Gniezno e Poznań,30/10/1869,15/12/1919,1922-02-02,0
2,Michael von Faulhaber,Repubblica di Weimar,Cardinale presbitero di Sant'Anastasia,Arcivescovo metropolita di Monaco e Frisinga,05/03/1869,07/03/1921,1922-02-02,0
3,Francisco de Asís Vidal y Barraquer,Regno di Spagna,Cardinale presbitero di Santa Sabina,Arcivescovo metropolita di Tarragona,03/10/1868,07/03/1921,1922-02-02,0
4,Rafael Merry del Val y Zulueta,Regno di Spagna,Cardinale presbitero di Santa Prassede,Arciprete della Basilica di San Pietro in Vati...,10/10/1865,09/11/1903,1922-02-02,0
...,...,...,...,...,...,...,...,...
495,Francisco Javier Errázuriz Ossa,Cile,Cardinale presbitero di Santa Maria della Pace,Arcivescovo emerito di Santiago del Cile,05/09/1933,21/02/2001,2013-03-12,0
496,Godfried Danneels,Belgio,Cardinale presbitero di Sant'Anastasia,Arcivescovo emerito di Malines-Bruxelles,04/06/1933,02/02/1983,2013-03-12,0
497,Juan Sandoval Íñiguez,Messico,Cardinale presbitero di Nostra Signora di Guad...,Arcivescovo emerito di Guadalajara,28/03/1933,26/11/1994,2013-03-12,0
498,Severino Poletto,Italia,Cardinale presbitero di San Giuseppe in Via Tr...,Arcivescovo emerito di Torino,18/03/1933,21/02/2001,2013-03-12,0


In [20]:
participants.to_pickle('conclave_participants.pkl')

In [21]:
participants['Italian'] = 0
participants.loc[participants.Country == 'Italia', 'Italian'] = 1


In [22]:
participants.Date_of_birth = pd.to_datetime(participants.Date_of_birth)
participants.Date_of_election = pd.to_datetime(participants.Date_of_election)
participants

Unnamed: 0,Name,Country,Title,Title2,Date_of_birth,Date_of_election,Date,Elected,Italian
0,Karl Joseph Schulte,Repubblica di Weimar,Cardinale presbitero dei Santi Quattro Coronati,Arcivescovo metropolita di Colonia,1871-09-14,1921-07-03,1922-02-02,0,0
1,Edmund Dalbor,Repubblica di Polonia,Cardinale presbitero di San Giovanni a Porta L...,Arcivescovo metropolita di Gniezno e Poznań,1869-10-30,1919-12-15,1922-02-02,0,0
2,Michael von Faulhaber,Repubblica di Weimar,Cardinale presbitero di Sant'Anastasia,Arcivescovo metropolita di Monaco e Frisinga,1869-05-03,1921-07-03,1922-02-02,0,0
3,Francisco de Asís Vidal y Barraquer,Regno di Spagna,Cardinale presbitero di Santa Sabina,Arcivescovo metropolita di Tarragona,1868-03-10,1921-07-03,1922-02-02,0,0
4,Rafael Merry del Val y Zulueta,Regno di Spagna,Cardinale presbitero di Santa Prassede,Arciprete della Basilica di San Pietro in Vati...,1865-10-10,1903-09-11,1922-02-02,0,0
...,...,...,...,...,...,...,...,...,...
495,Francisco Javier Errázuriz Ossa,Cile,Cardinale presbitero di Santa Maria della Pace,Arcivescovo emerito di Santiago del Cile,1933-05-09,2001-02-21,2013-03-12,0,0
496,Godfried Danneels,Belgio,Cardinale presbitero di Sant'Anastasia,Arcivescovo emerito di Malines-Bruxelles,1933-04-06,1983-02-02,2013-03-12,0,0
497,Juan Sandoval Íñiguez,Messico,Cardinale presbitero di Nostra Signora di Guad...,Arcivescovo emerito di Guadalajara,1933-03-28,1994-11-26,2013-03-12,0,0
498,Severino Poletto,Italia,Cardinale presbitero di San Giuseppe in Via Tr...,Arcivescovo emerito di Torino,1933-03-18,2001-02-21,2013-03-12,0,1


In [23]:
participants['Rank'] = participants.Title.apply(lambda x: 'CP' if x.split()[1] == 'presbitero' else 'CB' if x.split()[1] == 'vescovo' else 'CD')

In [24]:
participants['Emeritus'] = participants.Title2.apply(lambda x: 1 if x.split()[1] == 'emerito' else 0)

In [25]:
participants['Office'] = participants.Title2.apply(lambda x: 'Archbishop' if (x.split()[0] == 'Arcivescovo' or x.split()[0] == 'Vescovo' or x.split()[0] == 'Patriarca')else 'Prefect' if x.split()[0] == 'Prefetto' else 'Other_curia')

In [26]:
participants['Age_at_conclave'] = [relativedelta(a, b).years for a, b in zip(participants['Date'], participants['Date_of_birth'])]

In [27]:
participants['Card_seniority'] = [12 - relativedelta(a, b).months + relativedelta(a, b).years*12 for a, b in zip(participants['Date'], participants['Date_of_election'])]

In [28]:
participants1 = participants

In [29]:
participants1 = participants1.drop(['Country', 'Title', 'Title2', 'Date_of_birth', 'Date_of_election', 'Date'], 1)

In [33]:
participants1 = pd.concat([participants1.drop('Office', axis=1), pd.get_dummies(participants1['Office'])], axis=1)
participants1 = pd.concat([participants1.drop('Rank', axis=1), pd.get_dummies(participants1['Rank'])], axis=1)
participants1

Unnamed: 0,Name,Elected,Italian,Emeritus,Age_at_conclave,Card_seniority,Archbishop,Other_curia,Prefect,CB,CD,CP
0,Karl Joseph Schulte,0,0,0,50,6,1,0,0,0,0,1
1,Edmund Dalbor,0,0,0,52,35,1,0,0,0,0,1
2,Michael von Faulhaber,0,0,0,52,6,1,0,0,0,0,1
3,Francisco de Asís Vidal y Barraquer,0,0,0,53,6,1,0,0,0,0,1
4,Rafael Merry del Val y Zulueta,0,0,0,56,224,0,1,0,0,0,1
...,...,...,...,...,...,...,...,...,...,...,...,...
495,Francisco Javier Errázuriz Ossa,0,0,1,79,156,1,0,0,0,0,1
496,Godfried Danneels,0,0,1,79,371,1,0,0,0,0,1
497,Juan Sandoval Íñiguez,0,0,1,79,225,1,0,0,0,0,1
498,Severino Poletto,0,1,1,79,156,1,0,0,0,0,1
