In [1]:
from bs4 import BeautifulSoup
import requests
from urllib.request import urlopen, urlretrieve, quote
from urllib.parse import urljoin
import pandas as pd
from tqdm import tqdm
import csv

# Define

In [2]:
link_kabinet = []

In [3]:
BASE_URL = "https://id.wikipedia.org/"
url = "https://id.wikipedia.org/wiki/Kabinet_Indonesia_Maju"

In [4]:
def get_data(url):
    headers = {
         'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36'
     }
    r = requests.get(url, headers=headers)  # Using the custom headers we defined above
    soup = BeautifulSoup(r.content, 'html5lib') 
    return soup

In [5]:
def get_wiki(url):
    df = pd.read_html(url)[0].T
    new_header = df.iloc[0] #grab the first row for the header
    df = df[1:] #take the data less the header row
    df.columns = new_header #set the header row as the df header
    df = df.reset_index()
    df = df.rename(columns={"index" : "Nama"})
    df = df[["Nama", "Lahir"]]
    return df

# Test Code

# 1. Pimpinan

In [6]:
links_content = []
soup = get_data(url)
table = soup.find('table', 'wikitable')
links = table.findAll('a')
for idx, link in enumerate(links):
    if idx == 0 or idx == 3:
        links_content.append(BASE_URL + link['href'])
links_content

['https://id.wikipedia.org//wiki/Joko_Widodo',
 'https://id.wikipedia.org//wiki/Ma%27ruf_Amin']

In [7]:
li = []
for idx in tqdm(range(len(links_content))):
    df = get_wiki(links_content[idx])
    li.append(df)

100%|████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  3.30it/s]


In [8]:
df = pd.concat(li).reset_index(drop=True)
df["Nama"] = df["Nama"].str.replace(".1", "")
df

Unnamed: 0,Nama,Lahir
0,Ir. H.Joko Widodo,"Mulyono21 Juni 1961 (umur 60)Surakarta, Jawa T..."
1,Prof. Dr. (H.C.) K. H.Ma'ruf Amin,Ma'ruf al-Karkhi[1]11 Maret 1943 (umur 78)Kres...


In [9]:
df.to_csv("./All/Kabinet_Pimpinan.csv", index=False)

# 2. menteri Kabinet

In [10]:
df = pd.read_html(url)[5]
df

Unnamed: 0_level_0,No.,Jabatan,Pejabat,Pejabat,Mulai menjabat,Selesai menjabat,Partai,Partai
Unnamed: 0_level_1,Menteri koordinator,Menteri koordinator,Menteri koordinator,Menteri koordinator.1,Menteri koordinator,Menteri koordinator,Menteri koordinator,Menteri koordinator.1
0,1,"Menteri Koordinator Bidang Politik, Hukum, dan...",,Mohammad Mahfud MD,23 Oktober 2019,Petahana,,Nonpartai
1,2,Menteri Koordinator Bidang Perekonomian,,Airlangga Hartarto,23 Oktober 2019,Petahana,,Golkar
2,3,Menteri Koordinator Bidang Kemaritiman dan Inv...,,Luhut Binsar Panjaitan,23 Oktober 2019,Petahana,,Golkar
3,4,Menteri Koordinator Bidang Pembangunan Manusia...,,Muhadjir Effendy,23 Oktober 2019,Petahana,,Nonpartai
4,Menteri,Menteri,Menteri,Menteri,Menteri,Menteri,Menteri,Menteri
5,5,Menteri Sekretaris Negara,,Pratikno,23 Oktober 2019,Petahana,,Nonpartai
6,6,Menteri Dalam Negeri,,Tito Karnavian,23 Oktober 2019,28 Agustus 2020,,Nonpartai
7,6,Menteri Dalam Negeri,,Mohammad Mahfud MD(ad-interim)[10],28 Agustus 2020,30 Agustus 2020,,Nonpartai
8,6,Menteri Dalam Negeri,,Tito Karnavian,31 Agustus 2020,Petahana,,Nonpartai
9,7,Menteri Luar Negeri,,Retno Lestari Priansari Marsudi,23 Oktober 2019,Petahana,,Nonpartai


In [11]:
df.columns = df.columns.droplevel(1)
df = df.loc[:,~df.columns.duplicated(keep='last')]
df = df.reset_index(drop=True) 
df

Unnamed: 0,No.,Jabatan,Pejabat,Mulai menjabat,Selesai menjabat,Partai
0,1,"Menteri Koordinator Bidang Politik, Hukum, dan...",Mohammad Mahfud MD,23 Oktober 2019,Petahana,Nonpartai
1,2,Menteri Koordinator Bidang Perekonomian,Airlangga Hartarto,23 Oktober 2019,Petahana,Golkar
2,3,Menteri Koordinator Bidang Kemaritiman dan Inv...,Luhut Binsar Panjaitan,23 Oktober 2019,Petahana,Golkar
3,4,Menteri Koordinator Bidang Pembangunan Manusia...,Muhadjir Effendy,23 Oktober 2019,Petahana,Nonpartai
4,Menteri,Menteri,Menteri,Menteri,Menteri,Menteri
5,5,Menteri Sekretaris Negara,Pratikno,23 Oktober 2019,Petahana,Nonpartai
6,6,Menteri Dalam Negeri,Tito Karnavian,23 Oktober 2019,28 Agustus 2020,Nonpartai
7,6,Menteri Dalam Negeri,Mohammad Mahfud MD(ad-interim)[10],28 Agustus 2020,30 Agustus 2020,Nonpartai
8,6,Menteri Dalam Negeri,Tito Karnavian,31 Agustus 2020,Petahana,Nonpartai
9,7,Menteri Luar Negeri,Retno Lestari Priansari Marsudi,23 Oktober 2019,Petahana,Nonpartai


In [12]:
df = df[df["Pejabat"] != "Menteri"].reset_index(drop=True)
df

Unnamed: 0,No.,Jabatan,Pejabat,Mulai menjabat,Selesai menjabat,Partai
0,1,"Menteri Koordinator Bidang Politik, Hukum, dan...",Mohammad Mahfud MD,23 Oktober 2019,Petahana,Nonpartai
1,2,Menteri Koordinator Bidang Perekonomian,Airlangga Hartarto,23 Oktober 2019,Petahana,Golkar
2,3,Menteri Koordinator Bidang Kemaritiman dan Inv...,Luhut Binsar Panjaitan,23 Oktober 2019,Petahana,Golkar
3,4,Menteri Koordinator Bidang Pembangunan Manusia...,Muhadjir Effendy,23 Oktober 2019,Petahana,Nonpartai
4,5,Menteri Sekretaris Negara,Pratikno,23 Oktober 2019,Petahana,Nonpartai
5,6,Menteri Dalam Negeri,Tito Karnavian,23 Oktober 2019,28 Agustus 2020,Nonpartai
6,6,Menteri Dalam Negeri,Mohammad Mahfud MD(ad-interim)[10],28 Agustus 2020,30 Agustus 2020,Nonpartai
7,6,Menteri Dalam Negeri,Tito Karnavian,31 Agustus 2020,Petahana,Nonpartai
8,7,Menteri Luar Negeri,Retno Lestari Priansari Marsudi,23 Oktober 2019,Petahana,Nonpartai
9,8,Menteri Pertahanan,Prabowo Subianto,23 Oktober 2019,Petahana,Gerindra


In [13]:
list_link_menteri = []
for name in list(df["Pejabat"]):
    name = name.replace(" ", "_")
    list_link_menteri.append(BASE_URL + "wiki/" + name)

In [14]:
list_link_menteri

['https://id.wikipedia.org/wiki/Mohammad_Mahfud_MD',
 'https://id.wikipedia.org/wiki/Airlangga_Hartarto',
 'https://id.wikipedia.org/wiki/Luhut_Binsar_Panjaitan',
 'https://id.wikipedia.org/wiki/Muhadjir_Effendy',
 'https://id.wikipedia.org/wiki/Pratikno',
 'https://id.wikipedia.org/wiki/Tito_Karnavian',
 'https://id.wikipedia.org/wiki/Mohammad_Mahfud_MD(ad-interim)[10]',
 'https://id.wikipedia.org/wiki/Tito_Karnavian',
 'https://id.wikipedia.org/wiki/Retno_Lestari_Priansari_Marsudi',
 'https://id.wikipedia.org/wiki/Prabowo_Subianto',
 'https://id.wikipedia.org/wiki/Yasonna_Laoly',
 'https://id.wikipedia.org/wiki/Sri_Mulyani_Indrawati',
 'https://id.wikipedia.org/wiki/Arifin_Tasrif',
 'https://id.wikipedia.org/wiki/Agus_Gumiwang_Kartasasmita',
 'https://id.wikipedia.org/wiki/Agus_Suparmanto',
 'https://id.wikipedia.org/wiki/Muhammad_Lutfi',
 'https://id.wikipedia.org/wiki/Syahrul_Yasin_Limpo',
 'https://id.wikipedia.org/wiki/Siti_Nurbaya_Bakar',
 'https://id.wikipedia.org/wiki/Budi_Kar

In [15]:
list_sukses = []
list_gagal = []
li = []
for link in tqdm(list_link_menteri):
    try:
        df_sample = get_wiki(link)
        df_sample["Pejabat"] = link.split("/")[-1].replace("_", " ")
        li.append(df_sample)
        list_sukses.append(link)
    except:
        list_gagal.append(link)

100%|██████████████████████████████████████████████████████████████████████████████████| 48/48 [00:19<00:00,  2.51it/s]


In [16]:
len(list_sukses), len(list_gagal)

(40, 8)

In [17]:
list_gagal

['https://id.wikipedia.org/wiki/Mohammad_Mahfud_MD',
 'https://id.wikipedia.org/wiki/Luhut_Binsar_Panjaitan',
 'https://id.wikipedia.org/wiki/Mohammad_Mahfud_MD(ad-interim)[10]',
 'https://id.wikipedia.org/wiki/Luhut_Binsar_Panjaitan(ad-interim)[11]',
 'https://id.wikipedia.org/wiki/Luhut_Binsar_Panjaitan(ad-interim)',
 'https://id.wikipedia.org/wiki/Syahrul_Yasin_Limpo(ad-interim)',
 'https://id.wikipedia.org/wiki/Ida_Fauziyah',
 'https://id.wikipedia.org/wiki/Muhadjir_Effendy(ad-interim)[13]']

In [18]:
new_link = ["https://id.wikipedia.org/wiki/Mahfud_MD",
            "https://id.wikipedia.org/wiki/Ida_Fauziyah",
            "https://id.wikipedia.org/wiki/Luhut_Binsar_Panjaitan"]
list_pejabat_g = ["https://id.wikipedia.org/wiki/Mohammad_Mahfud_MD",
                  "https://id.wikipedia.org/wiki/Ida_Fauziyah",
                  "https://id.wikipedia.org/wiki/Luhut_Binsar_Panjaitan"]

In [19]:
def get_wiki_failed(idx, url):
    df = pd.read_html(url)[idx].T
    new_header = df.iloc[0] #grab the first row for the header
    df = df[1:] #take the data less the header row
    df.columns = new_header #set the header row as the df header
    df = df.reset_index()
    df = df.rename(columns={"index" : "Nama"})
    df = df[["Nama", "Lahir"]]
    return df

In [20]:
for idx in range(len(new_link)):
    df_failed = get_wiki_failed(idx, new_link[idx])
    df_failed["Pejabat"] = list_pejabat_g[idx].split("/")[-1].replace("_", " ")
    li.append(df_failed)

In [21]:
li

[Dr. (H.C.) Ir.Airlangga HartartoM.B.A., M.M.T., IPU.                                               Nama  \
 0                                                     Dr. (H.C.) Ir.Airlangga HartartoM.B.A., M.M.T....   
 
 Dr. (H.C.) Ir.Airlangga HartartoM.B.A., M.M.T., IPU.                                        Lahir  \
 0                                                     1 Oktober 1962 (umur 59)Surabaya, Indonesia   
 
 Dr. (H.C.) Ir.Airlangga HartartoM.B.A., M.M.T., IPU.             Pejabat  
 0                                                     Airlangga Hartarto  ,
 Prof. Dr.Muhadjir EffendyM.A.P.                               Nama  \
 0                                Prof. Dr.Muhadjir EffendyM.A.P..1   
 
 Prof. Dr.Muhadjir EffendyM.A.P.                                              Lahir  \
 0                                29 Juli 1956 (umur 65)Madiun, Jawa Timur, Indo...   
 
 Prof. Dr.Muhadjir EffendyM.A.P.           Pejabat  
 0                                Muhadjir Effendy

In [22]:
df_lahir = pd.concat(li).reset_index(drop=True)
df_lahir

Unnamed: 0,Nama,Lahir,Pejabat
0,"Dr. (H.C.) Ir.Airlangga HartartoM.B.A., M.M.T....","1 Oktober 1962 (umur 59)Surabaya, Indonesia",Airlangga Hartarto
1,Prof. Dr.Muhadjir EffendyM.A.P..1,"29 Juli 1956 (umur 65)Madiun, Jawa Timur, Indo...",Muhadjir Effendy
2,Prof. Dr.PratiknoM.Soc.Sc..1,"13 Februari 1962 (umur 59)Bojonegoro, Indonesia",Pratikno
3,Jenderal Pol. (Purn.) Prof. H.Muhammad Tito Ka...,"26 Oktober 1964 (umur 57)Palembang, Sumatra Se...",Tito Karnavian
4,Jenderal Pol. (Purn.) Prof. H.Muhammad Tito Ka...,"26 Oktober 1964 (umur 57)Palembang, Sumatra Se...",Tito Karnavian
5,Retno Marsudi.1,Retno Lestari Priansari27 November 1962 (umur ...,Retno Lestari Priansari Marsudi
6,Letnan Jenderal TNI (Purn.) H.Prabowo Subianto.1,Prabowo Subianto Djojohadikusumo17 Oktober 195...,Prabowo Subianto
7,Yasonna Laoly.1,"27 Mei 1953 (umur 68) Sorkam, Tapanuli Tengah,...",Yasonna Laoly
8,"Sri MulyaniS.E., M.Sc., Ph.D.1",Sri Mulyani Indrawati26 Agustus 1962 (umur 59)...,Sri Mulyani Indrawati
9,Ir.Arifin Tasrif.1,19 Juni 1953 (umur 68) Jakarta,Arifin Tasrif


In [23]:
df

Unnamed: 0,No.,Jabatan,Pejabat,Mulai menjabat,Selesai menjabat,Partai
0,1,"Menteri Koordinator Bidang Politik, Hukum, dan...",Mohammad Mahfud MD,23 Oktober 2019,Petahana,Nonpartai
1,2,Menteri Koordinator Bidang Perekonomian,Airlangga Hartarto,23 Oktober 2019,Petahana,Golkar
2,3,Menteri Koordinator Bidang Kemaritiman dan Inv...,Luhut Binsar Panjaitan,23 Oktober 2019,Petahana,Golkar
3,4,Menteri Koordinator Bidang Pembangunan Manusia...,Muhadjir Effendy,23 Oktober 2019,Petahana,Nonpartai
4,5,Menteri Sekretaris Negara,Pratikno,23 Oktober 2019,Petahana,Nonpartai
5,6,Menteri Dalam Negeri,Tito Karnavian,23 Oktober 2019,28 Agustus 2020,Nonpartai
6,6,Menteri Dalam Negeri,Mohammad Mahfud MD(ad-interim)[10],28 Agustus 2020,30 Agustus 2020,Nonpartai
7,6,Menteri Dalam Negeri,Tito Karnavian,31 Agustus 2020,Petahana,Nonpartai
8,7,Menteri Luar Negeri,Retno Lestari Priansari Marsudi,23 Oktober 2019,Petahana,Nonpartai
9,8,Menteri Pertahanan,Prabowo Subianto,23 Oktober 2019,Petahana,Gerindra


In [24]:
df_menteri = pd.merge(df, df_lahir, on="Pejabat")
df_menteri

Unnamed: 0,No.,Jabatan,Pejabat,Mulai menjabat,Selesai menjabat,Partai,Nama,Lahir
0,1,"Menteri Koordinator Bidang Politik, Hukum, dan...",Mohammad Mahfud MD,23 Oktober 2019,Petahana,Nonpartai,"Prof. Dr.Mahfud MDS.H., S.U., M.I.P.1",Mohammad Mahfud Mahmodin Damanik13 Mei 1957 (u...
1,2,Menteri Koordinator Bidang Perekonomian,Airlangga Hartarto,23 Oktober 2019,Petahana,Golkar,"Dr. (H.C.) Ir.Airlangga HartartoM.B.A., M.M.T....","1 Oktober 1962 (umur 59)Surabaya, Indonesia"
2,3,Menteri Koordinator Bidang Kemaritiman dan Inv...,Luhut Binsar Panjaitan,23 Oktober 2019,Petahana,Golkar,Luhut Binsar Panjaitan.1,"28 September 1947 (umur 74)Simargala, Huta Nam..."
3,4,Menteri Koordinator Bidang Pembangunan Manusia...,Muhadjir Effendy,23 Oktober 2019,Petahana,Nonpartai,Prof. Dr.Muhadjir EffendyM.A.P..1,"29 Juli 1956 (umur 65)Madiun, Jawa Timur, Indo..."
4,5,Menteri Sekretaris Negara,Pratikno,23 Oktober 2019,Petahana,Nonpartai,Prof. Dr.PratiknoM.Soc.Sc..1,"13 Februari 1962 (umur 59)Bojonegoro, Indonesia"
5,6,Menteri Dalam Negeri,Tito Karnavian,23 Oktober 2019,28 Agustus 2020,Nonpartai,Jenderal Pol. (Purn.) Prof. H.Muhammad Tito Ka...,"26 Oktober 1964 (umur 57)Palembang, Sumatra Se..."
6,6,Menteri Dalam Negeri,Tito Karnavian,23 Oktober 2019,28 Agustus 2020,Nonpartai,Jenderal Pol. (Purn.) Prof. H.Muhammad Tito Ka...,"26 Oktober 1964 (umur 57)Palembang, Sumatra Se..."
7,6,Menteri Dalam Negeri,Tito Karnavian,31 Agustus 2020,Petahana,Nonpartai,Jenderal Pol. (Purn.) Prof. H.Muhammad Tito Ka...,"26 Oktober 1964 (umur 57)Palembang, Sumatra Se..."
8,6,Menteri Dalam Negeri,Tito Karnavian,31 Agustus 2020,Petahana,Nonpartai,Jenderal Pol. (Purn.) Prof. H.Muhammad Tito Ka...,"26 Oktober 1964 (umur 57)Palembang, Sumatra Se..."
9,7,Menteri Luar Negeri,Retno Lestari Priansari Marsudi,23 Oktober 2019,Petahana,Nonpartai,Retno Marsudi.1,Retno Lestari Priansari27 November 1962 (umur ...


In [25]:
df_menteri.to_csv("./All/Kabinet_menteri.csv", index=False)

# 3. Pejabat setingkat menteri

In [26]:
df_3 = pd.read_html(url)[7]
df_3 = df_3.drop(["No.", "Pejabat"], axis=1)
df_3 = df_3.rename(columns={"Pejabat.1" : "Pejabat"})
df_3

Unnamed: 0,Jabatan,Pejabat,Mulai menjabat,Selesai menjabat
0,Jaksa Agung,Arminsyah(Pelaksana tugas),21 Oktober 2019,23 Oktober 2019
1,Jaksa Agung,ST Burhanuddin,23 Oktober 2019,Petahana
2,Panglima Tentara Nasional Indonesia,Hadi Tjahjanto,8 Desember 2017,17 November 2021
3,Panglima Tentara Nasional Indonesia,Andika Perkasa,17 November 2021,Petahana
4,Kepala Kepolisian Negara Republik Indonesia,Ari Dono Sukmanto(Pelaksana tugas),22 Oktober 2019,1 November 2019
5,Kepala Kepolisian Negara Republik Indonesia,Idham Azis,1 November 2019,27 Januari 2021
6,Kepala Kepolisian Negara Republik Indonesia,Listyo Sigit Prabowo,27 Januari 2021,Petahana
7,Sekretaris Kabinet,Pramono Anung,22 Oktober 2019,Petahana
8,Kepala Badan Intelijen Negara,Budi Gunawan,9 September 2016,Petahana
9,Kepala Staf Kepresidenan,Moeldoko,22 Oktober 2019,Petahana


In [29]:
list_link_pejabat = []
for name in list(df_3["Pejabat"]):
    name = name.replace(" ", "_")
    list_link_pejabat.append(BASE_URL + "wiki/" + name)
list_link_pejabat

['https://id.wikipedia.org/wiki/Arminsyah(Pelaksana_tugas)',
 'https://id.wikipedia.org/wiki/ST_Burhanuddin',
 'https://id.wikipedia.org/wiki/Hadi_Tjahjanto',
 'https://id.wikipedia.org/wiki/Andika_Perkasa',
 'https://id.wikipedia.org/wiki/Ari_Dono_Sukmanto(Pelaksana_tugas)',
 'https://id.wikipedia.org/wiki/Idham_Azis',
 'https://id.wikipedia.org/wiki/Listyo_Sigit_Prabowo',
 'https://id.wikipedia.org/wiki/Pramono_Anung',
 'https://id.wikipedia.org/wiki/Budi_Gunawan',
 'https://id.wikipedia.org/wiki/Moeldoko',
 'https://id.wikipedia.org/wiki/Laksana_Tri_Handoko']

In [30]:
list_sukses = []
list_gagal = []
li = []
for link in tqdm(list_link_pejabat):
    try:
        df_sample = get_wiki(link)
        df_sample["Pejabat"] = link.split("/")[-1].replace("_", " ")
        li.append(df_sample)
        list_sukses.append(link)
    except:
        list_gagal.append(link)

100%|██████████████████████████████████████████████████████████████████████████████████| 11/11 [00:04<00:00,  2.37it/s]


In [32]:
len(list_sukses), len(list_gagal)

(8, 3)

In [33]:
list_gagal

['https://id.wikipedia.org/wiki/Arminsyah(Pelaksana_tugas)',
 'https://id.wikipedia.org/wiki/Ari_Dono_Sukmanto(Pelaksana_tugas)',
 'https://id.wikipedia.org/wiki/Laksana_Tri_Handoko']

In [34]:
new_link = ["https://id.wikipedia.org/wiki/Arminsyah",
            "https://id.wikipedia.org/wiki/Ari_Dono_Sukmanto",
            "https://id.wikipedia.org/wiki/Laksana_Tri_Handoko"]
list_pejabat_g = ['https://id.wikipedia.org/wiki/Arminsyah(Pelaksana_tugas)',
                 'https://id.wikipedia.org/wiki/Ari_Dono_Sukmanto(Pelaksana_tugas)',
                 'https://id.wikipedia.org/wiki/Laksana_Tri_Handoko']

In [41]:
def get_wiki_failed(idx, url):
    if idx == 2:
        df = pd.read_html(url)[idx].T
    else:
        df = pd.read_html(url)[0].T
    new_header = df.iloc[0] #grab the first row for the header
    df = df[1:] #take the data less the header row
    df.columns = new_header #set the header row as the df header
    df = df.reset_index()
    df = df.rename(columns={"index" : "Nama"})
    df = df[["Nama", "Lahir"]]
    return df

In [44]:
for idx in range(len(new_link)):
    df_failed = get_wiki_failed(idx, new_link[idx])
    df_failed["Pejabat"] = list_pejabat_g[idx].split("/")[-1].replace("_", " ")
    li.append(df_failed)

In [46]:
df3_lahir = pd.concat(li).reset_index(drop=True)
df3_lahir

Unnamed: 0,Nama,Lahir,Pejabat
0,Sanitiar Burhanuddin.1,"17 Juli 1954 (umur 67) Cirebon, Jawa Barat, In...",ST Burhanuddin
1,Marsekal TNI (Purn.) Dr. (H.C.)Dato Paduka Ser...,"8 November 1963 (umur 58) Malang, Jawa Timur",Hadi Tjahjanto
2,Andika Perkasa.1,Fransiskus Xaverius Emanuel Andika Perkasa[1][...,Andika Perkasa
3,Idham Azis.1,"30 Januari 1963 (umur 58)Kendari, Sulawesi Ten...",Idham Azis
4,Listyo Sigit Prabowo.1,"5 Mei 1969 (umur 52)Ambon, Maluku",Listyo Sigit Prabowo
5,Pramono Anung Wibowo.1,"11 Juni 1963 (umur 58) Kediri, Jawa Timur, Ind...",Pramono Anung
6,Budi Gunawan.1,"11 Desember 1959 (umur 61) Surakarta, Jawa Tengah",Budi Gunawan
7,Moeldoko.1,"8 Juli 1957 (umur 64)Kediri, Jawa Timur, Indon...",Moeldoko
8,"Dr.ArminsyahS.H., M.Si..1","Padang, Sumatra Barat",Arminsyah(Pelaksana tugas)
9,Ari Dono Sukmanto.1,"23 Desember 1961 (umur 59) Bogor, Jawa Barat",Ari Dono Sukmanto(Pelaksana tugas)


In [45]:
df_3

Unnamed: 0,Jabatan,Pejabat,Mulai menjabat,Selesai menjabat
0,Jaksa Agung,Arminsyah(Pelaksana tugas),21 Oktober 2019,23 Oktober 2019
1,Jaksa Agung,ST Burhanuddin,23 Oktober 2019,Petahana
2,Panglima Tentara Nasional Indonesia,Hadi Tjahjanto,8 Desember 2017,17 November 2021
3,Panglima Tentara Nasional Indonesia,Andika Perkasa,17 November 2021,Petahana
4,Kepala Kepolisian Negara Republik Indonesia,Ari Dono Sukmanto(Pelaksana tugas),22 Oktober 2019,1 November 2019
5,Kepala Kepolisian Negara Republik Indonesia,Idham Azis,1 November 2019,27 Januari 2021
6,Kepala Kepolisian Negara Republik Indonesia,Listyo Sigit Prabowo,27 Januari 2021,Petahana
7,Sekretaris Kabinet,Pramono Anung,22 Oktober 2019,Petahana
8,Kepala Badan Intelijen Negara,Budi Gunawan,9 September 2016,Petahana
9,Kepala Staf Kepresidenan,Moeldoko,22 Oktober 2019,Petahana


In [47]:
df_pejabat = pd.merge(df_3, df3_lahir, on="Pejabat")
df_pejabat

Unnamed: 0,Jabatan,Pejabat,Mulai menjabat,Selesai menjabat,Nama,Lahir
0,Jaksa Agung,Arminsyah(Pelaksana tugas),21 Oktober 2019,23 Oktober 2019,"Dr.ArminsyahS.H., M.Si..1","Padang, Sumatra Barat"
1,Jaksa Agung,ST Burhanuddin,23 Oktober 2019,Petahana,Sanitiar Burhanuddin.1,"17 Juli 1954 (umur 67) Cirebon, Jawa Barat, In..."
2,Panglima Tentara Nasional Indonesia,Hadi Tjahjanto,8 Desember 2017,17 November 2021,Marsekal TNI (Purn.) Dr. (H.C.)Dato Paduka Ser...,"8 November 1963 (umur 58) Malang, Jawa Timur"
3,Panglima Tentara Nasional Indonesia,Andika Perkasa,17 November 2021,Petahana,Andika Perkasa.1,Fransiskus Xaverius Emanuel Andika Perkasa[1][...
4,Kepala Kepolisian Negara Republik Indonesia,Ari Dono Sukmanto(Pelaksana tugas),22 Oktober 2019,1 November 2019,Ari Dono Sukmanto.1,"23 Desember 1961 (umur 59) Bogor, Jawa Barat"
5,Kepala Kepolisian Negara Republik Indonesia,Idham Azis,1 November 2019,27 Januari 2021,Idham Azis.1,"30 Januari 1963 (umur 58)Kendari, Sulawesi Ten..."
6,Kepala Kepolisian Negara Republik Indonesia,Listyo Sigit Prabowo,27 Januari 2021,Petahana,Listyo Sigit Prabowo.1,"5 Mei 1969 (umur 52)Ambon, Maluku"
7,Sekretaris Kabinet,Pramono Anung,22 Oktober 2019,Petahana,Pramono Anung Wibowo.1,"11 Juni 1963 (umur 58) Kediri, Jawa Timur, Ind..."
8,Kepala Badan Intelijen Negara,Budi Gunawan,9 September 2016,Petahana,Budi Gunawan.1,"11 Desember 1959 (umur 61) Surakarta, Jawa Tengah"
9,Kepala Staf Kepresidenan,Moeldoko,22 Oktober 2019,Petahana,Moeldoko.1,"8 Juli 1957 (umur 64)Kediri, Jawa Timur, Indon..."


In [48]:
df_pejabat.to_csv("./All/Kabinet_pejabat.csv", index=False)

# 4. Wakil menteri

In [49]:
df_4 = pd.read_html(url)[8]
df_4 = df_4.drop(["No.", "Pejabat"], axis=1)
df_4 = df_4.rename(columns={"Pejabat.1" : "Pejabat"})
df_4

Unnamed: 0,Jabatan,Pejabat,Mulai menjabat,Selesai menjabat,Wakil dari Partai
0,Wakil Menteri Luar Negeri,Mahendra Siregar,25 Oktober 2019,Petahana,Non Partai
1,Wakil Menteri Pertahanan,Sakti Wahyu Trenggono,25 Oktober 2019,23 Desember 2020,Non Partai
2,Wakil Menteri Pertahanan,Muhammad Herindra,23 Desember 2020,Petahana,Non Partai
3,Wakil Menteri Keuangan,Suahasil Nazara,25 Oktober 2019,Petahana,Non Partai
4,Wakil Menteri Perdagangan,Jerry Sambuaga,25 Oktober 2019,Petahana,Golkar
5,Wakil Menteri Lingkungan Hidup dan Kehutanan,Alue Dohong,25 Oktober 2019,Petahana,Non Partai
6,"Wakil Menteri Desa, Pembangunan Daerah Terting...",Budi Arie Setiadi,25 Oktober 2019,Petahana,Non Partai
7,Wakil Menteri Pekerjaan Umum dan Perumahan Rakyat,John Wempi Wetipo,25 Oktober 2019,Petahana,PDI-P
8,Wakil Menteri Agama,Zainut Tauhid Sa'adi,25 Oktober 2019,Petahana,PPP
9,Wakil Menteri Agraria dan Tata Ruang/Wakil Kep...,Surya Tjandra,25 Oktober 2019,Petahana,PSI


In [50]:
list_link_wamen = []
for name in list(df_4["Pejabat"]):
    name = name.replace(" ", "_")
    list_link_wamen.append(BASE_URL + "wiki/" + name)
list_link_wamen

['https://id.wikipedia.org/wiki/Mahendra_Siregar',
 'https://id.wikipedia.org/wiki/Sakti_Wahyu_Trenggono',
 'https://id.wikipedia.org/wiki/Muhammad_Herindra',
 'https://id.wikipedia.org/wiki/Suahasil_Nazara',
 'https://id.wikipedia.org/wiki/Jerry_Sambuaga',
 'https://id.wikipedia.org/wiki/Alue_Dohong',
 'https://id.wikipedia.org/wiki/Budi_Arie_Setiadi',
 'https://id.wikipedia.org/wiki/John_Wempi_Wetipo',
 "https://id.wikipedia.org/wiki/Zainut_Tauhid_Sa'adi",
 'https://id.wikipedia.org/wiki/Surya_Tjandra',
 'https://id.wikipedia.org/wiki/Angela_Tanoesoedibjo',
 'https://id.wikipedia.org/wiki/Budi_Gunadi_Sadikin',
 'https://id.wikipedia.org/wiki/Kartika_Wirjoatmodjo',
 'https://id.wikipedia.org/wiki/Pahala_Mansury',
 'https://id.wikipedia.org/wiki/Dante_Saksono_Harbuwono',
 'https://id.wikipedia.org/wiki/Harvick_Hasnul_Qolbi',
 'https://id.wikipedia.org/wiki/Edward_Omar_Sharif_Hiariej']

In [51]:
list_sukses = []
list_gagal = []
li = []
for link in tqdm(list_link_wamen):
    try:
        df_sample = get_wiki(link)
        df_sample["Pejabat"] = link.split("/")[-1].replace("_", " ")
        li.append(df_sample)
        list_sukses.append(link)
    except:
        list_gagal.append(link)

100%|██████████████████████████████████████████████████████████████████████████████████| 17/17 [00:06<00:00,  2.80it/s]


In [52]:
len(list_sukses), len(list_gagal)

(16, 1)

In [55]:
new_link = ["https://id.wikipedia.org/wiki/Wempi_Wetipo"]
list_pejabat_g = ['https://id.wikipedia.org/wiki/John_Wempi_Wetipo']

In [57]:
df_sample = get_wiki(new_link[0])
df_sample["Pejabat"] = list_pejabat_g[0].split("/")[-1].replace("_", " ")
li.append(df_sample)

In [58]:
df4_lahir = pd.concat(li).reset_index(drop=True)
df4_lahir

Unnamed: 0,Nama,Lahir,Pejabat
0,Mahendra Siregar.1,"17 Oktober 1962 (umur 59)[1] Bandung, Jawa Bar...",Mahendra Siregar
1,Sakti Wahyu Trenggono.1,"3 November 1962 (umur 59)Kota Semarang, Jawa T...",Sakti Wahyu Trenggono
2,Muhammad Herindra.1,"30 November 1964 (umur 57) Magelang, Jawa Tengah",Muhammad Herindra
3,Suahasil Nazara.1,"23 November 1970 (umur 51) Jakarta, Indonesia",Suahasil Nazara
4,Jerry Sambuaga.1,"2 Juli 1985 (umur 36)Jakarta, Indonesia",Jerry Sambuaga
5,Alue Dohong.1,"Tumbang Kalang, Antang Kalang, Kotawaringin Ti...",Alue Dohong
6,Budi Arie Setiadi.1,"20 April 1969 (umur 52) Jakarta, Indonesia",Budi Arie Setiadi
7,Zainut Tauhid Sa'adi.1,"20 Juli 1963 (umur 58) Jepara, Jawa Tengah",Zainut Tauhid Sa'adi
8,Surya Tjandra.1,"28 Maret 1971 (umur 50) Jakarta, Indonesia",Surya Tjandra
9,Angela Tanoesoedibjo.1,Angela Herliani Tanoesoedibjo23 April 1987 (um...,Angela Tanoesoedibjo


In [59]:
df_4

Unnamed: 0,Jabatan,Pejabat,Mulai menjabat,Selesai menjabat,Wakil dari Partai
0,Wakil Menteri Luar Negeri,Mahendra Siregar,25 Oktober 2019,Petahana,Non Partai
1,Wakil Menteri Pertahanan,Sakti Wahyu Trenggono,25 Oktober 2019,23 Desember 2020,Non Partai
2,Wakil Menteri Pertahanan,Muhammad Herindra,23 Desember 2020,Petahana,Non Partai
3,Wakil Menteri Keuangan,Suahasil Nazara,25 Oktober 2019,Petahana,Non Partai
4,Wakil Menteri Perdagangan,Jerry Sambuaga,25 Oktober 2019,Petahana,Golkar
5,Wakil Menteri Lingkungan Hidup dan Kehutanan,Alue Dohong,25 Oktober 2019,Petahana,Non Partai
6,"Wakil Menteri Desa, Pembangunan Daerah Terting...",Budi Arie Setiadi,25 Oktober 2019,Petahana,Non Partai
7,Wakil Menteri Pekerjaan Umum dan Perumahan Rakyat,John Wempi Wetipo,25 Oktober 2019,Petahana,PDI-P
8,Wakil Menteri Agama,Zainut Tauhid Sa'adi,25 Oktober 2019,Petahana,PPP
9,Wakil Menteri Agraria dan Tata Ruang/Wakil Kep...,Surya Tjandra,25 Oktober 2019,Petahana,PSI


In [60]:
df_wamen = pd.merge(df_4, df4_lahir, on="Pejabat")
df_wamen

Unnamed: 0,Jabatan,Pejabat,Mulai menjabat,Selesai menjabat,Wakil dari Partai,Nama,Lahir
0,Wakil Menteri Luar Negeri,Mahendra Siregar,25 Oktober 2019,Petahana,Non Partai,Mahendra Siregar.1,"17 Oktober 1962 (umur 59)[1] Bandung, Jawa Bar..."
1,Wakil Menteri Pertahanan,Sakti Wahyu Trenggono,25 Oktober 2019,23 Desember 2020,Non Partai,Sakti Wahyu Trenggono.1,"3 November 1962 (umur 59)Kota Semarang, Jawa T..."
2,Wakil Menteri Pertahanan,Muhammad Herindra,23 Desember 2020,Petahana,Non Partai,Muhammad Herindra.1,"30 November 1964 (umur 57) Magelang, Jawa Tengah"
3,Wakil Menteri Keuangan,Suahasil Nazara,25 Oktober 2019,Petahana,Non Partai,Suahasil Nazara.1,"23 November 1970 (umur 51) Jakarta, Indonesia"
4,Wakil Menteri Perdagangan,Jerry Sambuaga,25 Oktober 2019,Petahana,Golkar,Jerry Sambuaga.1,"2 Juli 1985 (umur 36)Jakarta, Indonesia"
5,Wakil Menteri Lingkungan Hidup dan Kehutanan,Alue Dohong,25 Oktober 2019,Petahana,Non Partai,Alue Dohong.1,"Tumbang Kalang, Antang Kalang, Kotawaringin Ti..."
6,"Wakil Menteri Desa, Pembangunan Daerah Terting...",Budi Arie Setiadi,25 Oktober 2019,Petahana,Non Partai,Budi Arie Setiadi.1,"20 April 1969 (umur 52) Jakarta, Indonesia"
7,Wakil Menteri Pekerjaan Umum dan Perumahan Rakyat,John Wempi Wetipo,25 Oktober 2019,Petahana,PDI-P,John Wempi Wetipo.1,"15 September 1972 (umur 49) Hulekaima, Maima, ..."
8,Wakil Menteri Agama,Zainut Tauhid Sa'adi,25 Oktober 2019,Petahana,PPP,Zainut Tauhid Sa'adi.1,"20 Juli 1963 (umur 58) Jepara, Jawa Tengah"
9,Wakil Menteri Agraria dan Tata Ruang/Wakil Kep...,Surya Tjandra,25 Oktober 2019,Petahana,PSI,Surya Tjandra.1,"28 Maret 1971 (umur 50) Jakarta, Indonesia"


In [61]:
df_wamen.to_csv("./All/Kabinet_wakmen.csv", index=False)