# Web Scraping LPSE - Vendor (Announcement) Data

---

For introduction of Selenium, please be kind to open [**this site**](https://www.scrapingbee.com/blog/selenium-python/)

## Import modules

`%pip freeze > requirements.txt`

In [1]:
# Module for web scraping
from selenium import webdriver
# Module for data manipulation
import pandas as pd
from bs4 import BeautifulSoup
# Module for dictionary setting
from collections import defaultdict

## Load the Chromedriver

Read how to download webdriver for Chrome [**here**]('https://chromedriver.chromium.org/downloads')

In [2]:
# Main link
main_link = 'https://lpse.lkpp.go.id/eproc4/lelang/128119/pengumumanlelang'

In [3]:
# Access to main link
DRIVER_PATH = '../bin/chromedriver'
driver = webdriver.Chrome(executable_path = DRIVER_PATH)
driver.get(main_link)

## Core Procedure

### 1 Get links

In [51]:
# Get links
links = driver.find_elements_by_class_name('nav-link')
listLink = [link.get_attribute('href') for link in links]

In [52]:
# List of link
navName = ['Pengumuman', 'Peserta', 'Hasil Evaluasi', 'Pemenang', 'Pemenang Berkontrak']
dictLink = dict(zip(navName, listLink))
dictLink

{'Pengumuman': 'https://lpse.lkpp.go.id/eproc4/lelang/128119/pengumumanlelang',
 'Peserta': 'https://lpse.lkpp.go.id/eproc4/lelang/128119/peserta',
 'Hasil Evaluasi': 'https://lpse.lkpp.go.id/eproc4/evaluasi/128119/hasil',
 'Pemenang': 'https://lpse.lkpp.go.id/eproc4/evaluasi/128119/pemenang',
 'Pemenang Berkontrak': 'https://lpse.lkpp.go.id/eproc4/evaluasi/128119/pemenangberkontrak'}

### 2 Get information of announcement

#### Get link

In [53]:
# Link of announcement
linkAnnounce = dictLink['Pengumuman']
linkAnnounce

'https://lpse.lkpp.go.id/eproc4/lelang/128119/pengumumanlelang'

In [54]:
# Access to evaluation's link
driver.get(linkAnnounce)

#### Get column names

In [55]:
# Get the column elements
announceSummaryData = driver.find_element_by_class_name('content')

In [56]:
dataCollection = announceSummaryData.find_element_by_tag_name('tbody').find_elements_by_tag_name('tr')

In [57]:
# Data collections
dataCollection = announceSummaryData.find_element_by_tag_name('tbody').find_elements_by_tag_name('tr')
print('Length of data in one page: {} rows'.format(len(dataCollection)))

Length of data in one page: 23 rows


#### Get data from table

In [58]:
# Get column names
dictColNamesFirst = {}
for idx in range(len(dataCollection)):
    try:
        colNames = dataCollection[idx].find_elements_by_tag_name('th')[0].text
    except:
        continue
    dictColNamesFirst.update({str(idx): colNames})
# Result
dictColNamesFirst

{'0': 'Kode Tender',
 '1': 'Nama Tender',
 '2': 'Alasan di ulang',
 '3': 'Rencana Umum Pengadaan',
 '4': 'Tanggal Pembuatan',
 '5': 'Tahap Tender Saat Ini',
 '6': 'K/L/PD',
 '7': 'Satuan Kerja',
 '8': 'Jenis Pengadaan',
 '9': 'Metode Pengadaan',
 '10': '',
 '11': 'Tahun Anggaran',
 '12': 'Nilai Pagu Paket',
 '13': 'Jenis Kontrak',
 '14': 'Lokasi Pekerjaan',
 '15': 'Kualifikasi Usaha',
 '16': 'Syarat Kualifikasi',
 '17': 'Izin Usaha',
 '18': 'Izin Usaha',
 '22': 'Peserta Tender'}

In [59]:
# Get values
dictValuesFirst = {}
for idx in range(len(dataCollection)):
    try:
        value = dataCollection[idx].find_elements_by_tag_name('td')[0].text
    except:
        continue
    dictValuesFirst.update({str(idx): value})
# Result
dictValuesFirst

{'0': '128119',
 '1': 'Pengadaan Alat Pengolah Data Tender Ulang',
 '2': '- Yang memasukan dokumen penawaran dan isian kualifikasi hanya satu perusahaan.',
 '3': '',
 '4': '26 Januari 2012',
 '5': 'Tender Sudah Selesai',
 '6': 'Kementerian Koordinator Bidang Perekonomian',
 '7': 'Sekretariat Dewan Nasional Kawasan Ekonomi Khusus',
 '8': 'Pengadaan Barang',
 '9': 'Lelang Umum - Pascakualifikasi Satu File - Harga Terendah Sistem Gugur',
 '10': '',
 '11': 'APBN 2012   ',
 '12': 'Rp. 206.000.000,00',
 '13': 'Lumsum',
 '14': 'DKI Jakarta -',
 '15': 'Kecil',
 '16': '* Ijin Usaha\nIzin Usaha Klasifikasi\nSIUP Bidang pemasokan barang, sub bidang alat/suku cadang/peralatan : komputer\n* Telah Melunasi Kewajiban Pajak Tahun Terakhir\nTelah melunasi kewajiban pajak tahun terakhir (SPT/PPh) serta memiliki laporan bulanan PPh Pasal 25 atau Pasal 21/Pasal 23 atau PPN sekurangkurangnya 3 (tiga) bulan yang lalu; bukti pelunasan pajak bulanan 3 (tiga) bulan terakhir : September, Oktober, dan Nopember 2

## Convert into JSON

In [60]:
# Concate two dictionaries
dictColVal = defaultdict(list)
for d in (dictColNamesFirst, dictValuesFirst):
    for key, value in d.items():
        dictColVal[key].append(value)

In [61]:
dictColVal

defaultdict(list,
            {'0': ['Kode Tender', '128119'],
             '1': ['Nama Tender', 'Pengadaan Alat Pengolah Data Tender Ulang'],
             '2': ['Alasan di ulang',
              '- Yang memasukan dokumen penawaran dan isian kualifikasi hanya satu perusahaan.'],
             '3': ['Rencana Umum Pengadaan', ''],
             '4': ['Tanggal Pembuatan', '26 Januari 2012'],
             '5': ['Tahap Tender Saat Ini', 'Tender Sudah Selesai'],
             '6': ['K/L/PD', 'Kementerian Koordinator Bidang Perekonomian'],
             '7': ['Satuan Kerja',
              'Sekretariat Dewan Nasional Kawasan Ekonomi Khusus'],
             '8': ['Jenis Pengadaan', 'Pengadaan Barang'],
             '9': ['Metode Pengadaan',
              'Lelang Umum - Pascakualifikasi Satu File - Harga Terendah Sistem Gugur'],
             '10': ['', ''],
             '11': ['Tahun Anggaran', 'APBN 2012   '],
             '12': ['Nilai Pagu Paket', 'Rp. 206.000.000,00'],
             '13': ['Jenis K

In [62]:
# Final dictionary
dict_full = {}
for key in dictColVal.keys():
    if len(dictColVal[key]) == 2 and dictColVal[key][0] != '' and dictColVal[key][0] != '':
        dict_full.update({dictColVal[key][0]: dictColVal[key][1]})

In [63]:
# Data
dict_full

{'Kode Tender': '128119',
 'Nama Tender': 'Pengadaan Alat Pengolah Data Tender Ulang',
 'Alasan di ulang': '- Yang memasukan dokumen penawaran dan isian kualifikasi hanya satu perusahaan.',
 'Rencana Umum Pengadaan': '',
 'Tanggal Pembuatan': '26 Januari 2012',
 'Tahap Tender Saat Ini': 'Tender Sudah Selesai',
 'K/L/PD': 'Kementerian Koordinator Bidang Perekonomian',
 'Satuan Kerja': 'Sekretariat Dewan Nasional Kawasan Ekonomi Khusus',
 'Jenis Pengadaan': 'Pengadaan Barang',
 'Metode Pengadaan': 'Lelang Umum - Pascakualifikasi Satu File - Harga Terendah Sistem Gugur',
 'Tahun Anggaran': 'APBN 2012   ',
 'Nilai Pagu Paket': 'Rp. 206.000.000,00',
 'Jenis Kontrak': 'Lumsum',
 'Lokasi Pekerjaan': 'DKI Jakarta -',
 'Kualifikasi Usaha': 'Kecil',
 'Syarat Kualifikasi': '* Ijin Usaha\nIzin Usaha Klasifikasi\nSIUP Bidang pemasokan barang, sub bidang alat/suku cadang/peralatan : komputer\n* Telah Melunasi Kewajiban Pajak Tahun Terakhir\nTelah melunasi kewajiban pajak tahun terakhir (SPT/PPh) ser