# Web Scraping LPSE - Vendor (Announcement) Data

---

For introduction of Selenium, please be kind to open [**this site**](https://www.scrapingbee.com/blog/selenium-python/)

## Import modules

`%pip freeze > requirements.txt`

In [1]:
# Module for web scraping
from selenium import webdriver
# Module for data manipulation
import pandas as pd
from bs4 import BeautifulSoup

## Load the Chromedriver

Read how to download webdriver for Chrome [**here**]('https://chromedriver.chromium.org/downloads')

In [2]:
# Main link
main_link = 'https://lpse.lkpp.go.id/eproc4/lelang/139119/pengumumanlelang'

In [3]:
# Access to main link
DRIVER_PATH = '../bin/chromedriver'
driver = webdriver.Chrome(executable_path = DRIVER_PATH)
driver.get(main_link)

## Core Procedure

### 1 Get links

In [4]:
# Get links
links = driver.find_elements_by_class_name('nav-link')
listLink = [link.get_attribute('href') for link in links]

In [5]:
# List of link
navName = ['Pengumuman', 'Peserta', 'Hasil Evaluasi', 'Pemenang', 'Pemenang Berkontrak']
dictLink = dict(zip(navName, listLink))
dictLink

{'Pengumuman': 'https://lpse.lkpp.go.id/eproc4/lelang/139119/pengumumanlelang',
 'Peserta': 'https://lpse.lkpp.go.id/eproc4/lelang/139119/peserta',
 'Hasil Evaluasi': 'https://lpse.lkpp.go.id/eproc4/evaluasi/139119/hasil',
 'Pemenang': 'https://lpse.lkpp.go.id/eproc4/evaluasi/139119/pemenang',
 'Pemenang Berkontrak': 'https://lpse.lkpp.go.id/eproc4/evaluasi/139119/pemenangberkontrak'}

### 2 Get information of evaluation

#### Get link

In [7]:
# Link of announcement
linkAnnounce = dictLink['Pengumuman']
linkAnnounce

'https://lpse.lkpp.go.id/eproc4/lelang/139119/pengumumanlelang'

In [9]:
# Access to evaluation's link
driver.get(linkAnnounce)

#### Get column names

In [14]:
# Get the column elements
announceSummaryData = driver.find_element_by_class_name('content')

In [15]:
dataCollection = announceSummaryData.find_element_by_tag_name('tbody').find_elements_by_tag_name('tr')

In [18]:
# Data collections
dataCollection = announceSummaryData.find_element_by_tag_name('tbody').find_elements_by_tag_name('tr')
print('Length of data in one page: {} rows'.format(len(dataCollection)))

Length of data in one page: 25 rows


# =========

In [97]:
# Get column names
listColNamesFirst = []
for idx in range(len(dataCollection)):
    try:
        colNames = dataCollection[idx].find_elements_by_tag_name('th')[0].text
    except:
        colNames = dataCollection[idx].text
    listColNamesFirst.append(colNames)
    print(idx, colNames)
# Result
listColNamesFirst

0 Kode Tender
1 Nama Tender
2 Rencana Umum Pengadaan
3 Tanggal Pembuatan
4 Tahap Tender Saat Ini
5 K/L/PD
6 Satuan Kerja
7 Jenis Pengadaan
8 Metode Pengadaan
9 
10 Tahun Anggaran
11 Nilai Pagu Paket
12 Jenis Kontrak
13 Lokasi Pekerjaan
14 Kualifikasi Usaha
15 Syarat Kualifikasi
16 Izin Usaha
17 Izin Usaha
18 SIUP Komputer Dan Telekomunikasi
19 TDP
20 NPWP
21 * Memiliki Surat Keterangan Dukungan Keuangan dari Bank Pemerintah atau Swasta untuk Mengikuti Pengadaan Barang/Jasa
22 * Telah Melunasi Kewajiban Pajak Tahun Terakhir
23 * Pengalaman Pekerjaan
peserta berbentuk badan usaha harus memperoleh paling sedikit 1 (satu) pekerjaan sejenis sebagai penyedia dalam kurun waktu 3 (tiga) tahun terakhir, baik di lingkungan pemerintah maupun swasta termasuk pengalaman subkontrak, kecuali bagi penyedia yang baru berdiri kurang dari 3 (tiga) tahun;
24 Peserta Tender


['Kode Tender',
 'Nama Tender',
 'Rencana Umum Pengadaan',
 'Tanggal Pembuatan',
 'Tahap Tender Saat Ini',
 'K/L/PD',
 'Satuan Kerja',
 'Jenis Pengadaan',
 'Metode Pengadaan',
 '',
 'Tahun Anggaran',
 'Nilai Pagu Paket',
 'Jenis Kontrak',
 'Lokasi Pekerjaan',
 'Kualifikasi Usaha',
 'Syarat Kualifikasi',
 'Izin Usaha',
 'Izin Usaha',
 'SIUP Komputer Dan Telekomunikasi',
 'TDP',
 'NPWP',
 '* Memiliki Surat Keterangan Dukungan Keuangan dari Bank Pemerintah atau Swasta untuk Mengikuti Pengadaan Barang/Jasa',
 '* Telah Melunasi Kewajiban Pajak Tahun Terakhir',
 '* Pengalaman Pekerjaan\npeserta berbentuk badan usaha harus memperoleh paling sedikit 1 (satu) pekerjaan sejenis sebagai penyedia dalam kurun waktu 3 (tiga) tahun terakhir, baik di lingkungan pemerintah maupun swasta termasuk pengalaman subkontrak, kecuali bagi penyedia yang baru berdiri kurang dari 3 (tiga) tahun;',
 'Peserta Tender']

In [70]:
dataCollection[idx].find_elements_by_tag_name('th')[0].text

'Peserta Tender'

In [98]:
# Get column names
listColNamesFirst = []
for idx in range(len(dataCollection)):
    try:
        colval = dataCollection[idx].find_elements_by_tag_name('th')
        for i in range(len(colval)):
            colNames = colval[i].text
            listColNamesFirst.append(colNames)
            print(idx, colNames)
    except:
        continue
# Result
# listColNamesFirst

0 Kode Tender
1 Nama Tender
2 Rencana Umum Pengadaan
3 Tanggal Pembuatan
4 Tahap Tender Saat Ini
5 K/L/PD
6 Satuan Kerja
7 Jenis Pengadaan
8 Metode Pengadaan
9 
10 Tahun Anggaran
11 Nilai Pagu Paket
11 Nilai HPS Paket
12 Jenis Kontrak
12 Cara Pembayaran
13 Lokasi Pekerjaan
14 Kualifikasi Usaha
15 Syarat Kualifikasi
15 Izin Usaha
15 Klasifikasi
16 Izin Usaha
16 Klasifikasi
17 Izin Usaha
17 Klasifikasi
24 Peserta Tender


In [77]:
listColNamesFirst

['Kode Tender',
 'Nama Tender',
 'Rencana Umum Pengadaan',
 'Tanggal Pembuatan',
 'Tahap Tender Saat Ini',
 'K/L/PD',
 'Satuan Kerja',
 'Jenis Pengadaan',
 'Metode Pengadaan',
 '',
 'Tahun Anggaran',
 'Nilai Pagu Paket',
 'Nilai HPS Paket',
 'Jenis Kontrak',
 'Cara Pembayaran',
 'Lokasi Pekerjaan',
 'Kualifikasi Usaha',
 'Syarat Kualifikasi',
 'Izin Usaha',
 'Klasifikasi',
 'Izin Usaha',
 'Klasifikasi',
 'Izin Usaha',
 'Klasifikasi',
 'Peserta Tender']

In [129]:
# Get column names
listColNamesFirst = {}
for idx in range(len(dataCollection)):
    try:
        colNames = dataCollection[idx].find_elements_by_tag_name('th')[0].text
    except:
        continue
    listColNamesFirst.update({str(idx): colNames})
    print(idx, colNames)
# Result
# listColNamesFirst

0 Kode Tender
1 Nama Tender
2 Rencana Umum Pengadaan
3 Tanggal Pembuatan
4 Tahap Tender Saat Ini
5 K/L/PD
6 Satuan Kerja
7 Jenis Pengadaan
8 Metode Pengadaan
9 
10 Tahun Anggaran
11 Nilai Pagu Paket
12 Jenis Kontrak
13 Lokasi Pekerjaan
14 Kualifikasi Usaha
15 Syarat Kualifikasi
16 Izin Usaha
17 Izin Usaha
24 Peserta Tender


In [130]:
listColNamesFirst

{'0': 'Kode Tender',
 '1': 'Nama Tender',
 '2': 'Rencana Umum Pengadaan',
 '3': 'Tanggal Pembuatan',
 '4': 'Tahap Tender Saat Ini',
 '5': 'K/L/PD',
 '6': 'Satuan Kerja',
 '7': 'Jenis Pengadaan',
 '8': 'Metode Pengadaan',
 '9': '',
 '10': 'Tahun Anggaran',
 '11': 'Nilai Pagu Paket',
 '12': 'Jenis Kontrak',
 '13': 'Lokasi Pekerjaan',
 '14': 'Kualifikasi Usaha',
 '15': 'Syarat Kualifikasi',
 '16': 'Izin Usaha',
 '17': 'Izin Usaha',
 '24': 'Peserta Tender'}

In [102]:
len(listValuesFirst)

24

In [131]:
# Get values
listValuesFirst = {}
for idx in range(len(dataCollection)):
    try:
        value = dataCollection[idx].find_elements_by_tag_name('td')[0].text
    except:
        continue
    listValuesFirst.update({str(idx): value})
    print(idx, value)
# Result
# listValuesFirst

0 139119
1 1 (satu) Paket Peralatan Observasi Geimagnet Landas Bumi
2 
3 2 Februari 2012
4 Tender Sudah Selesai
5 Lembaga Penerbangan Dan Antariksa Nasional (LAPAN)
6 Pusat Sains Antariksa
7 Pengadaan Barang
8 Lelang Umum - Pascakualifikasi Satu File - Harga Terendah Sistem Gugur
9 
10 APBN 2012   
11 Rp. 1.556.954.000,00
12 Lumsum
13 Bandung -
14 Kecil
15 * Ijin Usaha
Izin Usaha Klasifikasi
SIUP Komputer Dan Telekomunikasi
TDP
NPWP
* Memiliki Surat Keterangan Dukungan Keuangan dari Bank Pemerintah atau Swasta untuk Mengikuti Pengadaan Barang/Jasa
* Telah Melunasi Kewajiban Pajak Tahun Terakhir
* Pengalaman Pekerjaan
peserta berbentuk badan usaha harus memperoleh paling sedikit 1 (satu) pekerjaan sejenis sebagai penyedia dalam kurun waktu 3 (tiga) tahun terakhir, baik di lingkungan pemerintah maupun swasta termasuk pengalaman subkontrak, kecuali bagi penyedia yang baru berdiri kurang dari 3 (tiga) tahun;
16 *
18 SIUP
19 TDP
20 NPWP
21 *
22 *
23 *
24 23 peserta


In [132]:
listValuesFirst

{'0': '139119',
 '1': '1 (satu) Paket Peralatan Observasi Geimagnet Landas Bumi',
 '2': '',
 '3': '2 Februari 2012',
 '4': 'Tender Sudah Selesai',
 '5': 'Lembaga Penerbangan Dan Antariksa Nasional (LAPAN)',
 '6': 'Pusat Sains Antariksa',
 '7': 'Pengadaan Barang',
 '8': 'Lelang Umum - Pascakualifikasi Satu File - Harga Terendah Sistem Gugur',
 '9': '',
 '10': 'APBN 2012   ',
 '11': 'Rp. 1.556.954.000,00',
 '12': 'Lumsum',
 '13': 'Bandung -',
 '14': 'Kecil',
 '15': '* Ijin Usaha\nIzin Usaha Klasifikasi\nSIUP Komputer Dan Telekomunikasi\nTDP\nNPWP\n* Memiliki Surat Keterangan Dukungan Keuangan dari Bank Pemerintah atau Swasta untuk Mengikuti Pengadaan Barang/Jasa\n* Telah Melunasi Kewajiban Pajak Tahun Terakhir\n* Pengalaman Pekerjaan\npeserta berbentuk badan usaha harus memperoleh paling sedikit 1 (satu) pekerjaan sejenis sebagai penyedia dalam kurun waktu 3 (tiga) tahun terakhir, baik di lingkungan pemerintah maupun swasta termasuk pengalaman subkontrak, kecuali bagi penyedia yang baru 

In [173]:
dd = defaultdict(list)

for d in (listColNamesFirst, listValuesFirst):
    for key, value in d.items():
        dd[key].append(value)

In [193]:
dd

defaultdict(list,
            {'0': ['Kode Tender', '139119'],
             '1': ['Nama Tender',
              '1 (satu) Paket Peralatan Observasi Geimagnet Landas Bumi'],
             '2': ['Rencana Umum Pengadaan', ''],
             '3': ['Tanggal Pembuatan', '2 Februari 2012'],
             '4': ['Tahap Tender Saat Ini', 'Tender Sudah Selesai'],
             '5': ['K/L/PD',
              'Lembaga Penerbangan Dan Antariksa Nasional (LAPAN)'],
             '6': ['Satuan Kerja', 'Pusat Sains Antariksa'],
             '7': ['Jenis Pengadaan', 'Pengadaan Barang'],
             '8': ['Metode Pengadaan',
              'Lelang Umum - Pascakualifikasi Satu File - Harga Terendah Sistem Gugur'],
             '9': ['', ''],
             '10': ['Tahun Anggaran', 'APBN 2012   '],
             '11': ['Nilai Pagu Paket', 'Rp. 1.556.954.000,00'],
             '12': ['Jenis Kontrak', 'Lumsum'],
             '13': ['Lokasi Pekerjaan', 'Bandung -'],
             '14': ['Kualifikasi Usaha', 'Kecil'],
  

In [208]:
d = {}
for key in dd.keys():
    if len(dd[key]) == 2 and dd[key][0] != '' and dd[key][0] != '':
        d.update({dd[key][0]: dd[key][1]})

In [209]:
d

{'Kode Tender': '139119',
 'Nama Tender': '1 (satu) Paket Peralatan Observasi Geimagnet Landas Bumi',
 'Rencana Umum Pengadaan': '',
 'Tanggal Pembuatan': '2 Februari 2012',
 'Tahap Tender Saat Ini': 'Tender Sudah Selesai',
 'K/L/PD': 'Lembaga Penerbangan Dan Antariksa Nasional (LAPAN)',
 'Satuan Kerja': 'Pusat Sains Antariksa',
 'Jenis Pengadaan': 'Pengadaan Barang',
 'Metode Pengadaan': 'Lelang Umum - Pascakualifikasi Satu File - Harga Terendah Sistem Gugur',
 'Tahun Anggaran': 'APBN 2012   ',
 'Nilai Pagu Paket': 'Rp. 1.556.954.000,00',
 'Jenis Kontrak': 'Lumsum',
 'Lokasi Pekerjaan': 'Bandung -',
 'Kualifikasi Usaha': 'Kecil',
 'Syarat Kualifikasi': '* Ijin Usaha\nIzin Usaha Klasifikasi\nSIUP Komputer Dan Telekomunikasi\nTDP\nNPWP\n* Memiliki Surat Keterangan Dukungan Keuangan dari Bank Pemerintah atau Swasta untuk Mengikuti Pengadaan Barang/Jasa\n* Telah Melunasi Kewajiban Pajak Tahun Terakhir\n* Pengalaman Pekerjaan\npeserta berbentuk badan usaha harus memperoleh paling sedikit 1

In [195]:
dict([(dd[key][0], dd[key][1]) if len(dd[key]) == 2 else (key, None) for key in dd.keys()])

{'Kode Tender': '139119',
 'Nama Tender': '1 (satu) Paket Peralatan Observasi Geimagnet Landas Bumi',
 'Rencana Umum Pengadaan': '',
 'Tanggal Pembuatan': '2 Februari 2012',
 'Tahap Tender Saat Ini': 'Tender Sudah Selesai',
 'K/L/PD': 'Lembaga Penerbangan Dan Antariksa Nasional (LAPAN)',
 'Satuan Kerja': 'Pusat Sains Antariksa',
 'Jenis Pengadaan': 'Pengadaan Barang',
 'Metode Pengadaan': 'Lelang Umum - Pascakualifikasi Satu File - Harga Terendah Sistem Gugur',
 '': '',
 'Tahun Anggaran': 'APBN 2012   ',
 'Nilai Pagu Paket': 'Rp. 1.556.954.000,00',
 'Jenis Kontrak': 'Lumsum',
 'Lokasi Pekerjaan': 'Bandung -',
 'Kualifikasi Usaha': 'Kecil',
 'Syarat Kualifikasi': '* Ijin Usaha\nIzin Usaha Klasifikasi\nSIUP Komputer Dan Telekomunikasi\nTDP\nNPWP\n* Memiliki Surat Keterangan Dukungan Keuangan dari Bank Pemerintah atau Swasta untuk Mengikuti Pengadaan Barang/Jasa\n* Telah Melunasi Kewajiban Pajak Tahun Terakhir\n* Pengalaman Pekerjaan\npeserta berbentuk badan usaha harus memperoleh paling 

# =========

In [133]:
listColNamesFirst

{'0': 'Kode Tender',
 '1': 'Nama Tender',
 '2': 'Rencana Umum Pengadaan',
 '3': 'Tanggal Pembuatan',
 '4': 'Tahap Tender Saat Ini',
 '5': 'K/L/PD',
 '6': 'Satuan Kerja',
 '7': 'Jenis Pengadaan',
 '8': 'Metode Pengadaan',
 '9': '',
 '10': 'Tahun Anggaran',
 '11': 'Nilai Pagu Paket',
 '12': 'Jenis Kontrak',
 '13': 'Lokasi Pekerjaan',
 '14': 'Kualifikasi Usaha',
 '15': 'Syarat Kualifikasi',
 '16': 'Izin Usaha',
 '17': 'Izin Usaha',
 '24': 'Peserta Tender'}

In [134]:
listValuesFirst

{'0': '139119',
 '1': '1 (satu) Paket Peralatan Observasi Geimagnet Landas Bumi',
 '2': '',
 '3': '2 Februari 2012',
 '4': 'Tender Sudah Selesai',
 '5': 'Lembaga Penerbangan Dan Antariksa Nasional (LAPAN)',
 '6': 'Pusat Sains Antariksa',
 '7': 'Pengadaan Barang',
 '8': 'Lelang Umum - Pascakualifikasi Satu File - Harga Terendah Sistem Gugur',
 '9': '',
 '10': 'APBN 2012   ',
 '11': 'Rp. 1.556.954.000,00',
 '12': 'Lumsum',
 '13': 'Bandung -',
 '14': 'Kecil',
 '15': '* Ijin Usaha\nIzin Usaha Klasifikasi\nSIUP Komputer Dan Telekomunikasi\nTDP\nNPWP\n* Memiliki Surat Keterangan Dukungan Keuangan dari Bank Pemerintah atau Swasta untuk Mengikuti Pengadaan Barang/Jasa\n* Telah Melunasi Kewajiban Pajak Tahun Terakhir\n* Pengalaman Pekerjaan\npeserta berbentuk badan usaha harus memperoleh paling sedikit 1 (satu) pekerjaan sejenis sebagai penyedia dalam kurun waktu 3 (tiga) tahun terakhir, baik di lingkungan pemerintah maupun swasta termasuk pengalaman subkontrak, kecuali bagi penyedia yang baru 

In [136]:
[k for k in listColNamesFirst]

['0',
 '1',
 '2',
 '3',
 '4',
 '5',
 '6',
 '7',
 '8',
 '9',
 '10',
 '11',
 '12',
 '13',
 '14',
 '15',
 '16',
 '17',
 '24']

In [164]:
dict([(k, [listColNamesFirst[k], listValuesFirst[k]]) for k in listColNamesFirst])

KeyError: '17'

In [111]:
dict2

{'name': 'Jaime',
 'last_name': 'Rivera',
 'phone_number': '111111',
 'email': 'test@gmail.com'}

In [83]:
# Get values
listValuesFirst = []
for idx in range(len(dataCollection)):
    try:
        value = dataCollection[idx].find_elements_by_tag_name('th')[0].text
    except:
        continue
    listValuesFirst.append(value)
    print(idx, value)
# Result
listValuesFirst

0 Kode Tender
1 Nama Tender
2 Rencana Umum Pengadaan
3 Tanggal Pembuatan
4 Tahap Tender Saat Ini
5 K/L/PD
6 Satuan Kerja
7 Jenis Pengadaan
8 Metode Pengadaan
9 
10 Tahun Anggaran
11 Nilai Pagu Paket
12 Jenis Kontrak
13 Lokasi Pekerjaan
14 Kualifikasi Usaha
15 Syarat Kualifikasi
16 Izin Usaha
17 Izin Usaha
24 Peserta Tender


['Kode Tender',
 'Nama Tender',
 'Rencana Umum Pengadaan',
 'Tanggal Pembuatan',
 'Tahap Tender Saat Ini',
 'K/L/PD',
 'Satuan Kerja',
 'Jenis Pengadaan',
 'Metode Pengadaan',
 '',
 'Tahun Anggaran',
 'Nilai Pagu Paket',
 'Jenis Kontrak',
 'Lokasi Pekerjaan',
 'Kualifikasi Usaha',
 'Syarat Kualifikasi',
 'Izin Usaha',
 'Izin Usaha',
 'Peserta Tender']

In [None]:
# Get column names
listColNamesFirst = []
for idx in range(len(dataCollection)):
    try:
        colval = dataCollection[idx].find_elements_by_tag_name('th')
        for i in range(len(colval)):
            colNames = colval[i].text
            listColNamesFirst.append(colNames)
            print(idx, colNames)
    except:
        continue
# Result
# listColNamesFirst

In [82]:
len(listValuesFirst)

52

In [81]:
# Get values
listValuesFirst = []
for idx in range(len(dataCollection)):
    try:
        valcol = dataCollection[idx].find_elements_by_tag_name('td')
        for i in range(len(valcol)):
            value = valcol[i].text
            listValuesFirst.append(value)
            print(idx, value)
    except:
        continue
# Result
# listValuesFirst

0 139119
1 1 (satu) Paket Peralatan Observasi Geimagnet Landas Bumi
2 
3 2 Februari 2012
4 Tender Sudah Selesai
5 Lembaga Penerbangan Dan Antariksa Nasional (LAPAN)
6 Pusat Sains Antariksa
7 Pengadaan Barang
8 Lelang Umum - Pascakualifikasi Satu File - Harga Terendah Sistem Gugur
9 
10 APBN 2012   
11 Rp. 1.556.954.000,00
11 Rp. 1.556.849.700,00
12 Lumsum
13 Bandung -
14 Kecil
15 * Ijin Usaha
Izin Usaha Klasifikasi
SIUP Komputer Dan Telekomunikasi
TDP
NPWP
* Memiliki Surat Keterangan Dukungan Keuangan dari Bank Pemerintah atau Swasta untuk Mengikuti Pengadaan Barang/Jasa
* Telah Melunasi Kewajiban Pajak Tahun Terakhir
* Pengalaman Pekerjaan
peserta berbentuk badan usaha harus memperoleh paling sedikit 1 (satu) pekerjaan sejenis sebagai penyedia dalam kurun waktu 3 (tiga) tahun terakhir, baik di lingkungan pemerintah maupun swasta termasuk pengalaman subkontrak, kecuali bagi penyedia yang baru berdiri kurang dari 3 (tiga) tahun;
15 *
15 Ijin Usaha
Izin Usaha Klasifikasi
SIUP Komputer Da