Program ini digunakan untuk melakukan data scraping data tentang kecelakaan penerbangan pesawat komersial dari website milik Bureau of Aircraft Accidents Archives.
Hasil dari data scraping yang dilakukan oleh program adalah beberapa komponen dari kecelakaan penerbangan pesawat komersil, yaitu sebagai berikut:
- Tanggal dan waktu kejadian
- Jenis pesawat yang mengalami kejadian
- Maskapai/ Operator penanggung jawab kejadian
- Fase penerbangan saat kejadian terjadi
- Lokasi dan topografi daerah tempat kejadian terjadi
- Jumlah kru dan penumpang pada pesawat
- Jumlah korban meninggal dunia
Runtime: Python ver. 3.7.7
Library:
- BeautifulSoup (bs4)
- concurrent.futures
- json
- re
- Request
- threading
- Masukkan script berikut ke dalam CLI pada root directory (*Note : Bila kode tidak berjalan, silahkan coba lagi dengan mengganti "python" dengan "py" atau "python3")
$ python src/main_scraper.py
- Masukkan nama file hasil data scraping yang diinginkan tanpa ekstensi .json
- Tunggu beberapa saat
- Akan muncul teks yang menandakan proses data scraping telah selesai
- Hasil data scraping dapat dilihat di folder data
[
{
"Accident Date": "2019-09-16",
"Airplane Operator": "twoFlex",
"Airplane Type": "Cessna 208B Grand Caravan",
"Flight Phase": "Takeoff ",
"Crash Location": "Amazonas, Brazil",
"Crew on Board": "2",
"Crew Casualties": "0",
"Passenger on Board": "8",
"Passenger Casualties": "0",
"Other Casualties": "0"
},
{
...
},
...
]
Library yang digunakann: