Project ini adalah tugas dari program magang di PT. INDONESIA INDIKATOR. Tujuan proyek ini adalah untuk mengembangkan sebuah sistem yang dapat melakukan web scraping pada sebuah webstore tertentu. Web scraping adalah teknik untuk mengumpulkan informasi dari halaman web secara otomatis.
- Pemilihan teknologi atau library yang sesuai untuk web scraping.
- Penentuan struktur data yang akan disimpan.
- Pengembangan script untuk mengambil data dari halaman web.
- Pengolahan dan penyimpanan data yang diambil.
- Dokumentasi yang jelas mengenai cara menjalankan proyek dan menjelaskan kode.
📦scrapping-webstore-python
┣ 📂browser
┃ ┗ 📀chromedriver
┣ 📂utils
┃ ┣ 📜__init__.py
┃ ┣ 📜browser.py
┃ ┣ 📜filter.py
┃ ┗ 📜write.py
┗ 📜main.py
This application is built using a number of open source projects to function properly:
- Python - bahasa pemrograman yang digunakan
- Chromedriver - komponen yang digunakan bersama dengan Selenium untuk mengotomatisasi pengujian atau web scraping di browser Chrome
- Selenium - framework yang digunakan untuk otomatisasi web page
- BeautifulSoup - library yang digunakan untuk mengekstrak informasi dari kode HTML dan XML
- Pandas - library yang digunakan untuk manipulasi dan analisis data
- Python v3.10+
- Chromedriver (version according to the chrome used)
This project requires Python v3.10+ to run
Install all the dependencies needed in this project
pip install -r requirements.txt
Then run the project
python main.py
MIT
Romy Saputra Sihananda