Skip to content

RomySaputraSihananda/scrapping-webstore-python

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Twitter: romy

scrapping-webstore-python

Project ini adalah tugas dari program magang di PT. INDONESIA INDIKATOR. Tujuan proyek ini adalah untuk mengembangkan sebuah sistem yang dapat melakukan web scraping pada sebuah webstore tertentu. Web scraping adalah teknik untuk mengumpulkan informasi dari halaman web secara otomatis.

Features

  • Pemilihan teknologi atau library yang sesuai untuk web scraping.
  • Penentuan struktur data yang akan disimpan.
  • Pengembangan script untuk mengambil data dari halaman web.
  • Pengolahan dan penyimpanan data yang diambil.
  • Dokumentasi yang jelas mengenai cara menjalankan proyek dan menjelaskan kode.

Structure

📦scrapping-webstore-python
 ┣ 📂browser
 ┃ ┗ 📀chromedriver
 ┣ 📂utils
 ┃ ┣ 📜__init__.py
 ┃ ┣ 📜browser.py
 ┃ ┣ 📜filter.py
 ┃ ┗ 📜write.py
 ┗ 📜main.py

Tech

This application is built using a number of open source projects to function properly:

  • Python - bahasa pemrograman yang digunakan
  • Chromedriver - komponen yang digunakan bersama dengan Selenium untuk mengotomatisasi pengujian atau web scraping di browser Chrome
  • Selenium - framework yang digunakan untuk otomatisasi web page
  • BeautifulSoup - library yang digunakan untuk mengekstrak informasi dari kode HTML dan XML
  • Pandas - library yang digunakan untuk manipulasi dan analisis data

Requirement

Installation

This project requires Python v3.10+ to run

Install all the dependencies needed in this project

pip install -r requirements.txt

Then run the project

python main.py

License

MIT

Credit

Romy Saputra Sihananda

About

Web Scrapping menggunakan selenium python dan beautifullsoup

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages