List library yang digunakan:
- Virtual Environment
- NLTK
- Sastrawi
- Math
- Beautiful Soup
- Requests
- Flask
- lxml
- Werkzeug
- Run Windows PowerShell as Administrator
- Copy paste Set-ExecutionPolicy Unrestricted -Force pada Windows Powershell agar dapat menggunakan Virtual Environment
- Install library Virtual Environment dengan menggunakan pip3 install virtualenv
- Kemudian clone repo ini
- Ganti directory pada file pyenv.cfg dalam folder Algeo dengan directory tempat install python.exe (Ganti "noler" dengan nama user pada windows yang digunakan atau ganti dengan directory ke python.exe)
- Buka Folder hasil clone repository ini pada VSCode dan ketik .\src\Algeo\Scripts\activate dalam terminal VSCode
- Pastikan Terminal VSCode berada pada directory dengan akhiran Algeo02-19029>
- Jalankan app.py
- Program akan melakukan proses scraping dan menyimpan hasilnya sebagai html pada folder test (sebelumnya ada 1 html file agar folder tidak di delete oleh github, setelah scraping akan terdapat 20 dokumen baru)
- Buka web-browser localhost:5000
- Pilih upload pada top bar home page untuk upload file hasil scraping
- Instruksi lebih lanjut ada pada page localhost:5000/instructions (dapat diakses pada tombol instructions pada bagian atas home page)
app.py menggunakan scraping.py (menjalankan proses scraping dari https://bola.kompas.com/liga-inggris, sekaligus yang menghitung similaritas query dengan dokumen yang telah diupload)
Tiap library yang digunakan sudah terdapat dalam virtual environment Algeo dan dapat digunakan jika sudah menginstall virtualenv dan menuliskan .src\Algeo\Scripts\activate pada terminal VSCode lalu menjalankan app.py. Jika tidak bisa digunakan maka harus install list library di atas.
Untuk menggunakan NLTK harus menjalankan nltkinstall.py terlebih dahulu setelah menggunakan virtual environment Algeo dan sudah mengganti path pada pyenv.cfg, kemudian pilih all packages untuk download semua package yang digunakan dalam program ini
- NLTK (pip3 install nltk dan jalankan program nltkinstall.py)
- Sastrawi (pip3 install Sastrawi)
- Math
- Beautiful Soup (pip3 install beautifulsoup4)
- requests (pip3 install requests)
- Flask (pip3 install Flask)
- lxml (pip3 install lxml)
- Werkzeug (pip3 install Werkzeug)
Buka folder hasil clone git ini
Contoh path terminal: PS C:\Users\Noler\Git\Algeo02-19029>
Tuliskan pip install -r requirements.txt untuk menginstall seluruh library yang digunakan
Pastikan ketika menjalankan program berada pada di directory Algeo02-19029 dan bukan dalam folder src
Khusus untuk NLTK harus menjalankan nltkinstall.py untuk menginstall package nltk (all packages)