# Preparing Libraries and Installations

In [1]:
%pip install bs4 selenium

Defaulting to user installation because normal site-packages is not writeable
Note: you may need to restart the kernel to use updated packages.


In [1]:
import selenium
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from webdriver_manager.chrome import ChromeDriverManager
from selenium.common.exceptions import WebDriverException

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

from selenium.common.exceptions import TimeoutException
from selenium.common.exceptions import NoSuchElementException
from selenium.common.exceptions import ElementClickInterceptedException, StaleElementReferenceException


from bs4 import BeautifulSoup

import pandas as pd
import time

# Opening the Website

In [3]:
# URL Ulasan dari Female Daily
url = "https://reviews.femaledaily.com/products/moisturizer/sun-protection-1/emina/sun-protection-spf-30-pa"

try:
    # Inisialisasi option chrome
    chrome_options = Options()
    chrome_options.add_argument('--headless')
    chrome_options.add_argument('--no-sandbox')
    chrome_options.add_argument('--disable-dev-shm-usage')

    # Inisialisasi WebDriver
    service = Service(executable_path = ChromeDriverManager().install())
    driver = webdriver.Chrome(service=service, options=chrome_options)

    # Buka URL
    driver.get(url)
    wait = WebDriverWait(driver, 10)

    # Ekstrak dan print title
    print(driver.title)
    time.sleep(5) #tunggu 5 detik

    #data frame
    df_data = pd.DataFrame(columns = ['age', 'skin_type', 'rating', 'recommended', 'review','usage_period', 'purchase_point'])

    # Get List Reviews
    soup = BeautifulSoup(driver.page_source, 'html.parser')
    list_reviews = soup.find(class_='list-reviews')

    reviews = list_reviews.find_all(class_='review-card')

    for review in reviews:
        #left column
        left_col = review.find(class_= 'review-card-col left')
        age = left_col.find('p', class_='profile-age').get_text(strip=True)
        skin_type = left_col.find('p', class_='profile-description').get_text(strip=True)


        #right column
        right_col = review.find(class_= 'review-card-col right')
        wrapper = right_col.find(class_='review-content-wrapper')

        #start ratings
        star_icons = wrapper.find_all('i', class_='icon-ic_big_star_full')
        rating = len(star_icons)

        #recommend
        recommendation_tag = wrapper.find('p', class_='recommend')
        if recommendation_tag:
            if 'recommends' in recommendation_tag.get_text():
                recommended = "recommended"
            else:
                recommended =  "not recommended"
        else:
            recommended =  "unknown"

        #text review
        try:
            review_text = wrapper.find(class_='text-content').get_text(strip=True)
        except  (StaleElementReferenceException, NoSuchElementException):
            review_text = ""

        #usage period and purchase point
        info_wrapper = wrapper.find(class_='information-wrapper')
        usage_period = info_wrapper.find('span', string='Usage Period ').find_next('b').get_text(strip=True)
        purchase_point = info_wrapper.find('span', string='Purchase Point ').find_next('b').get_text(strip=True)
        
        df_data.loc[len(df_data)] = [age, skin_type, rating, recommended, review_text, usage_period, purchase_point]
        # print(f'Age: {age}\nSkin type: {skin_type}\n')

    # Next Button untuk pagination
    # next_button = wait.until(EC.element_to_be_clickable((By.CLASS_NAME, 'paging-prev-text-active')))

    # driver.execute_script("arguments[0].scrollIntoView(true);", next_button)
    # time.sleep(1)  # brief sleep to allow any potential animations to complete

    # try:
    #     next_button.click()
    #     time.sleep(10)
    # except WebDriverException:
    #     # If the click fails, use JavaScript to click
    #     driver.execute_script("arguments[0].click();", next_button)

#exception
except WebDriverException as e:
    print(f"WebDriverException: {e}")
except Exception as e:
    print(f"An unexpected error occurred: {e}")
except TimeoutException:
    print("The element was not clickable within the given time")
finally:
    time.sleep(10)
    driver.quit()

Emina Sun Protection SPF 30 PA+++ - Beauty Review


In [8]:
pd.set_option('display.max_colwidth', None)
df_data.head(10)

Unnamed: 0,age,skin_type,rating,recommended,review,usage_period,purchase_point
0,30 - 34,"Combination, Medium Light, Cool",3,recommended,"Teksturnya agak watery gituDiblendnya agak lumayan usahaDi muka saya, kerasa panas pas dipakai. Dan ada aroma agak tajemnya. Tapi emang harganya sangat affordable. Kalau pas keringetan, lumayan keliatan putih putih gitu bulir keringetnya dan agak pedih dimata.",1 week - 1 month,Super Indo
1,19 - 24,"Oily, Medium, Neutral",5,recommended,"udah pake ini dari jaman SMA hahah seneng banget bisa cocok. suka banget sama texturenya yang ringan, gampang nyerep, gampang diblend, gak bikin gerah, gak ada whitecast. yang bikin seneng lagi, harganya murah meriah dan gampang didapetin.",More than 1 year,Alfamart
2,19 - 24,"Normal, Medium, Neutral",3,not recommended,"ini adalah suncreen pertamaku , dulu cocok banget krn harganya sangat friendly di kantong pelajar , mudah untuk di apply juga .. cuma gatau kenapa tiap aku habis pakai ini muka jadi keliatan lebih kusam , jd aku ga terlalu merekomendasikannya siii",6 months - 1 year,Guardian
3,25 - 29,"Combination, Medium, Warm",4,recommended,"Emina itu brand yang nge hype buat remaja dan aku dulu pernah jadi one of among a lot collector juga diantaranya yg pernah aku beli ini adalah spf nya yang di edisi packaging pattern unyu dan simple.. oke.. spf ini yg paling light dari semua spf yg pernah aku pakai.. sampai"" efeknya juga kayak ga pakai spf saking dia daya absorb nya yang setipis hantu.. fun fact nya adalah dia spf pertama aku yg beli iseng tanpa ada maksud daily used nih.. hahaha.. jadi cuman iseng aja.. btw,, bau aloe vera nya yang khas ala spf emina ini memang the best ya.. legend baunya.. teksturnya gel to lotion gituu.. memang spf affordable sih.. tapi belum tau efektifnya kalau buat daily bagus apa nggak..",1 month - 3 months,Guardian
4,18 and Under,"Oily, Medium, Warm",2,recommended,"sunscreen pertama akuu pas kenal skincareeteksturnya gel gtu mudah buat aplikasiinnyagda efek apa' si diaku, tapi mnurutku aku agak kurang cocok karena fragrancenya lumayan kenceng jadi ga nyaman aja pakenya",1 month - 3 months,FD Flash Sale
5,19 - 24,"Combination, Medium Dark, Warm",1,not recommended,"astaga ini tuh ss paling ngga banget dari semua ss yang aku pake, dia tuh bener bener bikin minyakan terus bruntusan parah dannnn bikin kusam banget, ngga tau emang muka aku yang sensitif atau gimana tapi ini emang bener bener ngga cocok bangetttt mungkin di beberapa orang ada yang cocok and balik lagi ke tipkul orang orang",1 month - 3 months,Tiktok
6,19 - 24,"Oily, Light, Neutral",2,not recommended,"Huhu sorry bgt tp ga suka sm ini product 😭 bikin kusem dan berminyak bgt. Jadi berat di wajah klo buat oily skin kek aku. Sepertinya ini lbh cocok buat yg normal-dry sih. Texturenya kyk gel putih kuning dikit cuman ga gampang nyerep gt lho. Aku gatau sih hasil reformulasinya kek apa. Soalnya, aku nyoba yg lama aku krng suka dan simply krn aku udah nemu yg lbh cocok aja sih. Plus nya emg affordable dan gampang ditemuin dimana2",1 month - 3 months,Watson
7,19 - 24,"Oily, Medium, Cool",4,recommended,pernah makai sunscreen emina ini pas dulu jaman sekolah lagi viral dan hype banget! bagus sih sebenernya cuma kurang cocok di muka ku agak bikin kusam after usednya jadi gak lanjut makai cuma semuanya oke aja kok produk dan komposisinya bagus,1 week - 1 month,Shopee
8,19 - 24,"Combination, Medium Light, Neutral",3,recommended,"Sebenarnya dulu waktu SMP sunscreen yang biasa aku pake dari emina sampe.aku sma pun masih tetep pake ko sempet berhenti waktu lagi breakout di masa pandemi dan kembali aku pake pas kuliah beberapa bulan aja sebenaenya untuk teksturnyan bagus koo tapi sayangnya dia ada kandungan alkohol yang buat dahi aku suka muncul bruntusan meskipun ga parah menurut ku juga tetap mengganggu bruntusannya cuma muncul beberapa ajaa dan di bawah kantung mata pun juga kadang ada belum lagi efek pemakaian beberapa jam kedepannya jadi buat kusam di wajah jadi aku kurang sukaa :( ,aku baru berani ambil keputusan ganti sunscreen setelah memasuki masa kuliah setelah beberapa tahun SMP dan SMA skincare yang aku pake dari emina semua xixxi... , tapi gais yang dulu aku pake kan formula lama untuk formula sekarang ini jauh lebih bagus koo sunscreennya meskipun belum pernah aku coba lagi sih sekarang tapi kalau berdasarkan review dari beberapa temen aku yang pake mereka ngejelasin formula sunscreen yang terbaru ini ada yang non-alkohol , ada juga varian yang non-comedogenic dan non-acnegenic. Menurutku jadi upgrade lebih bagus lagi sih harusnya udah ga ada permasalahan yang aku alami dulu di formula yang sekarang ( untuk sekarang aku cuma bisa kasih bintang 3 mungkin kalau nanti ada kesempatan buat coba formula barunya aku balik lagi buat review dan mempertimbangkan nilainya lagi 🥰)",More than 1 year,Guardian
9,19 - 24,"Combination, Medium Light, Cool",4,recommended,"Cocok untuk kulit normal to oily, sehingga gak terlalu becek di kulit cuma kurangnya dia agak bge crak kalau pake bedak padat. Overall untuk harga yang terjangkau dan ringan ini cocok untuk anak sekolahan dan gak ngebuat kulit menjadi iritasi",1 month - 3 months,Shopee
