#### web Driver installation and Url input

What is selenium? 
A WebDriver is a browser automation framework. It accepts commands and sends them to a browser.



In [5]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

driver = webdriver.Chrome()  # Or whichever browser/driver you're using
# define url
url = 'https://maps.app.goo.gl/geQwCeu2riPkrSqt8'
driver.get(url)

#### Navigate to the reviews tab via Selemium

In [6]:
xpath = "//button[contains(., 'ביקורות') or contains(., 'REVIEWS')]"
wait = WebDriverWait(driver, 10)
route_button = wait.until(EC.element_to_be_clickable((By.XPATH, xpath)))
route_button.click()

#### Extract Reviews into pandas DataFrame

TODO: explain xpath, div

In [7]:
# Get a list of all of the reviews
reviews = driver.find_elements(By.XPATH, "//div[@data-review-id]")
print(f'the type of each review is: {type(reviews[0])}')


the type of each review is: <class 'selenium.webdriver.remote.webelement.WebElement'>


In [8]:
# define an empty DataFrame for all of the reviews
import pandas as pd
df = pd.DataFrame(columns=['text_review', 'stars', 'time'])
df

Unnamed: 0,text_review,stars,time


In [9]:
# Extract the content of each review and insert it to the dataframe
from schemas import Review
import re

for review in reviews:
    review_text = review.find_element(By.XPATH, f".//span[contains(@class, '{Review.TEXT.value}')]").text
    review_rating = review.find_element(By.XPATH, f".//span[contains(@class, '{Review.STARS.value}')]").get_attribute('aria-label')
    review_rating_int = int(re.search(r'\d', review_rating).group(0))
    review_time =  review.find_element(By.XPATH, f".//span[contains(@class, '{Review.TIME.value}')]").text
    row = pd.DataFrame( {'text_review': [review_text], 'stars': [review_rating_int], 'time': [review_time]} )
    df = pd.concat([df, row], ignore_index=True)
    

#### Display

In [10]:
df

Unnamed: 0,text_review,stars,time
0,הגענו אני ובעלי לחגוג לו יום הולדת במקום.\nצוו...,5,לפני 5 חודשים
1,הגענו אני ובעלי לחגוג לו יום הולדת במקום.\nצוו...,5,לפני 5 חודשים
2,זו לא הפעם הראשונה שאני מבקרת ברוסטיקו אך כל פ...,5,לפני שנה
3,זו לא הפעם הראשונה שאני מבקרת ברוסטיקו אך כל פ...,5,לפני שנה
4,"אוכל מאוד טעים ואווירה נהדרת..ישבנו בחוץ, ולמ...",5,לפני 7 חודשים
5,"אוכל מאוד טעים ואווירה נהדרת..ישבנו בחוץ, ולמ...",5,לפני 7 חודשים
6,האוכל היה מצוין אבל השרות איטי להכעיס. לפחות ה...,4,לפני 8 חודשים
7,האוכל היה מצוין אבל השרות איטי להכעיס. לפחות ה...,4,לפני 8 חודשים
8,"מקום חמוד, חלק מהאוכל היה מעולה וחלק טעון שיפו...",3,לפני שנה
9,"מקום חמוד, חלק מהאוכל היה מעולה וחלק טעון שיפו...",3,לפני שנה


In [11]:
print(f'Rating: {df.stars.mean()} ')
df.head()

Rating: 4.3 


Unnamed: 0,text_review,stars,time
0,הגענו אני ובעלי לחגוג לו יום הולדת במקום.\nצוו...,5,לפני 5 חודשים
1,הגענו אני ובעלי לחגוג לו יום הולדת במקום.\nצוו...,5,לפני 5 חודשים
2,זו לא הפעם הראשונה שאני מבקרת ברוסטיקו אך כל פ...,5,לפני שנה
3,זו לא הפעם הראשונה שאני מבקרת ברוסטיקו אך כל פ...,5,לפני שנה
4,"אוכל מאוד טעים ואווירה נהדרת..ישבנו בחוץ, ולמ...",5,לפני 7 חודשים


### Do the same process using our DataLoader

In [2]:
url = 'https://maps.app.goo.gl/geQwCeu2riPkrSqt8'


In [3]:
from scraper import DataLoader

loader = DataLoader(url)

In [4]:
loader.navigate()

In [5]:
loader.create_reviews_df()
loader.df

the type of each review is: <class 'selenium.webdriver.remote.webelement.WebElement'>


Unnamed: 0,text_review,stars,time
0,הגענו אני ובעלי לחגוג לו יום הולדת במקום.\nצוו...,5,לפני 5 חודשים
1,הגענו אני ובעלי לחגוג לו יום הולדת במקום.\nצוו...,5,לפני 5 חודשים
2,זו לא הפעם הראשונה שאני מבקרת ברוסטיקו אך כל פ...,5,לפני שנה
3,זו לא הפעם הראשונה שאני מבקרת ברוסטיקו אך כל פ...,5,לפני שנה
4,"אוכל מאוד טעים ואווירה נהדרת..ישבנו בחוץ, ולמ...",5,לפני 7 חודשים
5,"אוכל מאוד טעים ואווירה נהדרת..ישבנו בחוץ, ולמ...",5,לפני 7 חודשים
6,האוכל היה מצוין אבל השרות איטי להכעיס. לפחות ה...,4,לפני 8 חודשים
7,האוכל היה מצוין אבל השרות איטי להכעיס. לפחות ה...,4,לפני 8 חודשים
8,"מקום חמוד, חלק מהאוכל היה מעולה וחלק טעון שיפו...",3,לפני שנה
9,"מקום חמוד, חלק מהאוכל היה מעולה וחלק טעון שיפו...",3,לפני שנה
