# Scraping Dynamically loaded Table From Website

In [12]:
import pandas as pd
from selenium import webdriver
from selenium.webdriver.common.by import By # need to import for find_element(By.) to work!

In [25]:
# Here I'm showing that pd.read_html doesn't work because the table data is being dynamically loaded 
# We are only able to scrape the column names 
URL = 'https://covid19.saglik.gov.tr/TR-66935/genel-koronavirus-tablosu.html'
dfs = pd.read_html(URL)
dfs[0]

Unnamed: 0,Tarih,Toplam Test Sayısı,Toplam Vaka Sayısı,Toplam Vefat Sayısı,Hastalarda Zatürre Oranı (%),Ağır Hasta Sayısı,Toplam İyileşen Hasta Sayısı,Bugünkü Vaka Sayısı,Bugünkü Hasta Sayısı,Bugünkü Test Sayısı,Bugünkü Vefat Sayısı,Bugünkü İyileşen Sayısı


In [13]:
options = webdriver.ChromeOptions()
options.add_argument('--headless')
#options.add_argument('--no-sandbox')
#options.add_argument('--disable-dev-shm-usage')

In [14]:
site = 'https://covid19.saglik.gov.tr/TR-66935/genel-koronavirus-tablosu.html'

In [15]:
driver = webdriver.Chrome('chromedriver',options=options)
driver.get(site)

In [16]:
html = driver.page_source

In [17]:
df = pd.read_html(html)

In [18]:
len(df)

1

In [19]:
df[0]

Unnamed: 0,Tarih,Toplam Test Sayısı,Toplam Vaka Sayısı,Toplam Vefat Sayısı,Hastalarda Zatürre Oranı (%),Ağır Hasta Sayısı,Toplam İyileşen Hasta Sayısı,Bugünkü Vaka Sayısı,Bugünkü Hasta Sayısı,Bugünkü Test Sayısı,Bugünkü Vefat Sayısı,Bugünkü İyileşen Sayısı
0,26 OCAK 2022,,,,,,,77.434,,416.536,188.0,85.501
1,25 OCAK 2022,,,,,,,76.341,,418.427,174.0,82.203
2,24 OCAK 2022,,,,,,,67.023,,401.636,156.0,78.362
3,23 OCAK 2022,,,,,,,65.503,,392.281,185.0,75.422
4,22 OCAK 2022,,,,,,,72.856,,417.161,184.0,89.926
...,...,...,...,...,...,...,...,...,...,...,...,...
682,15 MART 2020,,18,,,,,,,,,
683,14 MART 2020,,6,,,,,,,,,
684,13 MART 2020,,5,,,,,,,,,
685,12 MART 2020,,1,,,,,,,,,


## Exploring Webdriver Selenium

In [20]:
element = driver.find_elements(By.TAG_NAME, "tr")

In [21]:
x = 0
list1=[]
for i in element:
    if x>5:
        break
    else:
        x +=1
        list1.append(i.text)
print(list1)

['Tarih Toplam Test Sayısı Toplam Vaka Sayısı Toplam Vefat Sayısı Hastalarda Zatürre Oranı (%) Ağır Hasta Sayısı Toplam İyileşen Hasta Sayısı Bugünkü Vaka Sayısı Bugünkü Hasta Sayısı Bugünkü Test Sayısı Bugünkü Vefat Sayısı Bugünkü İyileşen Sayısı', '26 OCAK 2022 77.434 416.536 188 85.501', '25 OCAK 2022 76.341 418.427 174 82.203', '24 OCAK 2022 67.023 401.636 156 78.362', '23 OCAK 2022 65.503 392.281 185 75.422', '22 OCAK 2022 72.856 417.161 184 89.926']


In [23]:
data_from_table = driver.find_element(By.ID, value='TumVerileriGetir')
data_from_table.text.split("\n")

['26 OCAK 2022 77.434 416.536 188 85.501',
 '25 OCAK 2022 76.341 418.427 174 82.203',
 '24 OCAK 2022 67.023 401.636 156 78.362',
 '23 OCAK 2022 65.503 392.281 185 75.422',
 '22 OCAK 2022 72.856 417.161 184 89.926',
 '21 OCAK 2022 72.555 416.453 181 87.192',
 '20 OCAK 2022 71.843 414.312 166 85.948',
 '19 OCAK 2022 72.615 412.031 176 84.426',
 '18 OCAK 2022 69.658 418.253 157 77.612',
 '17 OCAK 2022 64.935 403.836 162 72.106',
 '16 OCAK 2022 54.100 364.426 136 68.895',
 '15 OCAK 2022 63.967 384.263 177 52.016',
 '14 OCAK 2022 67.857 392.438 167 56.256',
 '13 OCAK 2022 75.564 410.116 153 51.675',
 '12 OCAK 2022 77.722 422.028 145 42.573',
 '11 OCAK 2022 74.266 430.253 137 39.226',
 '10 OCAK 2022 65.236 403.104 141 38.242',
 '9 OCAK 2022 61.727 384.049 173 35.163',
 '8 OCAK 2022 66.237 418.264 141 34.592',
 '7 OCAK 2022 63.214 406.796 157 29.197',
 '6 OCAK 2022 68.413 418.823 156 25.502',
 '5 OCAK 2022 66.467 417.787 143 29.316',
 '4 OCAK 2022 54.724 382.888 137 26.561',
 '3 OCAK 2022 44.

### The find_element_by_* commands are deprecated in the latest Selenium Python libraries. Instead use find_element() :

Don't use:  
class_1 = driver.find_element_by_class_name("classname")   
Instead use:    
class1 = driver.find_element(By.CLASS_NAME, "classname")  

Similarly for different ways of accesing the elements:  

* element = driver.find_element(By.ID, "element_id")
*element = driver.find_element(By.NAME, "element_name")
*element = driver.find_element(By.LINK_TEXT, "element_link_text")
*element = driver.find_element(By.PARTIAL_LINK_TEXT, "element_partial_link_text")
*element = driver.find_element(By.TAG_NAME, "element_tag_name")
*element = driver.find_element(By.CSS_SELECTOR, "element_css_selector")
*element = driver.find_element(By.XPATH, "element_xpath")