In [1]:
import importlib

packages = ['selenium', 'pandas']

for package in packages:
    try:
        importlib.import_module(package)
    except ImportError:
        print(f"{package} is not installed. Installing...")
        import pip
        pip.main(['install', package])
    finally:
        globals()[package] = importlib.import_module(package)
        
try:
    import warnings
    
    try:
        from selenium import webdriver
        from selenium.webdriver.edge.service import Service
        from selenium.webdriver.edge.options import Options
        
        try:
            import pandas as pd
        except ImportError:
            print("Pandas module not found.")
        
    except ImportError:
        print("Selenium modules not found.")

except ImportError:
    print("Warnings module not found.")

In [2]:
warnings.simplefilter(action='ignore', category=FutureWarning)
warnings.simplefilter(action='ignore', category=RuntimeWarning)
warnings.simplefilter(action='ignore', category=pd.errors.SettingWithCopyWarning)

In [3]:
def get_set50():
    # driver_path = r'YOUR_PATH_TO_CHROMEDRIVER'
    driver_path = "YOUR_PATH_TO_EDGEDRIVER"
    
    # Initialize Chrome options
    options = Options()
    options.add_argument("--headless")  # Run in headless mode if needed
    options.add_argument("--no-sandbox")
    options.add_argument("--disable-dev-shm-usage")

    # Set the service for ChromeDriver
    service = Service(executable_path=driver_path)

    # Initialize the WebDriver with Chrome options
    driver = webdriver.Edge(service=service, options=options)

    # Navigate to the desired URL
    driver.get('https://www.set.or.th/th/market/index/set50/overview')
    
    return driver

In [4]:
driver = get_set50()

In [5]:
def get_set50_df(driver):
    data = driver.page_source
    data_df = pd.read_html(data)[1]
    clean_column = []
    for c in data_df.columns:
        clean_column.append(c.replace('  (Click to sort Ascending)',''))
    data_df.columns = clean_column
    
    # print(data_df)
    data_df = data_df.set_index('หลักทรัพย์')
    return data_df

In [6]:
data_df = get_set50_df(driver)
# get_set50_df(driver)
data_df

Unnamed: 0_level_0,เปิด,สูงสุด,ต่ำสุด,ล่าสุด,เปลี่ยนแปลง,% เปลี่ยนแปลง,เสนอซื้อ,เสนอขาย,ปริมาณ (หุ้น),มูลค่า ('000 บาท)
หลักทรัพย์,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
ADVANC,221.0,222.0,219.0,221.0,-1.0,-0.45,220.0,221.0,4854092,1070947.05
AOT,58.75,59.0,58.5,58.75,0.25,0.43,58.75,59.0,11544453,678433.27
AWC,3.74,3.92,3.72,3.86,0.14,3.76,3.86,3.88,135069031,517274.67
BBL,137.0,137.5,135.5,135.5,-1.5,-1.09,135.5,136.0,4820321,656216.52
BCP,36.5,37.5,36.25,37.0,0.5,1.37,37.0,37.25,8929317,329538.17
BDMS,26.0,26.5,25.75,26.0,-0.25,-0.95,26.0,26.25,46728518,1222529.58
BEM,7.65,7.85,7.6,7.8,0.15,1.96,7.75,7.8,50352916,390751.13
BGRIM,22.8,23.4,22.3,22.6,-0.1,-0.44,22.6,22.7,29665960,675801.96
BH,244.0,248.0,244.0,247.0,3.0,1.23,247.0,248.0,1861899,459371.15
BJC,21.4,21.5,21.3,21.4,0.0,0.0,21.4,21.5,3922984,84075.37


In [7]:
def get_stock_data(stock,driver,all_stock_dict):
    stock = stock.split()[0]
    url = 'https://www.set.or.th/th/market/product/stock/quote/' + stock + '/financial-statement/company-highlights'
    driver.get(url)
    stock_data = driver.page_source
    a_df = pd.read_html(stock_data)[0]
    b_df = pd.read_html(stock_data)[1]
    all_stock_dict[stock] = [a_df,b_df]
    return driver, all_stock_dict

In [8]:
all_stock_dict = dict()
for stock in data_df.index:
    driver, all_stock_dict = get_stock_data(stock,driver,all_stock_dict)
    
driver.quit()

In [9]:
pe_df = pd.DataFrame()

for stock, df_list in all_stock_dict.items():
    for df in df_list:
        if "ค่าสถิติสำคัญ ณ วันที่" in df.columns:
            pe_values = df.loc[df["ค่าสถิติสำคัญ ณ วันที่"] == "P/E (เท่า)"]
            if not pe_values.empty:
                pe_values['Stock'] = stock 
                pe_df = pd.concat([pe_values, pe_df], ignore_index=True)

pe_df = pe_df[['Stock'] + [col for col in pe_df.columns if col != 'Stock']]

In [10]:
pe_df

Unnamed: 0,Stock,ค่าสถิติสำคัญ ณ วันที่,30 ธ.ค. 2563,30 ธ.ค. 2564,30 ธ.ค. 2565,28 ธ.ค. 2566,11 ก.ค. 2567
0,WHA,P/E (เท่า),20.01,26.19,18.83,16.32,13.96
1,TU,P/E (เท่า),10.83,12.04,10.05,14.87,-
2,TTB,P/E (เท่า),9.92,15.94,10.38,9.30,8.93
3,TRUE,P/E (เท่า),,,,-,-
4,TOP,P/E (เท่า),-,6.82,3.35,7.21,5.71
5,TLI,P/E (เท่า),,,20.77,11.67,9.08
6,TISCO,P/E (เท่า),11.26,11.60,11.02,10.90,10.56
7,TIDLOR,P/E (เท่า),,28.24,20.36,17.05,12.79
8,SCGP,P/E (เท่า),28.89,38.79,32.77,34.50,22.76
9,SCC,P/E (เท่า),13.66,9.87,13.90,13.50,23.67


In [11]:
pbv_df = pd.DataFrame()

for stock, df_list in all_stock_dict.items():
    for df in df_list:
        if "ค่าสถิติสำคัญ ณ วันที่" in df.columns:
            pbv_values = df.loc[df["ค่าสถิติสำคัญ ณ วันที่"] == "P/BV (เท่า)"]
            if not pbv_values.empty:
                pbv_values['Stock'] = stock 
                pbv_df = pd.concat([pbv_values, pbv_df], ignore_index=True)

pbv_df = pbv_df[['Stock'] + [col for col in pbv_df.columns if col != 'Stock']]

In [12]:
pbv_df

Unnamed: 0,Stock,ค่าสถิติสำคัญ ณ วันที่,30 ธ.ค. 2563,30 ธ.ค. 2564,30 ธ.ค. 2565,28 ธ.ค. 2566,11 ก.ค. 2567
0,WHA,P/BV (เท่า),1.61,1.82,2.02,2.45,2.13
1,TU,P/BV (เท่า),1.25,1.59,1.29,0.89,1.13
2,TTB,P/BV (เท่า),0.51,0.68,0.64,0.72,0.74
3,TRUE,P/BV (เท่า),,,,1.78,3.7
4,TOP,P/BV (เท่า),0.98,0.87,0.81,0.75,0.69
5,TLI,P/BV (เท่า),,,1.9,1.06,0.8
6,TISCO,P/BV (เท่า),1.87,1.95,1.94,1.97,1.73
7,TIDLOR,P/BV (เท่า),,3.92,2.99,2.29,1.71
8,SCGP,P/BV (เท่า),-,3.12,2.4,1.99,1.66
9,SCC,P/BV (เท่า),1.50,1.29,1.04,0.96,0.74


In [13]:
## export to csv file
pe_df.to_csv("pe_set50.csv")
pbv_df.to_csv("pbv_set50.csv")

In [14]:
allStock = pd.DataFrame(all_stock_dict)

In [15]:
allStock['AOT'][0]

Unnamed: 0,งวดงบการเงิน ณ วันที่,งบปี 2563 30 ก.ย. 2563,งบปี 2564 30 ก.ย. 2564,งบปี 2565 30 ก.ย. 2565,งบปี 2566 30 ก.ย. 2566,งบ 6 เดือน2567 31 มี.ค. 2567
0,บัญชีทางการเงินที่สำคัญ,,,,,
1,สินทรัพย์รวม,173558.57,195085.77,183812.92,195611.09,195726.48
2,หนี้สินรวม,30526.9,81664.39,81294.32,83432.9,78158.65
3,ส่วนของผู้ถือหุ้น,142235.58,112343.77,101323.97,110464.78,115556.69
4,มูลค่าหุ้นที่เรียกชำระแล้ว,14285.7,14285.7,14285.7,14285.7,14285.7
5,รายได้รวม,33129.95,7715.73,16992.5,48435.31,34112.69
6,กำไร (ขาดทุน) จากกิจกรรมอื่น,145.56,-51.08,258.17,-8.37,-19.37
7,กำไรสุทธิ,4320.68,-16322.01,-11087.87,8790.87,10347.63
8,กำไรต่อหุ้น (บาท),0.3,-1.14,-0.78,0.62,0.72
9,อัตราส่วนทางการเงินที่สำคัญ,,,,,


In [16]:
allStock['AOT'][1]

Unnamed: 0,ค่าสถิติสำคัญ ณ วันที่,30 ธ.ค. 2563,30 ธ.ค. 2564,30 ธ.ค. 2565,28 ธ.ค. 2566,11 ก.ค. 2567
0,ราคาล่าสุด (บาท),62.25,61.00,75.00,59.75,58.50
1,มูลค่าหลักทรัพย์ตามราคาตลาด (ล้านบาท),889284.83,871427.70,1071427.50,853570.58,835713.45
2,วันที่ของงบการเงินที่ใช้คำนวณค่าสถิติ,30 ก.ย. 2563,30 ก.ย. 2564,30 ก.ย. 2565,30 ก.ย. 2566,31 มี.ค. 2567
3,P/E (เท่า),205.82,-,-,97.10,49.35
4,P/BV (เท่า),6.25,7.76,10.57,7.73,7.23
5,มูลค่าหุ้นทางบัญชีต่อหุ้น (บาท),9.96,7.86,7.09,7.73,8.09
6,อัตราส่วนเงินปันผลตอบแทน (%),0.31,-,-,0.60,0.62


In [17]:
pe_values = allStock['AOT'][1][allStock['AOT'][1]['ค่าสถิติสำคัญ ณ วันที่'] == 'P/E (เท่า)'].iloc[0, 1:].values
pbv_values = allStock['AOT'][1][allStock['AOT'][1]['ค่าสถิติสำคัญ ณ วันที่'] == 'P/BV (เท่า)'].iloc[0, 1:].values


In [18]:
pe_values

array(['205.82', '-', '-', '97.10', '49.35'], dtype=object)

In [19]:
pbv_values

array(['6.25', '7.76', '10.57', '7.73', '7.23'], dtype=object)

In [20]:
all_stock_dict

{'ADVANC': [           งวดงบการเงิน ณ วันที่  งบปี 2563 31 ธ.ค. 2563  \
  0        บัญชีทางการเงินที่สำคัญ                     NaN   
  1                   สินทรัพย์รวม               350170.58   
  2                     หนี้สินรวม               274481.21   
  3              ส่วนของผู้ถือหุ้น                75563.98   
  4     มูลค่าหุ้นที่เรียกชำระแล้ว                 2973.55   
  5                      รายได้รวม               173720.31   
  6   กำไร (ขาดทุน) จากกิจกรรมอื่น                   69.89   
  7                      กำไรสุทธิ                27434.36   
  8              กำไรต่อหุ้น (บาท)                    9.23   
  9    อัตราส่วนทางการเงินที่สำคัญ                     NaN   
  10                       ROA (%)                   12.02   
  11                       ROE (%)                   37.88   
  12            อัตรากำไรสุทธิ (%)                   15.79   
  
      งบปี 2564 31 ธ.ค. 2564  งบปี 2565 31 ธ.ค. 2565  งบปี 2566 31 ธ.ค. 2566  \
  0                      NaN           