In [None]:
import pandas as pd
df = pd.read_excel('20241211182337DataExport.xlsx')
codes = df['代號'].unique().tolist()
len(codes)

1020

In [None]:
df['年/月'] = pd.to_datetime(df['年/月'], format='%Y/%m')

# 找出每個公司最早的上市年份
company_first_year = df.groupby(['代號', '名稱'])['年/月'].min()

# 計算公司存在的年數 (相對於當前年)
current_year = pd.Timestamp.now().year
company_first_year_in_years = current_year - company_first_year.dt.year

# 找出上市超過 7 年的公司
listed_more_than_7_years = company_first_year_in_years[company_first_year_in_years > 7]

# 將篩選的公司資料與原資料合併
df_上市時間 = df[df['代號'].isin(listed_more_than_7_years.index.get_level_values('代號'))]

# 查看結果
上市時間_codes = df_上市時間['代號'].unique().tolist()

len(上市時間_codes)

974

In [None]:
# 確保 '年/月' 是 datetime 格式
df['年/月'] = pd.to_datetime(df['年/月'], format='%Y/%m')

# 獲取每股盈餘列
eps_columns = '每股盈餘'

# 按公司代號分組
grouped = df.groupby('代號')

# 定義條件：篩選最近10年，並計算9年盈餘 > 0
def filter_eps(group):
    # 按年排序，取最近10年的資料
    recent_10_years = group.sort_values('年/月', ascending=False).head(10)
    # 計算最近10年內，每股盈餘大於0的年份數量
    eps_positive_count = (recent_10_years[eps_columns] > 0).sum()
    # 返回滿足9年盈餘 > 0的公司
    return eps_positive_count >= 9

# 應用過濾條件
df_eps = grouped.filter(filter_eps)

EPS_codes = df_eps['代號'].unique().tolist()

len(EPS_codes)

644

In [None]:
df_股本 = df[df['  股本'] > 5000000]

股本_codes = df_股本['代號'].unique().tolist()

len(股本_codes)

245

In [None]:
# 計算本業收入比率，扣掉業外收入及支出
df['本業收入比率'] = ((df['營業收入淨額'] - df['營業外收入及支出']) / df['營業收入淨額']) * 100


df_本業收入比率 = df[(df['本業收入比率'] > 80)]

# 提取符合條件的代號
本業收入比率_codes = df_本業收入比率['代號'].unique().tolist()

# 輸出符合條件的代號數量
len(本業收入比率_codes)


994

In [None]:
# 篩選業外收支/營收 < 20 的公司
df_業外損失比率 = df[df['業外收支/營收'] < 20]

# 提取符合條件的代號
業外損失比率_codes = df_業外損失比率['代號'].unique().tolist()

len(業外損失比率_codes)

994

In [None]:
# 篩選存貨及應收帳款/淨值 < 30 的公司
df_存貨應收帳款 = df[df['存貨及應收帳款/淨值'] < 30]

# 提取符合條件的代號
營收灌水比率_codes = df_存貨應收帳款['代號'].unique().tolist()

len(營收灌水比率_codes)

465

In [None]:
# 篩選來自營運之現金流量 > 0 的公司
df_營運現金流量 = df[df['來自營運之現金流量'] > 0]

# 提取符合條件的代號
營運現金流量_codes = df_營運現金流量['代號'].unique().tolist()

len(營運現金流量_codes)

1012

In [None]:
# 篩選自由現金流量 > 0 的公司
df_自由現金流量 = df[df['自由現金流量'] > 0]

# 提取符合條件的代號
自由現金流量_codes = df_自由現金流量['代號'].unique().tolist()

len(自由現金流量_codes)


979

In [None]:
# 篩選出股利支付率大於 0 的行
df_股利 = df[df['股利支付率'] > 0]

# 按代號分組，計算每家公司發放股利的年份數量
dividend_years = df_股利.groupby('代號').size()

# 篩選出發放股利至少 8 年的公司
十年中至少八年發放股利_codes = dividend_years[dividend_years >= 8].index.unique().tolist()

len(十年中至少八年發放股利_codes)

720

In [None]:
# 篩選出負債比率小於 50 的行
df_負債比率 = df[df['總負債/總淨值'] < 50]

負債比率_codes = df_負債比率['代號'].unique().tolist()

len(負債比率_codes)

566

In [None]:
# 篩選出流動比率 > 100 且 速動比率 > 100 的公司
df_流動速動比率 = df[(df['流動比率'] > 100) & (df['速動比率'] > 100)]

# 提取符合條件的代碼
流動速動比率_codes = df_流動速動比率['代號'].unique().tolist()

len(流動速動比率_codes)

856

In [None]:
# 篩選出利息保障倍數 > 5 的公司
df_利息保障倍數 = df[df['利息保障倍數'] > 5]

# 提取符合條件的代碼
利息保障倍數_codes = df_利息保障倍數['代號'].unique().tolist()

len(利息保障倍數_codes)

961

In [None]:
# 移除所有欄位名稱中的前後空格
df.columns = df.columns.str.strip()

# 確保 '年/月' 是日期格式，便於進行時間處理
df['年/月'] = pd.to_datetime(df['年/月'], format='%Y/%m')

# 假設目前年是最新的年度，這邊以最大日期作為目前年份
current_year = df['年/月'].max()

# 計算5年前的年份
five_years_ago = current_year - pd.DateOffset(years=5)

# 按代號分組，查找每個公司在目前年份和5年前的股本
df_current = df[df['年/月'] == current_year]
df_5_years_ago = df[df['年/月'] == five_years_ago]

# 合併目前股本與5年前股本，根據代號匹配
df_merged = pd.merge(df_current[['代號', '股本']], df_5_years_ago[['代號', '股本']], on='代號', suffixes=('_current', '_5_years_ago'))

# 計算股本膨脹比率
df_merged['股本膨脹比率'] = (df_merged['股本_current'] - df_merged['股本_5_years_ago']) / df_merged['股本_current']

# 篩選股本膨脹比率小於 20% 的公司
df_filtered = df_merged[df_merged['股本膨脹比率'] < 0.2]

# 提取符合條件的代號
股本膨脹比率_codes = df_filtered['代號'].unique().tolist()

# 顯示結果
(len(股本膨脹比率_codes))

833

In [None]:
df_營收 = pd.read_excel('近12個月營收.xlsx')

# 篩選符合條件的資料
filtered_df = df_營收[df_營收['近12月累計營收(千元)'] > 300000]

# 提取符合條件的代號
營收_codes = filtered_df['代號'].unique().tolist()

# 輸出符合條件的代號
len(營收_codes)

969

In [None]:
df_每股淨值 = pd.read_excel('每股淨值.xlsx')

# 篩選符合條件的資料
filtered_df = df_每股淨值[df_每股淨值['每股淨值'] > 15]

# 提取符合條件的代號
每股淨值_codes = filtered_df['代號'].unique().tolist()

# 輸出符合條件的代號
len(每股淨值_codes)

817

In [None]:
# 讀取資料
df2 = pd.read_excel('籌碼面資料2010-2023.xlsx')

# 篩選集團法人董監持股%大於33%的資料
df_持股 = df[df2['集團法人董監持股%'] > 33]

# 提取符合條件的代號
持股_codes = df_持股['代號'].unique().tolist()

# 輸出符合條件的代號
len(持股_codes)

  df_持股 = df[df2['集團法人董監持股%'] > 33]


835

In [None]:
df_董監質押 = df[df2['董監質押%'] < 33]

# 提取符合條件的代號
董監質押_codes = df_董監質押['代號'].unique().tolist()

# 輸出符合條件的代號
len(董監質押_codes)

  df_董監質押 = df[df2['董監質押%'] < 33]


1020

In [None]:
# 讀取資料
df3 = pd.read_excel('股價淨值比2010-2023.xlsx')

df_股價淨值比 = df[df3['股價淨值比-TEJ'] < 1.5]

# 提取符合條件的代號
股價淨值比_codes = df_股價淨值比['代號'].unique().tolist()

# 輸出符合條件的代號
len(股價淨值比_codes)

  df_股價淨值比 = df[df3['股價淨值比-TEJ'] < 1.5]


1017

In [None]:
# 將所有代碼列表轉換為集合
上市時間_set = set(上市時間_codes)
EPS_set = set(EPS_codes)
股本_set = set(股本_codes)
本業收入比率_set = set(本業收入比率_codes)
業外損失比率_set = set(業外損失比率_codes)
營收灌水比率_set = set(營收灌水比率_codes)
營運現金流量_set = set(營運現金流量_codes)
自由現金流量_set = set(自由現金流量_codes)
十年中至少八年發放股利_set = set(十年中至少八年發放股利_codes)
負債比率_set = set(負債比率_codes)
流動速動比率_set = set(流動速動比率_codes)
利息保障倍數_set = set(利息保障倍數_codes)
股本膨脹比率_set = set(股本膨脹比率_codes)
營收_set = set(營收_codes)
每股淨值_set = set(每股淨值_codes)
持股_set = set(持股_codes)
董監質押_set = set(董監質押_codes)
股價淨值比_set = set(股價淨值比_codes)

# 計算所有集合的交集
交集_codes =上市時間_set.intersection(
    EPS_set,
    股本_set,
    本業收入比率_set,
    業外損失比率_set,
    營收灌水比率_set,
    營運現金流量_set,
    自由現金流量_set,
    十年中至少八年發放股利_set,
    負債比率_set,
    流動速動比率_set,
    利息保障倍數_set,
    股本膨脹比率_set,
    營收_set,
    每股淨值_set,
    持股_set,
    董監質押_set,
    股價淨值比_set
)

# 輸出交集的代號
# 將交集結果中的浮點數轉換為整數
交集_codes = {int(code) for code in 交集_codes}

# 輸出修正後的交集代號
print(交集_codes)

# 計算交集代號的數量
print(len(交集_codes))


{2441, 8464, 1301, 2454, 2330, 1308, 1440, 2340, 1319, 2344, 4904, 2474, 2605, 1326, 8110, 2354, 9908, 2104, 2107, 3532, 1103, 1234, 2514, 1110, 8926, 2015, 1504, 2408, 6505, 2412, 2303}
31


In [None]:
import requests
from bs4 import BeautifulSoup
import csv
# 準備存儲所有結果的列表
all_table_data = []

# 遍歷每個代碼
for code in 交集_codes:

    url = f'https://histock.tw/stock/{code}/%E7%9B%88%E9%A4%98%E5%86%8D%E6%8A%95%E8%B3%87%E6%AF%94%E7%8E%87'

    # 發送請求到目標網頁
    response = requests.get(url)

    # 使用 BeautifulSoup 解析網頁內容
    soup = BeautifulSoup(response.content, 'html.parser')

    # 找到目標表格 (通過 class 名稱)
    table = soup.find('table', {'class': 'tb-stock tbBasic'})

    # 準備存儲每個代碼的表格數據
    table_data = []

    # 查找所有行
    if table:
        rows = table.find_all('tr')

        # 遍歷每一行，提取其中的數據
        for row in rows:
            # 查找每行中的單元格 <td>
            cells = row.find_all('td')
            if len(cells) == 2:  # 確保行中有兩個單元格
                season = cells[0].text.strip()  # 年度/季別
                reinvestment_rate = cells[1].text.strip()  # 盈餘再投資比
                # 將數據添加到列表中
                table_data.append([code, season, reinvestment_rate])

        # 將此代碼的數據添加到總列表中
        all_table_data.extend(table_data)

# 將所有數據輸出到 CSV 文件
with open('reinvestment_rate_codes.csv', 'w', newline='', encoding='utf-8') as file:
    writer = csv.writer(file)
    writer.writerow(['代碼', '年度/季別', '盈餘再投資比'])  # 寫入表頭
    writer.writerows(all_table_data)  # 寫入所有數據

# 打印抓取結果
for row in all_table_data:
    print(f"{row[0]} - {row[1]}: {row[2]}")


2441 - 2024Q3: 16.18%
2441 - 2024Q2: 18.03%
2441 - 2024Q1: 19.39%
2441 - 2023Q4: 24.64%
2441 - 2023Q3: 28.89%
2441 - 2023Q2: 31.36%
2441 - 2023Q1: 33.33%
2441 - 2022Q4: 35.36%
2441 - 2022Q3: 38.54%
2441 - 2022Q2: 34.61%
2441 - 2022Q1: 35.12%
2441 - 2021Q4: 29.59%
2441 - 2021Q3: 25.09%
2441 - 2021Q2: 22.10%
2441 - 2021Q1: 19.69%
2441 - 2020Q4: 19.00%
2441 - 2020Q3: 25.10%
2441 - 2020Q2: 24.54%
2441 - 2020Q1: 28.39%
2441 - 2019Q4: 25.83%
2441 - 2019Q3: 24.51%
2441 - 2019Q2: 22.37%
2441 - 2019Q1: 26.02%
8464 - 2024Q3: 16.07%
8464 - 2024Q2: 14.27%
8464 - 2024Q1: 14.69%
8464 - 2023Q4: 12.79%
8464 - 2023Q3: 12.42%
8464 - 2023Q2: 12.49%
8464 - 2023Q1: 12.78%
8464 - 2022Q4: 16.61%
8464 - 2022Q3: 19.28%
8464 - 2022Q2: 17.40%
8464 - 2022Q1: 15.85%
8464 - 2021Q4: 14.14%
8464 - 2021Q3: 14.31%
8464 - 2021Q2: 13.12%
8464 - 2021Q1: 14.03%
8464 - 2020Q4: 13.36%
8464 - 2020Q3: 11.43%
8464 - 2020Q2: 8.94%
8464 - 2020Q1: 8.79%
8464 - 2019Q4: 8.71%
8464 - 2019Q3: 13.05%
1301 - 2024Q3: 56.09%
1301 - 2024Q2

In [None]:
import pandas as pd

# 讀取 CSV 文件
df4 = pd.read_csv('reinvestment_rate_codes.csv')

# 去除逗號和百分比符號，並轉換為浮點數
df4['盈餘再投資比'] = df4['盈餘再投資比'].str.replace(',', '').str.replace('%', '').astype(float)

# 篩選出2019Q1至2023Q4之間的資料，並篩選盈餘再投資比 < 200%
result_codes = df4[
    (df4['年度/季別'].between('2019Q1', '2023Q4')) &
    (df4['盈餘再投資比'] < 200)
]['代碼']

# 去除重複代碼並轉換為列表
result_codes = result_codes.unique().tolist()

# 輸出符合條件的代碼
print(result_codes)


[2441, 8464, 1301, 2454, 2330, 1308, 1440, 2340, 1319, 2344, 4904, 2474, 2605, 1326, 8110, 2354, 9908, 2104, 2107, 3532, 1103, 1234, 2514, 1110, 8926, 2015, 1504, 2408, 6505, 2412, 2303]
