0verKeyword of department search segmentation
因為系所關鍵字統計雖然依照經驗來搜尋不會差太多,但依照經驗總有點亂槍打鳥的感覺,深怕不小心遺漏掉重要趨勢。因此寫了一個簡易分詞小工具,至少在搜尋上有個依據。
- Python 3.7 or later
- pip3 & Poetry(幫你搞定一切)
- 沒有 pip3 的話請先安裝:
sudo apt install python3-pip
(Windows 的 Python 3.4 以上已經內建 pip) - Poetry 安裝請參考 https://python-poetry.org/docs/#installation 依照作業系統進行
poetry install
會建立虛擬環境並安裝所有需要的套件
- 將整理好的關鍵字 csv 檔案(只有一行,一列一個關鍵字紀錄)放進資料夾
- 執行
poetry run python3 depkeyword.py
- 程式會產出 3 個 csv:
csv 檔案名稱 說明 origin_ws.csv 每列都是一個原本的關鍵字分詞後的結果 all_ws.csv 將每個拆分出來的分詞結果通通放在第一行 count_keyword.csv 計算分詞後每一個獨特關鍵字出現的次數