Skip to content
無用的作品
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
data
src
.gitignore
README.md
output.csv
sentense2.log
sentense3.log

README.md

Useless

目的

因為一堆宅男女神 阿宅用詞出現在與多報章雜誌,想要知道到底在哪些年齡層會看見哪些描述用語,比方說到底幾歲到幾歲才會被稱之為正妹,而又是到了幾歲才會被稱之為少女等

  • 如果要設計遊戲稱號,從這個分析最方便了!

結論

  • 嬰兒 <= 2歲
  • 幼兒 <= 5歲
  • 女童 5 ~ 15 歲
  • 少女 13 ~ 20 歲
  • 青少年 15 ~ 19 歲
  • 女子 19 ~ 41 歲
  • 婦人 49 ~ 89 歲
  • 老人 65+ 歲
  • 老婦 86+ 歲

我對男的稱號興趣還沒那麼大,現在不想做

特別

  • 魔女 58歲
  • 人瑞 100+ 歲

資料

  1. 感謝Ronny贊助頻果日報資料
  2. 資料時間 20150801 - 20150831
  3. 採用jeiba分詞
  4. 使用python 處理資料 R做統計

重現流程

  1. 請先跟Ronny拿到資料解壓縮到data
  2. 修改src/parse.py資料處理路徑, 然後執行
  3. 執行analysis.R 輸出output.csv, 但別忘了要讓資料讀取sentence3.log
  4. 看看output.csv
You can’t perform that action at this time.