Skip to content

[Project๐Ÿ—‚] ์˜ํ™” ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•œ KNN, Decision tree, Regression ์ˆ˜ํ–‰. ๊ด€๊ฐ์ˆ˜, ๋ฐฐ์šฐ, ํˆฌ์ž ๋น„์šฉ๋“ค์„ ๊ณ ๋ คํ•œ ์˜ํ™” ๊ธฐ๋Œ€ ์ˆ˜์ต ์˜ˆ์ธก

parkjisu6239/2017_BigData_R

Repository files navigation

R์„ ์ด์šฉํ•œ Big Data ๋ถ„์„

2017 ์ถฉ๋ถ๋Œ€ํ•™๊ต ๋น…๋ฐ์ดํ„ฐ์ฒ˜๋ฆฌ

๊ต์ˆ˜๋ช… : Aziz Nasridinov

KNN

  • K ์ตœ๊ทผ์ ‘ ์ด์›ƒ ์•Œ๊ณ ๋ฆฌ์ฆ˜
  • ๋ถ„๋ฅ˜๋‚˜ ํšŒ๊ท€์— ์‚ฌ์šฉ๋˜๋Š” ๋น„๋ชจ์ˆ˜ ML ๋ถ„๋ฅ˜ ๋ฐฉ๋ฒ•
  • ์ „์ฒด ๋ฐ์ดํ„ฐ๋ฅผ K๊ฐœ์˜ ๊ตฐ์ง‘์œผ๋กœ ๋‚˜๋ˆ„๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค. ๊ทธ๋ ‡๊ธฐ ๋•Œ๋ฌธ์— ์‚ฌ์šฉ์ž๊ฐ€ ์ž„์˜๋กœ ์ ์ ˆํ•œ K๋ฅผ ์„ ํƒํ•ด์•ผ ํ•˜๊ณ , K์— ๋ถ„๋ฅ˜ ์ •ํ™•๋„๊ฐ€ ์˜์กด์ ์ด๋‹ค.
  • ์ผ๋ฐ˜์ ์œผ๋กœ K๊ฐ€ ์ปค์งˆ์ˆ˜๋ก ์žก์Œ์˜ ์˜ํ–ฅ์„ ์ค„์–ด๋“ค์ง€๋งŒ, ๋„ˆ๋ฌด ์ปค์ง€๋ฉด ๊ฒฝ๊ณ„๊ฐ€ ๋ถˆ๋ถ„๋ช…ํ•˜๋‹ค. (K๊ฐ€ N์— ๊ฐ€๊นŒ์šธ ์ˆ˜๋ก ํ•˜๋‚˜์”ฉ ์„œ๋กœ ๋‹ค๋ฅธ ๊ตฐ์ง‘์œผ๋กœ ๊ตฌ๋ถ„ํ•˜๋Š” ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์— ๋ถ„๋ฅ˜์˜ ์˜๋ฏธ๊ฐ€ ์—†์Œ)
  • ๋ฐ˜๋Œ€๋กœ K๊ฐ€ ์ž‘์„ ์ˆ˜๋ก ๋ถ„๋ฅ˜๋œ ๋ฐ์ดํ„ฐ ์‚ฌ์ด์˜ ์—ฐ๊ด€๋„๊ฐ€ ๋–จ์–ด์ง„๋‹ค.
  • ์ž์„ธํ•œ ์„ค๋ช…

Decision tree

  • ์˜์‚ฌ๊ฒฐ์ • ๋‚˜๋ฌด / ์ง€๋„ํ•™์Šต

  • ์˜์‚ฌ ๊ฒฐ์ •(Y or N)๋ฅผ ํŠธ๋ฆฌ ๊ตฌ์กฐ๋กœ ๋„์‹ํ™”ํ•œ ๊ฒƒ์ด๋‹ค.

  • ๋…๋ฆฝ๋ณ€์ˆ˜๋“ค์ด ์œ ํ•œํ•œ ์ด์‚ฐ๊ฐ’๋“ค๋กœ ๊ตฌ์„ฑ๋˜์–ด์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•œ๋‹ค. ์—ฐ์†๋ณ€์ˆ˜๋Š” ์œ ํ•œํ•œ ๊ฐ€์ง€๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์—†๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

  • ์ž์„ธํ•œ ์„ค๋ช…

Regression Analysis

  • ํšŒ๊ท€๋ถ„์„ / ์ง€๋„ํ•™์Šต
  • ์—ฐ์†ํ˜• ๋ณ€์ˆ˜๋“ค์— ๋Œ€ํ•ด ๋‘ ๋ณ€์ˆ˜ ์‚ฌ์ด์˜ ๋ชจํ˜•์„ ๊ตฌํ•œ๋’ค ์ ํ•ฉ๋„๋ฅผ ์ธก์ •
  • ๋‹ค์ค‘ ํšŒ๊ท€ ๋ถ„์„ : ํ•˜๋‚˜์˜ ์ข…์†๋ณ€์ˆ˜์™€ ์—ฌ๋Ÿฌ ๋…๋ฆฝ๋ณ€์ˆ˜ ์‚ฌ์ด์˜ ๊ด€๊ณ„
  • ์ด๋•Œ ๋…๋ฆฝ๋ณ€์ˆ˜๋“ค ๊ฐ„์— ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ๋†’์€ ๊ฒฝ์šฐ ๋‹ค์ค‘๊ณต์„ ์„ฑ ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•˜์—ฌ ์˜ˆ์ธก ์ •ํ™•๋„๋ฅผ ๋‚ฎ์ถœ ์ˆ˜ ์žˆ๋‹ค.
    • ์ด ๊ฒฝ์šฐ ์ฃผ์„ฑ๋ถ„ ๋ถ„์„์„ ํ•˜์—ฌ ๋…๋ฆฝ๋ณ€์ˆ˜์˜ ๊ฐฏ์ˆ˜๋ฅผ ์ค„์ด๋Š” ๋ฐฉ๋ฒ•์ด ์žˆ๋‹ค.
  • ์ž์„ธํ•œ ์„ค๋ช…

About

[Project๐Ÿ—‚] ์˜ํ™” ๋ฐ์ดํ„ฐ๋ฅผ ์ด์šฉํ•œ KNN, Decision tree, Regression ์ˆ˜ํ–‰. ๊ด€๊ฐ์ˆ˜, ๋ฐฐ์šฐ, ํˆฌ์ž ๋น„์šฉ๋“ค์„ ๊ณ ๋ คํ•œ ์˜ํ™” ๊ธฐ๋Œ€ ์ˆ˜์ต ์˜ˆ์ธก

Topics

Resources

Stars

Watchers

Forks