Skip to content

PSLeon24/Mathematical_Statistics

Repository files navigation

ใ…Ž# Mathematical_Statistics ๋ฐ์ดํ„ฐ ์‚ฌ์ด์–ธ์Šค๋ฅผ ์œ„ํ•œ ์ˆ˜๋ฆฌํ†ต๊ณ„ํ•™ ํ•™์Šต ๋…ธํŠธ

1. ํ™•๋ฅ ๊ณผ ๋ถ„ํฌ

1.1. Probability

  • ํ™•๋ฅ  ๋ณ€์ˆ˜(random variable): ํ™•๋ฅ ์ ์œผ๋กœ ๊ฐ’์ด ๊ฒฐ์ •๋˜๋Š” ๋ณ€์ˆ˜(e.g., ๋™์ „ ๋˜์ง€๊ธฐ์˜ ์˜ˆ์—์„œ ๋™์ „์„ ๋˜์กŒ์„ ๋•Œ ์œ—๋ฉด์ด ๋ฌด์—‡์ธ์ง€)
  • ํ™•๋ฅ  ๋ถ„ํฌ(probability distribution): ํ™•๋ฅ  ๋ณ€์ˆ˜๊ฐ€ ์ทจํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋“  ๊ฐ’๊ณผ ๊ทธ ๊ฐ’๋“ค์ด ๋‚˜ํƒ€๋‚  ํ™•๋ฅ ์„ ๋‚˜์—ดํ•œ ํ‘œ/๊ทธ๋ฆผ/ํ•จ์ˆ˜์‹(e.g., ๋™์ „ ๋˜์ง€๊ธฐ์˜ ์˜ˆ์—์„œ ์œ—๋ฉด์ด ์•ž๋ฉด(๋’ท๋ฉด)์ผ ๋•Œ ํ™•๋ฅ ์ด ์–ผ๋งˆ์ธ์ง€ ์•Œ๋ ค์ฃผ๋Š” ํ•จ์ˆ˜)
  • ํ™•๋ฅ (probability): ์–ด๋–ค ์‚ฌ๊ฑด์ด ์ผ์–ด๋‚ฌ์„ ์ง€์— ๋Œ€ํ•œ ๊ฐ€๋Šฅ์„ฑ์„ 0~1 ์‚ฌ์ด์˜ ์ˆซ์ž๋กœ ํ‘œํ˜„ํ•œ ๊ฐ’(e.g., ๋™์ „ ๋˜์ง€๊ธฐ์˜ ์˜ˆ์—์„œ ํ™•๋ฅ  ๋ณ€์ˆ˜๊ฐ€ ์•ž๋ฉด(๋’ท๋ฉด)์ผ ๊ฐ€๋Šฅ์„ฑ์˜ ๊ฐ’)
  • ์‚ฌ๊ฑด(event): ํ™•๋ฅ ๋ณ€์ˆ˜์—์„œ ๊ด€์ธก๋  ์ˆ˜ ์žˆ๋Š” ๊ฒฐ๊ณผ์˜ ์ง‘ํ•ฉ
  • ํ‘œ๋ณธ ๊ณต๊ฐ„(sample space): ๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ์‚ฌ๊ฑด์˜ ์ง‘ํ•ฉ
  • P(X = head) = p์—์„œ P๋Š” ํ™•๋ฅ  ๋ถ„ํฌ, X๋Š” ํ™•๋ฅ  ๋ณ€์ˆ˜, head๋Š” ์‚ฌ๊ฑด, p๋Š” ํ™•๋ฅ 

1.2. Probability distribution

  • ๊ท ์ผ ๋ถ„ํฌ(Uniform distribution): ์‚ฌ๊ฑด์ด ๋ฌด์—‡์ธ์ง€์™€ ๋ฌด๊ด€ํ•˜๊ฒŒ ํ™•๋ฅ ์ด ๋™์ผํ•œ ๋ถ„ํฌ

  • ๋ฒ ๋ฅด๋ˆ„์ด ๋ถ„ํฌ(Bernoulli distribution): ํ™•๋ฅ  ๋ณ€์ˆ˜ X์˜ ๊ฐ’์ด 2๊ฐœ(0 or 1)์ธ ๋ถ„ํฌ โ†’ ๋‘ ๊ฐ€์ง€์ธ ์‹œ๋„, ์˜ˆ์ปจ๋Œ€ ์ƒ์กด/์‚ฌ๋ง์ด๋‚˜ ์ •ํ’ˆ/๋ถˆ๋Ÿ‰ ๋“ฑ์˜ ์ˆ˜๋งŽ์€ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ์Œ

    • แ„‰แ…ณแ„แ…ณแ„…แ…ตแ†ซแ„‰แ…ฃแ†บ 2024-05-09 แ„‹แ…ฉแ„Œแ…ฅแ†ซ 9 27 33
    • "P(X = x)": ํ™•๋ฅ  ๋ณ€์ˆ˜ X๊ฐ€ ๊ฐ’ x(์˜ˆ๋ฅผ ๋“ค์–ด, 1)๋ฅผ ๊ฐ€์งˆ ๋•Œ์˜ ํ™•๋ฅ 
    • ";" ๋’ค์˜ p๋Š” p๊ฐ€ ๋ชจ์ˆ˜(parameter)๋กœ ์ฃผ์–ด์ง„๋‹ค๋Š” ์˜๋ฏธ
      • ํ™•๋ฅ  ๋ถ„ํฌ์—์„œ์˜ ๋ชจ์ˆ˜(parameter): ํ™•๋ฅ  ๋ถ„ํฌ์˜ ํŠน์„ฑ์„ ๋‚˜ํƒ€๋‚ด๋Š” ์ˆ˜(e.g., ๋ฒ ๋ฅด๋ˆ„์ด ๋ถ„ํฌ์—์„œ ๋™์ „์—์„œ ์•ž๋ฉด์ด ๋‚˜์˜ฌ ํ™•๋ฅ , ์ •๊ทœ ๋ถ„ํฌ์—์„œ๋Š” ํ‰๊ท ๊ณผ ๋ถ„์‚ฐ, ํ†ต๊ณ„ํ•™์—์„œ ๋ชจ์ˆ˜๋Š” ํ•ญ์ƒ ๊ทธ๋ฆฌ์Šค ๋ฌธ์ž๋กœ ํ‘œ๊ธฐ)
    • "{": x์˜ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ์ผ€์ด์Šค๋“ค์„ ๋‚˜๋ˆ ์„œ ๋ณด๋Š” ๊ฒƒ
    • ์„ฑ์งˆ
      • image
  • ์ง€์ง€์—ญ(support): ํ™•๋ฅ  ๋ถ„ํฌ์—์„œ ํ™•๋ฅ  ๊ฐ’์ด 0์ด ์•„๋‹Œ ํ™•๋ฅ  ๋ณ€์ˆ˜ x์˜ ์ง‘ํ•ฉ(์ฆ‰, ๋ฐœ์ƒ ๊ฐ€๋Šฅํ•œ ์‚ฌ๊ฑด(์˜ˆ: head, tail)์€ ์ง€์ง€์—ญ์œผ๋กœ ๋ฐ”๋€” ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋ฐœ์ƒ ๋ถˆ๊ฐ€๋Šฅํ•œ ์‚ฌ๊ฑด(์˜ˆ: ๋™์ „์„ ๋˜์กŒ๋Š”๋ฐ head๋„ tail๋„ ์•„๋‹Œ ๋™์ „์ด ์„ธ์›Œ์ง„๋‹ค๋˜์ง€)์€ ๋ถˆ๊ฐ€๋Šฅํ•œ ์‚ฌ๊ฑด์ด๋‹ˆ๊นŒ ํ™•๋ฅ ์ด 0์ด๋ฉฐ, ๋”ฐ๋ผ์„œ ์ง€์ง€์—ญ์œผ๋กœ ๋ฐ”๋€” ์ˆ˜ ์—†์Œ)

1.3. pmf vs pdf

  • ์ด์‚ฐํ˜• ํ™•๋ฅ  ๋ถ„ํฌ(Discrete probability distribution): ํ™•๋ฅ  ๋ณ€์ˆ˜ X์˜ ๊ฐ’์ด ์ด์‚ฐ์ (discrete)์ผ ๋•Œ์˜ ํ™•๋ฅ  ๋ถ„ํฌ(e.g., ๋ฒ ๋ฅด๋ˆ„์ด ๋ถ„ํฌ)

    • ์ด์‚ฐํ‘œ๋ณธ๊ณต๊ฐ„์—์„œ ์ •์˜๋œ ํ™•๋ฅ  ๋ณ€์ˆ˜์˜ ๊ฐ’์ด ์œ ํ•œํ•˜๊ฑฐ๋‚˜ countably infinite
    • ์ข…๋ฅ˜: ๋ฒ ๋ฅด๋ˆ„์ด ๋ถ„ํฌ, ์ดํ•ญ ๋ถ„ํฌ, ๊ธฐํ•˜ ๋ถ„ํฌ, ๋‹คํ•ญ ๋ถ„ํฌ, ํฌ์•„์†ก ๋ถ„ํฌ
  • ์—ฐ์†ํ˜• ํ™•๋ฅ  ๋ถ„ํฌ(Continuous probability distribution): ํ™•๋ฅ  ๋ณ€์ˆ˜ X์˜ ๊ฐ’์ด ์—ฐ์†์ (continuous)์ผ ๋•Œ์˜ ํ™•๋ฅ  ๋ถ„ํฌ(e.g., ์—ฐ์† ๊ท ๋“ฑ ๋ถ„ํฌ)

    • ํ™•๋ฅ  ๋ณ€์ˆ˜์˜ ๊ฐ’์ด ๋ฌดํ•œ๊ฐœ์ด๋ฉฐ ์…€ ์ˆ˜ ์—†์Œ
    • ์—ฐ์†ํ˜• ํ™•๋ฅ  ๋ณ€์ˆ˜์˜ ํ™•๋ฅ  ๊ฐ’์„ ๊ตฌํ•  ๋•Œ๋Š” ๋ฉด์ ์„ ๊ตฌํ•˜๊ธฐ ์œ„ํ•ด ์ ๋ถ„์„ ์ด์šฉ(e.g., ์•„๋ž˜๋Š” ์—ฐ์† ๊ท ๋“ฑ ๋ถ„ํฌ๋ฅผ ํ‘ธ๋Š” ์ˆ˜์‹)
    • ์ข…๋ฅ˜: ๊ท ๋“ฑ๋ถ„ํฌ, ์ •๊ทœ๋ถ„ํฌ, ์นด์ด์ œ๊ณฑ ๋ถ„ํฌ, t-๋ถ„ํฌ, F ๋ถ„ํฌ
    • ์ดํ•ญ๋ถ„ํฌ์˜ ํ™•๋ฅ  ์งˆ๋Ÿ‰ ํ•จ์ˆ˜(pmf)
      • แ„‰แ…ณแ„แ…ณแ„…แ…ตแ†ซแ„‰แ…ฃแ†บ 2024-05-09 แ„‹แ…ฉแ„Œแ…ฅแ†ซ 9 44 26
  • ํ™•๋ฅ  ์งˆ๋Ÿ‰ ํ•จ์ˆ˜(Probability mass function): ์ด์‚ฐํ˜• ํ™•๋ฅ  ๋ถ„ํฌ์— ๋Œ€ํ•œ ํ™•๋ฅ  ํ•จ์ˆ˜, ์ด์‚ฐํ™•๋ฅ ๋ณ€์ˆ˜ X์˜ ๊ฐ’ x1, ..., xn์˜ ๊ฐ ํ™•๋ฅ ์„ ๋Œ€์‘

  • ํ™•๋ฅ  ๋ฐ€๋„ ํ•จ์ˆ˜(Probability density function): ์—ฐ์†ํ˜• ํ™•๋ฅ  ๋ถ„ํฌ์— ๋Œ€ํ•œ ํ™•๋ฅ  ํ•จ์ˆ˜, ํ™•๋ฅ  ๋ณ€์ˆ˜ X๊ฐ€ ์–ด๋–ค ๊ตฌ๊ฐ„ [l, u]์˜ ๋ชจ๋“  ๊ฐ’์„ ์ทจํ•˜๊ณ  ์ด ๊ตฌ๊ฐ„์—์„œ์˜ ํ•จ์ˆ˜ f(x)

    • ํ™•๋ฅ  ๋ฐ€๋„ ํ•จ์ˆ˜์—์„œ๋Š” X๊ฐ€ ์ฃผ์–ด์ง„ ๋ฒ”์œ„(ํ‘œ๋ณธ ๊ณต๊ฐ„) ๋‚ด์—์„œ ์ž„์˜์˜ ์‹ค์ˆ˜ ๊ฐ’์„ ๊ฐ€์ง

1.4. Normal distribution

  • ์ •๊ทœ๋ถ„ํฌ(Normal distribuiton): ์—ฐ์† ํ™•๋ฅ  ๋ถ„ํฌ์˜ ํ•˜๋‚˜๋กœ, ์ž์—ฐ์ ์œผ๋กœ ํ”ํžˆ ๋ณผ ์ˆ˜ ์žˆ๋Š” ๋ถ„ํฌ. ๊ฐ€์šฐ์Šค ๋ถ„ํฌ
    • ํŠน์ง•: ๋Œ€์นญ(symmetric)์ด๋ฉฐ ์ข… ๋ชจ์–‘์˜ ํ˜•ํƒœ(bell shape)
  • ์ค‘์‹ฌ๊ทนํ•œ์ •๋ฆฌ(CLT, Central Limit Theorem): ํ‘œ๋ณธ ํ‰๊ท ์˜ ๋ถ„ํฌ๊ฐ€ ์ •๊ทœ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅธ๋‹ค๋Š” ์ •๋ฆฌ
  • ํ‘œ์ค€ ์ •๊ทœ ๋ถ„ํฌ(Z-distribution, Standard normal distribution): ํ‰๊ท ์ด 0์ด๊ณ  ํ‘œ์ค€ ํŽธ์ฐจ๊ฐ€ 1์ธ ์ •๊ทœ๋ถ„ํฌ
    • ๋ชจ๋“  ์ •๊ทœ ๋ถ„ํฌ๋Š” ํ‘œ์ค€ ์ •๊ทœ ๋ถ„ํฌ๋กœ ๋ณ€ํ™˜(transformation)๋  ์ˆ˜ ์žˆ์Œ.
    • ์ž„์˜์˜ ์ •๊ทœ ๋ถ„ํฌ๋ฅผ ํ‘œ์ค€ ์ •๊ทœ ๋ถ„ํฌ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ณผ์ •
      1. ํ‰๊ท ์ด ฮผ์ด๊ณ  ๋ถ„์‚ฐ์ด ฯƒยฒ์ธ ์ •๊ทœ ๋ถ„ํฌ๋ฅผ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ํ‘œ์‹œ: X ~ Normal(ฮผ, ฯƒยฒ)
      2. Y(Z-score) = (X - ฮผ) / ฯƒ
      3. Y ~ Normal(0, 1)

1.5. Binomial distribution

  • ์ดํ•ญ ๋ถ„ํฌ(Binomial distribution): 1ํšŒ์˜ ์‹œ๋„์—์„œ ์„ฑ๊ณต/์‹คํŒจ๋ฅผ ๋‹ค๋ฃจ์—ˆ๋˜ ๋ถ„ํฌ์ธ ๋ฒ ๋ฅด๋ˆ„์ด ๋ถ„ํฌ๋ฅผ n๋ฒˆ์˜ ์‹œ๋„๋กœ ํ™•์žฅํ•œ ๋ถ„ํฌ. ์ฆ‰, nํšŒ์˜ ๋ฒ ๋ฅด๋ˆ„์ด ์‹œํ–‰์„ ํ•ฉํ•œ ๊ฒƒ

    • แ„‰แ…ณแ„แ…ณแ„…แ…ตแ†ซแ„‰แ…ฃแ†บ 2024-05-09 แ„‹แ…ฉแ„Œแ…ฅแ†ซ 11 10 12
    • ์ฒซ๋ฒˆ์งธ ํ•ญ: ์กฐํ•ฉ(combination), ๋‘๋ฒˆ์งธ ํ•ญ: ์„ฑ๊ณต ํšŸ์ˆ˜ x, ์„ธ๋ฒˆ์งธ ํ•ญ: ์‹คํŒจ ํšŸ์ˆ˜ n-x๋ฒˆ
    • ์ดํ•ญ ๋ถ„ํฌ์˜ ํ‰๊ท : np, ๋ถ„์‚ฐ: np(1-p)
      • image
      • n์ด ๊ณ ์ •๋˜์—ˆ์„ ๋•Œ p๊ฐ€ 0๊ณผ ๊ฐ€๊น๊ฑฐ๋‚˜ 1์— ๊ฐ€๊นŒ์šฐ๋ฉด ๊ทธ ๋ถ„์‚ฐ ๊ฐ’์ด ์ปค์ง€๊ณ , p๊ฐ€ 0.5์ผ ๋•Œ ๋ถ„์‚ฐ์€ ์ตœ์†Œ๊ฐ€ ๋จ
  • ๋‹คํ•ญ ๋ถ„ํฌ(Mulitinomial distribution): ์ดํ•ญ ๋ถ„ํฌ(0 or 1) โ†’ ๋‹คํ•ญ ๋ถ„ํฌ(n1, n2, n3, ...)

  • ๋ชจ์ˆ˜ ๊ณต๊ฐ„(parameter space): ๋ชจ์ˆ˜๊ฐ€ ์˜๋ฏธ ์žˆ๋Š” ๊ฐ’์„ ๊ฐ€์งˆ ์ˆ˜ ์žˆ๋Š” ๊ณต๊ฐ„

    • ์ดํ•ญ ๋ถ„ํฌ์—์„œ์˜ ๋ชจ์ˆ˜ ๊ณต๊ฐ„: n์€ 1๋ณด๋‹ค ํฌ๊ฑฐ๋‚˜ ๊ฐ™์€ ์ •์ˆ˜, p๋Š” 0๊ณผ 1 ์‚ฌ์ด์˜ ์‹ค์ˆ˜
    • ์ •๊ทœ๋ถ„ํฌ์—์„œ์˜ ๋ชจ์ˆ˜ ๊ณต๊ฐ„: ํ‰๊ท ์€ ์ž„์˜์˜ ์‹ค์ˆ˜๊ฐ’, ๋ถ„์‚ฐ์€ 0๋ณด๋‹ค ํฐ ์‹ค์ˆ˜

1.6. Poisson distribution

  • ํฌ์•„์†ก ๋ถ„ํฌ(Poisson distribution): '๋‹จ์œ„ ์‹œ๊ฐ„/๊ณต๊ฐ„ ๋‚ด ์‚ฌ๊ฑด์˜ ๋ฐœ์ƒ ํšŸ์ˆ˜'์— ๋Œ€ํ•œ ํ™•๋ฅ  ๋ถ„ํฌ(e.g., 1์‹œ๊ฐ„์— ๋ช‡ ๊ฑด์˜ ๊ตฌ๋งค๊ฐ€ ๋ฐœ์ƒํ–ˆ๋Š”์ง€)
    • แ„‰แ…ณแ„แ…ณแ„…แ…ตแ†ซแ„‰แ…ฃแ†บ 2024-05-09 แ„‹แ…ฉแ„Œแ…ฅแ†ซ 11 25 00
    • ํŠน์ง•: ํ‰๊ท ๊ณผ ๋ถ„์‚ฐ ๋ชจ๋‘ ๋ชจ์ˆ˜์ธ ฮป๋กœ ๋™์ผ
      • ์‹ค์ œ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ํฌ์•„์†ก ๊ด€๋ จ ๋ชจ๋ธ๋ง์„ ํ•  ๋•Œ๋Š” ๊ณผ์‚ฐํฌ์ธ ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์€๋ฐ ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์Œ์ดํ•ญ ๋ถ„ํฌ(negative binomial)์„ ์‚ฌ์šฉํ•˜๊ธฐ๋„ ํ•จ
      • ๊ณผ์‚ฐํฌ(overdispersion): ํ‰๊ท ๋ณด๋‹ค ๋ถ„์‚ฐ์ด ํฐ ๊ฒฝ์šฐ
    • ํฌ์•„์†ก ๋ถ„ํฌ๋Š” ์ดํ•ญ ๋ถ„ํฌ๋กœ๋ถ€ํ„ฐ ์œ ๋„๋  ์ˆ˜๋„ ์žˆ์Œ. ์ดํ•ญ ๋ถ„ํฌ์—์„œ n์ด ๋ฌด์ฒ™ ํฌ๊ณ  p๊ฐ€ ๋‚ฎ์•„์ง€๋ฉด ฮป = np์ธ ํฌ์•„์†ก์œผ๋กœ ๊ทผ์‚ฌ๊ฐ€ ๊ฐ€๋Šฅ
      • ๋Œ€ํ‘œ์ ์ธ ์˜ˆ์‹œ: ์ฑ…์˜ ํ•œ ํŽ˜์ด์ง€์—์„œ ๋‚˜ํƒ€๋‚  ์ˆ˜ ์žˆ๋Š” ์˜คํƒˆ์ž์˜ ์ˆ˜
      • ์ˆ˜๋งŽ์€ ๊ธ€์ž(n์ด ํฌ๊ณ ) ์ค‘ ์˜คํƒˆ์ž์˜ ์ˆ˜๋Š” ๋ฌด์ฒ™ ์ ์Œ(p๊ฐ€ ์ž‘์Œ). ํฌ์•„์†ก ๊ด€์ ์—์„œ๋Š” ๊ฐ ํŽ˜์ด์ง€๋ฅผ ๋‹จ์œ„ ๊ณต๊ฐ„์œผ๋กœ ๋ณด๊ณ  ํŽ˜์ด์ง€ ๋‹น ์˜คํƒˆ์ž์˜ ์ˆ˜๊ฐ€ ํฌ์•„์†ก์„ ๋”ฐ๋ฅธ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ์Œ

1.7. Standardization and Normalization

  • ์Šค์ผ€์ผ๋ง(Scaling): ์ˆซ์ž์˜ ์Šค์ผ€์ผ์„ ์กฐ์ ˆํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋Œ€ํ‘œ์ ์ธ ๋ฐฉ๋ฒ•์œผ๋กœ ํ‘œ์ค€ํ™”์™€ ์ •๊ทœํ™”๊ฐ€ ์žˆ์œผ๋ฉฐ, ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ ํ˜•ํƒœ๋Š” ๋ฐ”๊พธ์ง€ ์•Š์Œ

  • ํ‘œ์ค€ํ™”(Standardization): ํ‰๊ท ์„ 0, ํ‘œ์ค€ํŽธ์ฐจ๋ฅผ 1๋กœ ๋งž์ถฐ์ฃผ๋Š” ๋ณ€ํ™˜

    • แ„‰แ…ณแ„แ…ณแ„…แ…ตแ†ซแ„‰แ…ฃแ†บ 2024-05-09 แ„‹แ…ฉแ„Œแ…ฅแ†ซ 11 35 21
  • ์ •๊ทœํ™”(Normalization): ์ตœ์†Ÿ๊ฐ’์„ 0, ์ตœ๋Œ“๊ฐ’์„ 1๋กœ ๋งž์ถฐ์ฃผ๋Š” ๋ณ€ํ™˜

    • แ„‰แ…ณแ„แ…ณแ„…แ…ตแ†ซแ„‰แ…ฃแ†บ 2024-05-09 แ„‹แ…ฉแ„Œแ…ฅแ†ซ 11 35 33

1.8. Negative binomial distribution

2. ๊ธฐ๋Œ“๊ฐ’, ๊ทธ๋ฆฌ๊ณ  ๋” ๋งŽ์€ ๋ถ„ํฌ

2.1. Expectation

  • ๊ธฐ๋Œ“๊ฐ’(expectation): ๊ธฐ๋Œ€๊ฐ’์€ ๋‹จ์ˆœํ•œ ํ‰๊ท  ๊ทธ ์ด์ƒ์œผ๋กœ ์ผ๋ฐ˜ํ™”๋œ ๊ฐœ๋…
    • ์˜ˆ์ธก/์ถ”์ •ํ•˜๋ ค๋Š” ์–ด๋–ค ํŠน์ •๊ฐ’์ด ์•„๋‹Œ, ๊ธฐ๋Œ€๋˜๋Š” ์˜ˆ์ธก์น˜๋“ค์˜ ํ‰๊ท ๊ฐ’
    • ์ฆ‰, ํ™•๋ฅ ์  ๋ถ„ํฌ ๊ฐœ๋…์ด ๊ณ ๋ ค๋œ ํ‰๊ท 
      • ํ™•๋ฅ ๋ถ„ํฌ์˜ ์„ฑ๊ฒฉ์„ ๊ฒฐ์ •์ง“๋Š” ํ™•๋ฅ ์  ํ‰๊ท ์น˜(๋ฌด๊ฒŒ์ค‘์‹ฌ, ๊ท ํ˜•์ )
      • ํ™•๋ฅ ๋ณ€์ˆ˜๊ฐ€ ๋‚˜ํƒ€๋‚ด๋Š” ํ™•๋ฅ ๋ถ„ํฌ์—์„œ, ์ค‘์‹ฌ ๊ฒฝํ–ฅ / ๊ธฐ๋Œ€๋˜๋Š” ์œ„์น˜(์ฆ‰, ์ค‘์‹ฌ์ ์œผ๋กœ ๊ธฐ๋Œ€๋˜๋Š” ๋Œ€ํ‘œ ๊ฐ’)
    • ๊ฒฐ๊ตญ, ํ™•๋ฅ ๋ถ„ํฌ๋ฅผ ๋‹ด๊ณ ์žˆ๋Š” ํ™•๋ฅ ๋ณ€์ˆ˜์— ์ทจํ•ด์ง€๋Š” ํ™•๋ฅ ์  ๊ฐ€์ค‘ํ‰๊ท 

2.2. Independence

  • ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ (Conditional probability): ์ฃผ์–ด์ง„ ์‚ฌ๊ฑด์ด ์ผ์–ด๋‚ฌ๋‹ค๋Š” ๊ฐ€์ • ํ•˜์— ๋‹ค๋ฅธ ํ•œ ์‚ฌ๊ฑด์ด ์ผ์–ด๋‚  ํ™•๋ฅ 
    • แ„‰แ…ณแ„แ…ณแ„…แ…ตแ†ซแ„‰แ…ฃแ†บ 2024-05-22 แ„‹แ…ฉแ„’แ…ฎ 3 06 45
    • ๋ถ„์ž: ์‚ฌ๊ฑด A์™€ ์‚ฌ๊ฑด B๊ฐ€ ๋™์‹œ์— ์ผ์–ด๋‚ฌ๋‹ค๋Š” ๋œป, ๋ถ„๋ชจ: ์‚ฌ๊ฑด B๊ฐ€ ์ผ์–ด๋‚ฌ๋‹ค๋Š” ๋œป
    • ์ฆ‰, ์‚ฌ๊ฑด B๊ฐ€ ์ผ์–ด๋‚ฌ์„ ๋•Œ, ์‚ฌ๊ฑด A์™€ ์‚ฌ๊ฑด B๊ฐ€ ๋™์‹œ์— ์ผ์–ด๋‚ฌ์„ ํ™•๋ฅ 
  • ๋…๋ฆฝ(independence): ๋‘˜ ์ค‘ ํ•˜๋‚˜์˜ ์‚ฌ๊ฑด์ด ์ผ์–ด๋‚  ํ™•๋ฅ ์ด ๋‹ค๋ฅธ ์‚ฌ๊ฑด์ด ์ผ์–ด๋‚  ํ™•๋ฅ ์— ์˜ํ–ฅ์„ ๋ฏธ์น˜์ง€ ์•Š๋Š”๋‹ค๋Š” ๊ฒƒ
    • ๋…๋ฆฝ์ด๋ผ๋Š” ๊ฒƒ์€ ํ™•๋ฅ  ๋ถ„ํฌ๋ฅผ ํ†ตํ•ด ์–ด๋– ํ•œ ์‚ฌ๊ฑด์ด๋‚˜ ํŠน์„ฑ๋“ค์ด ๊ด€๋ จ ์žˆ๋Š”์ง€๋ฅผ ๋ณด๋Š” ๊ฒƒ
    • แ„‰แ…ณแ„แ…ณแ„…แ…ตแ†ซแ„‰แ…ฃแ†บ 2024-05-22 แ„‹แ…ฉแ„’แ…ฎ 3 09 36
    • ์ฆ‰, ์กฐ๊ฑด๋ถ€ ํ™•๋ฅ ์ด ์›๋ž˜์˜ ํ™•๋ฅ ๊ณผ ๊ฐ™๋‹ค๋ฉด ๋‘ ์‚ฌ๊ฑด์€ ๋…๋ฆฝ
  • ์ข…์†(dependent): ๋…๋ฆฝ์ด ์•„๋‹Œ ๊ด€๊ณ„

2.3. Sample & statistic

2.4. Chi-squared distribution

2.5. F and t distribution

2.6. Cumulative distribution function

2.7. Quantile

2.8. Compare means

2.9. Secretary problem

3. ์  ์ถ”์ •๊ณผ ๊ตฌ๊ฐ„ ์ถ”์ •

4. ๊ฐ€์„ค ๊ฒ€์ •: t-test์™€ ANOVA

Practical Statistics for Data Scientists

New 1. ํƒ์ƒ‰์  ๋ฐ์ดํ„ฐ ๋ถ„์„ (practice/Practice EDA~.ipynb)

  • ํƒ์ƒ‰์  ๋ฐ์ดํ„ฐ ๋ถ„์„(exploratory data analysis): ์š”์•ฝํ†ต๊ณ„๋Ÿ‰(ํ‰๊ท , ์ค‘์•™๊ฐ’, ๋ถ„์œ„์ˆ˜ ๋“ฑ)๊ณผ ๊ฐ„๋‹จํ•œ ๋„ํ‘œ(์ƒ์ž๊ทธ๋ฆผ, ์‚ฐ์ ๋„ ๋“ฑ)๋“ฑ์„ ํ†ตํ•ด ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ์˜ ๊ฒฝํ–ฅ์„ฑ์„ ํŒŒ์•…ํ•˜๋Š” ๊ฒƒ
  • ๋ฐ์ดํ„ฐ์˜ ์ข…๋ฅ˜
    • ์ˆ˜์น˜ํ˜•, ์—ฐ์†ํ˜•, ์ •์ˆ˜ํ˜•(์ด์‚ฐ), ๋ฒ”์ฃผํ˜•, ์ด์ง„, ์ˆœ์„œํ˜•
  • ํ…Œ์ด๋ธ” ๋ฐ์ดํ„ฐ: ํ”ํžˆ ํ–‰๊ณผ ์—ด๋กœ ์ด๋ฃจ์–ด์ ธ์„œ ๋ฐ์ดํ„ฐ๋ฅผ ํ‘œํ˜„ํ•˜๋Š” ๋ฐฉ๋ฒ• ~ ํŒ๋‹ค์Šค์—์„œ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ๊ตฌ์กฐ(feature๋Š” ๊ฐ ์—ด, record๋Š” ๊ฐ ํ–‰์„ ๋‚˜ํƒ€๋ƒ„)
    • features are used to predict outcome.
    1. ์œ„์น˜ ์ถ”์ •
    • ๋ฐ์ดํ„ฐ์˜ ๊ฐ’๋“ค์ด ์–ด๋””์ฏค์— ์œ„์น˜ํ•˜๋Š”์ง€(์ค‘์‹ฌ๊ฒฝํ–ฅ์„ฑ)๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์ถ”์ •๊ฐ’์„ ํ™•์ธํ•˜๋Š” ๊ณผ์ •
    • ํ‰๊ท , ๊ฐ€์ค‘ํ‰๊ท , ์ค‘์•™๊ฐ’, ๋ฐฑ๋ถ„์œ„์ˆ˜, ๊ฐ€์ค‘ ์ค‘์•™๊ฐ’, ์ ˆ์‚ฌํ‰๊ท , ๊ทน๋‹จ๊ฐ’(outlier) ๋“ฑ์„ ํ™•์ธ + robust
      • ๊ฐ€์ค‘ ํ‰๊ท (weighted mean): ๊ฐ€์ค‘์น˜๋ฅผ ๊ณฑํ•œ ๊ฐ’์˜ ์ดํ•ฉ์„ ๊ฐ€์ค‘์น˜์˜ ์ดํ•ฉ์œผ๋กœ ๋‚˜๋ˆˆ ๊ฐ’
      • ๊ฐ€์ค‘ ์ค‘์•™๊ฐ’(weighted median): ๋ฐ์ดํ„ฐ๋ฅผ ์ •๋ ฌํ•œ ํ›„, ๊ฐ ๊ฐ€์ค‘์น˜ ๊ฐ’์„ ์œ„์—์„œ๋ถ€ํ„ฐ ๋”ํ•  ๋•Œ, ์ดํ•ฉ์˜ ์ค‘๊ฐ„์ด ์œ„์น˜ํ•˜๋Š” ๋ฐ์ดํ„ฐ ๊ฐ’, wquantiles ํŒจํ‚ค์ง€์˜ median() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•ด์„œ ๊ตฌํ•  ์ˆ˜ ์žˆ์Œ
      • ์ ˆ์‚ฌํ‰๊ท (trimmed mean): ์ •ํ•ด์ง„ ๊ฐœ์ˆ˜์˜ ๊ทน๋‹จ๊ฐ’์„ ์ œ์™ธํ•œ ๋‚˜๋จธ์ง€ ๊ฐ’๋“ค์˜ ํ‰๊ท  ~ scipy.stats์— ์žˆ๋Š” trim_mean ํ•จ์ˆ˜ ์‚ฌ์šฉ
    1. ๋ณ€์ด ์ถ”์ •
    • ๋ฐ์ดํ„ฐ ๊ฐ’์ด ์–ผ๋งˆ๋‚˜ ๋ฐ€์ง‘ํ•ด ์žˆ๋Š”์ง€ ํ˜น์€ ํผ์ ธ ์žˆ๋Š”์ง€๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์‚ฐํฌ๋„๋ฅผ ํ™•์ธํ•˜๋Š” ๊ณผ์ •, ์ผ๋ฐ˜์ ์œผ๋กœ ํŽธ์ฐจ๋ฅผ ๊ธฐ๋ณธ์œผ๋กœ ํ•จ(e.g., ํ‰๊ท ์ ˆ๋Œ€ํŽธ์ฐจ)
    • ํŽธ์ฐจ, ๋ถ„์‚ฐ, ํ‘œ์ค€ํŽธ์ฐจ(๋ถ„์‚ฐ์˜ ์ œ๊ณฑ๊ทผ), ํ‰๊ท ์ ˆ๋Œ€ํŽธ์ฐจ(Manhattan norm, L1 norm), ์ค‘์•™๊ฐ’์˜ ์ค‘์œ„์ ˆ๋Œ€ํŽธ์ฐจ(MAD), ์ˆœ์„œํ†ต๊ณ„๋Ÿ‰, ๋ฒ”์œ„, ๋ฐฑ๋ถ„์œ„์ˆ˜, ์‚ฌ๋ถ„์œ„๋ฒ”์œ„(IQR)์„ ํ™•์ธ
      • ํ‰๊ท ์ ˆ๋Œ€ํŽธ์ฐจ(mean absolute deviation): ํ‰๊ท ๊ณผ์˜ ํŽธ์ฐจ์˜ ์ ˆ๋Œ“๊ฐ’์˜ ํ‰๊ท (ํŽธ์ฐจ ์ž์ฒด์˜ ํ‰๊ท ์„ ๊ตฌํ•˜๊ฒŒ ๋˜๋ฉด ์Œ์˜ ํŽธ์ฐจ๊ฐ€ ์–‘์˜ ํŽธ์ฐจ๋ฅผ ์ƒ์‡„์‹œํ‚ค๋ฏ€๋กœ ๋ฐ”๋žŒ์งํ•˜์ง€ ์•Š์Œ)
      • ์ค‘์•™๊ฐ’์˜ ์ค‘์œ„์ ˆ๋Œ€ํŽธ์ฐจ(median absolute deviation from the median): ์ค‘๊ฐ„๊ฐ’๊ณผ์˜ ํŽธ์ฐจ์˜ ์ ˆ๋Œ“๊ฐ’์˜ ์ค‘๊ฐ„๊ฐ’, statsmodels ํŒจํ‚ค์ง€์˜ strong.scale.mad() ํ•จ์ˆ˜ ์‚ฌ์šฉ
      • ์ˆœ์„œํ†ต๊ณ„๋Ÿ‰(์ˆœ์œ„, order statistics): ์ •๋ ฌ(์ˆœ์œ„) ๋ฐ์ดํ„ฐ๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ํ†ต๊ณ„๋Ÿ‰, ๊ฐ€์žฅ ๊ธฐ๋ณธ์ด ๋˜๋Š” ์ธก๋„๊ฐ€ ๋ฒ”์œ„(range)
      • ๋ฒ”์œ„(range): ์ตœ๋Œ“๊ฐ’๊ณผ ์ตœ์†Ÿ๊ฐ’์˜ ์ฐจ์ด(์ตœ๋Œ“๊ฐ’ - ์ตœ์†Ÿ๊ฐ’), ๋ฒ”์œ„๋Š” ๊ทน๋‹จ๊ฐ’์— ๋งค์šฐ ๋ฏผ๊ฐํ•˜์—ฌ ๋ฐ์ดํ„ฐ์˜ ๋ณ€์ด๋ฅผ ์ธก์ •ํ•˜๋Š”๋ฐ ํฌ๊ฒŒ ์œ ์šฉํ•˜์ง€ ์•Š์Œ ~ ์‚ฌ๋ถ„์œ„๋ฒ”์œ„(IQR)๋ฅผ ํ™œ์šฉํ•ด ๊ทน๋ณต
    • ๋ถ„์‚ฐ, ํ‘œ์ค€ํŽธ์ฐจ, ํ‰๊ท ์ ˆ๋Œ€ํŽธ์ฐจ ๋ชจ๋‘ ๊ทน๋‹จ๊ฐ’์— ๋กœ๋ฒ„์ŠคํŠธํ•˜์ง€ ์•Š์Œ โ†’ robustํ•œ ๋ณ€์ด ์ถ”์ •๊ฐ’์œผ๋กœ ์ค‘๊ฐ„๊ฐ’์˜ ์ค‘์œ„์ ˆ๋Œ€ํŽธ์ฐจ(MAD)๊ฐ€ ์žˆ์Œ
      • ๋ถ„์‚ฐ๊ณผ ํ‘œ์ค€ํŽธ์ฐจ๋Š” ์ œ๊ณฑํŽธ์ฐจ๋ฅผ ์‚ฌ์šฉํ•˜๊ธฐ ๋•Œ๋ฌธ์— ํŠนํžˆ ๊ทน๋‹จ๊ฐ’์— ๋ฏผ๊ฐํ•จ
    1. ๋ฐ์ดํ„ฐ ๋ถ„ํฌ ํƒ์ƒ‰
    • ์ฃผ๋กœ ๋ฐ์ดํ„ฐ๊ฐ€ ์ „๋ฐ˜์ ์œผ๋กœ ์–ด๋–ป๊ฒŒ ๋ถ„ํฌํ•˜๊ณ  ์žˆ๋Š”์ง€๋ฅผ ์•Œ์•„๋ณด๋Š” ๊ณผ์ •
    • ์ƒ์ž๊ทธ๋ฆผ(boxplot), ๋„์ˆ˜๋ถ„ํฌํ‘œ(frequency table), ํžˆ์Šคํ† ๊ทธ๋žจ(histogram), ๋ฐ€๋„ ๊ทธ๋ฆผ(density plot)๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์‹œ๊ฐํ™”
      • ๋ฐ€๋„ ๊ทธ๋ฆผ(density plot): ํžˆ์Šคํ† ๊ทธ๋žจ์„ ๋ถ€๋“œ๋Ÿฌ์šด ๊ณก์„ ์œผ๋กœ ๋‚˜ํƒ€๋‚ธ ๊ทธ๋ฆผ์œผ๋กœ ์ปค๋„๋ฐ€๋„์ถ”์ •์„ ์ฃผ๋กœ ์‚ฌ์šฉ
    1. ์ด์ง„ ๋ฐ์ดํ„ฐ์™€ ๋ฒ”์ฃผ ๋ฐ์ดํ„ฐ ํƒ์ƒ‰
      • ์ด์ง„ ๋ฐ์ดํ„ฐ์˜ ๊ฒฝ์šฐ๋Š” 1๊ณผ ๊ฐ™์ด ์ค‘์š”ํ•œ ๋ฒ”์ฃผ์˜ ๋น„์œจ์ด ์–ด๋Š ์ •๋„ ๋˜๋Š”์ง€ ์•Œ์•„๋ณด๋ฉด ๋จ - ๋ง‰๋Œ€ ๊ทธ๋ž˜ํ”„(count plot or bar plot) ํ™œ์šฉํ•˜์—ฌ ์‹œ๊ฐํ™” ๊ฐ€๋Šฅ
      • ๋ฒ”์ฃผ ๋ฐ์ดํ„ฐ๋Š” ๋ณดํ†ต ๋น„์œจ๋กœ ์š”์•ฝํ•  ์ˆ˜ ์žˆ๊ณ  ์•„๋ž˜์™€ ๊ฐ™์ด 2๊ฐ€์ง€์˜ ๊ฒฝ์šฐ๋กœ ์ฃผ๋กœ ๋ถ„๋ฅ˜ํ•ด์„œ ๊ตฌํ•จ
        • ๋ฒ”์ฃผ๊ฐ€ ๋ช‡ ๊ฐœ ์•ˆ ๋˜๋Š” ๊ฒฝ์šฐ: ๋ง‰๋Œ€ ๊ทธ๋ž˜ํ”„(count plot or bar plot), ํŒŒ์ด์ฐจํŠธ(pie chart)
          • ๋ง‰๋Œ€ ๊ทธ๋ž˜ํ”„๋Š” ํžˆ์Šคํ† ๊ทธ๋žจ๊ณผ ์œ ์‚ฌํ•˜๋ฉฐ, ํ†ต๊ณ„ํ•™์ž๋‚˜ ๋ฐ์ดํ„ฐ ์‹œ๊ฐํ™” ์ „๋ฌธ๊ฐ€๋“ค์€ ํŒŒ์ด์ฐจํŠธ๊ฐ€ ์‹œ๊ฐ์ ์œผ๋กœ ํšจ๊ณผ์ ์ด์ง€ ์•Š๋‹ค๋Š” ์ด์œ ๋กœ ์ž˜ ์‚ฌ์šฉํ•˜์ง€ ์•Š์Œ
        • ๋ฒ”์ฃผ๊ฐ€ ๋งŽ์€ ๊ฒฝ์šฐ: ์ตœ๋นˆ๊ฐ’(mode), ๊ธฐ๋Œ“๊ฐ’(expected value)
    1. ์ƒ๊ด€๊ด€๊ณ„
    • ์˜ˆ์ธก๊ฐ’๊ณผ ๋ชฉํ‘ฏ๊ฐ’์˜ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ์กฐ์‚ฌํ•˜๋Š” ๊ฒƒ์œผ๋กœ์จ ์ด๋ณ€๋Ÿ‰๋ถ„์„์˜ ์ค‘์š”ํ•œ ๋ฐฉ๋ฒ•, ์ƒ๊ด€ํ–‰๋ ฌ์ด๋‚˜ ์‚ฐ์ ๋„๋ฅผ ํ™œ์šฉํ•ด์„œ ํŒŒ์•…
      • X๊ฐ€ ํฐ ๊ฐ’์„ ๊ฐ€์ง€๋ฉด Y๋„ ํฐ ๊ฐ’์„ ๊ฐ–๊ณ , X๊ฐ€ ์ž‘์€ ๊ฐ’์„ ๊ฐ€์ง€๋ฉด Y๋„ ์ž‘์€ ๊ฐ’์„ ๊ฐ€์ง€๋Š” ๊ฒฝ์šฐ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ๊ฐ–๋Š”๋‹ค๊ณ  ํ•จ
    • ์ƒ๊ด€๊ณ„์ˆ˜(correlation coefficient): ์ˆ˜์น˜์  ๋ณ€์ˆ˜๋“ค ๊ฐ„์— ์–ด๋–ค ๊ด€๊ณ„๊ฐ€ ์žˆ๋Š”์ง€๋ฅผ ๋‚˜ํƒ€๋‚ด๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋Š” ์ธก์ •๋Ÿ‰(-1 ~ +1)
      • ์ ˆ๋Œ“๊ฐ’์ด 1์— ๊ฐ€๊นŒ์šธ์ˆ˜๋ก ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ๋†’์œผ๋ฉฐ 0์— ๊ฐ€๊นŒ์šธ์ˆ˜๋ก ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ์—†๋‹ค๋Š” ๋œป(+ ์–‘์˜ ์ƒ๊ด€๊ด€๊ณ„, ์Œ์˜ ์ƒ๊ด€๊ด€๊ณ„)
    • ์ƒ๊ด€ํ–‰๋ ฌ(correlation matrix): ํ–‰๊ณผ ์—ด์ด ๋ณ€์ˆ˜๋“ค์„ ์˜๋ฏธํ•˜๋Š” ํ‘œ, ๊ฐ ์…€์€ ๊ทธ ํ–‰๊ณผ ์—ด์— ํ•ด๋‹นํ•˜๋Š” ๋ณ€์ˆ˜๋“ค ๊ฐ„์˜ ์ƒ๊ด€๊ด€๊ณ„๋ฅผ ์˜๋ฏธ
    • ์‚ฐ์ ๋„(scatterplot): x์ถ•๊ณผ y์ถ•์ด ์„œ๋กœ ๋‹ค๋ฅธ ๋‘ ๊ฐœ์˜ ๋ณ€์ˆ˜๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๋„ํ‘œ
    1. ์ด๋ณ€๋Ÿ‰๋ถ„์„ & ๋‹ค๋ณ€๋Ÿ‰๋ถ„์„
    • ์œก๊ฐํ˜• ๊ตฌ๊ฐ„(hexagonal binning), ๋“ฑ๊ณ ์„ ๋„(contour plot), ํžˆํŠธ๋งต(heatmap), ๋ถ„ํ• ํ‘œ(contingency table), ๋ฐ”์ด์˜ฌ๋ฆฐ ๋„ํ‘œ(violin plot)

    • ์œก๊ฐํ˜• ๊ตฌ๊ฐ„: ๋ฐ์ดํ„ฐ๋ฅผ ์ ์œผ๋กœ ํ‘œ์‹œํ•˜๋Š” ๋Œ€์‹  ๋ฐ์ดํ„ฐ๋ฅผ ์œก๊ฐํ˜• ๋ชจ์–‘์˜ ๊ตฌ๊ฐ„๋“ค๋กœ ๋‚˜๋ˆ„๊ณ  ๊ฐ ๊ตฌ๊ฐ„์— ํฌํ•จ๋œ ๊ธฐ๋ก๊ฐ’์˜ ๊ฐœ์ˆ˜์— ๋”ฐ๋ผ ์ƒ‰๊น”์„ ํ‘œ์‹œํ•œ ๋„ํ‘œ(pandas ํŒจํ‚ค์ง€์˜ hexbin() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์‹œ๊ฐํ™” ๊ฐ€๋Šฅ)

      • ์‚ฐ์ ๋„๋Š” ๋ฐ์ดํ„ฐ์˜ ๊ฐœ์ˆ˜๊ฐ€ ์ ์„ ๋•Œ๋Š” ๊ดœ์ฐฎ์ง€๋งŒ ์ˆ˜๋งŽ์€ ํ–‰์„ ๋‚˜ํƒ€๋‚ด๊ธฐ์—๋Š” ๋ถ€์ ์ ˆํ•œ๋ฐ ์ด๋ฅผ ๋Œ€์ฒดํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋Š” ๋ฐฉ๋ฒ•
      • image
    • ๋“ฑ๊ณ ์„ ๋„: ์‚ฐ์ ๋„ ์œ„์— ๋“ฑ๊ณ ์„ ์„ ์‚ฌ์šฉํ•œ ๋„ํ‘œ๋กœ์จ ๋“ฑ๊ณ ์„ ์˜ '๊ผญ๋Œ€๊ธฐ'์ชฝ์œผ๋กœ ๊ฐˆ์ˆ˜๋ก ๋ฐ€๋„๊ฐ€ ๋†’์•„์ง(seaborn ํŒจํ‚ค์ง€์˜ kdeplot() ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•ด ์‹œ๊ฐํ™” ๊ฐ€๋Šฅ)

      • image
    • ๋ถ„ํ• ํ‘œ: ๋‘ ๋ฒ”์ฃผํ˜• ๋ณ€์ˆ˜๋ฅผ ์š”์•ฝํ•˜๋Š” ๋ฐ ํšจ๊ณผ์ ์ธ ๋ฐฉ๋ฒ•์œผ๋กœ, ๋ฒ”์ฃผ๋ณ„ ๋นˆ๋„์ˆ˜๋ฅผ ๊ธฐ๋กํ•œ ํ‘œ

      • image
    • ๋ฐ”์ด์˜ฌ๋ฆฐ ๋„ํ‘œ: ์ƒ์ž๊ทธ๋ฆผ์„ ๋ณด์™„ํ•œ ํ˜•ํƒœ๋กœ, y์ถ•์„ ๋”ฐ๋ผ ๋ฐ€๋„์ถ”์ • ๊ฒฐ๊ณผ๋ฅผ ๋™์‹œ์— ์‹œ๊ฐํ™”(seaborn ํŒจํ‚ค์ง€์˜ violinplot() ํ•จ์ˆ˜๋ฅผ ์ด์šฉํ•ด ์‹œ๊ฐํ™” ๊ฐ€๋Šฅ)

      • ์žฅ์ : ์ƒ์ž๊ทธ๋ฆผ์—์„œ๋Š” ๋ณด์ด์ง€ ์•Š๋Š” ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ๋ฅผ ๋ณผ ์ˆ˜ ์žˆ์Œ(๋‹ค๋งŒ, ๊ทน๋‹จ๊ฐ’๊ณผ ์ด์ƒ๊ฐ’์€ ์ƒ์ž๊ทธ๋ฆผ์ด ๋” ๋ช…ํ™•ํ•˜๊ฒŒ ๋ณด์—ฌ์คŒ)
      • image

About

A brief course in mathematical statics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages