In [1]:
import numpy as np
import pandas as pd

from math import factorial, exp, sqrt
import statistics
import scipy as sp
import scipy.stats

import matplotlib.pyplot as plt
import seaborn as sns

# os 패키지를 통해 현재 디렉토리 위치를 변경하고, read_csv를 더 편리하게 할 수 있음
import os
os.getcwd() # 현재 디렉토리 파악
# os.chdir(r"______") # 불러오고 싶은 파일이 위치한 주소를 ___에 입력

# 다른 노트북 작성할 때도 이 셀만 떼서 사용 가능하다.
import platform                

# 웬만하면 해주는 것이 좋다.
from matplotlib import font_manager, rc
plt.rcParams['axes.unicode_minus'] = False

if platform.system() == 'Darwin': #맥os 사용자의 경우에
    plt.style.use('seaborn-darkgrid') 
    rc('font', family = 'AppleGothic')
    
elif platform.system() == 'Windows':#윈도우 사용자의 경우에
    path = 'c:/Windows/Fonts/malgun.ttf'
    font_name = font_manager.FontProperties(fname=path).get_name()
    plt.style.use('seaborn-v0_8-whitegrid') # https://python-graph-gallery.co|m/199-matplotlib-style-sheets/
    rc('font', family=font_name)

## 1. 점추정 구간추정

### 구간추정

In [2]:
def interval_est(x, se):
    z = 1.64
    a = x - (z * se)
    b = x + (z * se)
    print(f'90%: {a} <= u <= {b}')
    
    z = 1.96
    a = x - (z * se)
    b = x + (z * se)
    print(f'95%: {a} <= u <= {b}')
    
    z = 2.58
    a = x - (z * se)
    b = x + (z * se)
    print(f'99%: {a} <= u <= {b}')

In [3]:
interval_est(500, 100)

90%: 336.0 <= u <= 664.0
95%: 304.0 <= u <= 696.0
99%: 242.0 <= u <= 758.0


## 2. 모평균의 구간추정

> z분포, t분포, 표본의 크기 결정

### 모집단의 표준편차를 아는 경우
+ 실제에서는 거의 없다

In [4]:
def mean_interval(n, x, s):
    a = x - 1.96 * (s / sqrt(n))
    b = x + 1.96 * (s / sqrt(n))
    
    print(f'{a} <= u <= {b}')

In [5]:
mean_interval(200, 30000, 500)

29930.703535443718 <= u <= 30069.296464556282


### 모집단의 표준편차를 모르는 경우
+ t분포 이용

In [6]:
l1 = [168, 160, 170, 162, 168, 163, 164, 167, 175, 179, 161, 155]

statistics.mean(l1)
statistics.stdev(l1), np.std(l1)
# statistics.variance(l1)

(6.646940512883967, 6.363961030678928)

In [7]:
def u_interval(list):
    import statistics
    x = statistics.mean(list)
    s = statistics.stdev(list)
    n = len(list)
    
    a = x - 2.201 * (s / sqrt(n))
    b = x + 2.201 * (s / sqrt(n))
    
    print(f'{a} <= u <= {b}')

In [8]:
u_interval(l1)

161.7767070097117 <= u <= 170.2232929902883


### 표본의 크기 결정

In [9]:
def sample_size(s, d):
    n = ((2.58 * s) / d)**2
    return n

In [10]:
sample_size(150, 100)

14.9769

In [11]:
sample_size(170, 100)

19.236996

## 3. 모집단의 비율 및 분산의 구간추정

### 모집단 비율의 구간추정

In [12]:
def prob_interval(n, t):
    p = t / n
    a = p - 1.96 * sqrt((p * (1 - p)) / n)
    b = p + 1.96 * sqrt((p * (1 - p)) / n)
    
    print(f'{a} <= p <= {b}')

In [13]:
prob_interval(77, 5)

0.009895976304936237 <= p <= 0.11997415356519361


### 표본의 크기 결정

In [14]:
def sample_size(p, d):
    n = p * (1 - p) * (1.96 / d)**2
    return n

In [15]:
sample_size(.95, 0.05)

72.99040000000005

### 모집단 분산의 구간추정

In [16]:
def var_interval(n, ss):
    a = ((n - 1) * ss) / 70.22
    b = ((n - 1) * ss) / 31.55
    print(f'{a} <= 모분산 <= {b}')

In [17]:
var_interval(50, 2.5)

1.7445172315579607 <= 모분산 <= 3.882725832012678
