In [None]:
! pip install numpy pandas
! pip install matplotlib

In [3]:
import numpy as np
import pandas as pd

# 1. 데이터 입력: 점수 리스트
scores = np.array([60, 70, 80, 90, 100])

# 2. 평균 계산
mean = np.mean(scores)

# 3. 편차 계산 (각 데이터 값 - 평균)
deviation = scores - mean

# 4. 편차제곱 계산
squared_deviation = deviation ** 2

# 5. 분산 계산 (편차제곱의 평균)
variance = np.mean(squared_deviation)

# 6. 표준편차 계산 (분산의 제곱근)
std_dev = np.sqrt(variance)

# 7. 결과를 데이터프레임으로 정리
result_df = pd.DataFrame({
    "점수": scores,
    "평균 (80)": [mean] * len(scores),
    "편차 (Xi - X̄)": deviation,
    "편차제곱 (Xi - X̄)^2": squared_deviation
})

# 8. 추가 계산 요약
summary = pd.DataFrame({
    "개념": ["평균", "편차", "편차제곱", "분산", "표준편차"],
    "설명": ["데이터의 중심값", "각 데이터와 평균의 차이", "편차를 제곱하여 음수를 없앤 값", 
            "편차제곱의 평균값", "분산의 제곱근으로 데이터 흩어진 정도"],
    "계산 결과": [round(mean, 2), f"{list(deviation)}", f"{list(squared_deviation)}", round(variance, 2), round(std_dev, 2)]
})

# 9. 결과 출력
print("중앙값 분석 결과")
print(result_df)
print("\n계산 요약")
print(summary)


중앙값 분석 결과
    점수  평균 (80)  편차 (Xi - X̄)  편차제곱 (Xi - X̄)^2
0   60     80.0         -20.0             400.0
1   70     80.0         -10.0             100.0
2   80     80.0           0.0               0.0
3   90     80.0          10.0             100.0
4  100     80.0          20.0             400.0

계산 요약
     개념                    설명  \
0    평균              데이터의 중심값   
1    편차         각 데이터와 평균의 차이   
2  편차제곱     편차를 제곱하여 음수를 없앤 값   
3    분산             편차제곱의 평균값   
4  표준편차  분산의 제곱근으로 데이터 흩어진 정도   

                                               계산 결과  
0                                               80.0  
1  [np.float64(-20.0), np.float64(-10.0), np.floa...  
2  [np.float64(400.0), np.float64(100.0), np.floa...  
3                                              200.0  
4                                              14.14  


In [4]:
import numpy as np

def calculate_percentile(data, p):
    """
    백분위수를 계산하는 함수
    :param data: 리스트 형태의 숫자 데이터
    :param p: 백분위 (0 ~ 1 사이의 소수)
    :return: 백분위수 값
    """
    # 1. 데이터 정렬 (오름차순)
    sorted_data = sorted(data)
    n = len(sorted_data)

    # 2. 위치 계산
    position = n * p

    # 3-1. nxp가 정수인 경우
    if position.is_integer():
        pos = int(position)
        # 두 값의 평균
        percentile_value = (sorted_data[pos - 1] + sorted_data[pos]) / 2
    else:
        # 3-2. nxp가 정수가 아닌 경우
        pos = int(np.ceil(position))  # 올림하여 위치 결정
        percentile_value = sorted_data[pos - 1]
    
    return percentile_value

# 테스트 데이터 (학생 점수)
scores = [52, 55, 58, 60, 63, 65, ]

# 백분위수 계산
percentiles = [0.25, 0.50, 0.75]
print("백분위수 계산 결과:")
for p in percentiles:
    result = calculate_percentile(scores, p)
    print(f"{int(p * 100)}th Percentile: {result}")


백분위수 계산 결과:
25th Percentile: 55
50th Percentile: 59.0
75th Percentile: 63


In [None]:
import numpy as np

def calculate_quartiles(data):
    """
    사분위수를 계산하는 함수
    :param data: 숫자형 리스트 또는 배열
    :return: Q1, Q2, Q3, IQR (제1사분위수, 중앙값, 제3사분위수, 사분위 범위)
    """
    # 1. 데이터 정렬
    sorted_data = np.sort(data)
    
    # 2. 사분위수 계산
    Q1 = np.percentile(sorted_data, 25)  # 제1사분위수 (25%)
    Q2 = np.percentile(sorted_data, 50)  # 중앙값 (50%)
    Q3 = np.percentile(sorted_data, 75)  # 제3사분위수 (75%)
    
    # 3. IQR (Interquartile Range) 계산
    IQR = Q3 - Q1
    
    return Q1, Q2, Q3, IQR

# 테스트 데이터
scores = [52, 55, 58, 60, 63, 65, 68, 70, 72, 75, 78, 80, 82, 85, 88, 90, 92, 95, 98, 100]

# 사분위수 계산
Q1, Q2, Q3, IQR = calculate_quartiles(scores)

# 결과 출력
print("사분위수 계산 결과:")
print(f"제1사분위수 (Q1): {Q1}")
print(f"중앙값 (Q2): {Q2}")
print(f"제3사분위수 (Q3): {Q3}")
print(f"사분위 범위 (IQR): {IQR}")

In [None]:
import numpy as np

def calculate_quartiles(data):
    """
    사분위수를 직접 계산하는 함수
    :param data: 숫자형 리스트 또는 배열
    :return: Q1, Q2, Q3, IQR (제1사분위수, 중앙값, 제3사분위수, 사분위 범위)
    """
    # 1. 데이터 정렬
    sorted_data = sorted(data)
    n = len(sorted_data)

    # 중앙값 계산 함수
    def find_median(subset):
        m = len(subset)
        if m % 2 == 0:
            # 짝수일 경우 중앙값: 두 중간값의 평균
            median = (subset[m // 2 - 1] + subset[m // 2]) / 2
        else:
            # 홀수일 경우 중앙값: 가운데 값
            median = subset[m // 2]
        return median

    # 2. 중앙값(Q2) 계산
    Q2 = find_median(sorted_data)

    # 3. 제1사분위수(Q1) 계산 (하위 절반의 중앙값)
    lower_half = sorted_data[:n // 2] if n % 2 == 0 else sorted_data[:n // 2]
    Q1 = find_median(lower_half)

    # 4. 제3사분위수(Q3) 계산 (상위 절반의 중앙값)
    upper_half = sorted_data[n // 2:] if n % 2 == 0 else sorted_data[n // 2 + 1:]
    Q3 = find_median(upper_half)

    # 5. 사분위 범위(IQR) 계산
    IQR = Q3 - Q1

    return Q1, Q2, Q3, IQR

# 테스트 데이터
scores = [52, 55, 58, 60, 63, 65, 68, 70, 72, 75, 78, 80, 82, 85, 88, 90, 92, 95, 98, 100]

# 사분위수 계산
Q1, Q2, Q3, IQR = calculate_quartiles(scores)

# 결과 출력
print("사분위수 계산 결과:")
print(f"제1사분위수 (Q1): {Q1}")
print(f"중앙값 (Q2): {Q2}")
print(f"제3사분위수 (Q3): {Q3}")
print(f"사분위 범위 (IQR): {IQR}")

In [None]:
import numpy as np

def calculate_iqr(data):
    """
    IQR과 이상치를 계산하는 함수
    :param data: 숫자형 리스트 또는 배열
    :return: Q1, Q3, IQR, 이상치 범위, 이상치 리스트
    """
    # 1. 데이터 정렬
    sorted_data = np.sort(data)

    # 2. 사분위수 계산
    Q1 = np.percentile(sorted_data, 25)  # 제1사분위수 (Q1)
    Q3 = np.percentile(sorted_data, 75)  # 제3사분위수 (Q3)
    
    # 3. IQR 계산
    IQR = Q3 - Q1
    
    # 4. 이상치 범위 계산
    lower_bound = Q1 - 1.5 * IQR
    upper_bound = Q3 + 1.5 * IQR
    
    # 5. 이상치 탐지
    outliers = [x for x in sorted_data if x < lower_bound or x > upper_bound]

    return Q1, Q3, IQR, (lower_bound, upper_bound), outliers

# 테스트 데이터
scores = [52, 55, 58, 60, 63, 65, 68, 70, 72, 145]

# IQR과 이상치 계산
Q1, Q3, IQR, outlier_range, outliers = calculate_iqr(scores)

# 결과 출력
print("IQR 계산 및 이상치 탐지 결과:")
print(f"제1사분위수 (Q1): {Q1}")
print(f"제3사분위수 (Q3): {Q3}")
print(f"사분위 범위 (IQR): {IQR}")
print(f"이상치 범위: {outlier_range}")
print(f"이상치: {outliers}" if outliers else "이상치 없음")

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# 데이터 정의
scores = [52, 55, 58, 60, 63, 65, 68, 70, 72, 75, 78, 80, 82, 85, 88, 90, 92, 95, 98, 100]

# 상자그림(Box Plot) 그리기
plt.figure(figsize=(6, 4))
plt.boxplot(scores, vert=False, patch_artist=True, 
            boxprops=dict(facecolor='lightblue', color='blue'), 
            medianprops=dict(color='red', linewidth=2))

# 제목과 축 설정
plt.title("(Box Plot) - score")
plt.xlabel("Score")
plt.grid(axis='x', linestyle='--', alpha=0.7)

# 그래프 출력
plt.show()


In [None]:
import numpy as np

def calculate_cv(data):
    """
    변동계수(CV)를 계산하는 함수
    :param data: 숫자형 리스트 또는 배열
    :return: 평균, 표준편차, 변동계수
    """
    # 평균 계산
    mean = np.mean(data)
    # 표준편차 계산
    std_dev = np.std(data)
    # 변동계수 계산
    cv = (std_dev / mean) * 100
    return mean, std_dev, cv

# 테스트 데이터 1: 학생 성적 (변동이 적음)
scores = [80, 82, 79, 81, 83]

# 테스트 데이터 2: 주식 수익률 (변동이 큼)
returns = [5, -3, 10, 8, -2]

# 변동계수 계산 및 출력
print("변동계수 계산 결과")

# 학생 성적 변동계수
mean1, std_dev1, cv1 = calculate_cv(scores)
print(f"\n학생 성적: {scores}")
print(f"평균: {mean1:.2f}, 표준편차: {std_dev1:.2f}, 변동계수: {cv1:.2f}%")

# 주식 수익률 변동계수
mean2, std_dev2, cv2 = calculate_cv(returns)
print(f"\n주식 수익률: {returns}")
print(f"평균: {mean2:.2f}, 표준편차: {std_dev2:.2f}, 변동계수: {cv2:.2f}%")
