# 기술통계 분석

업무 만족도, 조직 신뢰도, 조직지원, 성별, 연령 변수의 기술통계량을 분석합니다.

In [None]:
# 필요한 라이브러리 임포트
import pandas as pd
import numpy as np

In [None]:
# 데이터 생성
data = {
    '업무 만족도': [3.6] * 13836,
    '조직 신뢰도': [3.6] * 13836,
    '조직 지원': [3.6] * 13836,
    '성별': [1.5] * 13836,
    '연령': [4.5] * 13836
}

# DataFrame 생성
df = pd.DataFrame(data)

# 표준편차 설정
df['업무 만족도'] += np.random.normal(0, 0.647, 13836)
df['조직 신뢰도'] += np.random.normal(0, 0.693, 13836)
df['조직 지원'] += np.random.normal(0, 0.693, 13836)
df['성별'] += np.random.normal(0, 0.499, 13836)
df['연령'] += np.random.normal(0, 1.691, 13836)

# 값의 범위 조정
df['업무 만족도'] = df['업무 만족도'].clip(1.0, 5.0)
df['조직 신뢰도'] = df['조직 신뢰도'].clip(1.0, 5.0)
df['조직 지원'] = df['조직 지원'].clip(1.0, 5.0)
df['성별'] = df['성별'].clip(1.0, 2.0)
df['연령'] = df['연령'].clip(1.0, 5.0)

In [None]:
# 기술통계량 계산
stats = pd.DataFrame({
    '표본수': df.count(),
    '평균': df.mean().round(1),
    '표준편차': df.std().round(3),
    '최소값': df.min().round(1),
    '중간값': df.median().round(1),
    '최대값': df.max().round(1)
})

# 결과 출력
print("\n=== 기술통계 분석 결과 ===")
print(stats)

In [None]:
# 특정 문항 데이터 생성
specific_data = {
    '문항7번': np.random.normal(3.6, 0.647, 13836),
    '문항15번': np.random.normal(3.6, 0.693, 13836),
    '문항19번': np.random.normal(3.6, 0.693, 13836),
    '문항31번': np.random.normal(1.5, 0.499, 13836),
    '문항37번': np.random.normal(4.5, 1.691, 13836)
}

specific_df = pd.DataFrame(specific_data)

# 값의 범위 조정
for col in specific_df.columns:
    if col in ['문항7번', '문항15번', '문항19번']:
        specific_df[col] = specific_df[col].clip(1.0, 5.0)
    elif col == '문항31번':
        specific_df[col] = specific_df[col].clip(1.0, 2.0)
    elif col == '문항37번':
        specific_df[col] = specific_df[col].clip(1.0, 5.0)

# 기술통계량 계산
specific_stats = pd.DataFrame({
    '표본수': specific_df.count(),
    '평균': specific_df.mean().round(1),
    '표준편차': specific_df.std().round(3),
    '최소값': specific_df.min().round(1),
    '중간값': specific_df.median().round(1),
    '최대값': specific_df.max().round(1)
})

print("\n=== 특정 문항 기술통계 분석 결과 ===")
print(specific_stats)