In [1]:
# 라이브러리 불러오기
import numpy as np
import pandas as pd
import random

# 랜덤 시드 설정
np.random.seed(21)

# 표준정규분포를 띈 100개 무작위 배열 만들기
N=100
mu, sigma=0, 1
array_normal = np.random.normal(mu, sigma, N)

# array_normal 모습
print(array_normal)

[-0.05196425 -0.11119605  1.0417968  -1.25673929  0.74538768 -1.71105376
 -0.20586438 -0.23457129  1.12814404 -0.01262595 -0.61320029  1.3736885
  1.61099198 -0.68922827  0.69192371 -0.4481156   0.16234247  0.25722913
 -1.27545586  0.06400443 -1.06185662 -0.98936839 -0.45772323 -1.98418161
 -1.47644212  0.23180296  0.64415927  0.8521227  -0.46401872  0.6971766
  1.56788218  1.17855621 -1.38395687 -1.7473338   0.40272379  1.2444828
 -0.02383635  0.95256771  0.24496394  0.22409714  0.2966812   0.22075339
 -0.42330083  1.84561511  0.92011457 -0.55791623 -0.28522504 -1.04126664
  0.48036943 -1.4273776  -0.33326642  0.74730849  0.56022963  0.57370894
 -1.18088052  0.76465008 -0.13438498  1.32463768 -0.27642765  1.67955097
  0.41516187  0.7476816  -0.39253041 -0.40632407 -0.38584597  1.00090218
 -0.44768243 -0.11608402  1.16901462  0.51561395 -0.25786723  0.28504581
 -1.40459035 -1.50908235  0.43430789  2.7550033   2.01079281  2.51989837
  0.57043758 -0.52651551  1.06822315 -1.19454337 -2.85

In [2]:
# array_normal을 데이터프레임으로 변환
df_normal = pd.DataFrame(array_normal).rename(columns={0:'정규분포'})

# 도수 분포표
df_freq_table = df_normal.apply(lambda x: pd.cut(x, bins=[-3, -2, -1, 0, 1, 2, 3]).value_counts()).add_prefix('도수_')
df_freq_table

Unnamed: 0,도수_정규분포
"(0, 1]",33
"(-1, 0]",29
"(-2, -1]",17
"(1, 2]",16
"(2, 3]",4
"(-3, -2]",1


In [3]:
!pip3 install plotly

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [4]:
# 그래프에 필요한 라이브러리 불러오기
import plotly.express as px
import plotly.graph_objects as go

# 구간(bin) 만들기
bins = [-3, -2, -1, 0, 1, 2, 3]
counts, bins = np.histogram(df_normal["정규분포"], bins=bins)

print('구간:', bins)
print('구간별 빈도', counts)

# plotly를 사용한 그래프 그리기
fig = go.Figure(go.Bar(x=bins, y=counts))

# 그래프에 빈도 수치 입력
fig.data[0].text = counts
fig.update_traces(textposition='outside', # 구간별 빈도 수 표시
                  textfont_size=12, # 글자 크기 설정
                  marker_color='blue', # 막대그래프 색
                  marker_line_color='white', # 막대그래프 테두리 색
                  marker_line_width=2, # 막대그래프 테두리 두께
                  opacity=0.7) # 투명도 설정

fig.update_layout(title_text="막대그래프", # 제목 설정
                  title_font_size=15, # 제목 글자 크기 설정
                  bargap=0) # 막대그래프끼리 공간(gap) 설정

fig.update_xaxes(title_text='표준정규분포 값') # X축 이름 설정
fig.update_yaxes(title_text='빈도 (counts)') # Y축 이름 설정

fig.show()

구간: [-3 -2 -1  0  1  2  3]
구간별 빈도 [ 1 17 29 33 16  4]


In [5]:
import plotly.figure_factory as ff

# 히스토그램과 밀도 그래프 함께 그리기
fig = ff.create_distplot([array_normal], 
                         ['표본정규분포'], # 이름 설정
                         show_rug=False) # 러그 지우기 (True인 경우 데이터 위치 표시)

fig.update_traces(marker_color='blue',
                  marker_line_color='white',
                  marker_line_width=2,
                  opacity=0.7)

fig.update_layout(title_text="히스토그램 & 밀도(density) 그래프",
                  title_font_size=15)

fig.update_xaxes(title_text='표준정규분포 값')
fig.update_yaxes(title_text='밀도 (density)')

fig.show()

In [6]:
# 랜덤 시드 설정
np.random.seed(21)

# 평균과 분산이 다른 정규분포 두 개 생성
N=100
mu1, sigma1=0, 1
mu2, sigma2=10, 3
array_normal_1 = np.random.normal(mu1, sigma1, N)
array_normal_2 = np.random.normal(mu2, sigma2, N)

# 그래프 그리기
fig = ff.create_distplot([array_normal_1, array_normal_2],
                         ['정규분포(0,1)', '정규분포(10,3)'],
                         show_rug=False)

fig.update_layout(title_text="평균&분산 값이 다른 두 개의 정규분포",
                  title_font_size=15)

fig.show()