In [1]:
# import  : data_covid19.csv, region.csv 을 각각 data, region이라는 이름의 데이터프레임 형태로 불러오기
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
data = pd.read_csv('data_covid19.csv')
region = pd.read_csv('region.csv')
def F1(data1, data2):
    # blank 열 삭제 
    data1.drop(columns='blank', inplace=True)
    # 변수 이름 변경 
    data1.rename(columns={
        'districtData/0/district': 'district',
        'districtData/0/confirmed': 'confirmed',
        'districtData/0/deceased': 'deceased',
        'districtData/0/recovered': 'recovered',
    }, inplace=True)
    
    # 'active' 변수 생성 (열의 형태로)
    data1['active'] = data1['confirmed'] - data1['recovered'] - data1['deceased']
    
    # 변수 정렬
    data1 = data1[['district', 'active', 'confirmed', 'recovered', 'deceased']]
    
    # data2와의 병합
    # on='district'로 이 열이 같은 행끼리 결합 
    # how='left'로 타입 기준은 왼쪽=data1
    merged_data = pd.merge(data1, data2, on='district', how='left')
    
    # 최종 데이터 추출
    final_data = merged_data.head(31)
    
    # 시각화. 3행 1열. 
    fig, axes = plt.subplots(3,1, figsize=(20, 25))
    
    # Boxplot
    
    axes[0].boxplot([final_data['active'], final_data['confirmed'], final_data['recovered'], final_data['deceased']],
                    sym='b*')
    # 티커 라벨 설정
    axes[0].set_xticklabels(["Active", "Confirmed", "Recovered", "Deceased"])
    axes[0].set_ylabel("No. of Cases", fontsize=13)
    axes[0].set_title("Boxplot of COVID-19 status", fontsize=15)
    
    # Barplot
    # 개별 district의 각 변수 열들 표현 
    axes[1].bar(final_data['district'], final_data['confirmed'], color='blue', alpha=0.5, label='Confirmed',)
    axes[1].bar(final_data['district'], final_data['recovered'], color='green', label='Recovered',)
    axes[1].bar(final_data['district'], final_data['deceased'], color='red', label='Deceased')
    axes[1].set_ylabel("No. of Cases", fontsize=13)
    # 90도로 돌려서 x축의 눈금값을 각 이름으로 표현 
    axes[1].set_xticks(np.arange(len(final_data['district'])))
    axes[1].set_xticklabels(final_data['district'], rotation=90)
    # 범례 이름 
    axes[1].legend(title='Status')
    axes[1].set_title("COVID-19 status by region", fontsize=15)
    
    # Scatter plot
    
    for name, group in final_data.groupby('group'):
        axes[2].scatter(group['confirmed'], group['recovered'], s=100*group['deceased']+50, alpha=0.6, label=name)
    axes[2].set_xlabel("Confirmed", fontsize=13)
    axes[2].set_ylabel("Recovered", fontsize=13)
    axes[2].set_title("Scatter Plot", fontsize=15)
    # 범례 이름 
    axes[2].legend(title="Region", ncol=2)
    
    # 그림 저장
    plt.tight_layout()
    plt.savefig("F1_2023122004.png")
    
    return final_data

def F2(num):
    # 그림 크기 설정
    plt.figure(figsize=(8, 8))

    # num 리스트의 각 요소에 대해 반복
    # i번째의 인덱스, 그리고 요소 n
    for i, n in enumerate(num):
        # 표본 평균을 저장할 리스트
        sample_means = []

        # 500번의 반복으로 표본 평균 계산
        for k in range(500):
            # n 만큼의 난수 추출 
            samples = np.random.uniform(0, 1, n)
            # 표본평균 
            sample_mean = np.mean(samples)
            # 리스트에 더해주기. 이 과정들을 500회 반복 
            sample_means.append(sample_mean)

        # Subplot 설정
        axes = plt.subplot(2, 2, i+1)
        # 히스토그램 
        axes.hist(sample_means, bins=20, alpha=0.5)
        # 제목 설정 
        axes.set_title(f'n={n}')

    # 전체 layout 조정
    plt.tight_layout()
    plt.show()

In [None]:
import numpy as np
import matplotlib.pyplot as plt

def F2(num):
    # 그림 크기 설정
    plt.figure(figsize=(8, 8))

    # num 리스트의 각 요소에 대해 반복
    # i번째의 인덱스, 그리고 요소 n
    for i, n in enumerate(num):
        # 표본 평균을 저장할 리스트
        sample_means = []

        # 500번의 반복으로 표본 평균 계산
        for k in range(500):
            # n 만큼의 난수 추출 
            samples = np.random.uniform(0, 1, n)
            # 표본평균 
            sample_mean = np.mean(samples)
            # 리스트에 더해주기. 이 과정들을 500회 반복 
            sample_means.append(sample_mean)

        # Subplot 설정
        axes = plt.subplot(2, 2, i+1)
        # 히스토그램 
        axes.hist(sample_means, bins=20, alpha=0.5)
        # 제목 설정 
        axes.set_title(f'n={n}')

    # 전체 layout 조정
    plt.tight_layout()
    plt.show()