### 느낀점
데이터 처리는 예상보다 더 많은 과정과 주의가 필요하다는 것을 깨달았습니다. 또한, 데이터를 다양한 방법으로 시각화할 수 있는 점은 흥미로웠지만, 사용해야 할 라이브러리와 함수의 매개변수가 다양하고 복잡하다는 점이 여렵다고 느꼈습니다. 적재적소에 맞게 적절한 기법을 사용하기 위해서는 더 많은 실습과 경험이 필요할 것 이라고 생각합니다. 하지만 이러한 과정을 통해 데이터를 이해하고 분석하는 능력을 키울 수 있다는 것에서는 좋았습니다.

### **1. 실행할 셀이 많기때문에 리미트 재설정 필요**

!jupyter notebook --ServerApp.iopub_data_rate_limit=10000000

### **1. 맵플립 활용**

In [None]:
import platform
from matplotlib import font_manager, rc 
import matplotlib

# '-' 부호가 제대로 표시되게 하는 설정 
matplotlib.rcParams['axes.unicode_minus'] = False

# 운영 체제마다 한글이 보이게 하는 설정 
# 윈도우즈
if platform.system() == 'Windows':
    path = "c:\\Windows\\Fonts\\malgun.ttf"  # 윈도우즈에서 한글 폰트 경로
    print("윈도우즈에 한글 적용함")
    font_name = font_manager.FontProperties(fname=path).get_name() 
    rc('font', family=font_name)  # 한글 폰트 설정
elif platform.system() == 'Darwin':  # 맥
    rc('font', family='AppleGothic')  # 맥에서 한글 폰트 설정
elif platform.system() == 'Linux':  # 리눅스
    rc('font', family='NanumBarunGothic')  # 리눅스에서 한글 폰트 설정


In [None]:
import matplotlib.pyplot as plt  # 맷플롯립의 pyplot 모듈을 임포트합니다
import pandas as pd  # 판다스를 임포트합니다
import numpy as np  # 넘파이를 임포트합니다
import csv  # CSV 파일을 처리하기 위한 모듈을 임포트합니다

### **기온.csv 데이터 활용** ###

In [None]:
# '기온.csv' 파일을 읽어서 그대로 출력합니다
f = open('reference files/csv/기온.csv', 'r', encoding='cp949')  # 파일을 엽니다
data = csv.reader(f, delimiter=',')  # CSV 데이터를 읽는 객체를 생성합니다
for row in data:
    print(row)  # 각 행을 출력합니다
f.close()  # 파일을 닫습니다

In [None]:
f = open('reference files/csv/기온.csv')  # 파일을 엽니다
data = csv.reader(f)  # CSV 데이터를 읽는 객체를 생성합니다
header = next(data)  # 헤더를 가져옵니다
print(header)  # 헤더를 출력합니다
f.close()  # 파일을 닫습니다

In [None]:
f = open('reference files/csv/기온.csv')  # 파일을 엽니다
data = csv.reader(f)  # CSV 데이터를 읽는 객체를 생성합니다
header = next(data)  # 헤더를 가져옵니다
for row in data:
    print(row)  # 각 행을 출력합니다
f.close()  # 파일을 닫습니다

In [None]:
df = pd.read_csv('reference files/csv/기온.csv', encoding='cp949')  # CSV 파일을 읽어 데이터프레임으로 저장합니다
df.head(3)  # 데이터프레임의 처음 3개 행을 출력합니다

In [None]:
df.head()  # 데이터프레임의 처음 5개 행을 출력합니다

In [None]:
df.tail()  # 데이터프레임의 마지막 5개 행을 출력합니다

In [None]:
df.describe()  # 데이터프레임의 요약 통계 정보를 출력합니다

In [None]:
df.info()  # 데이터프레임의 각 열에 대한 정보를 출력합니다

In [None]:
df2 = df.ffill()  # 누락된 값을 앞 방향으로 채웁니다.
df2.info()  # 데이터프레임의 각 열에 대한 정보를 출력합니다

In [None]:
# 열 이름을 변경합니다
df2.rename(columns={'최저기온(°C)': 'min_temp'}, inplace=True)
df2.rename(columns={'평균기온(°C)': 'avg_temp'}, inplace=True)
df2.rename(columns={'최고기온(°C)': 'max_temp'}, inplace=True)
df2.head(3)  # 변경된 열 이름을 가진 데이터프레임의 처음 3개 행을 출력합니다

In [None]:
plt.title('서울시 2022년도 기온 변화')  # 그래프 제목 설정
plt.plot(range(1, len(df2) + 1), df2['max_temp'], label='최고기온', c='r')  # 최고기온 그래프
plt.plot(range(1, len(df2) + 1), df2['avg_temp'], label='평균기온', c='y')  # 평균기온 그래프
plt.plot(range(1, len(df2) + 1), df2['min_temp'], label='최저기온', c='b')  # 최저기온 그래프
plt.xlabel('일')  # x축 레이블 설정
plt.ylabel('기온')  # y축 레이블 설정
plt.legend()  # 범례 표시
plt.show()  # 그래프 출력

In [None]:
df2['일시'] = pd.to_datetime(df2['일시'], format='%Y-%m-%d')  # '일시' 열을 날짜 형식으로 변환합니다
df2['일시']  # 변환된 '일시' 열을 출력합니다

In [None]:
df3 = df2.set_index('일시')  # '일시' 열을 새로운 인덱스로 설정합니다
df3.head(3)  # 변경된 데이터프레임의 처음 3개 행을 출력합니다

In [None]:
df_Mar = df3[pd.DatetimeIndex(df3.index).month == 3]  # 3월 데이터만 추출합니다

In [None]:
plt.title('서울시 2022년도 3월 기온 변화')  # 그래프 제목 설정
plt.plot(range(1, 32), df_Mar['max_temp'], label='최고기온', c='r')  # 최고기온 그래프
plt.plot(range(1, 32), df_Mar['avg_temp'], label='평균기온', c='y')  # 평균기온 그래프
plt.plot(range(1, 32), df_Mar['min_temp'], label='최저기온', c='b')  # 최저기온 그래프

plt.xlabel('3월')  # x축 레이블 설정
plt.ylabel('기온')  # y축 레이블 설정
plt.xlim(1, 31)  # x축 범위 설정
plt.ylim(-7, 22)  # y축 범위 설정
plt.legend()  # 범례 표시

plt.savefig('reference files/img/png/서울.png')  # 그래프를 이미지 파일로 저장합니다
plt.show()  # 그래프 출력

In [None]:
#plt.boxplot(df['지점'])

In [None]:
plt.figure(figsize=(3, 1), dpi=300)  # 그림의 크기와 해상도를 설정합니다
plt.boxplot(df2['min_temp'])  # 최저기온에 대한 상자그림을 그립니다

### **기온2.csv 데이터 활용** ###

In [None]:
f = open('reference files/csv/기온2.csv')  # 파일을 엽니다
data = csv.reader(f)  # CSV 데이터를 읽는 객체를 생성합니다
header = next(data)  # 헤더를 가져옵니다
for row in data:
    row[-1] = float(row[-1])  # 마지막 열의 값을 실수형(float)으로 변환합니다
    print(row)  # 각 행을 출력합니다
f.close()  # 파일을 닫습니다

In [None]:
max_temp = -999  # 최고 기온을 저장하는 변수 초기화
max_date = ''  # 최고 기온이 측정된 날짜를 저장하는 변수 초기화

f = open('reference files/csv/기온2.csv')  # 파일을 엽니다
data = csv.reader(f)  # CSV 데이터를 읽는 객체를 생성합니다
header = next(data)  # 헤더를 가져옵니다

for row in data:
    if row[-1] == '':
        row[-1] = -999  # 누락된 값이면 -999로 대체합니다
    row[-1] = float(row[-1])  # 마지막 열의 값을 실수형(float)으로 변환합니다
    if max_temp < row[-1]:
        max_date = row[0]  # 최고 기온이 측정된 날짜를 갱신합니다
        max_temp = row[-1]  # 최고 기온을 갱신합니다

f.close()  # 파일을 닫습니다

print('기상 관측 이래 서울의 최고 기온이 가장 높았던 날은', max_date + '로,', max_temp, '도 였습니다.')

In [None]:
f = open('reference files/csv/기온2.csv')  # 파일을 엽니다
data = csv.reader(f)  # CSV 데이터를 읽는 객체를 생성합니다
next(data)  # 헤더를 건너뜁니다
result = []  # 결과를 저장할 리스트를 초기화합니다

plt.figure(figsize=(5, 3), dpi=300)  # 그림의 크기와 해상도를 설정합니다

for row in data:
    if row[-2] != '':
        result.append(float(row[-2]))  # 누락된 값이 아니면 결과 리스트에 추가합니다

plt.hist(result, bins=100, color='r')  # 히스토그램을 그립니다
plt.show()  # 그래프를 출력합니다

In [None]:
f = open('reference files/csv/기온2.csv')  # 파일을 엽니다
data = csv.reader(f)  # CSV 데이터를 읽는 객체를 생성합니다
next(data)  # 헤더를 건너뜁니다
aug = []  # 8월 기온을 저장할 리스트를 초기화합니다

plt.figure(figsize=(5, 3), dpi=300)  # 그림의 크기와 해상도를 설정합니다

for row in data:
    month = row[0].split('-')[1]  # 날짜에서 월을 추출합니다
    if row[-1] != '':
        if month == '08':  # 8월인 경우에만
            aug.append(float(row[-1]))  # 8월 기온을 리스트에 추가합니다

plt.hist(aug, bins=100, color='r')  # 8월 기온에 대한 히스토그램을 그립니다
plt.show()  # 그래프를 출력합니다


In [None]:
f = open('reference files/csv/기온2.csv')  # 파일을 엽니다
data = csv.reader(f)  # CSV 데이터를 읽는 객체를 생성합니다
next(data)  # 헤더를 건너뜁니다
aug = []  # 8월 기온을 저장할 리스트를 초기화합니다
jan = []  # 1월 기온을 저장할 리스트를 초기화합니다

plt.figure(figsize=(5, 3), dpi=300)  # 그림의 크기와 해상도를 설정합니다

for row in data:
    month = row[0].split('-')[1]  # 날짜에서 월을 추출합니다
    if row[-1] != '':
        if month == '08':  # 8월인 경우에만
            aug.append(float(row[-1]))  # 8월 기온을 리스트에 추가합니다
        if month == '01':  # 1월인 경우에만
            jan.append(float(row[-1]))  # 1월 기온을 리스트에 추가합니다

plt.hist(aug, bins=100, color='r', label='Aug')  # 8월 기온에 대한 히스토그램을 그립니다
plt.hist(jan, bins=100, color='b', alpha=0.5, label='Jan')  # 1월 기온에 대한 히스토그램을 그립니다 (alpha값 설정으로 투명도 조절)
plt.legend()  # 범례 표시
plt.show()  # 그래프를 출력합니다

In [None]:
f = open('reference files/csv/기온2.csv')  # 파일을 엽니다
data = csv.reader(f)  # CSV 데이터를 읽는 객체를 생성합니다
next(data)  # 헤더를 건너뜁니다
result = []  # 결과를 저장할 리스트를 초기화합니다

plt.figure(figsize=(3, 1), dpi=300)  # 그림의 크기와 해상도를 설정합니다

for row in data:
    if row[-1] != '':
        result.append(float(row[-1]))  # 누락된 값이 아니면 결과 리스트에 추가합니다

plt.boxplot(result)  # 상자 그림을 그립니다
plt.show()  # 그래프를 출력합니다

In [None]:
f = open('reference files/csv/기온2.csv')  # 파일을 엽니다
data = csv.reader(f)  # CSV 데이터를 읽는 객체를 생성합니다
next(data)  # 헤더를 건너뜁니다
aug = []  # 8월 기온을 저장할 리스트를 초기화합니다
jan = []  # 1월 기온을 저장할 리스트를 초기화합니다

plt.figure(figsize=(10, 5), dpi=300)  # 그림의 크기와 해상도를 설정합니다

for row in data:
    month = row[0].split('-')[1]  # 날짜에서 월을 추출합니다
    if row[-1] != '':
        if month == '08':  # 8월인 경우에만
            aug.append(float(row[-1]))  # 8월 기온을 리스트에 추가합니다
        if month == '01':  # 1월인 경우에만
            jan.append(float(row[-1]))  # 1월 기온을 리스트에 추가합니다

plt.boxplot([aug, jan])  # 상자 그림을 그립니다
plt.show()  # 그래프를 출력합니다

In [None]:
plt.figure(figsize=(5, 3), dpi=300)  # 그림의 크기와 해상도를 설정합니다
plt.boxplot([aug, jan])  # 8월과 1월 기온에 대한 상자그림을 그립니다
plt.show()  # 그래프를 출력합니다

In [None]:
f = open('reference files/csv/기온2.csv')  # 파일을 엽니다
data = csv.reader(f)  # CSV 데이터를 읽는 객체를 생성합니다
next(data)  # 헤더를 건너뜁니다
day = []  # 각 일별 기온을 저장할 리스트를 초기화합니다

plt.figure(figsize=(5, 3), dpi=300)  # 그림의 크기와 해상도를 설정합니다

# 31일 동안의 리스트를 생성합니다
for i in range(31):
    day.append([])

# 데이터를 일별로 분류하여 리스트에 추가합니다
for row in data:
    if row[-1] != '':
        if row[0].split('-')[1] == '08':  # 8월인 경우에만
            day[int(row[0].split('-')[2]) - 1].append(float(row[-1]))  # 해당 일에 해당하는 리스트에 추가합니다

plt.boxplot(day, showfliers=False)  # 상자그림을 그립니다 (이상치는 표시하지 않습니다)
plt.show()  # 그래프를 출력합니다

In [None]:
f = open('reference files/csv/기온2.csv')  # 파일을 엽니다
data = csv.reader(f)  # CSV 데이터를 읽는 객체를 생성합니다
next(data)  # 헤더를 건너뜁니다

day = [[] for i in range(31)]  # 각 일별 기온을 저장할 리스트를 초기화합니다

plt.figure(figsize=(5, 3), dpi=300)  # 그림의 크기와 해상도를 설정합니다

# 데이터를 일별로 분류하여 리스트에 추가합니다
for row in data:
    if row[-1] != '':
        if row[0].split('-')[1] == '08':  # 8월인 경우에만
            day[int(row[0].split('-')[2]) - 1].append(float(row[-1]))  # 해당 일에 해당하는 리스트에 추가합니다

plt.style.use('ggplot')  # ggplot 스타일을 사용합니다
plt.figure(figsize=(10, 5), dpi=300)  # 그림의 크기와 해상도를 설정합니다
plt.boxplot(day, showfliers=False)  # 상자그림을 그립니다 (이상치는 표시하지 않습니다)
plt.show()  # 그래프를 출력합니다

In [None]:
f = open('reference files/csv/기온2.csv')  # 파일을 엽니다
data = csv.reader(f)  # CSV 데이터를 읽는 객체를 생성합니다
next(data)  # 헤더를 건너뜁니다

high = []  # 최고 기온을 저장할 리스트를 초기화합니다
low = []  # 최저 기온을 저장할 리스트를 초기화합니다

plt.figure(figsize=(5, 3), dpi=300)  # 그림의 크기와 해상도를 설정합니다

# 데이터를 순회하면서 1983년 이후 2월 14일의 최고 기온과 최저 기온을 추출합니다
for row in data:
    if row[-1] != '' and row[-2] != '':
        if 1983 <= int(row[0].split('-')[0]):
            if row[0].split('-')[1] == '02' and row[0].split('-')[2] == '14':
                high.append(float(row[-1]))  # 최고 기온을 리스트에 추가합니다
                low.append(float(row[-2]))  # 최저 기온을 리스트에 추가합니다

plt.plot(high, 'hotpink')  # 최고 기온을 hotpink 색으로 그립니다
plt.plot(low, 'skyblue')  # 최저 기온을 skyblue 색으로 그립니다
plt.show()  # 그래프를 출력합니다

In [None]:
f = open('reference files/csv/기온2.csv')  # 파일을 엽니다
data = csv.reader(f)  # CSV 데이터를 읽는 객체를 생성합니다
next(data)  # 헤더를 건너뜁니다

high = []  # 최고 기온을 저장할 리스트를 초기화합니다
low = []  # 최저 기온을 저장할 리스트를 초기화합니다

plt.figure(figsize=(5, 3), dpi=300)  # 그림의 크기와 해상도를 설정합니다

# 데이터를 순회하면서 5월 4일의 최고 기온과 최저 기온을 추출합니다
for row in data:
    if row[-1] != '' and row[-2] != '':
        if row[0].split('-')[1] == '05' and row[0].split('-')[2] == '04':
            high.append(float(row[-1]))  # 최고 기온을 리스트에 추가합니다
            low.append(float(row[-2]))  # 최저 기온을 리스트에 추가합니다

plt.title('내 생일의 기온 변화 그래프')  # 그래프 제목을 설정합니다
plt.plot(high, 'hotpink', label='high')  # 최고 기온을 hotpink 색으로 그립니다
plt.plot(low, 'skyblue', label='low')  # 최저 기온을 skyblue 색으로 그립니다
plt.legend()  # 범례를 표시합니다
plt.show()  # 그래프를 출력합니다

### **Lab 문제 - 대전 기온**

In [None]:
import pandas as pd  # Pandas 라이브러리를 pd라는 별명으로 가져옵니다.

# '대전기온.csv' 파일을 읽어들여서 데이터프레임으로 저장합니다. 파일의 인코딩은 'cp949'로 설정합니다.
df = pd.read_csv('reference files/csv/대전기온.csv', encoding='cp949')

# 데이터프레임의 간단한 정보(행과 열의 개수, 각 열의 데이터 타입 등)를 출력합니다.
df.info()

In [None]:
# 결측치를 바로 이전의 값으로 채워넣은 새로운 데이터프레임을 생성합니다.
df2 = df.ffill()

# 열 이름을 변경합니다. '최저기온(°C)' 열을 'min_temp'로 변경합니다.
df2.rename(columns={'최저기온(°C)':'min_temp'}, inplace=True)

# 열 이름을 변경합니다. '평균기온(°C)' 열을 'avg_temp'로 변경합니다.
df2.rename(columns={'평균기온(°C)':'avg_temp'}, inplace=True)

# 열 이름을 변경합니다. '최고기온(°C)' 열을 'max_temp'로 변경합니다.
df2.rename(columns={'최고기온(°C)':'max_temp'}, inplace=True)

In [None]:
# 그림의 크기와 해상도를 설정합니다.
plt.figure(figsize=(5, 3), dpi=600)

# 그래프의 제목을 설정합니다.
plt.title('대전광역시 2003년 12월 기온 변화')

# 최고기온, 평균기온, 최저기온을 각각 그래프로 그립니다.
plt.plot(range(1, len(df) + 1), df2['max_temp'], label='최고기온', c='r')
plt.plot(range(1, len(df) + 1), df2['avg_temp'], label='평균기온', c='y')
plt.plot(range(1, len(df) + 1), df2['min_temp'], label='최저기온', c='b')

# x축과 y축의 라벨을 설정합니다.
plt.xlabel('일')
plt.ylabel('기온')

# 범례를 추가합니다.
plt.legend()

# 그래프를 이미지 파일로 저장합니다.
plt.savefig('reference files/img/png/대전기온.png')

# 그래프를 화면에 출력합니다.
plt.show()

### **age.csv 데이터 활용** ###

In [None]:
# 'age.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/age.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)
 
# 데이터를 한 줄씩 읽어와서 출력합니다.
for row in data:
    print(row)

# 파일을 닫습니다.
f.close()

In [None]:
# '서울특별시 구로구 신도림동(1153051000)' 문자열 안에 '신도림'이 포함되어 있는지 확인합니다.
print('신도림' in '서울특별시 구로구 신도림동(1153051000)')

# '서울특별시 구로구 신도림동(1153051000)' 문자열 안에 '1153'이 포함되어 있는지 확인합니다.
print('1153' in '서울특별시 구로구 신도림동(1153051000)')

# '서울특별시 구로구 신도림동(1153051000)' 문자열 안에 '()'가 포함되어 있는지 확인합니다.
print('()' in '서울특별시 구로구 신도림동(1153051000)')

In [None]:
# 'age.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/age.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

# 데이터를 한 줄씩 읽어오면서 첫 번째 열에 '신도림'이 포함된 행을 출력합니다.
for row in data:
    if '신도림' in row[0]:  # 첫 번째 열에 '신도림'이 포함되어 있는지 확인합니다.
        print(row)

# 파일을 닫습니다.
f.close()

In [None]:
# 'age.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/age.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

# 데이터를 한 줄씩 읽어오면서
for row in data:
    if '신도림' in row[0]:  # 첫 번째 열에 '신도림'이 포함되어 있는지 확인합니다.
        # 해당 행의 네 번째 열부터 끝까지의 데이터를 출력합니다.
        for i in row[3:]:
            print(i, "\t", end='')  # 각 열을 탭으로 구분하여 출력합니다.

# 파일을 닫습니다.
f.close()

In [None]:
# 'age.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/age.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

result = []  # 결과를 저장할 빈 리스트를 생성합니다.

# 데이터를 한 줄씩 읽어오면서
for row in data:
    if '신도림' in row[0]:  # 첫 번째 열에 '신도림'이 포함되어 있는지 확인합니다.
        # 해당 행의 네 번째 열부터 끝까지의 데이터를 정수로 변환하여 리스트에 추가합니다.
        for i in row[3:]:
            result.append(int(i))

# 결과 리스트를 출력합니다.
print(result)

# 파일을 닫습니다.
f.close()

In [None]:
# 스타일을 'ggplot'으로 설정합니다.
plt.style.use('ggplot')

# 그래프의 크기를 4인치 x 2인치로 설정하고, 해상도를 300dpi로 설정합니다.
plt.figure(figsize = (4,2), dpi=300)

# result 데이터를 선 그래프로 그립니다.
plt.plot(result)

# 그래프를 화면에 출력합니다.
plt.show()

In [None]:
# 'reference files/csv/age.csv' 파일을 열어서 f에 저장합니다.
f = open('reference files/csv/age.csv')

# csv 파일 reader 객체를 생성합니다.
data = csv.reader(f)

# 결과를 저장할 빈 리스트를 생성합니다.
result = []

# 사용자에게 인구 구조를 알고 싶은 지역의 이름(읍면동 단위)을 입력받습니다.
name = "제기동"

# name = input('인구 구조가 알고 싶은 지역의 이름(읍면동 단위)을 입력해주세요 : ')

# csv 파일의 각 행에 대해 반복문을 실행합니다.
for row in data:
   # 만약 사용자가 입력한 지역 이름이 행의 첫 번째 열(지역명)에 포함되어 있다면
   if name in row[0]:
       # 해당 행의 4번째 열부터 끝까지의 값들을 정수형으로 변환하여 result 리스트에 추가합니다.
       for i in row[3:]:
           result.append(int(i))

# matplotlib의 스타일을 'ggplot'으로 설정합니다.
plt.style.use('ggplot')

# 그래프의 크기를 4인치 x 2인치로 설정하고, 해상도를 300dpi로 설정합니다.
plt.figure(figsize=(4, 2), dpi=300)

# 그래프 제목을 "{지역명} 지역의 인구 구조"로 설정합니다.
plt.title(name + ' 지역의 인구 구조')

# result 리스트의 값들을 선 그래프로 그립니다.
plt.plot(result)

# 그래프를 화면에 출력합니다.
plt.show()

In [None]:
# 'reference files/csv/age.csv' 파일을 열어서 f에 저장합니다.
f = open('reference files/csv/age.csv')

# csv 파일 reader 객체를 생성합니다.
data = csv.reader(f)

# 결과를 저장할 빈 리스트를 생성합니다.
result = []

# csv 파일의 각 행에 대해 반복문을 실행합니다.
for row in data:
   # 만약 '신도림'이 행의 첫 번째 열(지역명)에 포함되어 있다면
   if '신도림' in row[0]:
       # 해당 행의 4번째 열부터 끝까지의 값들을 정수형으로 변환하여 result 리스트에 추가합니다.
       for i in row[3:]:
           result.append(int(i))

# 그래프의 크기를 4인치 x 2인치로 설정하고, 해상도를 300dpi로 설정합니다.
plt.figure(figsize=(4, 2), dpi=300)

# 범위 0부터 100까지의 값을 x축으로 하고, result 리스트의 값들을 y축으로 하여 막대 그래프를 그립니다.
plt.bar(range(101), result)

# 그래프를 화면에 출력합니다.
plt.show()

In [None]:
# 'reference files/csv/age.csv' 파일을 열어서 f에 저장합니다.
f = open('reference files/csv/age.csv')

# csv 파일 reader 객체를 생성합니다.
data = csv.reader(f)

# 결과를 저장할 빈 리스트를 생성합니다.
result = []

# csv 파일의 각 행에 대해 반복문을 실행합니다.
for row in data:
   # 만약 '신도림'이 행의 첫 번째 열(지역명)에 포함되어 있다면
   if '신도림' in row[0]:
       # 해당 행의 4번째 열부터 끝까지의 값들을 정수형으로 변환하여 result 리스트에 추가합니다.
       for i in row[3:]:
           result.append(int(i))

# 그래프의 크기를 4인치 x 2인치로 설정하고, 해상도를 300dpi로 설정합니다.
plt.figure(figsize=(4, 2), dpi=300)

# 범위 0부터 100까지의 값을 y축으로 하고, result 리스트의 값들을 x축으로 하여 가로 막대 그래프를 그립니다.
plt.barh(range(101), result)

# 그래프를 화면에 출력합니다.
plt.show()

In [None]:
# 'reference files/csv/age2.csv' 파일을 cp949 인코딩으로 읽어와서 DataFrame으로 저장합니다.
# 첫 번째 열을 인덱스로 지정합니다.
df = pd.read_csv('reference files/csv/age2.csv', encoding='cp949', index_col=0)

# DataFrame의 처음 5개 행을 출력합니다.
df.head()

In [None]:
# 사용자에게 원하는 지역 이름을 입력받습니다.
name = "제기동"
#name = input('원하는 지역의 이름을 입력해주세요 : ')

# DataFrame의 인덱스(지역명)에서 입력받은 지역 이름이 포함된 행을 찾습니다.
a = df.index.str.contains(name)

# 찾은 행들만 새로운 DataFrame df2에 저장합니다.
df2 = df[a]

# df2를 출력합니다.
df2

In [None]:
# 'reference files/csv/age2.csv' 파일을 cp949 인코딩으로 읽어와서 DataFrame으로 저장합니다.
# 첫 번째 열을 인덱스로 지정합니다.
df = pd.read_csv('reference files/csv/age2.csv', encoding='cp949', index_col=0)

# 각 행의 모든 값을 '총인구수' 열의 값으로 나누어 비율로 변환합니다.
df = df.div(df['총인구수'], axis=0)

# '총인구수'와 '연령구간인구수' 열을 DataFrame에서 삭제합니다.
del df['총인구수'], df['연령구간인구수']

In [None]:
# df2 DataFrame을 전치(Transpose)하고 plot() 메서드를 사용하여 그래프를 그립니다.
df2.T.plot()

# 그래프의 크기를 2인치 x 1인치로 설정하고, 해상도를 300dpi로 설정합니다.
plt.figure(figsize=(2, 1), dpi=300)

# 그래프를 화면에 출력합니다.
plt.show()

In [None]:
# 'reference files/csv/age2.csv' 파일을 cp949 인코딩으로 읽어와서 DataFrame으로 저장합니다.
# 첫 번째 열을 인덱스로 지정합니다.
df = pd.read_csv('reference files/csv/age2.csv', encoding='cp949', index_col=0)

# ①-1. 각 행의 모든 값을 '총인구수' 열의 값으로 나누어 비율로 변환합니다.
df = df.div(df['총인구수'], axis=0)

# ①-2. '총인구수'와 '연령구간인구수' 열을 DataFrame에서 삭제합니다.
del df['총인구수'], df['연령구간인구수']

# ② 사용자에게 원하는 지역 이름을 입력받습니다.
name = input('원하는 지역의 이름을 입력해주세요 : ')

# ③ DataFrame의 인덱스(지역명)에서 입력받은 지역 이름이 포함된 행을 찾습니다.
a = df.index.str.contains(name)

# 찾은 행들만 새로운 DataFrame df2에 저장합니다.
df2 = df[a]

# 그래프의 크기를 4인치 x 2인치로 설정하고, 해상도를 300dpi로 설정합니다.
plt.figure(figsize=(4, 2), dpi=300)

# 입력받은 지역의 인구 구조와 가장 유사한 상위 5개 지역의 인구 구조를 그래프로 그립니다.
df.loc[np.power(df.sub(df2.iloc[0], axis=1), 2).sum(axis=1).sort_values().index[:5]].T.plot()

# 그래프를 화면에 출력합니다.
plt.show()

### **gender.csv 데이터 활용** ###

In [None]:
# 'reference files/csv/gender.csv' 파일을 엽니다.
f = open('reference files/csv/gender.csv')

# csv 파일 reader 객체를 생성합니다.
data = csv.reader(f)

# 남성 인구수를 저장할 빈 리스트를 생성합니다.
m = []

# 여성 인구수를 저장할 빈 리스트를 생성합니다.
f = []

# csv 파일의 각 행에 대해 반복문을 실행합니다.
for row in data:
   # 만약 '신도림'이 행의 첫 번째 열(지역명)에 포함되어 있다면
   if '신도림' in row[0]:
       # 0세부터 100세까지 반복하면서
       for i in range(0, 101):
           # 남성 인구수를 m 리스트에 추가합니다.
           m.append(int(row[i + 3]))
           # 여성 인구수를 f 리스트에 추가합니다.
           f.append(int(row[-(i + 1)]))

# f 리스트를 반전시킵니다. (나이 순서를 0세부터 100세로 맞춥니다.)
f.reverse()

In [None]:
# 'reference files/csv/gender.csv' 파일을 엽니다.
f = open('reference files/csv/gender.csv')

# csv 파일 reader 객체를 생성합니다.
data = csv.reader(f)

# 남성 인구수를 저장할 빈 리스트를 생성합니다.
m = []

# 여성 인구수를 저장할 빈 리스트를 생성합니다.
f = []

# csv 파일의 각 행에 대해 반복문을 실행합니다.
for row in data:
   # 만약 '신도림'이 행의 첫 번째 열(지역명)에 포함되어 있다면
   if '신도림' in row[0]:
       # 4번째 열부터 103번째 열까지의 값들(남성 인구수)을 m 리스트에 추가합니다. 단, 값에 -1을 곱해서 음수로 저장합니다.
       for i in row[3:104]:
           m.append(-int(i))
       # 107번째 열부터 끝까지의 값들(여성 인구수)을 f 리스트에 추가합니다.
       for i in row[106:]:
           f.append(int(i))

# matplotlib의 스타일을 'ggplot'으로 설정합니다.
plt.style.use('ggplot')

# 그래프의 크기를 4인치 x 2인치로 설정하고, 해상도를 300dpi로 설정합니다.
plt.figure(figsize=(4, 2), dpi=300)

# 그래프 제목을 '신도림 지역의 남녀 성별 인구 분포'로 설정합니다.
plt.title('신도림 지역의 남녀 성별 인구 분포')

# 범위 0부터 100까지의 값을 y축으로 하고, m 리스트의 값들을 x축으로 하여 가로 막대 그래프를 그립니다. 레이블은 '남성'입니다.
plt.barh(range(101), m, label='남성')

# 범위 0부터 100까지의 값을 y축으로 하고, f 리스트의 값들을 x축으로 하여 가로 막대 그래프를 그립니다. 레이블은 '여성'입니다.
plt.barh(range(

In [None]:
# 'reference files/csv/gender.csv' 파일을 엽니다.
f = open('reference files/csv/gender.csv')

# csv 파일 reader 객체를 생성합니다.
data = csv.reader(f)

# 남성 인구수를 저장할 빈 리스트를 생성합니다.
m = []

# 여성 인구수를 저장할 빈 리스트를 생성합니다.
f = []

# 사용자에게 찾고 싶은 지역 이름을 입력받습니다.
name = input('찾고 싶은 지역의 이름을 알려주세요 : ')

# csv 파일의 각 행에 대해 반복문을 실행합니다.
for row in data:
   # 만약 입력받은 지역 이름이 행의 첫 번째 열(지역명)에 포함되어 있다면
   if name in row[0]:
       # 4번째 열부터 103번째 열까지의 값들(남성 인구수)을 m 리스트에 추가합니다. 단, 값에 -1을 곱해서 음수로 저장합니다.
       for i in row[3:104]:
           m.append(-int(i))
       # 107번째 열부터 끝까지의 값들(여성 인구수)을 f 리스트에 추가합니다.
       for i in row[106:]:
           f.append(int(i))
       # 해당 지역을 찾았으므로 반복문을 종료합니다.
       break

# matplotlib의 스타일을 'ggplot'으로 설정합니다.
plt.style.use('ggplot')

# 그래프의 크기를 5인치 x 3인치로 설정하고, 해상도를 300dpi로 설정합니다.
plt.figure(figsize=(5, 3), dpi=300)

# 그래프 제목을 '{지역 이름} 지역의 남녀 성별 인구 분포'로 설정합니다.
plt.title(name + ' 지역의 남녀 성별 인구 분포')

# 범위 0부터 100까지의 값을 y축으로 하고, m 리스트의 값들을 x축으로 하여 가로 막대 그래프를 그립니다. 레이블은 '남성'입니다.
plt.barh(range(101), m, label='남성')

# 범위 0부터 100까지의 값을 y축으로 하고, f 리스트의 값들을 x축으로 하여 가로 막대 그래프를 그립니다. 레이블은 '여성'입니다.
plt.barh(range(101), f, label='여성')

# 범례를 표시합니다.
plt.legend()

# 그래프를 화면에 출력합니다.
plt.show()

In [None]:
# m 리스트와 f 리스트의 길이(요소 개수)를 출력합니다.
print(len(m), len(f))

In [None]:
# 'reference files/csv/gender.csv' 파일을 엽니다.
f = open('reference files/csv/gender.csv')

# csv 파일 reader 객체를 생성합니다.
data = csv.reader(f)

# 남녀 인구수를 저장할 빈 리스트를 생성합니다.
size = []

# 사용자에게 찾고 싶은 지역 이름을 입력받습니다.
name = input('찾고 싶은 지역의 이름을 알려주세요 : ')

# csv 파일의 각 행에 대해 반복문을 실행합니다.
for row in data:
   # 만약 입력받은 지역 이름이 행의 첫 번째 열(지역명)에 포함되어 있다면
   if name in row[0]:
       # 남성 인구수와 여성 인구수를 초기화합니다.
       m = 0
       f = 0
       # 0세부터 100세까지 반복하면서
       for i in range(101):
           # 남성 인구수를 누적합니다.
           m += int(row[i+3])
           # 여성 인구수를 누적합니다.
           f += int(row[i+106])
       # 해당 지역을 찾았으므로 반복문을 종료합니다.
       break

# size 리스트에 남성 인구수와 여성 인구수를 추가합니다.
size.append(m)
size.append(f)

# 그래프의 크기를 5인치 x 3인치로 설정하고, 해상도를 300dpi로 설정합니다.
plt.figure(figsize=(5, 3), dpi=300)

# 남성과 여성을 나타내는 색상을 설정합니다.
color = ['crimson', 'darkcyan']

# 원형 그래프의 비율을 동일하게 설정합니다.
plt.axis('equal')

# 원형 그래프를 그립니다. 데이터는 size 리스트, 레이블은 ['남', '여'], 백분율 표시, 색상은 color 리스트, 시작 각도는 90도입니다.
plt.pie(size, labels=['남', '여'], autopct='%.1f%%', colors=color, startangle=90)

# 그래프 제목을 '{지역 이름} 지역의 남녀 성별 비율'로 설정합니다.
plt.title(name + ' 지역의 남녀 성별 비율')

# 그래프를 화면에 출력합니다.
plt.show()

In [None]:
# 'reference files/csv/gender.csv' 파일을 엽니다.
f = open('reference files/csv/gender.csv')

# csv 파일 reader 객체를 생성합니다.
data = csv.reader(f)

# 남성 인구수를 저장할 빈 리스트를 생성합니다.
m = []

# 여성 인구수를 저장할 빈 리스트를 생성합니다.
f = []

# 사용자에게 궁금한 동네 이름을 입력받습니다.
name = input('궁금한 동네를 입력해주세요 : ')

# csv 파일의 각 행에 대해 반복문을 실행합니다.
for row in data:
   # 만약 입력받은 동네 이름이 행의 첫 번째 열(지역명)에 포함되어 있다면
   if name in row[0]:
       # 4번째 열부터 103번째 열까지의 값들(남성 인구수)을 m 리스트에 추가합니다.
       for i in range(3, 104):
           m.append(int(row[i]))
       # 107번째 열부터 끝까지의 값들(여성 인구수)을 f 리스트에 추가합니다.
       for i in range(3, 104):
           f.append(int(row[i+103]))
       # 해당 동네를 찾았으므로 반복문을 종료합니다.
       break

# 그래프의 크기를 5인치 x 3인치로 설정하고, 해상도를 300dpi로 설정합니다.
plt.figure(figsize=(5, 3), dpi=300)

# m 리스트의 값들을 선 그래프로 그립니다. 레이블은 'Male'입니다.
plt.plot(m, label='Male')

# f 리스트의 값들을 선 그래프로 그립니다. 레이블은 'Female'입니다.
plt.plot(f, label='Female')

# 범례를 표시합니다.
plt.legend()

# 그래프를 화면에 출력합니다.
plt.show()

In [None]:
# 'reference files/csv/gender.csv' 파일을 엽니다.
f = open('reference files/csv/gender.csv')

# csv 파일 reader 객체를 생성합니다.
data = csv.reader(f)

# 결과를 저장할 빈 리스트를 생성합니다.
result = []

# 사용자에게 궁금한 동네 이름을 입력받습니다.
name = input('궁금한 동네를 입력해주세요 : ')

# csv 파일의 각 행에 대해 반복문을 실행합니다.
for row in data:
   # 만약 입력받은 동네 이름이 행의 첫 번째 열(지역명)에 포함되어 있다면
   if name in row[0]:
       # 4번째 열부터 103번째 열까지의 값들(남성 인구수 - 여성 인구수)을 result 리스트에 추가합니다.
       for i in range(3, 104):
           result.append(int(row[i]) - int(row[i+103]))
       # 해당 동네를 찾았으므로 반복문을 종료합니다.
       break

# 그래프의 크기를 3인치 x 1인치로 설정하고, 해상도를 300dpi로 설정합니다.
plt.figure(figsize=(3, 1), dpi=300)

# 범위 0부터 100까지의 값을 x축으로 하고, result 리스트의 값들을 y축으로 하여 막대 그래프를 그립니다.
plt.bar(range(101), result)

# 그래프를 화면에 출력합니다.
plt.show()

In [None]:
# 'reference files/csv/gender.csv' 파일을 엽니다.
f = open('reference files/csv/gender.csv')

# csv 파일 reader 객체를 생성합니다.
data = csv.reader(f)

# 남성 인구수를 저장할 빈 리스트를 생성합니다.
m = []

# 여성 인구수를 저장할 빈 리스트를 생성합니다.
f = []

# 사용자에게 궁금한 동네 이름을 입력받습니다.
name = input('궁금한 동네를 입력해주세요 : ')

# csv 파일의 각 행에 대해 반복문을 실행합니다.
for row in data:
   # 만약 입력받은 동네 이름이 행의 첫 번째 열(지역명)에 포함되어 있다면
   if name in row[0]:
       # 4번째 열부터 103번째 열까지의 값들(남성 인구수)을 m 리스트에 추가합니다.
       for i in range(3, 104):
           m.append(int(row[i]))
       # 107번째 열부터 끝까지의 값들(여성 인구수)을 f 리스트에 추가합니다.
       for i in range(3, 104):
           f.append(int(row[i+103]))
       # 해당 동네를 찾았으므로 반복문을 종료합니다.
       break

# matplotlib의 스타일을 'ggplot'으로 설정합니다.
plt.style.use('ggplot')

# 그래프의 크기를 5인치 x 3인치로 설정하고, 해상도를 300dpi로 설정합니다.
plt.figure(figsize=(5, 3), dpi=300)

# m 리스트의 값들을 x축으로, f 리스트의 값들을 y축으로 하여 산점도를 그립니다.
plt.scatter(m, f)

# 그래프를 화면에 출력합니다.
plt.show()

In [None]:
# math 모듈을 임포트합니다.
import math

# 'reference files/csv/gender.csv' 파일을 엽니다.
f = open('reference files/csv/gender.csv')

# csv 파일 reader 객체를 생성합니다.
data = csv.reader(f)

# 남성 인구수를 저장할 빈 리스트를 생성합니다.
m = []

# 여성 인구수를 저장할 빈 리스트를 생성합니다.
f = []

# 산점도 크기를 저장할 빈 리스트를 생성합니다.
size = []

# 사용자에게 궁금한 동네 이름을 입력받습니다.
name = input('궁금한 동네를 입력해주세요 : ')

# csv 파일의 각 행에 대해 반복문을 실행합니다.
for row in data:
   # 만약 입력받은 동네 이름이 행의 첫 번째 열(지역명)에 포함되어 있다면
   if name in row[0]:
       # 4번째 열부터 103번째 열까지의 값들(남성 인구수)을 m 리스트에 추가합니다.
       for i in range(3, 104):
           m.append(int(row[i]))
       # 107번째 열부터 끝까지의 값들(여성 인구수)를 f 리스트에 추가합니다.
       for i in range(3, 104):
           f.append(int(row[i+103]))
       # 산점도 크기를 계산하여 size 리스트에 추가합니다.
       for i in range(3, 104):
           size.append(math.sqrt(int(row[i]) + int(row[i+103])))
       # 해당 동네를 찾았으므로 반복문을 종료합니다.
       break

# matplotlib의 스타일을 'ggplot'으로 설정합니다.
plt.style.use('ggplot')

# 그래프의 크기를 5인치 x 3인치로 설정하고, 해상도를 300dpi로 설정합니다.
plt.figure(figsize=(5, 3), dpi=300)

# 그래프 제목을 '{지역 이름} 지역의 성별 인구 그래프'로 설정합니다.
plt.title(name + ' 지역의 성별 인구 그래프')

# m 리스트의 값들을 x축으로, f 리스트의 값들을 y축으로 하여 산점도를 그립니다.
# 산점도의 크기는 size 리스트의 값들로, 색상은 범위 0부터 100까지의 값으로, 투명도는 0.5, 색상맵은 'jet'입니다.
plt.scatter(m, f, s=size, c=range(101), alpha=0.5, cmap='jet')

# 색상바를 표시합니다.
plt.colorbar()

# 대각선 직선을 그립니다. (x=y)
plt.plot(range(max(m)), range(max(m)), 'g')

# x축 레이블을 '남성 인구 수'로 설정합니다.
plt.xlabel('남성 인구 수')

# y축 레이블을 '여성 인구 수'로 설정합니다.
plt.ylabel('여성 인구 수')

# 그래프를 화면에 출력합니다.
plt.show()

### **subwayfee.csv 데이터 활용** ###

In [None]:
# 'gender.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/gender.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

# 데이터를 한 줄씩 읽어와서 출력합니다.
for row in data:
    print(row)

# 파일을 닫습니다.
f.close()

In [None]:
# 'gender.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/gender.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

next(data)  # 첫 번째 줄은 건너뜁니다.

# 데이터를 한 줄씩 읽어와서 처리합니다.
for row in data:
    row[4] = int(row[4])  # 다섯 번째 열의 값을 정수로 변환합니다.
    print(row)  # 변환된 행을 출력합니다.

# 파일을 닫습니다.
f.close()

In [None]:
# 'gender.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/gender.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

next(data)  # 첫 번째 줄은 건너뜁니다.

# 데이터를 한 줄씩 읽어와서 처리합니다.
for row in data:
    # 각 행의 네 번째부터 일곱 번째 열까지의 값을 정수로 변환합니다.
    for i in range(4, 8):
        row[i] = int(row[i])
    # 변환된 행을 출력합니다.
    print(row)

# 파일을 닫습니다.
f.close()

In [None]:
# 'subwayfee.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/subwayfee.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

next(data)  # 첫 번째 줄은 건너뜁니다.

mx = 0  # 최대 비율을 저장할 변수를 초기화합니다.

# 데이터를 한 줄씩 읽어와서 처리합니다.
for row in data:
    # 각 행의 다섯 번째부터 여덟 번째 열까지의 값을 정수로 변환합니다.
    for i in range(4, 8):
        row[i] = int(row[i])
    
    # 각 역의 요금과 승차인원을 나눠서 비율을 계산합니다.
    rate = row[4] / row[6]
    
    # 최대 비율을 갱신합니다.
    if rate > mx:
        mx = rate

# 최대 비율을 출력합니다.
print(mx)

# 파일을 닫습니다.
f.close()

In [None]:
# 'subwayfee.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/subwayfee.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

next(data)  # 첫 번째 줄은 건너뜁니다.

# 승차인원이 0인 역의 정보를 출력합니다.
for row in data:
    # 각 행의 다섯 번째부터 여덟 번째 열까지의 값을 정수로 변환합니다.
    for i in range(4, 8):
        row[i] = int(row[i])
    
    # 승차인원이 0인 역의 정보를 출력합니다.
    if row[6] == 0:
        print(row)

# 파일을 닫습니다.
f.close()

In [None]:
# 'subwayfee.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/subwayfee.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

next(data)  # 첫 번째 줄은 건너뜁니다.

mx = 0  # 최대 비율을 저장할 변수를 초기화합니다.
rate = 0  # 비율을 저장할 변수를 초기화합니다.

# 데이터를 한 줄씩 읽어와서 처리합니다.
for row in data:
    # 각 행의 다섯 번째부터 여덟 번째 열까지의 값을 정수로 변환합니다.
    for i in range(4, 8):
        row[i] = int(row[i])
    
    # 승차인원이 0이 아닌 경우에만 비율을 계산하고, 최대 비율을 갱신합니다.
    if row[6] != 0:
        rate = row[4] / row[6]
        if rate > mx:
            mx = rate
            # 각 역의 정보와 해당 역의 요금 대 승차인원 비율을 출력합니다.
            print(row, round(rate, 2))

# 파일을 닫습니다.
f.close()

In [None]:
# 'subwayfee.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/subwayfee.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

next(data)  # 첫 번째 줄은 건너뜁니다.

mx = 0  # 최대 비율을 저장할 변수를 초기화합니다.
rate = 0  # 비율을 저장할 변수를 초기화합니다.

# 데이터를 한 줄씩 읽어와서 처리합니다.
for row in data:
    # 각 행의 다섯 번째부터 여덟 번째 열까지의 값을 정수로 변환합니다.
    for i in range(4, 8):
        row[i] = int(row[i])
    
    # 승차인원이 0이 아니고, 총 승차인원이 100,000명 이상인 경우에만 비율을 계산합니다.
    if row[6] != 0 and (row[4] + row[6]) > 100000:
        rate = row[4] / (row[4] + row[6])
        if rate > mx:
            mx = rate
            # 각 역의 정보와 해당 역의 요금 대 총 승차인원 비율을 출력합니다.
            print(row, round(rate, 2))

# 파일을 닫습니다.
f.close()

In [None]:
# 'subwayfee.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/subwayfee.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

next(data)  # 첫 번째 줄은 건너뜁니다.

mx = 0  # 최대 비율을 저장할 변수를 초기화합니다.
rate = 0  # 비율을 저장할 변수를 초기화합니다.

# 데이터를 한 줄씩 읽어와서 처리합니다.
for row in data:
    # 각 행의 다섯 번째부터 여덟 번째 열까지의 값을 정수로 변환합니다.
    for i in range(4, 8):
        row[i] = int(row[i])
    
    # 승차인원이 0이 아니고, 총 승차인원이 100,000명 이상인 경우에만 비율을 계산합니다.
    if row[6] != 0 and (row[4] + row[6]) > 100000:
        rate = row[4] / (row[4] + row[6])
        if rate > 0.94:
            mx = rate
            # 각 역의 정보와 해당 역의 요금 대 총 승차인원 비율을 출력합니다.
            print(row, round(rate, 2))

# 파일을 닫습니다.
f.close()

In [None]:
# 'subwayfee.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/subwayfee.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

next(data)  # 첫 번째 줄은 건너뜁니다.

mx = 0  # 최대 비율을 저장할 변수를 초기화합니다.
rate = 0  # 비율을 저장할 변수를 초기화합니다.
mx_station = ''  # 최대 비율을 갖는 역의 이름을 저장할 변수를 초기화합니다.

# 데이터를 한 줄씩 읽어와서 처리합니다.
for row in data:
    # 각 행의 다섯 번째부터 여덟 번째 열까지의 값을 정수로 변환합니다.
    for i in range(4, 8):
        row[i] = int(row[i])
    
    # 승차인원이 0이 아니고, 총 승차인원이 100,000명 이상인 경우에만 비율을 계산합니다.
    if row[6] != 0 and (row[4] + row[6]) > 100000:
        rate = row[4] / (row[4] + row[6])
        if rate > mx:
            mx = rate
            # 최대 비율을 갖는 역의 이름을 저장합니다.
            mx_station = row[3] + ' ' + row[1]

# 최대 비율을 갖는 역의 이름과 비율을 출력합니다.
print(mx_station, round(mx * 100, 2))

# 파일을 닫습니다.
f.close()

In [None]:
# 'subwayfee.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/subwayfee.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

next(data)  # 첫 번째 줄은 건너뜁니다.

# 최대 값과 그에 해당하는 역의 이름을 저장할 리스트를 초기화합니다.
mx = [0] * 4
mx_station = [''] * 4

# 데이터를 한 줄씩 읽어와서 처리합니다.
for row in data:
    # 각 행의 다섯 번째부터 여덟 번째 열까지의 값을 정수로 변환합니다.
    for i in range(4, 8):
        row[i] = int(row[i])
        # 해당 열의 값이 최대 값보다 크다면 최대 값을 업데이트하고 역의 이름을 저장합니다.
        if row[i] > mx[i - 4]:
            mx[i - 4] = row[i]
            mx_station[i - 4] = row[3] + ' ' + row[1]

# 각 열에서의 최대 값을 출력합니다.
for i in range(4):
    print(mx_station[i], mx[i])

# 파일을 닫습니다.
f.close()

In [None]:
# 'subwayfee.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/subwayfee.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

next(data)  # 첫 번째 줄은 건너뜁니다.

# 최대 값과 그에 해당하는 역의 이름을 저장할 리스트를 초기화합니다.
mx = [0] * 4
mx_station = [''] * 4

# 각 열에 대한 라벨을 설정합니다.
label = ['유임승차', '유임하차', '무임승차', '무임하차']

# 데이터를 한 줄씩 읽어와서 처리합니다.
for row in data:
    # 각 행의 다섯 번째부터 여덟 번째 열까지의 값을 정수로 변환합니다.
    for i in range(4, 8):
        row[i] = int(row[i])
        # 해당 열의 값이 최대 값보다 크다면 최대 값을 업데이트하고 역의 이름을 저장합니다.
        if row[i] > mx[i - 4]:
            mx[i - 4] = row[i]
            mx_station[i - 4] = row[3] + ' ' + row[1]

# 각 열에서의 최대 값을 출력합니다.
for i in range(4):
    print(label[i] + ' : ' + mx_station[i], mx[i])

# 파일을 닫습니다.
f.close()

In [None]:
# 'subwayfee.csv' 파일을 열고 파일 객체를 생성합니다.
f = open('reference files/csv/subwayfee.csv')

# csv.reader를 사용하여 파일 객체에서 데이터를 읽어옵니다.
data = csv.reader(f)

next(data)  # 첫 번째 줄은 건너뜁니다.

# 각 열에 대한 라벨을 설정합니다.
label = ['유임승차', '유임하차', '무임승차', '무임하차']

# 데이터를 한 줄씩 읽어와서 처리합니다.
for row in data:
    # 각 행의 다섯 번째부터 여덟 번째 열까지의 값을 정수로 변환합니다.
    for i in range(4, 8):
        row[i] = int(row[i])
    
    # 파이 차트를 생성합니다.
    plt.figure(figsize=(5, 3), dpi=300)
    plt.pie(row[4:8], labels=label, autopct='%1.1f%%')
    plt.axis('equal')  # 파이 차트를 원형으로 출력합니다.
    plt.show()

# 파일을 닫습니다.
f.close()

In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwayfee.csv')
data = csv.reader(f)
next(data)  # 헤더 건너뛰기

# 파이 차트에 사용할 라벨과 색상 정의
label = ['유임승차','유임하차','무임승차','무임하차']
c = ['#14CCC0', '#389993', '#FF1C6A', '#CC14AF']

# 데이터 처리 및 시각화
for row in data:
    for i in range(4, 8):
        row[i] = int(row[i])  # 정수로 변환
    
    # 이미지 생성
    plt.figure(figsize=(3, 2), dpi=300)
    plt.title(row[3] + ' ' + row[1])  # 제목 설정
    plt.pie(row[4:8], labels=label, colors=c, autopct='%1.f%%')  # 파이 차트 그리기
    plt.axis('equal')  # 차트를 원형으로 보이도록 설정
    plt.savefig("reference files/img/png/" + row[3] + ' ' + row[1] + '.png')  # 이미지 저장
    plt.show()  # 이미지 출력


### **subwaytime.csv 데이터 활용** ###

In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwaytime.csv')
data = csv.reader(f)

# 각 행 출력
for row in data:
    print(row)

In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwaytime.csv')
data = csv.reader(f)
next(data)  # 첫 번째 행은 건너뜁니다.
next(data)  # 두 번째 행도 건너뜁니다.

# 각 행의 데이터를 정수로 변환하여 출력
for row in data:
    row[4:] = map(int, row[4:])  # 4번째 열부터 끝까지를 정수로 변환합니다.
    print(row)

In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwaytime.csv')
data = csv.reader(f)
next(data)  # 첫 번째 행은 건너뜁니다.
next(data)  # 두 번째 행도 건너뜁니다.

result = []

# 각 행의 데이터를 정수로 변환하여 결과 리스트에 추가
for row in data:
    row[4:] = map(int, row[4:])  # 4번째 열부터 끝까지를 정수로 변환합니다.
    result.append(row[10])  # 10번째 열의 데이터를 결과 리스트에 추가합니다.

# 결과 리스트의 길이와 내용을 출력
print(len(result))
print(result)

In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwaytime.csv')
data = csv.reader(f)
next(data)  # 첫 번째 행은 건너뜁니다.
next(data)  # 두 번째 행도 건너뜁니다.

result = []

# 각 행의 데이터를 정수로 변환하여 결과 리스트에 추가
for row in data:
    row[4:] = map(int, row[4:])  # 4번째 열부터 끝까지를 정수로 변환합니다.
    result.append(row[10])  # 10번째 열의 데이터를 결과 리스트에 추가합니다.

# 결과를 막대 그래프로 시각화
plt.figure(figsize=(3, 2), dpi=300)
plt.style.use('ggplot')  # 스타일 설정
plt.bar(range(len(result)), result)  # 막대 그래프 그리기
plt.show()  # 그래프 출력

In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwaytime.csv')
data = csv.reader(f)
next(data)  # 첫 번째 행은 건너뜁니다.
next(data)  # 두 번째 행도 건너뜁니다.

result = []

# 각 행의 데이터를 정수로 변환하여 결과 리스트에 추가
for row in data:
    row[4:] = map(int, row[4:])  # 4번째 열부터 끝까지를 정수로 변환합니다.
    result.append(row[10])  # 10번째 열의 데이터를 결과 리스트에 추가합니다.

result.sort()  # 결과를 정렬합니다.

# 결과를 막대 그래프로 시각화
plt.figure(figsize=(3, 2), dpi=300)
plt.style.use('ggplot')  # 스타일 설정
plt.bar(range(len(result)), result)  # 막대 그래프 그리기
plt.show()  # 그래프 출력


In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwaytime.csv')  # 지하철 시간 데이터가 있는 CSV 파일을 엽니다.
data = csv.reader(f)  # CSV 파일을 읽기 모드로 엽니다.
next(data)  # CSV 파일에서 첫 번째 행은 헤더 정보이므로 건너뜁니다.
next(data)  # CSV 파일에서 두 번째 행도 헤더 정보이므로 건너뜁니다.

result = []  # 결과를 저장할 리스트를 초기화합니다.

for row in data:  # CSV 파일의 각 행에 대해 반복합니다.
    row[4:] = map(int, row[4:])  # 각 행의 4번째 열부터 끝까지를 정수로 변환합니다.
    total_paid = sum(row[10:15:2])  # 각 행에서 10번째부터 14번째 열까지(인덱스는 9부터 13까지)의 값을 가져와서 홀수 번째 열(인덱스는 9, 11, 13)의 값을 합산합니다.
    result.append(total_paid)  # 합을 결과 리스트에 추가합니다.

result.sort()  # 결과 리스트를 오름차순으로 정렬합니다.

# 결과를 막대 그래프로 시각화
plt.figure(figsize=(3, 2), dpi=300)  # 그래프의 크기를 설정합니다.
plt.style.use('ggplot')  # 그래프 스타일을 설정합니다.
plt.bar(range(len(result)), result)  # 결과 리스트의 길이에 맞게 막대 그래프를 그립니다.
plt.show()  # 그래프를 출력합니다.

In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwaytime.csv')  # 'subwaytime.csv' 파일을 엽니다.
data = csv.reader(f)  # CSV 파일을 읽어오는 객체를 생성합니다.
next(data)  # 첫 번째 행은 열의 이름을 나타냅니다. 이를 건너뜁니다.
next(data)  # 두 번째 행도 데이터가 아닌 설명을 담고 있어 건너뜁니다.

mx = 0  # 최대 승차 인원 수 초기값을 설정합니다.
mx_station = ''  # 최대 승차 인원을 기록한 역의 정보를 담을 변수를 초기화합니다.

# 데이터 처리 및 최대값 찾기
for row in data:  # 데이터를 한 줄씩 읽어옵니다.
    row[4:] = map(int, row[4:])  # 4번째 열부터 끝까지를 정수로 변환합니다. (유임승차, 유임하차, 무임승차, 무임하차)
    total_passengers = sum(row[4:8])  # 승차 인원과 하차 인원의 합을 계산합니다.
    if total_passengers > mx:  # 현재까지의 최대값보다 큰 경우
        mx = total_passengers  # 최대값을 갱신합니다.
        mx_station = row[3] + '(' + row[1] + ')'  # 최대값을 갖는 역 이름을 저장합니다.

# 결과 출력
print(mx_station, mx)  # 가장 많은 승차 인원을 기록한 역과 그 값이 출력됩니다.

In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwaytime.csv')  # 'subwaytime.csv' 파일을 엽니다.
data = csv.reader(f)  # CSV 파일을 읽어오는 객체를 생성합니다.
next(data)  # 첫 번째 행은 열의 이름을 나타냅니다. 이를 건너뜁니다.
next(data)  # 두 번째 행도 데이터가 아닌 설명을 담고 있어 건너뜁니다.

mx = 0  # 최대 하차 인원 수 초기값을 설정합니다.
mx_station = ''  # 최대 하차 인원을 기록한 역의 정보를 담을 변수를 초기화합니다.

for row in data:  # 데이터를 한 줄씩 읽어옵니다.
    row[4:] = map(int, row[4:])  # 4번째 열부터 끝까지를 정수로 변환합니다. (유임승차, 유임하차, 무임승차, 무임하차)
    exit_counts = row[11:16:2]  # 하차 인원 데이터를 추출합니다.
    total_exits = sum(exit_counts)  # 하차 인원의 합을 계산합니다.
    if total_exits > mx:  # 현재까지의 최대값보다 큰 경우
        mx = total_exits  # 최대값을 갱신합니다.
        mx_station = row[3] + '(' + row[1] + ')'  # 최대값을 갖는 역 이름을 저장합니다.

# 결과 출력
print(mx_station, mx)  # 가장 많은 하차 인원을 기록한 역과 그 값이 출력됩니다.

In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwaytime.csv')  # 'subwaytime.csv' 파일을 엽니다.
data = csv.reader(f)  # CSV 파일을 읽어오는 객체를 생성합니다.
next(data)  # 첫 번째 행은 열의 이름을 나타냅니다. 이를 건너뜁니다.
next(data)  # 두 번째 행도 데이터가 아닌 설명을 담고 있어 건너뜁니다.

mx = 0  # 가장 많은 승차인원 초기값 설정
mx_station = ''  # 가장 많은 승차인원을 기록한 역 초기값 설정

# 사용자로부터 시간대 입력 받기
t = int(input('몇 시의 승차인원이 가장 많은 역이 궁금하세요? : '))

for row in data:
    row[4:] = map(int, row[4:])  # 승하차인원 데이터를 정수로 변환합니다.
    a = row[2 * t - 4]  # 입력받은 시간대에 해당하는 승차인원을 가져옵니다.
    if a > mx:  # 최대값을 갱신하는 경우
        mx = a  # 최대값을 갱신합니다.
        mx_station = row[3] + '(' + row[1] + ')'  # 최대값을 갖는 역 이름을 저장합니다.

# 결과 출력
print(mx_station, mx)  # 가장 많은 승차인원을 기록한 역과 그 값이 출력됩니다.

In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwaytime.csv')  # 'subwaytime.csv' 파일을 엽니다.
data = csv.reader(f)  # CSV 파일을 읽어오는 객체를 생성합니다.
next(data)  # 첫 번째 행은 열의 이름을 나타냅니다. 이를 건너뜁니다.
next(data)  # 두 번째 행도 데이터가 아닌 설명을 담고 있어 건너뜁니다.

mx = [0] * 24  # 24개 시간대의 최대 승차인원을 기록할 리스트를 초기화합니다.
mx_station = [''] * 24  # 24개 시간대의 최대 승차인원을 기록한 역을 기록할 리스트를 초기화합니다.

for row in data:
    row[4:] = map(int, row[4:])  # 승하차인원 데이터를 정수로 변환합니다.
    for j in range(24):  # 0부터 23까지의 시간대에 대해 반복합니다.
        a = row[j * 2 + 4]  # 해당 시간대의 승차인원을 가져옵니다.
        if a > mx[j]:  # 현재까지의 최대값보다 큰 경우
            mx[j] = a  # 최대값을 갱신합니다.
            mx_station[j] = row[3]  # 최대값을 갖는 역 이름을 저장합니다.

# 결과 출력
print(mx_station)  # 각 시간대별로 최대 승차인원을 기록한 역을 출력합니다.
print(mx)  # 각 시간대별로 최대 승차인원을 출력합니다.

In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwaytime.csv')  # 'subwaytime.csv' 파일을 엽니다.
data = csv.reader(f)  # CSV 파일을 읽어오는 객체를 생성합니다.
next(data)  # 첫 번째 행은 열의 이름을 나타냅니다. 이를 건너뜁니다.
next(data)  # 두 번째 행도 데이터가 아닌 설명을 담고 있어 건너뜁니다.

mx = [0] * 24  # 24개 시간대의 최대 승차인원을 기록할 리스트를 초기화합니다.
mx_station = [''] * 24  # 24개 시간대의 최대 승차인원을 기록한 역을 기록할 리스트를 초기화합니다.

for row in data:
    row[4:] = map(int, row[4:])  # 승하차인원 데이터를 정수로 변환합니다.
    for j in range(24):  # 0부터 23까지의 시간대에 대해 반복합니다.
        a = row[j * 2 + 4]  # 해당 시간대의 승차인원을 가져옵니다.
        if a > mx[j]:  # 현재까지의 최대값보다 큰 경우
            mx[j] = a  # 최대값을 갱신합니다.
            mx_station[j] = row[3] + '(' + str(j + 4) + ')'  # 최대값을 갖는 역 이름과 시간대를 저장합니다.

# 막대 그래프로 시각화
plt.figure(figsize=(12, 6))  # 그래프의 크기를 설정합니다.
plt.bar(range(24), mx)  # 시간대별 최대 승차인원을 막대 그래프로 표시합니다.
plt.xticks(range(24), mx_station, rotation=90, size=6)  # x축 눈금을 시간대와 역 이름으로 설정하고, 90도 회전시킵니다.
plt.xlabel('시간대')  # x축 레이블을 추가합니다.
plt.ylabel('최대 승차인원')  # y축 레이블을 추가합니다.
plt.title('지하철 시간대별 최대 승차인원 역')  # 그래프의 제목을 추가합니다.
plt.tight_layout()  # 그래프 요소들이 겹치지 않도록 설정합니다.
plt.show()  # 그래프를 출력합니다.

In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwaytime.csv')  # 'subwaytime.csv' 파일을 엽니다.
data = csv.reader(f)  # CSV 파일을 읽어오는 객체를 생성합니다.
next(data)  # 첫 번째 행은 열의 이름을 나타냅니다. 이를 건너뜁니다.
next(data)  # 두 번째 행도 데이터가 아닌 설명을 담고 있어 건너뜁니다.

mx = [0] * 24  # 24개 시간대의 최대 하차인원을 기록할 리스트를 초기화합니다.
mx_station = [''] * 24  # 24개 시간대의 최대 하차인원을 기록한 역을 기록할 리스트를 초기화합니다.

for row in data:
    row[4:] = map(int, row[4:])  # 승하차인원 데이터를 정수로 변환합니다.
    for j in range(24):  # 0부터 23까지의 시간대에 대해 반복합니다.
        b = row[5 + j * 2]  # 해당 시간대의 하차인원을 가져옵니다.
        if b > mx[j]:  # 현재까지의 최대값보다 큰 경우
            mx[j] = b  # 최대값을 갱신합니다.
            mx_station[j] = row[3] + '(' + str(j + 4) + ')'  # 최대값을 갖는 역 이름과 시간대를 저장합니다.

# 막대 그래프로 시각화
plt.figure(figsize=(12, 6))  # 그래프의 크기를 설정합니다.
plt.bar(range(24), mx, color='b')  # 시간대별 최대 하차인원을 막대 그래프로 표시합니다.
plt.xticks(range(24), mx_station, rotation=90, size=6)  # x축 눈금을 시간대와 역 이름으로 설정하고, 90도 회전시킵니다.
plt.xlabel('시간대')  # x축 레이블을 추가합니다.
plt.ylabel('최대 하차인원')  # y축 레이블을 추가합니다.
plt.title('지하철 시간대별 최대 하차인원 역')  # 그래프의 제목을 추가합니다.
plt.tight_layout()  # 그래프 요소들이 겹치지 않도록 설정합니다.
plt.show()  # 그래프를 출력합니다.

In [None]:
# CSV 파일 열기
f = open('reference files/csv/subwaytime.csv')  # 'subwaytime.csv' 파일을 엽니다.
data = csv.reader(f)  # CSV 파일을 읽어오는 객체를 생성합니다.
next(data)  # 첫 번째 행은 열의 이름을 나타냅니다. 이를 건너뜁니다.
next(data)  # 두 번째 행도 데이터가 아닌 설명을 담고 있어 건너뜁니다.

s_in = [0] * 24  # 각 시간대별 승차 인원을 저장할 리스트를 초기화합니다.
s_out = [0] * 24  # 각 시간대별 하차 인원을 저장할 리스트를 초기화합니다.

for row in data:
    row[4:] = map(int, row[4:])  # 승하차인원 데이터를 정수로 변환합니다.
    for i in range(24):  # 0부터 23까지의 시간대에 대해 반복합니다.
        s_in[i] += row[4 + i * 2]  # 해당 시간대의 승차인원을 누적하여 저장합니다.
        s_out[i] += row[5 + i * 2]  # 해당 시간대의 하차인원을 누적하여 저장합니다.

# 시간대별 승하차 인원 추이 시각화
plt.figure(figsize=(10, 6))  # 그래프의 크기를 설정합니다.
plt.title('지하철 시간대별 승하차 인원 추이')  # 그래프의 제목을 설정합니다.
plt.plot(s_in, label='승차')  # 승차 인원 추이를 선 그래프로 표시합니다.
plt.plot(s_out, label='하차')  # 하차 인원 추이를 선 그래프로 표시합니다.
plt.legend()  # 범례를 추가합니다.
plt.xticks(range(24), range(4, 28))  # x축 눈금을 시간대로 설정하고, 라벨을 4부터 27까지로 설정합니다.
plt.xlabel('시간대')  # x축 레이블을 추가합니다.
plt.ylabel('인원 수')  # y축 레이블을 추가합니다.
plt.tight_layout()  # 그래프 요소들이 겹치지 않도록 설정합니다.
plt.show()  # 그래프를 출력합니다.

### **위키피디아 데이터 활용** ###

In [None]:
!pip install lxml

In [None]:
# URL에서 HTML을 가져옵니다.
url = 'https://en.wikipedia.org/wiki/All-time_Olympic_Games_medal_table'
tables = pd.read_html(url)

# 가져온 테이블의 개수를 확인합니다.
print(len(tables))  # 테이블의 개수를 출력합니다.

# 가져온 테이블 중에서 원하는 테이블을 선택합니다.
# 예를 들어, 첫 번째 테이블을 선택합니다.
df = tables

# 선택한 테이블을 출력합니다.
print(df)

In [None]:
df[1]

In [None]:
# 위키피디아에서 올림픽 메달 테이블을 포함한 HTML 페이지를 가져와서 DataFrame으로 변환합니다.
# header=0은 첫 번째 행을 열 이름으로 지정하고, index_col=0은 첫 번째 열을 행 인덱스로 지정합니다.
df = pd.read_html('https://en.wikipedia.org/wiki/All-time_Olympic_Games_medal_table', header=0, index_col=0)
df[1]

In [None]:
# df[1]은 위키피디아에서 가져온 DataFrame 객체의 두 번째 요소를 선택합니다.
# iloc를 사용하여 행과 열을 선택하는데, ':'은 모든 행을 의미하고, ':5'는 처음부터 다섯 번째 열까지의 열을 의미합니다.
# 따라서 summer에는 df[1]의 모든 행과 처음 다섯 개의 열의 데이터가 포함된 DataFrame 객체가 저장됩니다.
summer = df[1].iloc[:, :5]

In [None]:
# DataFrame 객체 summer의 열 이름을 변경합니다.
# '경기수', '금', '은', '동', '계'는 각각 열에 대한 새로운 이름입니다.
# 이 코드를 통해 DataFrame 객체의 열 이름이 변경됩니다.
summer.columns = ['경기수', '금', '은', '동', '계']

In [None]:
# '금' 열을 기준으로 내림차순으로 정렬하여 출력합니다.
print(summer.sort_values('금', ascending=False))

In [None]:
# DataFrame 객체 summer을 엑셀 파일로 저장합니다.
# 'reference files/xlsx/' 경로에 '하계올림픽메달.xlsx' 파일로 저장됩니다.
summer.to_excel('reference files/xlsx/하계올림픽메달.xlsx')

In [None]:
# '1/1/2000'부터 시작하여 8일간의 날짜를 포함하는 날짜 범위를 생성합니다.
# 이 범위는 인덱스로 사용될 수 있습니다.
index = pd.date_range('1/1/2000', periods=8)

# 생성된 날짜 범위를 출력합니다.
print(index)