In [1]:
import pandas as pd

# CSV 파일 읽기
df = pd.read_csv('school_info.csv')

# school_name 중복 제거
df = df.drop_duplicates(subset='school_name')


In [2]:
# 초등학교, 중학교, 고등학교로 분류 후 필요한 열만 선택
elementary_schools = df[df['school_name'].str.contains("초등학교")][['gu', 'school_name']]
middle_schools = df[df['school_name'].str.contains("중학교")][['gu', 'school_name']]
high_schools = df[df['school_name'].str.contains("고등학교")][['gu', 'school_name']]


In [3]:
# 각 구별로 학교 종류별 나누기 및 최대 10개씩 선택
result = {}
for gu_name in df['gu'].unique():
    result[gu_name] = {
        '초등학교': elementary_schools[elementary_schools['gu'] == gu_name].head(10),
        '중학교': middle_schools[middle_schools['gu'] == gu_name].head(10),
        '고등학교': high_schools[high_schools['gu'] == gu_name].head(10)
    }


In [4]:
# 구별로 학교 종류별 개수 계산 및 출력
school_counts = {}

for gu_name, schools in result.items():
    elementary_count = len(schools['초등학교'])
    middle_count = len(schools['중학교'])
    high_count = len(schools['고등학교'])
    
    school_counts[gu_name] = {
        '초등학교': elementary_count,
        '중학교': middle_count,
        '고등학교': high_count
    }

# 결과 출력
for gu_name, counts in school_counts.items():
    print(f"{gu_name}: 초등학교 {counts['초등학교']}개, 중학교 {counts['중학교']}개, 고등학교 {counts['고등학교']}개")

광진구: 초등학교 10개, 중학교 10개, 고등학교 9개
성동구: 초등학교 10개, 중학교 10개, 고등학교 7개
동작구: 초등학교 10개, 중학교 10개, 고등학교 10개
관악구: 초등학교 10개, 중학교 10개, 고등학교 10개
강동구: 초등학교 10개, 중학교 10개, 고등학교 10개
송파구: 초등학교 10개, 중학교 10개, 고등학교 10개
강북구: 초등학교 10개, 중학교 10개, 고등학교 7개
성북구: 초등학교 10개, 중학교 10개, 고등학교 10개
강남구: 초등학교 10개, 중학교 10개, 고등학교 10개
서초구: 초등학교 10개, 중학교 10개, 고등학교 10개
중구: 초등학교 10개, 중학교 8개, 고등학교 10개
강서구: 초등학교 10개, 중학교 10개, 고등학교 10개
양천구: 초등학교 10개, 중학교 10개, 고등학교 10개
종로구: 초등학교 10개, 중학교 10개, 고등학교 10개
용산구: 초등학교 10개, 중학교 9개, 고등학교 10개
노원구: 초등학교 10개, 중학교 10개, 고등학교 10개
도봉구: 초등학교 10개, 중학교 10개, 고등학교 9개
구로구: 초등학교 10개, 중학교 10개, 고등학교 10개
영등포구: 초등학교 10개, 중학교 10개, 고등학교 9개
금천구: 초등학교 10개, 중학교 10개, 고등학교 6개
은평구: 초등학교 10개, 중학교 10개, 고등학교 10개
서대문구: 초등학교 10개, 중학교 10개, 고등학교 8개
마포구: 초등학교 10개, 중학교 10개, 고등학교 10개
중랑구: 초등학교 10개, 중학교 10개, 고등학교 10개
동대문구: 초등학교 10개, 중학교 10개, 고등학교 10개


In [5]:
# 빈 리스트 생성
school_names = []

# 각 구별로 학교 이름을 수집
for gu_data in result.values():
    for school_type in gu_data.values():
        school_names.extend(school_type['school_name'].tolist())

# 텍스트 파일로 저장 (세로로 한 줄씩)
with open('school_names.txt', 'w', encoding='utf-8') as file:
    for name in school_names:
        file.write(f"{name}\n")


In [8]:
# 빈 리스트 생성
middle_school_names = []

# 각 구별로 중학교 이름을 수집
for gu_data in result.values():
    middle_school_names.extend(gu_data['중학교']['school_name'].tolist())

# 텍스트 파일로 저장 (세로로 한 줄씩)
with open('middle_school_gu_crawling/middle_school_names.txt', 'w', encoding='utf-8') as file:
    for name in middle_school_names:
        file.write(f"{name}\n")

In [13]:
print(result)

{'광진구': {'초등학교':      gu school_name
26  광진구      세종초등학교
27  광진구      성동초등학교
30  광진구    서울중마초등학교
31  광진구    서울중광초등학교
32  광진구    서울장안초등학교
33  광진구    서울자양초등학교
35  광진구    서울용마초등학교
37  광진구    서울용곡초등학교
40  광진구    서울양진초등학교
41  광진구    서울양남초등학교, '중학교':      gu       school_name
0   광진구           선화예술중학교
4   광진구             자양중학교
5   광진구             용곡중학교
7   광진구             양진중학교
8   광진구             신양중학교
13  광진구           대원국제중학교
15  광진구  동국대학교사범대학부속여자중학교
16  광진구             구의중학교
18  광진구             광진중학교
19  광진구             광장중학교, '고등학교':        gu        school_name
2166  광진구  동국대학교사범대학부속여자고등학교
3219  광진구           선화예술고등학교
3419  광진구          대원외국어고등학교
3439  광진구           대원여자고등학교
3458  광진구             대원고등학교
3534  광진구    건국대학교사범대학부속고등학교
3615  광진구             자양고등학교
3826  광진구             광양고등학교
3830  광진구             광남고등학교}, '성동구': {'초등학교':      gu school_name
1   성동구    서울숭신초등학교
25  성동구      한양초등학교
28  성동구    서울행현초등학교
29  성동구    서울행당초등학교
34  성동구    서울응봉초등학교
36  성동구    서울용답초등학교
38  성동구    서