In [11]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from bs4 import BeautifulSoup

# Selenium WebDriver 설정
options = webdriver.ChromeOptions()
options.add_argument("--headless")  # 브라우저 창을 띄우지 않음
options.add_argument("--no-sandbox")
options.add_argument("--disable-dev-shm-usage")

# ChromeDriver 실행
driver = webdriver.Chrome(options=options)

# URL 설정
url = "https://namu.wiki/w/%EC%BA%A0%ED%8D%BC%EC%8A%A4"
driver.get(url)

# WebDriverWait으로 특정 div가 로드될 때까지 대기
try:
    WebDriverWait(driver, 30).until(
        EC.presence_of_element_located((By.CLASS_NAME, "_1CbAe5Lw"))  # div 클래스명
    )
    print("특정 div가 로드되었습니다.")
except:
    print("특정 div 로드 실패.")
    driver.quit()
    exit()

# 페이지 소스 가져오기
html = driver.page_source
soup = BeautifulSoup(html, "html.parser")

# 해당 클래스명을 가진 모든 테이블 찾기
tables = soup.find_all("table", {"class": "xZl7LbPm _ba832eed82a14e6b3bc9304cd9b2a6d0"})

# 3번과 4번 테이블 데이터 가져오기
all_university_data = []
for index in [2, 3]:  # 3번, 4번 테이블은 인덱스 2, 3 (Python의 리스트는 0부터 시작)
    if index < len(tables):
        table = tables[index]
        rows = table.find("tbody").find_all("tr")
        for row in rows[1:]:  # 첫 번째 행은 헤더
            columns = row.find_all("td")
            if len(columns) >= 4:  # 데이터가 4열 이상인 경우
                # 대학명 (두 번째 열)
                name_div = columns[1].find("div", {"class": "W4-ZFyxd"})
                area_div = columns[3].find("div", {"class": "W4-ZFyxd"})
                if name_div and area_div:
                    name = name_div.get_text(strip=True)
                    area = area_div.get_text(strip=True)
                    
                    # 데이터 저장
                    all_university_data.append({
                        "대학명": name,
                        "면적": area
                    })

# WebDriver 종료
driver.quit()

# 결과 출력
if all_university_data:
    for item in all_university_data:
        print(f"{item['대학명']}: {item['면적']}")
else:
    print("데이터를 찾을 수 없습니다.")
    



특정 div가 로드되었습니다.
서울대학교: 4,317,000㎡
연세대학교: 952,750㎡
고려대학교: 946,177㎡
이화여자대학교: 554,927㎡
서울과학기술대학교: 504,922㎡
건국대학교: 456,392㎡[62]
서울시립대학교: 434,004㎡
경희대학교: 407,376㎡
한양대학교: 401,729㎡
삼육대학교: 319,537㎡
서강대학교: 242,091㎡
서울여자대학교: 225,020㎡
국민대학교: 191,736㎡
덕성여자대학교: 188,260㎡
중앙대학교: 179,972㎡
상명대학교: 174,763㎡
동국대학교: 171,904㎡
성신여자대학교: 156,419㎡
성균관대학교: 154,104㎡
가톨릭대학교: 137,991㎡
숭실대학교: 133,951㎡
세종대학교: 119,694㎡
홍익대학교: 112,653㎡
강서대학교: 92,483㎡
한국외국어대학교: 82,291㎡
광운대학교: 75,836㎡
숙명여자대학교: 68,337㎡
명지대학교: 55,486㎡
동덕여자대학교: 54,323㎡
서경대학교: 53,615㎡
한성대학교: 48,726㎡
총신대학교: 42,349㎡
성공회대학교: 39,431㎡
경기대학교: 19,157㎡
서울한영대학교: 18,899㎡
서울기독대학교: 7,940㎡
인덕대학교: 76,485m²
한양여자대학교: 70,558㎡
한국폴리텍대학[81]: 57,729㎡[82]
삼육보건대학교: 49,710㎡
서일대학교: 38,505㎡
동양미래대학교: 36,881㎡
명지전문대학: 33,500㎡
숭의여자대학교: 25,724㎡
배화여자대학교: 23,389㎡
서울여자간호대학교: 4,534㎡


In [12]:
import googlemaps
from dotenv import load_dotenv
import os

# .env 파일에서 Google API Key 로드
load_dotenv()
api_key = os.getenv('GOOGLE_API_KEY')
gmaps = googlemaps.Client(key=api_key)

# 대학교 이름과 면적 데이터를 기반으로 위도/경도 추가
university_locations = []
for data in all_university_data:
    try:
        # Geocoding API 호출
        geocode_result = gmaps.geocode(data['대학명'], language='ko')
        if geocode_result:
            location = geocode_result[0]['geometry']['location']
            latitude = location['lat']
            longitude = location['lng']
            university_locations.append({
                "대학명": data['대학명'],
                "면적": data['면적'],
                "위도": latitude,
                "경도": longitude
            })
            print(f"{data['대학명']}: 위도 {latitude}, 경도 {longitude}")
        else:
            print(f"{data['대학명']}: 위치 정보를 찾을 수 없습니다.")
    except Exception as e:
        print(f"{data['대학명']}: 오류 발생 - {e}")




서울대학교: 위도 37.4648267, 경도 126.9571988
연세대학교: 위도 37.5663937, 경도 126.9387066
고려대학교: 위도 37.58938759999999, 경도 127.0324773
이화여자대학교: 위도 37.5618588, 경도 126.9468339
서울과학기술대학교: 위도 37.6316684, 경도 127.0774813
건국대학교: 위도 37.5423265, 경도 127.0759204
서울시립대학교: 위도 37.5838657, 경도 127.0587771
경희대학교: 위치 정보를 찾을 수 없습니다.
한양대학교: 위도 37.5571759, 경도 127.0454092
삼육대학교: 위도 37.6435824, 경도 127.1063459
서강대학교: 위도 37.5509442, 경도 126.9410023
서울여자대학교: 위도 37.6281126, 경도 127.0904568
국민대학교: 위도 37.6108694, 경도 126.9972889
덕성여자대학교: 위도 37.6512976, 경도 127.0165728
중앙대학교: 위도 37.5045563, 경도 126.9569379
상명대학교: 위도 37.602638, 경도 126.955252
동국대학교: 위도 37.5582876, 경도 127.0001671
성신여자대학교: 위도 37.5912999, 경도 127.0221068
성균관대학교: 위도 37.588227, 경도 126.993606
가톨릭대학교: 위도 37.5857654, 경도 127.0048121
숭실대학교: 위도 37.4963538, 경도 126.9572222
세종대학교: 위도 37.5507583, 경도 127.0741682
홍익대학교: 위도 37.5507563, 경도 126.9254901
강서대학교: 위도 37.5483449, 경도 126.8547974
한국외국어대학교: 위도 37.5974453, 경도 127.0588002
광운대학교: 위도 37.6194277, 경도 127.05982
숙명여자대학교: 위도 37.54647500000001,

[{'대학명': '서울대학교', '면적': '4,317,000㎡', '위도': 37.4648267, '경도': 126.9571988},
 {'대학명': '연세대학교', '면적': '952,750㎡', '위도': 37.5663937, '경도': 126.9387066},
 {'대학명': '고려대학교',
  '면적': '946,177㎡',
  '위도': 37.58938759999999,
  '경도': 127.0324773},
 {'대학명': '이화여자대학교', '면적': '554,927㎡', '위도': 37.5618588, '경도': 126.9468339},
 {'대학명': '서울과학기술대학교', '면적': '504,922㎡', '위도': 37.6316684, '경도': 127.0774813},
 {'대학명': '건국대학교', '면적': '456,392㎡[62]', '위도': 37.5423265, '경도': 127.0759204},
 {'대학명': '서울시립대학교', '면적': '434,004㎡', '위도': 37.5838657, '경도': 127.0587771},
 {'대학명': '한양대학교', '면적': '401,729㎡', '위도': 37.5571759, '경도': 127.0454092},
 {'대학명': '삼육대학교', '면적': '319,537㎡', '위도': 37.6435824, '경도': 127.1063459},
 {'대학명': '서강대학교', '면적': '242,091㎡', '위도': 37.5509442, '경도': 126.9410023},
 {'대학명': '서울여자대학교', '면적': '225,020㎡', '위도': 37.6281126, '경도': 127.0904568},
 {'대학명': '국민대학교', '면적': '191,736㎡', '위도': 37.6108694, '경도': 126.9972889},
 {'대학명': '덕성여자대학교', '면적': '188,260㎡', '위도': 37.6512976, '경도': 127.0165728},
 {'대학명'

In [13]:
import pandas as pd

# 데이터를 DataFrame으로 변환
df = pd.DataFrame(university_locations)

# CSV 파일로 저장
df.to_csv("university_locations.csv", index=False, encoding="utf-8-sig")

print("CSV 파일이 저장되었습니다.")


CSV 파일이 저장되었습니다.
