In [None]:
import requests
import csv
import pandas as pd
import time
import os
from datetime import datetime

def get_cortar_no(dong_name):
    """동 이름으로 cortarNo(지역코드)를 찾는 함수"""
    try:
        # cortarList.csv 파일 경로 설정
        csv_path = os.path.join('cortarList/', 'cortarList.csv')
        print(f"파일위치는 '{csv_path}' 입니다.")
        # CSV 파일 읽기
        with open(csv_path, 'r', encoding='euc-kr') as file:
            reader = csv.reader(file)
            header = next(reader)  # 헤더 스킵
            
            # 동 이름으로 cortarNo 찾기
            for row in reader:
                print(f"동 리스트는 '{row[0]}' 입니다.")
                if dong_name in row[0]:  # 동 이름이 포함된 행 찾기
                    return row[1]  # cortarNo 반환
        
        print(f"'{dong_name}'에 대한 지역코드(cortarNo)를 찾을 수 없습니다.")
        return None
    
    except FileNotFoundError:
        print(f"오류: 'cortarList' 폴더 내의 'cortarList.csv' 파일을 찾을 수 없습니다.")
        return None
    except Exception as e:
        print(f"오류 발생: {e}")
        return None

def get_apartment_list(cortar_no):
    """지역코드(cortarNo)로 아파트 목록을 가져오는 함수"""
    # 요청에 필요한 쿠키 및 헤더 설정
    cookies = {
        'NAC': 'fy5GCABTmweeE',
        'NNB': 'POQIQ3VVBGUGO',
    }
    headers = {
        'accept': '*/*',
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/133.0.0.0 Safari/537.36',
    }
    params = {
        'cortarNo': cortar_no,
        'realEstateType': 'APT',
        'order': '',
    }
    
    # API 요청
    response = requests.get('https://new.land.naver.com/api/regions/complexes', params=params, cookies=cookies, headers=headers)

    # 응답 데이터 확인
    if response.status_code == 200:
        data = response.json()
        complexes = data.get('complexList', [])
        
        apartment_list = []
        for complex in complexes:
            apartment_list.append({
                'complexName': complex.get('complexName', ''),
                'complexNo': complex.get('complexNo', '')
            })
        
        # CSV 파일 저장 - 인코딩 수정: utf-8-sig에서 utf-8로 변경
        os.makedirs('processing', exist_ok=True)  # processing 폴더가 없는 경우 생성
        with open('processing/apartments.csv', 'w', newline='', encoding='utf-8') as file:
            writer = csv.writer(file)
            writer.writerow(['아파트명', 'Complex No'])
            
            for apartment in apartment_list:
                writer.writerow([apartment['complexName'], apartment['complexNo']])
        
        print(f"CSV 파일 저장 완료: apartments.csv (총 {len(apartment_list)}개 아파트)")
        return apartment_list
    else:
        print(f"API 요청 실패: {response.status_code}")
        return []

def get_floor_number(floor_info):
    """층수 정보를 숫자로 변환하는 함수"""
    if not floor_info or '/' not in floor_info:
        return None
    
    floor, _ = floor_info.split('/')
    if floor == '저':
        return 1
    elif floor == '중':
        return 7
    elif floor == '고':
        return 12
    try:
        return int(floor)
    except ValueError:
        return None

def convert_area_to_pyeong(area_m2):
    """제곱미터를 평으로 변환하는 함수"""
    return area_m2 / 3.3058

def convert_price_to_number(price_str):
    """가격 문자열을 숫자로 변환하는 함수"""
    if not price_str:
        return float('inf')
    
    parts = price_str.split()
    total = 0
    
    for part in parts:
        if '억' in part:
            total += int(part.replace('억', '')) * 10000
        else:
            total += int(part.replace(',', ''))
    
    return total

def get_real_estate_data(complex_id):
    """아파트 단지 ID로 매물 정보를 가져오는 함수"""
    cookies = {
        'NAC': 'fy5GCABTmweeE',
        'NNB': 'POQIQ3VVBGUGO',
        'nhn.realestate.article.rlet_type_cd': 'A01',
        'nhn.realestate.article.trade_type_cd': '""',
        'nhn.realestate.article.ipaddress_city': '4100000000',
        '_fwb': '2822mnjwK7KrhQ4ppK031c.1740097918618',
        'landHomeFlashUseYn': 'Y',
        'NACT': '1',
        'SRT30': '1740276799',
        'SRT5': '1740276799',
        'REALESTATE': 'Sun%20Feb%2023%202025%2011%3A13%3A36%20GMT%2B0900%20(Korean%20Standard%20Time)',
        'BUC': 'QuCnJVKpftzR-H_rr7vo3TIAIol2aZu562bx4tTBtZs=',
    }

    headers = {
        'accept': '*/*',
        'accept-language': 'ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7',
        'authorization': 'Bearer eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IlJFQUxFU1RBVEUiLCJpYXQiOjE3NDAyNzY4MTYsImV4cCI6MTc0MDI4NzYxNn0.eIaOAg5jFR_cprKYpljfa3gLn_h5eOiZZEKXt2XA91w',
        'priority': 'u=1, i',
        'referer': f'https://new.land.naver.com/complexes/{complex_id}',
        'sec-ch-ua': '"Not(A:Brand";v="99", "Google Chrome";v="133", "Chromium";v="133"',
        'sec-ch-ua-mobile': '?0',
        'sec-ch-ua-platform': '"Windows"',
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/133.0.0.0 Safari/537.36',
    }

    apartment_data = []
    
    # 두 가지 거래 유형 처리 (A1: 매매, B1: 전세)
    trade_types = [("A1", "매매"), ("B1", "전세")]
    
    for trade_type, trade_type_name in trade_types:
        for page in range(1, 6):  # 각 거래 유형별로 5페이지씩 조회
            url = f'https://new.land.naver.com/api/articles/complex/{complex_id}?realEstateType=APT&tradeType={trade_type}&page={page}'
            
            try:
                response = requests.get(url, cookies=cookies, headers=headers)
                response.raise_for_status()
                
                if not response.text.strip():  
                    print(f"🚨 빈 응답 (단지 ID: {complex_id}, 거래유형: {trade_type_name}, 페이지: {page})")
                    continue

                data = response.json()
                
                if 'articleList' not in data or not data['articleList']:
                    print(f"⚠️ 매물이 없습니다. (단지 ID: {complex_id}, 거래유형: {trade_type_name}, 페이지: {page})")
                    break
                
                for article in data['articleList']:
                    floor = get_floor_number(article.get('floorInfo', ''))
                    area_pyeong = round(convert_area_to_pyeong(article.get('area1', 0)), 1)
                    
                    # 층수 정보에 동 정보 추가
                    floor_info = article.get('floorInfo', '')
                    building_info = article.get('buildingName', '')  # 동 정보 가져오기
                    
                    # 동 정보가 있으면 층수 정보에 추가
                    combined_floor_info = floor_info
                    if building_info:
                        combined_floor_info = f"{floor_info} ({building_info})"
                    
                    if floor is not None and (floor >= 4 or article.get('floorInfo', '').split('/')[0] in ['중', '고']):
                        article_data = {
                            '아파트명': article.get('articleName', ''),
                            '가격': article.get('dealOrWarrantPrc', ''),
                            '가격_정렬용': convert_price_to_number(article.get('dealOrWarrantPrc', '')),
                            '면적(평)': area_pyeong,
                            '방과욕실수': article.get('areaName', ''),  # 방/욕실 정보
                            '공급면적': article.get('area1', 0),  # 공급면적(m²)
                            '전용면적': article.get('area2', 0),  # 전용면적(m²)
                            '층수': combined_floor_info,  # 동 정보가 포함된 층수 정보
                            '방향': article.get('direction', ''),
                            '특징': article.get('articleFeatureDesc', '정보 없음'),
                            '거래유형': trade_type_name,  # 거래 유형 (매매, 전세)
                        }
                        
                        apartment_data.append(article_data)
            
            except requests.exceptions.RequestException as e:
                print(f"요청 오류: {e}")
                continue
            except ValueError as e:
                print(f"데이터 처리 오류: {e}")
                continue
            
            time.sleep(1)  # API 요청 간 딜레이

    return apartment_data

def create_complex_excel(apartment_list):
    """아파트 목록을 엑셀 파일로 변환하는 함수"""
    df = pd.DataFrame(apartment_list)
    df.columns = ['아파트명', 'complex_id']  # 열 이름 변경
    
    # 엑셀 파일로 저장
    excel_path = 'TotalComplexIDtest.xlsx'
    with pd.ExcelWriter(excel_path, engine='openpyxl') as writer:
        df.to_excel(writer, sheet_name='아파트목록', index=False)
    
    print(f"엑셀 파일 저장 완료: {excel_path}")
    return excel_path

def process_apartments_by_dong(dong_name):
    """동 이름으로 아파트 정보를 찾는 메인 함수 - 매매는 최저가, 전세는 최고가 기준"""
    try:
        print(f"🔍 '{dong_name}' 지역의 아파트 검색을 시작합니다...")
        
        # 1. 동 이름으로 cortarNo 찾기
        cortar_no = get_cortar_no(dong_name)
        if not cortar_no:
            return
        
        print(f"✅ '{dong_name}'의 지역코드(cortarNo): {cortar_no}")
        
        # 2. 해당 지역의 아파트 목록 가져오기
        apartment_list = get_apartment_list(cortar_no)
        if not apartment_list:
            print("아파트 목록을 가져오지 못했습니다.")
            return
        
        # 3. 아파트 목록을 엑셀 파일로 변환 (process_all_apartments 함수가 엑셀 파일을 필요로 함)
        excel_path = create_complex_excel(apartment_list)
        
        # 3. 결과 디렉토리 확인 및 생성
        result_dir = 'result'
        if not os.path.exists(result_dir):
            os.makedirs(result_dir)
        
        # 현재 날짜를 가져와서 파일명에 사용할 형식으로 변환
        current_date = datetime.now().strftime('%Y%m%d_%H:%M')
        output_filename = f'{result_dir}/{dong_name}_price_result_{current_date}.xlsx'
        
        # 4. 각 아파트의 매물 정보 수집
        all_data = []
        print(f"\n📌 '{dong_name}' 지역 아파트 매물 수집 시작...")
        
        for idx, apartment in enumerate(apartment_list, 1):
            complex_id = apartment['complexNo']
            apartment_name = apartment['complexName']
            print(f"▶ [{idx}/{len(apartment_list)}] {apartment_name} (ID: {complex_id}) 처리 중...")
            
            data = get_real_estate_data(complex_id)
            if data:
                all_data.extend(data)
                print(f"  ✓ {len(data)}개 매물 정보 수집 완료")
            else:
                print(f"  ✗ 매물 정보 없음")
            
            time.sleep(2)  # API 요청 간 딜레이
        
        # 5. 수집한 데이터 처리 및 저장
        if all_data:
            # 데이터를 DataFrame으로 변환
            df = pd.DataFrame(all_data)
            
            # 매매와 전세 데이터 분리
            sale_df = df[df['거래유형'] == '매매'].copy()
            jeonse_df = df[df['거래유형'] == '전세'].copy()
            
            # 엑셀 파일 작성 준비
            with pd.ExcelWriter(output_filename, engine='openpyxl') as writer:
                # 1. 매매 정보 시트 생성 (타입별 최저가)
                if not sale_df.empty:
                    # 평형별 그룹화하여 최저가 선택
                    min_price_sale = sale_df.loc[sale_df.groupby(['아파트명', '면적(평)'])['가격_정렬용'].idxmin()]
                    min_price_sale = min_price_sale.drop('가격_정렬용', axis=1)
                    min_price_sale = min_price_sale.rename(columns={'가격': '매매가격'})
                    
                    # 결과를 저장
                    min_price_sale.to_excel(writer, sheet_name='매매', index=False)
                    print(f"✅ 매매 최저가 데이터 저장 완료 (총 {len(min_price_sale)}개 매물)")
                else:
                    # 매매 데이터가 없는 경우 빈 DataFrame 저장
                    pd.DataFrame(columns=['아파트명', '매매가격', '면적(평)', '방과욕실수', '공급면적', '전용면적', '층수', '방향', '특징']).\
                        to_excel(writer, sheet_name='매매', index=False)
                    print("⚠️ 매매 데이터가 없습니다.")
                
                # 2. 전세 정보 시트 생성 (타입별 최고가)
                if not jeonse_df.empty:
                    # 평형별 그룹화하여 최고가 선택 (idxmin에서 idxmax로 변경)
                    max_price_jeonse = jeonse_df.loc[jeonse_df.groupby(['아파트명', '면적(평)'])['가격_정렬용'].idxmax()]
                    max_price_jeonse = max_price_jeonse.drop('가격_정렬용', axis=1)
                    max_price_jeonse = max_price_jeonse.rename(columns={'가격': '전세가격'})
                    
                    # 결과를 저장
                    max_price_jeonse.to_excel(writer, sheet_name='전세', index=False)
                    print(f"✅ 전세 최고가 데이터 저장 완료 (총 {len(max_price_jeonse)}개 매물)")
                else:
                    # 전세 데이터가 없는 경우 빈 DataFrame 저장
                    pd.DataFrame(columns=['아파트명', '전세가격', '면적(평)', '방과욕실수', '공급면적', '전용면적', '층수', '방향', '특징']).\
                        to_excel(writer, sheet_name='전세', index=False)
                    print("⚠️ 전세 데이터가 없습니다.")
                
            print(f"\n✅ 모든 데이터 저장 완료! 파일명: {output_filename}")
        else:
            print("\n❌ 저장할 데이터가 없습니다.")
            
    except Exception as e:
        print(f"오류 발생: {e}")


if __name__ == "__main__":
    print(f"⏳ 실행 날짜: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")

    # 사용자로부터 동 이름 입력 받기
    dong_name = input("동 이름을 입력하세요 (예: 망포동, 동천동): ")
    
    # 입력받은 동 이름으로 아파트 최저가 검색 실행
    process_apartments_by_dong(dong_name)

⏳ 실행 날짜: 2025-03-01 11:07:14
🔍 '화도읍' 지역의 아파트 검색을 시작합니다...
파일위치는 'cortarList/cortarList.csv' 입니다.
동 리스트는 '망포동' 입니다.
동 리스트는 '매탄동' 입니다.
동 리스트는 '신동' 입니다.
동 리스트는 '영통동' 입니다.
동 리스트는 '원천동' 입니다.
동 리스트는 '이의동' 입니다.
동 리스트는 '하동' 입니다.
동 리스트는 '화도읍' 입니다.
✅ '화도읍'의 지역코드(cortarNo): 4136025600
CSV 파일 저장 완료: apartments.csv (총 55개 아파트)
엑셀 파일 저장 완료: TotalComplexIDtest.xlsx

📌 '화도읍' 지역 아파트 매물 수집 시작...
▶ [1/55] 경향 (ID: 8220) 처리 중...
⚠️ 매물이 없습니다. (단지 ID: 8220, 거래유형: 매매, 페이지: 2)
⚠️ 매물이 없습니다. (단지 ID: 8220, 거래유형: 전세, 페이지: 1)
  ✓ 6개 매물 정보 수집 완료
▶ [2/55] 광원4차 (ID: 133723) 처리 중...
⚠️ 매물이 없습니다. (단지 ID: 133723, 거래유형: 매매, 페이지: 2)
⚠️ 매물이 없습니다. (단지 ID: 133723, 거래유형: 전세, 페이지: 1)
  ✗ 매물 정보 없음
▶ [3/55] 남양주녹촌두산위브 (ID: 18951) 처리 중...
⚠️ 매물이 없습니다. (단지 ID: 18951, 거래유형: 매매, 페이지: 3)
⚠️ 매물이 없습니다. (단지 ID: 18951, 거래유형: 전세, 페이지: 3)
  ✓ 51개 매물 정보 수집 완료
▶ [4/55] 남양주두산위브트레지움 (ID: 120597) 처리 중...
⚠️ 매물이 없습니다. (단지 ID: 120597, 거래유형: 전세, 페이지: 2)
  ✓ 106개 매물 정보 수집 완료
▶ [5/55] 남양주라온프라이빗1단지 (ID: 114585) 처리 중...
⚠️ 매물이 없습니다. (단지 ID: 114585, 거래유형

: 