In [None]:
import requests
import pandas as pd
import time
import os
from datetime import datetime

def get_floor_number(floor_info):
    if not floor_info or '/' not in floor_info:
        return None
    
    floor, _ = floor_info.split('/')
    if floor == '저':
        return 1
    elif floor == '중':
        return 7
    elif floor == '고':
        return 12
    try:
        return int(floor)
    except ValueError:
        return None

def convert_area_to_pyeong(area_m2):
    return area_m2 / 3.3058

def convert_price_to_number(price_str):
    if not price_str:
        return float('inf')
    
    parts = price_str.split()
    total = 0
    
    for part in parts:
        if '억' in part:
            total += int(part.replace('억', '')) * 10000
        else:
            total += int(part.replace(',', ''))
    
    return total

def get_real_estate_data(complex_id):
    cookies = {
        'NAC': 'fy5GCABTmweeE',
        'NNB': 'POQIQ3VVBGUGO',
        'nhn.realestate.article.rlet_type_cd': 'A01',
        'nhn.realestate.article.trade_type_cd': '""',
        'nhn.realestate.article.ipaddress_city': '4100000000',
        '_fwb': '2822mnjwK7KrhQ4ppK031c.1740097918618',
        'landHomeFlashUseYn': 'Y',
        'NACT': '1',
        'SRT30': '1740276799',
        'SRT5': '1740276799',
        'REALESTATE': 'Sun%20Feb%2023%202025%2011%3A13%3A36%20GMT%2B0900%20(Korean%20Standard%20Time)',
        'BUC': 'QuCnJVKpftzR-H_rr7vo3TIAIol2aZu562bx4tTBtZs=',
    }

    headers = {
        'accept': '*/*',
        'accept-language': 'ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7',
        'authorization': 'Bearer eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpZCI6IlJFQUxFU1RBVEUiLCJpYXQiOjE3NDAyNzY4MTYsImV4cCI6MTc0MDI4NzYxNn0.eIaOAg5jFR_cprKYpljfa3gLn_h5eOiZZEKXt2XA91w',
        'priority': 'u=1, i',
        'referer': 'https://new.land.naver.com/complexes/109412',
        'sec-ch-ua': '"Not(A:Brand";v="99", "Google Chrome";v="133", "Chromium";v="133"',
        'sec-ch-ua-mobile': '?0',
        'sec-ch-ua-platform': '"Windows"',
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/133.0.0.0 Safari/537.36',
    }

    apartment_data = []
    
    for page in range(1, 6):
        url = f'https://new.land.naver.com/api/articles/complex/{complex_id}?realEstateType=APT&tradeType=A1&page={page}'
        
        try:
            response = requests.get(url, cookies=cookies, headers=headers)
            response.raise_for_status()
            
            if not response.text.strip():  
                print(f"🚨 빈 응답 (단지 ID: {complex_id}, 페이지: {page})")
                continue

            data = response.json()
            
            if 'articleList' not in data or not data['articleList']:
                print(f"⚠️ 매물이 없습니다. (단지 ID: {complex_id}, 페이지: {page})")
                break
            
            for article in data['articleList']:
                floor = get_floor_number(article.get('floorInfo', ''))
                area_pyeong = round(convert_area_to_pyeong(article.get('area1', 0)), 1)
                
                if floor is not None and (floor >= 4 or article.get('floorInfo', '').split('/')[0] in ['중', '고']):
                    article_data = {
                        '아파트명': article.get('articleName', ''),
                        '가격': article.get('dealOrWarrantPrc', ''),
                        '가격_정렬용': convert_price_to_number(article.get('dealOrWarrantPrc', '')),
                        '면적(평)': area_pyeong,
                        '방과욕실수': article.get('areaName', ''),  # 방/욕실 정보
                        '공급면적': article.get('area1', 0),  # 공급면적(m²)
                        '전용면적': article.get('area2', 0),  # 전용면적(m²)
                        '층수': article.get('floorInfo', ''),
                        '방향': article.get('direction', ''),
                        '특징': article.get('articleFeatureDesc', '정보 없음')
                    }
                    
                    apartment_data.append(article_data)
        
        except requests.exceptions.RequestException:
            continue
        except ValueError:
            continue
        
        time.sleep(1)  

    return apartment_data

def process_all_apartments():
    try:
        file_path = 'TotalComplexIDtest.xlsx'
        
        # 현재 날짜를 가져와서 파일명에 사용할 형식으로 변환
        current_date = datetime.now().strftime('%Y%m%d')
        
        # 결과 디렉토리 확인 및 생성
        result_dir = 'result'
        if not os.path.exists(result_dir):
            os.makedirs(result_dir)
            
        output_filename = f'{result_dir}/price_result_{current_date}.xlsx'
        
        # 엑셀 파일의 모든 시트 읽기
        xls = pd.ExcelFile(file_path)
        all_data = []
        
        for sheet_name in xls.sheet_names:
            print(f"\n📋 시트 '{sheet_name}' 처리 중...")
            
            # 현재 시트에서 데이터 읽기
            apt_df = pd.read_excel(file_path, sheet_name=sheet_name)
            
            if 'complex_id' not in apt_df.columns:
                print(f"❌ 시트 '{sheet_name}'에 'complex_id' 열이 없습니다. 건너뜁니다.")
                continue
                
            print(f"\n📌 '{sheet_name}' 시트에서 데이터 수집 시작...")
            idx = 0
            
            for _, row in apt_df.iterrows():
                idx = idx + 1
                complex_id = str(row['complex_id'])
                print(f"▶ [{idx}] 단지 ID: {complex_id} 처리 중...")

                data = get_real_estate_data(complex_id)
                if data:
                    all_data.extend(data)
                
                time.sleep(2)

        if all_data:
            # 데이터를 DataFrame으로 변환
            df = pd.DataFrame(all_data)
            
            # 평형별 그룹화하여 최저가 선택
            # '아파트명'과 '면적(평)'으로 그룹화하고 가격_정렬용이 최소인 항목 선택
            min_price_df = df.loc[df.groupby(['아파트명', '면적(평)'])['가격_정렬용'].idxmin()]
            
            # 필요없는 정렬용 가격 컬럼 제거
            min_price_df = min_price_df.drop('가격_정렬용', axis=1)
            
            # 결과를 엑셀 파일로 저장 (시트 이름 지정)
            min_price_df.to_excel(output_filename, sheet_name='아파트가격정보', index=False)
            print(f"✅ 데이터 저장 완료! 파일명: {output_filename}")
            print(f"✅ 총 {len(min_price_df)}개의 최저가 매물 정보가 저장되었습니다.")
        else:
            print("❌ 저장할 데이터가 없습니다.")
            
    except Exception as e:
        print(f"오류 발생: {e}")

if __name__ == "__main__":
    print(f"⏳ 실행 날짜: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")
    process_all_apartments()

⏳ 실행 날짜: 2025-02-28 11:20:23

📋 시트 '동천동' 처리 중...

📌 '동천동' 시트에서 데이터 수집 시작...
▶ [1] 단지 ID: 8652 처리 중...
⚠️ 매물이 없습니다. (단지 ID: 8652, 페이지: 4)
▶ [2] 단지 ID: 10144 처리 중...
⚠️ 매물이 없습니다. (단지 ID: 10144, 페이지: 3)
▶ [3] 단지 ID: 3705 처리 중...
⚠️ 매물이 없습니다. (단지 ID: 3705, 페이지: 4)

📋 시트 '망포동' 처리 중...

📌 '망포동' 시트에서 데이터 수집 시작...
▶ [1] 단지 ID: 12045 처리 중...
▶ [2] 단지 ID: 3988 처리 중...
▶ [3] 단지 ID: 3991 처리 중...
✅ 데이터 저장 완료! 파일명: result/price_result_20250228.xlsx
