In [7]:
import os
import requests
import pandas as pd
from dotenv import load_dotenv
import time
from tqdm.notebook import tqdm

In [None]:
def get_total_count(api_key):
    """전체 데이터 수를 조회하는 함수"""    
    url = f"http://openapi.seoul.go.kr:8088/{api_key}/json/tbLnOpendataRentV/1/1/2025"    
    try:
        response = requests.get(url)        
        data = response.json()        
        return data['tbLnOpendataRentV']['list_total_count']
    except Exception as e:
        print(f"데이터 수 조회 중 오류 발생: {e}")
        return 0

def get_rent_data(start_idx, end_idx,api_key):
    """임대차 정보를 조회하는 함수"""    
    url = f"http://openapi.seoul.go.kr:8088/{api_key}/json/tbLnOpendataRentV/{start_idx}/{end_idx}/2025"    
    print(url)
    try:
        response = requests.get(url)
        data = response.json()
        return data['tbLnOpendataRentV']['row']
    except Exception as e:
        print(f"데이터 조회 중 오류 발생: {e}")
        return []

In [None]:
# .env 파일에서 환경변수 로드
load_dotenv()
api_key = os.getenv('SEOUL_LANDMARK_API')    

# 전체 데이터 수 조회
total_count = int(get_total_count(api_key)*0.2)
print(f"전체 데이터 수: {total_count}")

if total_count == 0:    
    raise Exception("데이터를 가져올 수 없습니다.")

# 데이터를 저장할 리스트
all_data = []

# 전체 반복 횟수 계산
total_iterations = (total_count + 9) // 10  # 올림 나눗셈

# 10페이지씩 데이터 조회 (tqdm으로 진행률 표시)
page_size = 10
progress_bar = tqdm(range(1, total_count + 1, page_size), 
                   total=total_iterations,
                   desc="데이터 수집 진행률",
                   unit="페이지")

for start in progress_bar:
    end = min(start + page_size - 1, total_count)
    data = get_rent_data(start, end, api_key)
    all_data.extend(data)
    
    # 진행상황 업데이트 메시지
    progress_bar.set_postfix(현재=f"{start}~{end}")
    
    # API 호출 간격 조절
    time.sleep(0.5)

# 데이터프레임 생성
df = pd.DataFrame(all_data)

# CSV 파일로 저장
current_time = time.strftime("%Y%m%d_%H%M%S")
filename = f"seoul_rent_data_{current_time}.csv"
df.to_csv(filename, index=False, encoding='utf-8-sig')
print(f"데이터가 {filename}에 저장되었습니다.")

# 데이터 요약 정보 출력
print("\n데이터 요약:")
print(f"총 행 수: {len(df)}")
print("\n컬럼 정보:")
for col in df.columns:
    print(f"- {col}")

http://openapi.seoul.go.kr:8088/70794a6f4d70696138305243626973/json/tbLnOpendataRentV/1/1/2025
전체 데이터 수: 92065
전체 데이터 수: 92065


데이터 수집 진행률:   0%|          | 0/9207 [00:00<?, ?페이지/s]

http://openapi.seoul.go.kr:8088/70794a6f4d70696138305243626973/json/tbLnOpendataRentV/1/10/2025
http://openapi.seoul.go.kr:8088/70794a6f4d70696138305243626973/json/tbLnOpendataRentV/11/20/2025
http://openapi.seoul.go.kr:8088/70794a6f4d70696138305243626973/json/tbLnOpendataRentV/11/20/2025
http://openapi.seoul.go.kr:8088/70794a6f4d70696138305243626973/json/tbLnOpendataRentV/21/30/2025
http://openapi.seoul.go.kr:8088/70794a6f4d70696138305243626973/json/tbLnOpendataRentV/21/30/2025
http://openapi.seoul.go.kr:8088/70794a6f4d70696138305243626973/json/tbLnOpendataRentV/31/40/2025
http://openapi.seoul.go.kr:8088/70794a6f4d70696138305243626973/json/tbLnOpendataRentV/31/40/2025
http://openapi.seoul.go.kr:8088/70794a6f4d70696138305243626973/json/tbLnOpendataRentV/41/50/2025
http://openapi.seoul.go.kr:8088/70794a6f4d70696138305243626973/json/tbLnOpendataRentV/41/50/2025
http://openapi.seoul.go.kr:8088/70794a6f4d70696138305243626973/json/tbLnOpendataRentV/51/60/2025
http://openapi.seoul.go.kr:8088