## 도소매업 강원도 (읍면동)
## https://bigdata-sme.kr/#/datastore/detail/statistics/DATASET_SUNDO_52

In [8]:
import requests
import pandas as pd
import json
import os
from dotenv import load_dotenv
import time # API 서버 부하를 줄이기 위해 time 라이브러리 추가

# --- dotenv 설정 ---
load_dotenv()
api_key = os.getenv("wholesale_retail_key")
if not api_key:
    print("❌ 오류: .env 파일에서 'wholesale_retail_key' 키를 찾을 수 없습니다.")
else:
    url = "https://dataapi.wehago.com/data/"
    headers = {
        "apicode": api_key
    }
    
    # --- 반복문 로직 ---
    all_data_list = []  # 모든 데이터를 저장할 빈 리스트 (장바구니)
    start_index = 0
    chunk_size = 500    # 한 번에 요청할 개수 (0~499는 500개)

    print("데이터 수집을 시작합니다...")

    while True:
        # 1. 'from'과 'to' 파라미터를 동적으로 설정
        params = {
            "dataset_key": "DATASET_SUNDO_52",
            "from": start_index,
            "to": start_index + chunk_size - 1
        }
        
        print(f"  -> {start_index}부터 {start_index + chunk_size - 1}까지 요청 중...")

        try:
            response = requests.get(url, headers=headers, params=params)

            if response.status_code == 200:
                data = response.json()
                
                # 2. 'data' 키에서 실제 데이터 리스트를 가져옴
                data_chunk = data.get('data') # .get()을 사용하면 'data' 키가 없어도 오류 안남

                # 3. 데이터가 비어있는지 확인
                if not data_chunk:
                    # 서버가 빈 리스트([])를 반환하면, 더 이상 데이터가 없다는 의미
                    print("✅ 모든 데이터를 수집했습니다. 반복을 종료합니다.")
                    break
                
                # 4. (중요) 가져온 데이터를 '장바구니' 리스트에 추가
                all_data_list.extend(data_chunk)
                
                # 5. 다음 루프를 위해 시작 인덱스 업데이트
                start_index += chunk_size
                
                # (권장) API 서버에 대한 예의로, 요청 사이에 짧은 휴식 추가
                time.sleep(0.1) # 0.1초 대기

            else:
                # API 호출 자체가 실패한 경우 (400, 404, 500 등)
                print(f"❌ 오류 발생 (Status Code: {response.status_code})")
                print(response.text)
                break # 오류 발생 시 반복 중단

        except requests.exceptions.RequestException as e:
            print(f"연결 중 오류가 발생했습니다: {e}")
            break # 오류 발생 시 반복 중단

    # --- 반복문 종료 후 ---
    if all_data_list:
        # 6. '장바구니'에 모아둔 모든 데이터를 하나의 DataFrame으로 변환
        df_total = pd.DataFrame(all_data_list)
        
        print("\n--- 최종 DataFrame 변환 결과 ---")
        print(f"총 {len(df_total)}개의 행(row)을 가져왔습니다.")
        print(df_total.head())
    else:
        print("\n가져온 데이터가 없습니다.")

데이터 수집을 시작합니다...
  -> 0부터 499까지 요청 중...
  -> 500부터 999까지 요청 중...
✅ 모든 데이터를 수집했습니다. 반복을 종료합니다.

--- 최종 DataFrame 변환 결과 ---
총 139개의 행(row)을 가져왔습니다.
   index CTPRVN_CODE SIGNGU_CODE EMD_CODE STLE_SE_CODE INDUST_LCLAS_CODE  \
0      0          22          10       54            1                 G   
1      1          22          10       56            1                 G   
2      2          22          10       59            1                 G   
3      3          22          10       61            1                 G   
4      4          22          10       62            1                 G   

  ONLINE_TRADE_EXST_ENNC  BULD_TOTAL_SUM  BULD_POSESN_TOTAL  BULD_LEASE_TOTAL  \
0                      N         45597.0             6010.0           39326.0   
1                      N        237584.0            65090.0          169282.0   
2                      N        271246.0           184305.0           62728.0   
3                      N         66741.0            29793.0           357

In [9]:
df_total.to_csv('읍면동_도소매업.csv')

In [5]:
import os
print(os.getcwd())

/workspaces/company_data/first_week


In [None]:
!pip install dotenv 