In [2]:
import json
from time import sleep
import requests
import pandas as pd

In [3]:
# ID로 문제정보 가져오기
def get_problemData(problem_id):
    """
     solved.ac에서 문제 정보를 받아옴
     too_many_request 에러가 발생하면 중단
     존재하지 않는 문제의 경우 예외 발생
     100번째마다 로그 출력
    """
    try:
        url = f"https://solved.ac/api/v3/problem/show?problemId={problem_id}"
        r_profile = requests.get(url)
        if r_profile.status_code == requests.codes.too_many_requests: 
            return False
        
        profile = json.loads(r_profile.content.decode('utf-8'))
        tag = ""
        tags = profile.get("tags")
        for t in tags:
            tag += t['key'] +','
            
        problem = \
                {
                    "problemId": profile.get("problemId"),
                    "titleKo": profile.get("titleKo"),
                    "isSolvable": profile.get("isSolvable"),
                    "isPartial" : profile.get("isPartial"),
                    "acceptedUserCount" : profile.get("acceptedUserCount"),
                    "level" : profile.get("level"),
                    "votedUserCount" : profile.get("votedUserCount"),
                    "sprout" : profile.get("sprout"),
                    "givesNoRating" : profile.get("givesNoRating"),
                    "isLevelLocked" : profile.get("isLevelLocked"),
                    "averageTries" : profile.get("averageTries"),
                    "official" : profile.get("official"),
                    "tag" : tag
                }
        if problem_id % 100 == 0:
            print(f"Completed {problem_id}")
            
        return problem
    
    except Exception as e:    
        print(f'{problem_id}에서 예외가 발생했습니다.', e)

# ID로 문제정보를 가져오고 데이터 프레임 및 엑셀파일로 저장
def run_problemData(start,end): 
    """
     solved.ac에서 문제정보를 받아옴
     입력 파라미터 start번부터 end번까지의 문제 정보를 받아옴
     too_many_request 에러가 발생하면 500초 동안 중단
     모두 받아온 후에 result 폴더를 생성한 뒤 data.csv로 저장
    """
    allProblem = []

    for id in range(start,end+1):

        result = get_problemData(id)
        if result == False: 
            print(f"{id}번째 처리 중 Error 429 발생")
            sleep(500)
        else:
            allProblem.append(result)

    df = pd .DataFrame()
    for pro in allProblem:
        df = df.append(pro,ignore_index = True)
    df.to_csv("result/data.csv")


In [4]:
run_problemData(16000,25000)

Completed 16000
Completed 16100
Completed 16200
Completed 16300
Completed 16400
Completed 16500
Completed 16600
Completed 16700
Completed 16800
Completed 16900
16901번째 처리 중 Error 429 발생
16902번째 처리 중 Error 429 발생
16962에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
16963에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
Completed 17000
17061에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
17062에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
17063에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
17064에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
17065에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
17066에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
17067에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
17068에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
Completed 17100
17125에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
17183에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
17189에서 예외가 

24216에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
24217에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
Completed 24300
Completed 24400
Completed 24500
Completed 24600
Completed 24700
Completed 24800
24898에서 예외가 발생했습니다. Expecting value: line 1 column 1 (char 0)
Completed 24900
Completed 25000
