In [3]:
import requests
from concurrent.futures import ThreadPoolExecutor
from bs4 import BeautifulSoup
from tqdm import tqdm

In [4]:
def retrieve_article(url):
    try:
        response = requests.get(url)
        response.raise_for_status()  # 페이지 요청이 성공한 경우에만 진행
        soup = BeautifulSoup(response.text, 'html.parser')
        article = soup.select("#__next > div > div.toktok-details_container___FDIt > p")
        article_text = [elem.text.replace('\n', '') for elem in article]  # '\n'을 빈 문자열로 대체
        return article_text
    except (requests.exceptions.RequestException, requests.exceptions.HTTPError):
        return None

In [5]:
# 크롤링할 URL 리스트
urls = [f"https://www.mongseng.io/toktok/{i}" for i in range(42016, 0, -1)]

# 결과를 저장할 리스트 생성
mongseng_question_list = []

# ThreadPoolExecutor를 사용하여 멀티스레딩으로 크롤링 작업 실행
with ThreadPoolExecutor() as executor:
    # 진행 상태 바 생성
    with tqdm(total=len(urls)) as pbar:
        # 각 URL을 병렬로 처리
        results = [executor.submit(retrieve_article, url) for url in urls]

        # 결과 확인 및 진행 상태 업데이트
        for result in results:
            if result.result():
                mongseng_question_list.append(result.result())
            pbar.update(1)

  0%|          | 0/42016 [00:00<?, ?it/s]

  1%|          | 284/42016 [00:36<1:13:32,  9.46it/s]

In [None]:
# 결과 추출
mongseng_question_list = [result.result() for result in mongseng_question_list if result.result()]

# 결과 출력
for article_text in mongseng_question_list[10]:
    print(article_text)

['이제 8개월 다 되는 미니비숑인데자기가 싼 똥을 여기저기 밟고다녀요...왜그러는지 아시는분 계실까요?😭아직 배변훈련은 70프로 정도입니다...']
['로얄캐닌에서 넘어가려고 어제 샘플사료 10개 넘게 먹여봤는데알갱이가 조금만 크다 싶으면 퉤퉤~!!연어가 들어간건 귀신같이 알고 퉤퉤~!!엄마 지갑사정 고려해주느라 비싼것도 퉤퉤~!!😆결국 아그작아그작 맛나게 씹어먹는건 밥이보약 건강한성장이랑 네추럴코어네요ㅎㅎ그런데 저는 아무리 성분비교를 해봐도 잘 모르겠더라구요.. 닭은 알러지 유발 원료라서 잘 안먹이신다고 알고있는데..고민이에요ㅠㅠ 어떤게 나을까요??ㅠㅠ']
['4개월 넘은 고양이인데 놀다가 지혼자 흥분이 주체가 안돼서 막 겁나 뛰어댕기다가 막 가족들 발 물고 그러는데 다른 고양이들도 그러나요..? ']
['애기가 7개월이 되어가고 안그러더니 산책맛을 알아버린건지 아빠가 나갈땐 슥처다만보고 따라가다가 다시돌아오지만 저는 옷갈아입으면 나가는줄 아는지 중문앞에 서있어요ㅋㅋㅋ 그래서 터그해주고 노즈워크해주고 관심돌려주고 소리없이 나갈라해도 어느샌가 문앞에 서있어요 그리고 들여다놓으면 짖어요;;;  아빠는 안그러는데 말이죠 저만그래요ㅠ 짖다가 조용해지기는 하는데 그래도 그시간이 안쓰러우니...  교정할 방법 없나요..?']
['콩이가  가는 동물병원 원장님은 뭐든 안하시는걸 좋아하시는 분입니다ᆢ ㅎ말이 좀 이상하긴 한데ᆢ약도 최대한 작게 먹이고ᆢ 진료도 검사 많이 안하시고ᆢ암튼 다른 분들과 제일 다른점은 심장 사상충약인데ᆢ먹이지 말라하셔요ᆢ모기랑 외부진드기에 안물리면 되는거니ᆢ 평소 산책다닐때 해충기피제 사용하고시중에 판매되는 기생충약중 내외부를 전부 100프로 잡아주는 약은 없다시며ᆢ (인터넷에 기생충약별 잡을수있는 종류 표 있어요)내부 다 잡을 수 있는 드론탈플러스만 먹이는걸 권장하십니다ᆢ것두 6개월에 한번ᆢ ㅎ다시 본론으로 와서ᆢ심장사상충약이 너무 독해 간에 무리가 많이가서 병원어 마비되어 애들이 많다느 에피소드와 함께ᆢ긴글이 적힌 사진을 보내주셨어요ᆢ 보시고