In [16]:
import requests
from bs4 import BeautifulSoup
import csv
import time

BASE_URL = "https://www.all-con.co.kr/view/contest/"
HEADERS = {"User-Agent": "Mozilla/5.0"}

def get_contest_detail(contest_id):
    url = f"{BASE_URL}{contest_id}"
    res = requests.get(url, headers=HEADERS)

    if res.status_code != 200:
        return None  # 존재하지 않는 공모전이면 skip

    soup = BeautifulSoup(res.text, 'html.parser')

    title_tag = soup.select_one("div.contest_title_wrap h1")
    dday_tag = soup.select_one("span.cl_dday")
    content_tag = soup.select_one("div#contest_body")
    image_tag = soup.select_one("div.contest_poster img")
    pdf_tag = soup.select_one("a[href$='.pdf']")

    return {
        "title": title_tag.get_text(strip=True) if title_tag else "N/A",
        "date": dday_tag.get_text(strip=True) if dday_tag else "N/A",
        "content": content_tag.get_text("\n", strip=True) if content_tag else "N/A",
        "image_url": "https://www.all-con.co.kr" + image_tag['src'] if image_tag else "",
        "pdf_url": "https://www.all-con.co.kr" + pdf_tag['href'] if pdf_tag else "",
        "detail_url": url
    }

# 🔁 ID 범위 순회
all_data = []
list1=[525865, 525856, 525855, 525852, 525851, 525845, 
       525844, 525840, 525837, 525831, 525815, 525809
]
for contest_id in list1:
    print(f"🔍 Fetching ID {contest_id}...")
    try:
        detail = get_contest_detail(contest_id)
        if detail:
            all_data.append(detail)
            print(f"✔️ {detail['title']}")
        else:
            print("❌ 페이지 없음 또는 잘못된 ID")
        time.sleep(0.3)  # 너무 빠른 접근 방지
    except Exception as e:
        print(f"⚠️ Error ID {contest_id}: {e}")

# 📄 CSV 저장
with open("contest_id_range_crawl.csv", "w", newline="", encoding="utf-8-sig") as f:
    writer = csv.DictWriter(f, fieldnames=[
        "title", "date", "content", "image_url", "pdf_url", "detail_url"
    ])
    writer.writeheader()
    writer.writerows(all_data)

print("✅ 크롤링 완료: contest_id_range_crawl.csv 저장됨")


🔍 Fetching ID 525865...
✔️ 제2회 여수 국제 웹드라마 영화제 작품 공모
🔍 Fetching ID 525856...
✔️ 2025년 「새마을금고연구」 논몬 공모
🔍 Fetching ID 525855...
✔️ 2025 스컬피아 신진작가 공모전 (2025 Sculpia Rising Artist Festa - SRAF)
🔍 Fetching ID 525852...
✔️ 2025 울산조선해양축제 기발한 배 콘테스트&아이디어 공모전
🔍 Fetching ID 525851...
✔️ 2025 축산유통 국민참여 혁신 경진대회
🔍 Fetching ID 525845...
✔️ 2025년 아태기후센터 기후위기 숏폼 공모전
🔍 Fetching ID 525844...
✔️ 「자연을 걷고, 순간을 담다. 」전북 생태관광 및 천리길 사진 및 숏폼 공모전
🔍 Fetching ID 525840...
✔️ 충청광역연합 새 얼굴 심벌(CI) 디자인 공모전
🔍 Fetching ID 525837...
✔️ 2025년 강원특별자치도 규제개선 과제 공모
🔍 Fetching ID 525831...
✔️ 『오구오구 동대문』2025 동대문구 59초 숏폼 공모전
🔍 Fetching ID 525815...
✔️ 해군 카카오톡 이모티콘 공모전
🔍 Fetching ID 525809...
✔️ 2025년 소상공인365,공공데이터 숏폼 영상 공모전
✅ 크롤링 완료: contest_id_range_crawl.csv 저장됨


In [17]:
import csv

# 기존 크롤링된 데이터 불러오기
input_file = "contest_id_range_crawl.csv"
output_file = "filtered_contest_data.csv"

filtered_rows = []

# 데이터 읽기 & 필터링
with open(input_file, newline='', encoding='utf-8-sig') as infile:
    reader = csv.DictReader(infile)
    for row in reader:
        if row["제목"] != "N/A":
            filtered_rows.append(row)

# 필터링된 데이터 저장
with open(output_file, "w", newline='', encoding='utf-8-sig') as outfile:
    writer = csv.DictWriter(outfile, fieldnames=reader.fieldnames)
    writer.writeheader()
    writer.writerows(filtered_rows)

print(f"✅ 제목이 'N/A'인 항목을 제거하고 저장 완료: {output_file}")


✅ 제목이 'N/A'인 항목을 제거하고 저장 완료: filtered_contest_data.csv
