# 🧑‍💻 정적 웹 크롤링 실습 (requests + BeautifulSoup)
전시 산업 사이트를 활용한 정적 크롤링 실습입니다.

## 🗂️ 학습 목표
- `requests`와 `BeautifulSoup`을 이용한 정적 웹 크롤링 이해
- HTML 구조 파악 및 CSS 선택자 사용
- 전시회 사이트에서 정보 추출


In [None]:
# ✅ 필요한 라이브러리 설치
!pip install requests beautifulsoup4 pandas

## 예제 1: `https://www.anuga.com/` 타이틀 가져오기

In [None]:
import requests
from bs4 import BeautifulSoup

url = "https://www.anuga.com/"
res = requests.get(url)
soup = BeautifulSoup(res.text, "html.parser")

# 페이지 제목 출력
print("페이지 제목:", soup.title.text)


## 예제 2: `https://www.interzoo.com/en` 출품사 리스트 추출

In [None]:
url = "https://www.interzoo.com/en/exhibitor-list"

res = requests.get(url)
soup = BeautifulSoup(res.text, "html.parser")

# 출품사 이름 추출 예시 (정확한 selector는 실제 확인 필요)
companies = soup.select(".exhibitor-list-entry .title")

for idx, c in enumerate(companies[:10], 1):
    print(f"{idx}. {c.text.strip()}")


## 예제 3: 출품사 이름 + 링크 + 설명 추출 후 CSV 저장

In [None]:
import pandas as pd

data = []

cards = soup.select(".exhibitor-list-entry")
for card in cards[:10]:  # 상위 10개만 추출
    name = card.select_one(".title").text.strip() if card.select_one(".title") else "N/A"
    link = card.select_one("a")["href"] if card.select_one("a") else "N/A"
    desc = card.select_one(".description").text.strip() if card.select_one(".description") else "N/A"
    
    data.append({
        "Name": name,
        "Link": f"https://www.interzoo.com{link}" if "http" not in link else link,
        "Description": desc
    })

df = pd.DataFrame(data)
df.to_csv("interzoo_exhibitors.csv", index=False, encoding="utf-8-sig")
print("✅ CSV 저장 완료")

## 📥 Colab에서 CSV 파일 다운로드

In [None]:
from google.colab import files
files.download("interzoo_exhibitors.csv")