### (1) 도서 정보 크롤링

[All products | Books to Scrape - Sandbox](https://books.toscrape.com/)

- 위 사이트에서 카테고리별로 책 정보를 수집합니다.
- 수집한 데이터는 json 파일에 저장합니다.
- 책 정보 수집을 위해 필요한 상호작용
    - 요소 탐색
    - 요소 텍스트 추출
    - 요소 속성(href) 추출
    - 카테고리 선택 버튼 탐색 및 클릭
    - 다음 페이지 이동 버튼 탐색 및 클릭
- 수집할 책 카테고리
    - Travel
    - Romance
    - Fiction
- 수집할 책 정보 목록
    - 카테고리
    - 책 이름
    - 책 가격
    - 상세 정보 페이지 주소
- `WebElement.get_attribute(속성명)`
    - 요소의 속성명에 해당하는 속성 정보를 반환합니다.
- json 파일 예시

```json
[
    {
        "카테고리": "Travel",
        "책 이름": "It's Only the Himalayas",
        "가격": "£45.17",
        "주소": "https://books.toscrape.com/catalogue/its-only-the-himalayas_981/index.html"
    },
    {
        "카테고리": "Travel",
        "책 이름": "Full Moon over Noah’s ...",
        "가격": "£49.43",
        "주소": "https://books.toscrape.com/catalogue/full-moon-over-noahs-ark-an-odyssey-to-mount-ararat-and-beyond_811/index.html"
    },
   // 중략...
   {
        "카테고리": "Fiction",
        "책 이름": "Lost Among the Living",
        "가격": "£27.70",
        "주소": "https://books.toscrape.com/catalogue/lost-among-the-living_31/index.html"
    },
    {
        "카테고리": "Fiction",
        "책 이름": "A Spy's Devotion (The ...",
        "가격": "£16.97",
        "주소": "https://books.toscrape.com/catalogue/a-spys-devotion-the-regency-spies-of-london-1_3/index.html"
    }
]
```

In [59]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.by import By
from pprint import pprint
import json

# 웹 페이지 상호작용 객체 ActionChains
from selenium.webdriver.common.action_chains import ActionChains

# 키보드 객체
from selenium.webdriver.common.keys import Keys

service = Service(ChromeDriverManager().install())

driver = webdriver.Chrome(service=service)

# 대기 매커니즘 코드
driver.implicitly_wait(3)

url = "https://books.toscrape.com/"

driver.get(url)

category = ["Travel", "Romance", "Fiction"]
book_list_json = []
for change_category in category:

    category_change = driver.find_element(By.LINK_TEXT, change_category)

    category_change.click()

    while True:

        book_div = driver.find_elements(By.CSS_SELECTOR, "article.product_pod")

        for book_info in book_div:

            book_title = book_info.find_element(
                By.CSS_SELECTOR, "h3>a"
            )  # h3 안에 있는 a 태그를 찾음
            book_price = book_info.find_element(By.CSS_SELECTOR, "p.price_color")

            book_link = book_title.get_attribute("href")

            book_dict = {
                "카테고리": change_category,
                "책 이름": book_title.text,
                "가격": book_price.text,
                "주소": book_link,
            }

            book_list_json.append(book_dict)

        try:  # next 버튼이 있는지 찾기, 없으면 while문 나가고 다시 카테고리 고르기
            next_button = driver.find_element(By.LINK_TEXT, "next")
            next_button.click()
        except Exception as e:
            break

# json 파일에 저장
with open("book_list.json", "w") as file:
    json.dump(book_list_json, file, indent=4, ensure_ascii=False)

pprint(book_list_json)

[{'가격': '£45.17',
  '주소': 'https://books.toscrape.com/catalogue/its-only-the-himalayas_981/index.html',
  '책 이름': "It's Only the Himalayas",
  '카테고리': 'Travel'},
 {'가격': '£49.43',
  '주소': 'https://books.toscrape.com/catalogue/full-moon-over-noahs-ark-an-odyssey-to-mount-ararat-and-beyond_811/index.html',
  '책 이름': 'Full Moon over Noah’s ...',
  '카테고리': 'Travel'},
 {'가격': '£48.87',
  '주소': 'https://books.toscrape.com/catalogue/see-america-a-celebration-of-our-national-parks-treasured-sites_732/index.html',
  '책 이름': 'See America: A Celebration ...',
  '카테고리': 'Travel'},
 {'가격': '£36.94',
  '주소': 'https://books.toscrape.com/catalogue/vagabonding-an-uncommon-guide-to-the-art-of-long-term-world-travel_552/index.html',
  '책 이름': 'Vagabonding: An Uncommon Guide ...',
  '카테고리': 'Travel'},
 {'가격': '£37.33',
  '주소': 'https://books.toscrape.com/catalogue/under-the-tuscan-sun_504/index.html',
  '책 이름': 'Under the Tuscan Sun',
  '카테고리': 'Travel'},
 {'가격': '£44.34',
  '주소': 'https://books.toscrape.