# 정적 웹 크롤링 연습

In [21]:
# 삼성전자 증권 정보를 추출하기
import requests
from bs4 import BeautifulSoup as bs

url = "https://finance.naver.com"
response = requests.get(url)
html_text = response.text
soup = bs(html_text, 'html.parser')
print(soup)


<html lang="ko">
<head>
<title>네이버페이 증권</title>
<meta content="text/html; charset=utf-8" http-equiv="Content-Type"/>
<meta content="text/javascript" http-equiv="Content-Script-Type"/>
<meta content="text/css" http-equiv="Content-Style-Type"/>
<meta content="네이버페이 증권" name="apple-mobile-web-app-title">
<meta content="네이버페이 증권" property="og:title">
<meta content="https://ssl.pstatic.net/static/m/stock/im/2016/08/og_stock-200.png" property="og:image"/>
<meta content="https://finance.naver.com" property="og:url"/>
<meta content="국내 해외 증시 지수, 시장지표, 뉴스, 증권사 리서치 등 제공" property="og:description"/>
<meta content="article" property="og:type"/>
<meta content="" property="og:article:thumbnailUrl"/>
<meta content="네이버페이 증권" property="og:article:author"/>
<meta content="http://FINANCE.NAVER.COM" property="og:article:author:url"/>
<link href="https://ssl.pstatic.net/imgstock/static.pc/20241226190829/css/finance_header.css" rel="stylesheet" type="text/css"/>
<link href="https://ssl.pstatic.net/imgstoc

In [22]:
# id가 "_topItems4"인 요소 내의 모든 <tr> 태그를 선택
items = soup.select("#_topItems4 tr")

# 데이터를 저장할 빈 리스트 생성
data = []

# 선택한 <tr> 태그를 하나씩 순회
for item in items:
    # <th> 태그 안의 <a> 태그를 선택하고, 그 안의 텍스트를 추출한 뒤 공백 제거
    title = item.select_one("th a").get_text().strip()
    # 추출한 텍스트가 정확히 "삼성전자"인지 확인
    if "삼성전자" in title:
        # 현재 <tr> 태그 안에 있는 모든 <td> 태그를 리스트로 가져옴
        tbs = item.select("td")
        
        # 1주당 가격, 변동 정보, 변동률 추출
        price = tbs[0].get_text().strip()  # 1주당 가격
        change = tbs[1].get_text().strip()  # 변동 정보
        percent = tbs[2].get_text().strip()  # 변동률
        
        # 하나의 주식 정보를 리스트로 묶어서 추가
        data.append([price, change, percent])

# 최종적으로 수집된 데이터를 출력
print(data)

[['53,900', '하락 200', '-0.37%'], ['44,100', '하락 400', '-0.90%']]
