In [1]:
from bs4 import BeautifulSoup

# 예제 HTML
html = '''
<div class="rkt-tr">
    <div class="td rking"><span>981</span></div>
    <div class="td name new">
        <span class="abata">
            <div class="imgt">
                <img src="https://img-api.neople.co.kr/df/servers/hilder/characters/f4d38774dc652d0e58991b93cc732fad?zoom=1.jpg&temp=152">
            </div>
        </span>
        <span class="nik">마지막겨울밤</span>
        <div class="tb_fsev">
            <div class="level rker-lv">
                <span class="fpic">
                    <div class="imgt"></div>
                </span>
                <span class="val">62686</span>
            </div>
            <div class="rker-sever">
                <div class="rkrsv"><span class="svname">힐더</span></div>
            </div>
        </div>
    </div>
    <div class="td dameged">
        <span class="weapon" name="착용 무기">
            <div class="imgt">
                <img src="https://dundam.xyz/img/item/42c7c12aa21ebe298e8020ca5ccf9ddf">
            </div>
        </span>
        <span class="damegen" name="데미지">795,028,109,996</span>
        <span class="more"></span>
    </div>
</div>
'''

# BeautifulSoup으로 HTML 파싱
soup = BeautifulSoup(html, 'html.parser')

# 순위 추출
ranking = soup.find('div', class_='td rking').span.text
print(f"순위: {ranking}")

# 캐릭터 이름 추출
character_name = soup.find('span', class_='nik').text
print(f"캐릭터 이름: {character_name}")

# 캐릭터 레벨 추출
character_level = soup.find('span', class_='val').text
print(f"캐릭터 레벨: {character_level}")

# 서버 이름 추출
server_name = soup.find('span', class_='svname').text
print(f"서버 이름: {server_name}")

# 캐릭터 이미지 URL 추출
character_image_url = soup.find('span', class_='abata').img['src']
print(f"캐릭터 이미지 URL: {character_image_url}")

# 무기 이미지 URL 추출
weapon_image_url = soup.find('span', class_='weapon').img['src']
print(f"무기 이미지 URL: {weapon_image_url}")

# 데미지 추출
damage = soup.find('span', class_='damegen').text
print(f"데미지: {damage}")


순위: 981
캐릭터 이름: 마지막겨울밤
캐릭터 레벨: 62686
서버 이름: 힐더
캐릭터 이미지 URL: https://img-api.neople.co.kr/df/servers/hilder/characters/f4d38774dc652d0e58991b93cc732fad?zoom=1.jpg&temp=152
무기 이미지 URL: https://dundam.xyz/img/item/42c7c12aa21ebe298e8020ca5ccf9ddf
데미지: 795,028,109,996


In [17]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

# 웹페이지 URL
url = 'https://dundam.xyz/dat/dealerRankingData.jsp?page={page}&type=7&job={job}&baseJob={base_job}&weaponType=%EC%A0%84%EC%B2%B4&weaponDetail=%EC%A0%84%EC%B2%B4'

# 웹페이지 HTML 가져오기
response = requests.post(url.format(page=1))
response.raise_for_status()  # 요청이 성공했는지 확인

# BeautifulSoup으로 HTML 파싱
response.encoding = 'utf-8'
soup = BeautifulSoup(response.text, 'html.parser')

# rkt-tr 클래스를 가진 모든 요소 찾기
elements = soup.find_all('div', class_='rkt-tr')

# 데이터를 저장할 리스트 초기화
data = []

# 각 요소에서 데이터 추출
for element in elements:
    # 순위 추출
    ranking = element.find('div', class_='td rking').span.text if element.find('div', class_='td rking') else None
    # 캐릭터 이름 추출
    character_name = element.find('span', class_='nik').text if element.find('span', class_='nik') else None
    # 캐릭터 레벨 추출
    character_level = element.find('span', class_='val').text if element.find('span', class_='val') else None
    # 서버 이름 추출
    server_name = element.find('span', class_='svname').text if element.find('span', class_='svname') else None
    # 캐릭터 이미지 URL 추출
    character_image_url = element.find('span', class_='abata').img['src'] if element.find('span', class_='abata') else None
    # 무기 이미지 URL 추출
    weapon_image_url = element.find('span', class_='weapon').img['src'] if element.find('span', class_='weapon') else None
    # 데미지 추출
    damage = element.find('span', class_='damegen').text if element.find('span', class_='damegen') else None
    
    # 추출한 데이터를 리스트에 추가
    data.append({
        '순위': ranking,
        '캐릭터 이름': character_name,
        '캐릭터 레벨': character_level,
        '서버 이름': server_name,
        '캐릭터 이미지 URL': character_image_url,
        '무기 이미지 URL': weapon_image_url,
        '데미지': damage
    })

# DataFrame 생성
df = pd.DataFrame(data)

# 결과 출력
print(df)


Empty DataFrame
Columns: []
Index: []


In [26]:
import json
import pandas as pd
print(response.text)
parsed_data = json.loads(response.text)
df = pd.DataFrame(parsed_data['ranking'])
df


    









{"ranking":[{"nick":"챤기","server":"prey","damage":"980,446,987,982","weapon":"火 : 불타는 고난의 소검","rank":21,"fame":65354,"key":"5668dc435a339450b852b046a96bf181"},{"nick":"βisu","server":"cain","damage":"975,500,555,168","weapon":"火 : 넘어선 기억의 소검","rank":22,"fame":64814,"key":"cc4e43e427e487475766d3ea28c059e1"},{"nick":"닥고나이트","server":"prey","damage":"970,349,943,992","weapon":"火 : 넘어선 기억의 소검","rank":23,"fame":64900,"key":"9ee9dadc1225e0e71c9f68bbe2e45bfc"},{"nick":"마지막닼나","server":"cain","damage":"969,951,683,017","weapon":"火 : 불타는 고난의 광검","rank":24,"fame":65864,"key":"313a0f072602583ac5b765310ecf7083"},{"nick":"회절","server":"casillas","damage":"962,340,566,784","weapon":"木 : 그늘진 새벽의 소검","rank":25,"fame":64702,"key":"cddc2df3ead281ff9fab065a5c8f4dda"},{"nick":"§세이버§","server":"prey","damage":"960,270,710,005","weapon":"木 : 그늘진 새벽의 광검","rank":26,"fame":65726,"key":"6e9c040eb01290e93de6afc4c2ab8e9a"},{"nick":"조선구라왕","server":"diregie","damage":"951,846,529,072","weapon":"火 : 

Unnamed: 0,nick,server,damage,weapon,rank,fame,key
0,챤기,prey,980446987982,火 : 불타는 고난의 소검,21,65354,5668dc435a339450b852b046a96bf181
1,βisu,cain,975500555168,火 : 넘어선 기억의 소검,22,64814,cc4e43e427e487475766d3ea28c059e1
2,닥고나이트,prey,970349943992,火 : 넘어선 기억의 소검,23,64900,9ee9dadc1225e0e71c9f68bbe2e45bfc
3,마지막닼나,cain,969951683017,火 : 불타는 고난의 광검,24,65864,313a0f072602583ac5b765310ecf7083
4,회절,casillas,962340566784,木 : 그늘진 새벽의 소검,25,64702,cddc2df3ead281ff9fab065a5c8f4dda
5,§세이버§,prey,960270710005,木 : 그늘진 새벽의 광검,26,65726,6e9c040eb01290e93de6afc4c2ab8e9a
6,조선구라왕,diregie,951846529072,火 : 불타는 고난의 소검,27,64284,5c44dbd6dcaded432e284613248d81df
7,체게바라8,hilder,949105922133,火 : 불타는 고난의 소검,28,64328,aeaba3a00a3a7e31e3e37f3ddd4fdc25
8,파스칼,cain,942624126791,木 : 그늘진 새벽의 소검,29,64761,dc4b5b25e104aa9a016ab32c59545fad
9,한송알,cain,939063169521,木 : 그늘진 새벽의 광검,30,64328,f2af5cfd77795589ae4b27cff10666ba
