In [1]:
from playwright.sync_api import Page, expect

In [2]:
import re

In [3]:
def test_has_title(page: Page):
    page.goto("https://playwright.dev/")

    expect(page).to_have_title(re.compile("Playwright"))

def test_get_started_link(page: Page):
    page.goto("https://playwright.dev/")

    page.get_by_role("link", name="Get started").click()

    expect(page.get_by_role("heading", name="Installation")).to_be_visible()

In [6]:
from playwright.sync_api import sync_playwright

with sync_playwright() as p:
    # 브라우저 열기
    browser = p.chromium.launch(headless=False)  # headless=False로 설정하여 브라우저를 띄움
    context = browser.new_context()
    page = context.new_page()

    # 테스트할 웹사이트 열기
    page.goto("https://limbus.kusoge.xyz/identity/10101")  # 실제 웹사이트 URL로 변경

    # 첫 번째 버튼 클릭 (q-btn--fab 클래스의 버튼)
    fab_button_selector = ".q-btn.q-btn--fab"
    page.click(fab_button_selector)

    # 하위 버튼이 나타날 때까지 대기
    page.wait_for_selector(".q-btn.q-btn--fab-mini")

    # 하위 버튼 클릭 (Uptie 버튼)
    uptie_button_selector = ".q-btn.q-btn--fab-mini"
    page.click(uptie_button_selector)

    # 변화된 그림(이미지)의 src 속성 가져오기
    img_selector = ".q-fab__icon-holder img"  # 변화된 이미지의 선택자
    page.wait_for_selector(img_selector)  # 이미지가 로드될 때까지 대기
    img_src = page.get_attribute(img_selector, "src")  # 이미지 src 속성 읽기

    # 결과 출력
    print("변화된 이미지 src:", img_src)

    # 브라우저 닫기
    browser.close()


Error: It looks like you are using Playwright Sync API inside the asyncio loop.
Please use the Async API instead.

In [7]:
import asyncio
from playwright.async_api import async_playwright

async def main():
    async with async_playwright() as p:
        # 브라우저 열기
        browser = await p.chromium.launch(headless=False)  # headless=False로 설정하여 브라우저 UI 띄움
        context = await browser.new_context()
        page = await context.new_page()

        # 테스트할 웹사이트 열기
        await page.goto("https://your-website-url.com")  # 실제 웹사이트 URL로 변경

        # 첫 번째 버튼 클릭 (q-btn--fab 클래스의 버튼)
        fab_button_selector = ".q-btn.q-btn--fab"
        await page.click(fab_button_selector)

        # 하위 버튼이 나타날 때까지 대기
        await page.wait_for_selector(".q-btn.q-btn--fab-mini")

        # 하위 버튼 클릭 (Uptie 버튼)
        uptie_button_selector = ".q-btn.q-btn--fab-mini"
        await page.click(uptie_button_selector)

        # 변화된 그림(이미지)의 src 속성 가져오기
        img_selector = ".q-fab__icon-holder img"  # 변화된 이미지의 선택자
        await page.wait_for_selector(img_selector)  # 이미지가 로드될 때까지 대기
        img_src = await page.get_attribute(img_selector, "src")  # 이미지 src 속성 읽기

        # 결과 출력
        print("변화된 이미지 src:", img_src)

        # 브라우저 닫기
        await browser.close()

# asyncio를 통해 비동기 함수 실행
asyncio.run(main())

RuntimeError: asyncio.run() cannot be called from a running event loop

In [10]:
from playwright.async_api import async_playwright

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 테스트할 웹사이트 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")

        # 첫 번째 버튼 클릭
        fab_button_selector = ".q-btn.q-btn--fab"
        await page.click(fab_button_selector)

        # 하위 버튼이 나타날 때까지 대기
        await page.wait_for_selector(".q-btn.q-btn--fab-mini")

        # 하위 버튼 클릭
        uptie_button_selector = ".q-btn.q-btn--fab-mini"
        await page.click(uptie_button_selector)

        # 변화된 이미지 src 가져오기
        img_selector = ".q-fab__icon-holder img"
        await page.wait_for_selector(img_selector)
        img_src = await page.get_attribute(img_selector, "src")

        print("변화된 이미지 src:", img_src)
        await browser.close()

# Jupyter Notebook 또는 IPython 환경에서는 아래와 같이 실행
await main()


변화된 이미지 src: https://img.kusoge.xyz/limbus/img/ui/uptie_1.png


In [26]:
import asyncio
from playwright.async_api import async_playwright

async def monitor_page_changes(page):
    """
    페이지에서 DOM 변화 및 네트워크 요청을 추적합니다.
    """
    # 네트워크 요청 추적
    page.on("response", lambda response: print(f"네트워크 응답: {response.url}, 상태 코드: {response.status}"))

    # DOM 변화 추적
    async def dom_mutation_listener():
        await page.evaluate("""
        new MutationObserver((mutations) => {
            console.log("DOM 변화 감지:", mutations);
        }).observe(document.body, { childList: true, subtree: true, attributes: true });
        """)
        print("DOM 변화 추적 활성화")

    await dom_mutation_listener()

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 웹페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("페이지 로드 완료")

        # 변경 사항 추적 시작
        await monitor_page_changes(page)

        # 첫 번째 버튼 클릭 (FAB 버튼)
        fab_button_selector = ".q-btn.q-btn--fab"
        await page.click(fab_button_selector)
        print("FAB 버튼 클릭 완료")

        # 하위 버튼(Uptie) 클릭
        uptie_button_selector = ".q-btn.q-btn--fab-mini"
        await page.wait_for_selector(uptie_button_selector)
        await page.click(uptie_button_selector)
        print("Uptie 버튼 클릭 완료")

        # 변화된 이미지 src 속성 가져오기
        img_selector = ".q-fab__icon-holder img"
        await page.wait_for_selector(img_selector)  # 이미지가 로드될 때까지 대기
        img_src = await page.get_attribute(img_selector, "src")
        print("변화된 이미지 src:", img_src)

        # 일정 시간 대기 (변화 확인용)
        await asyncio.sleep(10)

        # 브라우저 닫기
        await browser.close()

# asyncio 실행
asyncio.run(main())


RuntimeError: asyncio.run() cannot be called from a running event loop

In [29]:
from playwright.async_api import async_playwright
import asyncio

async def monitor_skill_text_change(page, skill_text_selector, button_name):
    """
    특정 클래스에 포함된 텍스트의 변화를 추적합니다.
    텍스트 변화가 느리게 발생할 수 있도록 텍스트 비교 주기를 길게 설정합니다.
    """
    previous_text = await page.text_content(skill_text_selector)  # 초기 텍스트 저장
    print(f"[{button_name}] 초기 스킬 텍스트: {previous_text}")

    while True:
        try:
            # 텍스트 변화가 너무 자주 발생하면 비교가 어려우므로 시간을 늘려줍니다.
            await asyncio.sleep(2)  # 텍스트 확인 간격을 2초로 늘림
            current_text = await page.text_content(skill_text_selector)  # 현재 텍스트 가져오기
            if current_text != previous_text:
                print(f"[{button_name}] 스킬 텍스트가 변경되었습니다: {current_text}")
                previous_text = current_text  # 변경된 텍스트를 업데이트
        except Exception as e:
            print(f"[{button_name}] 오류 발생 또는 스킬 텍스트를 찾을 수 없음: {e}")
            break

async def click_and_monitor(page, fab_button_selector, uptie_button_selector, skill_text_selector, button_name):
    """
    버튼을 클릭하고, 해당 버튼 클릭 후 텍스트 변화를 모니터링합니다.
    """
    # 상위 fab 버튼 클릭
    await page.click(fab_button_selector)
    print(f"[{button_name}] 버튼 클릭 후 텍스트 변화 모니터링 시작")

    # 하위 버튼 클릭
    await page.wait_for_selector(uptie_button_selector)  # 버튼이 보일 때까지 기다림
    await page.click(uptie_button_selector)
    print(f"[{button_name}] 버튼 클릭 완료")

    # 스킬 텍스트 변화 추적
    await monitor_skill_text_change(page, skill_text_selector, button_name)

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("페이지 로드 완료")

        # 상위 fab 버튼 선택자
        fab_button_selector = ".q-btn.q-btn--fab"

        # 스킬 텍스트 선택자
        skill_text_selector = ".col.middle.q-mt-xs.skilltext"  # 스킬 텍스트 선택자

        # 첫 번째 버튼 클릭 후 텍스트 변화 추적
        uptie_button_1_selector = 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_1.png"])'
        task1 = asyncio.create_task(click_and_monitor(page, fab_button_selector, uptie_button_1_selector, skill_text_selector, "첫 번째 Uptie"))

        # 두 번째 버튼 클릭 후 텍스트 변화 추적
        uptie_button_2_selector = 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_2.png"])'
        task2 = asyncio.create_task(click_and_monitor(page, fab_button_selector, uptie_button_2_selector, skill_text_selector, "두 번째 Uptie"))

        # 세 번째 버튼 클릭 후 텍스트 변화 추적
        uptie_button_3_selector = 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_3.png"])'
        task3 = asyncio.create_task(click_and_monitor(page, fab_button_selector, uptie_button_3_selector, skill_text_selector, "세 번째 Uptie"))

        # 네 번째 버튼 클릭 후 텍스트 변화 추적
        uptie_button_4_selector = 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_4.png"])'
        task4 = asyncio.create_task(click_and_monitor(page, fab_button_selector, uptie_button_4_selector, skill_text_selector, "네 번째 Uptie"))

        # 작업들 실행
        await asyncio.gather(task1, task2, task3, task4)

        # 일정 시간 대기 후 브라우저 닫기
        await asyncio.sleep(10)  # 충분한 시간 대기 후 종료
        await browser.close()

# Jupyter Notebook에서 실행
await main()


페이지 로드 완료
[첫 번째 Uptie] 버튼 클릭 후 텍스트 변화 모니터링 시작
[두 번째 Uptie] 버튼 클릭 후 텍스트 변화 모니터링 시작
[세 번째 Uptie] 버튼 클릭 후 텍스트 변화 모니터링 시작
[네 번째 Uptie] 버튼 클릭 후 텍스트 변화 모니터링 시작
[첫 번째 Uptie] 버튼 클릭 완료
[첫 번째 Uptie] 초기 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[On Hit] Inflict 2 Sinking
[네 번째 Uptie] 버튼 클릭 완료
[네 번째 Uptie] 초기 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[On Hit] Inflict 2 Sinking
[두 번째 Uptie] 버튼 클릭 완료
[두 번째 Uptie] 초기 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 2 Sinking
[첫 번째 Uptie] 스킬 텍스트가 변경되었습니다: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 2 Sinking
[네 번째 Uptie] 스킬 텍스트가 변경되었습니다: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 2 Sinking


TimeoutError: Page.click: Timeout 30000ms exceeded.
Call log:
  - waiting for locator("a:has(img[src=\"https://img.kusoge.xyz/limbus/img/ui/uptie_3.png\"])")
  -     - locator resolved to <a tabindex="-1" hidelabel="false" data-v-387841ec="" labelposition="left" aria-disabled="true" externallabel="false" class="q-btn q-btn-item non-selectable no-outline q-btn--push q-btn--rectangle q-btn--rounded bg-grey-9 text-white disabled q-btn--fab-mini q-btn--no-uppercase q-btn--square q-fab--form-square">…</a>
  -   - attempting click action
  -     2 × waiting for element to be visible, enabled and stable
  -       - element is visible, enabled and stable
  -       - scrolling into view if needed
  -       - done scrolling
  -       - <div data-v-045a300e="" class="q-pa-sm left">…</div> from <div data-v-387841ec="">…</div> subtree intercepts pointer events
  -     - retrying click action
  -     - waiting 20ms
  -     2 × waiting for element to be visible, enabled and stable
  -       - element is visible, enabled and stable
  -       - scrolling into view if needed
  -       - done scrolling
  -       - <div data-v-045a300e="" class="q-pa-sm left">…</div> from <div data-v-387841ec="">…</div> subtree intercepts pointer events
  -     - retrying click action
  -       - waiting 100ms
  -     23 × waiting for element to be visible, enabled and stable
  -        - element is visible, enabled and stable
  -        - scrolling into view if needed
  -        - done scrolling
  -        - <div data-v-045a300e="" class="q-pa-sm left">…</div> from <div data-v-387841ec="">…</div> subtree intercepts pointer events
  -      - retrying click action
  -        - waiting 500ms
  -     - waiting for element to be visible, enabled and stable
  -     - element is not stable
  -   32 × retrying click action
  -        - waiting 500ms
  -        - waiting for element to be visible, enabled and stable
  -        - element is visible, enabled and stable
  -        - scrolling into view if needed
  -        - done scrolling
  -        - <div data-v-045a300e="" class="q-pa-sm left">…</div> from <div data-v-387841ec="">…</div> subtree intercepts pointer events
  -   - retrying click action
  -     - waiting 500ms


[첫 번째 Uptie] 오류 발생 또는 스킬 텍스트를 찾을 수 없음: Page.text_content: Target page, context or browser has been closed
[네 번째 Uptie] 오류 발생 또는 스킬 텍스트를 찾을 수 없음: Page.text_content: Target page, context or browser has been closed
[두 번째 Uptie] 오류 발생 또는 스킬 텍스트를 찾을 수 없음: Page.text_content: Target page, context or browser has been closed


In [1]:
from playwright.async_api import async_playwright
import asyncio

async def monitor_skill_text_change(page, skill_text_selector, button_name):
    """
    특정 클래스에 포함된 텍스트의 변화를 추적합니다.
    """
    try:
        previous_text = await page.text_content(skill_text_selector)  # 초기 텍스트 저장
        print(f"[{button_name}] 초기 스킬 텍스트: {previous_text}")

        # 최대 10초 동안 텍스트 변화를 감지 (추적 시간을 제한)
        for _ in range(10):  # 10초 동안 확인 (1초 간격)
            await asyncio.sleep(1)  # 1초 간격으로 확인
            current_text = await page.text_content(skill_text_selector)  # 현재 텍스트 가져오기
            if current_text != previous_text:
                print(f"[{button_name}] 스킬 텍스트가 변경되었습니다: {current_text}")
                previous_text = current_text  # 변경된 텍스트 업데이트
    except Exception as e:
        print(f"[{button_name}] 오류 발생 또는 스킬 텍스트를 찾을 수 없음: {e}")

async def click_uptie_and_monitor(page, uptie_buttons, fab_button_selector, skill_text_selector):
    """
    각 Uptie 버튼을 순차적으로 클릭하고 텍스트 변화를 추적합니다.
    """
    for button_name, uptie_button_selector in uptie_buttons.items():
        # 상위 FAB 버튼 클릭
        await page.click(fab_button_selector)
        print(f"[{button_name}] 상위 FAB 버튼 클릭 완료")

        # Uptie 버튼 클릭
        await page.wait_for_selector(uptie_button_selector)  # 버튼이 보일 때까지 기다림
        await page.click(uptie_button_selector)
        print(f"[{button_name}] Uptie 버튼 클릭 완료")

        # 스킬 텍스트 변화 추적
        await monitor_skill_text_change(page, skill_text_selector, button_name)

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("페이지 로드 완료")

        # 상위 FAB 버튼 선택자
        fab_button_selector = ".q-btn.q-btn--fab"

        # 스킬 텍스트 선택자
        skill_text_selector = ".col.middle.q-mt-xs.skilltext"

        # Uptie 버튼 선택자 딕셔너리
        uptie_buttons = {
            "첫 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_1.png"])',
            "두 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_2.png"])',
            "세 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_3.png"])',
            "네 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_4.png"])'
        }

        # Uptie 버튼 클릭 및 텍스트 변화 추적
        await click_uptie_and_monitor(page, uptie_buttons, fab_button_selector, skill_text_selector)

        # 일정 시간 대기 후 브라우저 닫기
        await asyncio.sleep(5)  # 충분한 시간 대기 후 종료
        await browser.close()

# Jupyter Notebook에서 실행
await main()

페이지 로드 완료
[첫 번째 Uptie] 상위 FAB 버튼 클릭 완료
[첫 번째 Uptie] Uptie 버튼 클릭 완료
[첫 번째 Uptie] 초기 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 1 Sinking
[두 번째 Uptie] 상위 FAB 버튼 클릭 완료
[두 번째 Uptie] Uptie 버튼 클릭 완료
[두 번째 Uptie] 초기 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 2 Sinking
[세 번째 Uptie] 상위 FAB 버튼 클릭 완료
[세 번째 Uptie] Uptie 버튼 클릭 완료
[세 번째 Uptie] 초기 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 2 Sinking
[네 번째 Uptie] 상위 FAB 버튼 클릭 완료
[네 번째 Uptie] Uptie 버튼 클릭 완료
[네 번째 Uptie] 초기 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[On Hit] Inflict 2 Sinking


CancelledError: 

In [4]:
from playwright.async_api import async_playwright
import asyncio

async def monitor_slider_and_skill_change(page, slider_selector, skill_text_selector, button_name):
    """
    슬라이더 값을 조작하며, 각 값 변화와 스킬 텍스트 변화를 추적합니다.
    """
    # 슬라이더 범위 가져오기
    min_value = int(await page.get_attribute(slider_selector, "aria-valuemin"))
    max_value = int(await page.get_attribute(slider_selector, "aria-valuemax"))

    # 슬라이더 값을 최소값으로 이동
    await move_slider_to_value(page, slider_selector, min_value)
    print(f"[{button_name}] 슬라이더를 최소값({min_value})으로 설정했습니다.")

    # 슬라이더 값을 최소값에서 최대값까지 이동
    step = 1  # 슬라이더의 이동 간격
    for value in range(min_value, max_value + 1, step):
        await move_slider_to_value(page, slider_selector, value)
        await asyncio.sleep(0.5)  # 값이 안정적으로 반영되도록 대기

        # 슬라이더 값과 스킬 텍스트 추출
        current_value = await page.get_attribute(slider_selector, "aria-valuenow")
        skill_text = await page.text_content(skill_text_selector)

        # 값 출력
        print(f"[{button_name}] 슬라이더 값: {current_value}, 스킬 텍스트: {skill_text}")

    print(f"[{button_name}] 슬라이더가 최대값({max_value})에 도달했습니다.")

async def move_slider_to_value(page, slider_selector, target_value):
    """
    슬라이더를 주어진 값으로 이동시킵니다.
    target_value는 슬라이더의 최소값부터 최대값 사이여야 합니다.
    """
    # 슬라이더의 현재 값 가져오기
    current_value = await page.get_attribute(slider_selector, "aria-valuenow")
    if current_value == str(target_value):
        return  # 슬라이더가 이미 target_value에 설정되어 있으면 아무 작업도 하지 않음

    # 슬라이더의 범위 및 위치 계산
    min_value = int(await page.get_attribute(slider_selector, "aria-valuemin"))
    max_value = int(await page.get_attribute(slider_selector, "aria-valuemax"))

    # 슬라이더 thumb의 위치 계산
    percentage = (target_value - min_value) / (max_value - min_value) * 100
    slider_thumb = await page.query_selector(f"{slider_selector} .q-slider__thumb")
    thumb_box = await slider_thumb.bounding_box()

    # 슬라이더 이동 (드래그 방식)
    start_x = thumb_box["x"] + thumb_box["width"] / 2
    target_x = start_x + (thumb_box["width"] * (percentage / 100))
    y = thumb_box["y"] + thumb_box["height"] / 2

    await page.mouse.move(start_x, y)
    await page.mouse.down()
    await page.mouse.move(target_x, y, steps=1)  # 부드럽게 이동
    await page.mouse.up()
    print(f"슬라이더를 {target_value}로 이동 완료.")

async def click_uptie_and_monitor_with_slider(page, uptie_buttons, fab_button_selector, slider_selector, skill_text_selector):
    """
    각 Uptie 버튼을 순차적으로 클릭하고 슬라이더를 조작하며, 스킬 텍스트 변화를 추적합니다.
    """
    for button_name, uptie_button_selector in uptie_buttons.items():
        # 상위 FAB 버튼 클릭
        await page.click(fab_button_selector)
        print(f"[{button_name}] 상위 FAB 버튼 클릭 완료")

        # Uptie 버튼 클릭
        await page.wait_for_selector(uptie_button_selector)  # 버튼이 보일 때까지 기다림
        await page.click(uptie_button_selector)
        print(f"[{button_name}] Uptie 버튼 클릭 완료")

        # 슬라이더 조작 및 값/상태 추적
        await monitor_slider_and_skill_change(page, slider_selector, skill_text_selector, button_name)

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("페이지 로드 완료")

        # 상위 FAB 버튼 선택자
        fab_button_selector = ".q-btn.q-btn--fab"

        # 슬라이더 선택자
        slider_selector = ".q-slider"

        # 스킬 텍스트 선택자
        skill_text_selector = ".col.middle.q-mt-xs.skilltext"

        # Uptie 버튼 선택자 딕셔너리
        uptie_buttons = {
            "첫 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_1.png"])',
            "두 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_2.png"])',
            "세 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_3.png"])',
            "네 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_4.png"])'
        }

        # Uptie 버튼 클릭 및 슬라이더 조작과 변화 추적
        await click_uptie_and_monitor_with_slider(page, uptie_buttons, fab_button_selector, slider_selector, skill_text_selector)

        # 일정 시간 대기 후 브라우저 닫기
        await asyncio.sleep(5)
        await browser.close()

# Jupyter Notebook에서 실행
await main()

페이지 로드 완료
[첫 번째 Uptie] 상위 FAB 버튼 클릭 완료
[첫 번째 Uptie] Uptie 버튼 클릭 완료
슬라이더를 1로 이동 완료.
[첫 번째 Uptie] 슬라이더를 최소값(1)으로 설정했습니다.
슬라이더를 1로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 50, 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 1 Sinking
슬라이더를 2로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 50, 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 1 Sinking
슬라이더를 3로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 50, 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 1 Sinking
슬라이더를 4로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 50, 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 1 Sinking
슬라이더를 5로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 50, 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 1 Sinking
슬라이더를 6로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 1, 스킬 텍스트: SKILL 13xDeflect1Atk Weight1[Heads Hit] Inflict 1 Sinking
슬라이더를 7로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 50, 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 1 Sinking
슬라이더를 8로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 50, 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 1 Sinking
슬라이더를 9로 이동 완료.
[첫 

CancelledError: 

In [16]:
from playwright.async_api import async_playwright
import asyncio

async def move_slider_to_value(page, slider_selector, target_value):
    """
    슬라이더를 주어진 값으로 이동시킵니다.
    target_value는 슬라이더의 최소값부터 최대값 사이여야 합니다.
    """
    # 슬라이더의 범위 확인
    min_value = int(await page.get_attribute(slider_selector, "aria-valuemin"))
    max_value = int(await page.get_attribute(slider_selector, "aria-valuemax"))

    if target_value < min_value or target_value > max_value:
        raise ValueError(f"Target value {target_value} is out of bounds ({min_value}, {max_value})")

    # 슬라이더 thumb의 위치 계산
    percentage = (target_value - min_value) / (max_value - min_value) * 100

    # 출력: 범위와 목표 값에 대한 정보
    print(f"[DEBUG] 슬라이더 범위: {min_value} ~ {max_value}, 목표 값: {target_value}, 비율: {percentage}%")

    slider_thumb = await page.query_selector(f"{slider_selector} .q-slider__thumb")
    thumb_box = await slider_thumb.bounding_box()

    # 출력: 슬라이더 thumb의 위치 정보
    print(f"[DEBUG] 슬라이더 thumb 위치: {thumb_box}")

    # 슬라이더의 현재 위치 계산
    current_x = thumb_box["x"] + thumb_box["width"] / 2
    target_x = current_x + (thumb_box["width"] * (percentage / 100)) - current_x  # 목표 위치로 이동할 만큼만 이동
    y = thumb_box["y"] + thumb_box["height"] / 2

    # 출력: 이동할 시작 위치, 목표 위치, Y 위치
    print(f"[DEBUG] 시작 위치: {current_x}, 목표 위치: {target_x}, Y 위치: {y}")

    # 슬라이더를 드래그하여 이동
    await page.mouse.move(current_x, y)
    await page.mouse.down()

    # 목표 위치까지 슬라이더를 드래그
    steps = abs(target_x - current_x) / 10  # 이동 단위를 조금 더 나누어 부드럽게 이동
    for step in range(int(steps)):
        intermediate_x = current_x + (target_x - current_x) * (step / steps)
        await page.mouse.move(intermediate_x, y)
        await asyncio.sleep(0.02)  # 부드럽게 이동하기 위한 지연 시간 추가

        # 출력: 중간 이동 위치
        print(f"[DEBUG] 중간 이동 위치: {intermediate_x}")

    # 드래그 완료 후 마우스를 떼기
    await page.mouse.move(target_x, y)
    await page.mouse.up()

    print(f"[DEBUG] 슬라이더를 {target_value}로 이동 완료.")
    
    # 슬라이더 값이 실제로 업데이트될 때까지 대기
    await asyncio.sleep(0.5)  # 충분히 시간을 두어 값이 업데이트되도록 기다림

    # 슬라이더 값 확인
    current_value = await page.get_attribute(slider_selector, "aria-valuenow")
    print(f"[DEBUG] 현재 슬라이더 값: {current_value}, 목표 값: {target_value}")

    if current_value != str(target_value):
        print(f"경고: 슬라이더 값이 예상과 다릅니다. 현재 값: {current_value}, 예상 값: {target_value}")
    else:
        print(f"슬라이더 값 확인 완료: {current_value}")

async def test_slider_movement(page, slider_selector):
    """
    최소값, 중간값, 최대값으로 슬라이더를 순차적으로 이동시키고 확인합니다.
    """
    # 슬라이더의 범위 가져오기
    min_value = int(await page.get_attribute(slider_selector, "aria-valuemin"))
    max_value = int(await page.get_attribute(slider_selector, "aria-valuemax"))
    mid_value = (min_value + max_value) // 2

    # 최소값으로 이동
    print("슬라이더를 최소값으로 이동 중...")
    await move_slider_to_value(page, slider_selector, min_value)

    # 중간값으로 이동
    print("슬라이더를 중간값으로 이동 중...")
    await move_slider_to_value(page, slider_selector, mid_value)

    # 최대값으로 이동
    print("슬라이더를 최대값으로 이동 중...")
    await move_slider_to_value(page, slider_selector, max_value)

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("페이지 로드 완료")

        # 슬라이더 선택자
        slider_selector = ".q-slider"

        # 슬라이더를 최소값, 중간값, 최대값으로 이동시킴
        await test_slider_movement(page, slider_selector)

        # 일정 시간 대기 후 브라우저 닫기
        await asyncio.sleep(5)
        await browser.close()

# Jupyter Notebook에서 실행
await main()


페이지 로드 완료
슬라이더를 최소값으로 이동 중...
[DEBUG] 슬라이더 범위: 1 ~ 50, 목표 값: 1, 비율: 0.0%
[DEBUG] 슬라이더 thumb 위치: {'x': 1135.3125, 'y': 65, 'width': 20, 'height': 20}
[DEBUG] 시작 위치: 1145.3125, 목표 위치: 0.0, Y 위치: 75.0
[DEBUG] 중간 이동 위치: 1145.3125
[DEBUG] 중간 이동 위치: 1135.3125
[DEBUG] 중간 이동 위치: 1125.3125
[DEBUG] 중간 이동 위치: 1115.3125
[DEBUG] 중간 이동 위치: 1105.3125
[DEBUG] 중간 이동 위치: 1095.3125
[DEBUG] 중간 이동 위치: 1085.3125
[DEBUG] 중간 이동 위치: 1075.3125
[DEBUG] 중간 이동 위치: 1065.3125
[DEBUG] 중간 이동 위치: 1055.3125
[DEBUG] 중간 이동 위치: 1045.3125
[DEBUG] 중간 이동 위치: 1035.3125
[DEBUG] 중간 이동 위치: 1025.3125
[DEBUG] 중간 이동 위치: 1015.3125
[DEBUG] 중간 이동 위치: 1005.3125
[DEBUG] 중간 이동 위치: 995.3125
[DEBUG] 중간 이동 위치: 985.3125
[DEBUG] 중간 이동 위치: 975.3125
[DEBUG] 중간 이동 위치: 965.3125
[DEBUG] 중간 이동 위치: 955.3125
[DEBUG] 중간 이동 위치: 945.3125
[DEBUG] 중간 이동 위치: 935.3125
[DEBUG] 중간 이동 위치: 925.3125
[DEBUG] 중간 이동 위치: 915.3125
[DEBUG] 중간 이동 위치: 905.3125
[DEBUG] 중간 이동 위치: 895.3125
[DEBUG] 중간 이동 위치: 885.3125
[DEBUG] 중간 이동 위치: 875.3125
[DEBUG] 중간 이동 위치: 865.3125
[DEB

In [4]:
from playwright.async_api import async_playwright
import asyncio

async def move_slider_to_value(page, slider_selector, target_value):
    """
    슬라이더를 주어진 값으로 이동시킵니다.
    target_value는 슬라이더의 최소값부터 최대값 사이여야 합니다.
    """
    # 슬라이더의 현재 값 가져오기
    current_value = await page.get_attribute(slider_selector, "aria-valuenow")
    print(f"[디버깅] 현재 슬라이더 값: {current_value}, 목표값: {target_value}")

    if current_value == str(target_value):
        print(f"[디버깅] 슬라이더가 이미 {target_value}에 설정되어 있습니다. 이동하지 않습니다.")
        return

    # JavaScript를 사용하여 슬라이더 값을 직접 설정
    await page.evaluate(
        f"""
        (slider) => {{
            slider.value = {target_value};
            slider.dispatchEvent(new Event('input'));  // oninput 이벤트 트리거
            slider.dispatchEvent(new Event('change'));  // onchange 이벤트 트리거
        }}
        """,
        await page.query_selector(slider_selector)
    )
    print(f"[디버깅] 슬라이더 값을 {target_value}로 설정 완료.")

    # 슬라이더의 현재 값 다시 가져오기
    updated_value = await page.get_attribute(slider_selector, "aria-valuenow")
    print(f"[디버깅] 슬라이더 이동 후 값 확인: {updated_value}")

async def monitor_slider_and_skill_change(page, slider_selector, skill_text_selector, button_name):
    """
    슬라이더를 최소값, 중간값, 최대값으로 이동시키며 각 값 변화와 스킬 텍스트 변화를 추적합니다.
    """
    # 슬라이더 범위 가져오기
    min_value = int(await page.get_attribute(slider_selector, "aria-valuemin"))
    max_value = int(await page.get_attribute(slider_selector, "aria-valuemax"))
    mid_value = (min_value + max_value) // 2  # 중간값 계산

    # 이동할 값들: 최소값, 중간값, 최대값
    values_to_move = [min_value, mid_value, max_value]

    for value in values_to_move:
        print(f"[디버깅] 슬라이더 이동 시도: {value}")
        # 슬라이더 값을 이동
        await move_slider_to_value(page, slider_selector, value)

        # 이동 후 슬라이더 속성 확인
        current_value = await page.get_attribute(slider_selector, "aria-valuenow")
        print(f"[디버깅] 이동 후 슬라이더 값 (aria-valuenow): {current_value}")

        # 스킬 텍스트 확인
        skill_text = await page.text_content(skill_text_selector)
        print(f"[{button_name}] 슬라이더 값: {current_value}, 스킬 텍스트: {skill_text}")

    print(f"[{button_name}] 슬라이더를 최소값({min_value}), 중간값({mid_value}), 최대값({max_value})으로 이동 완료.")

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("페이지 로드 완료")

        # 상위 FAB 버튼 선택자
        fab_button_selector = ".q-btn.q-btn--fab"

        # 슬라이더 선택자
        slider_selector = ".q-slider"

        # 스킬 텍스트 선택자
        skill_text_selector = ".col.middle.q-mt-xs.skilltext"

        # Uptie 버튼 선택자 딕셔너리
        uptie_buttons = {
            "첫 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_1.png"])',
            "두 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_2.png"])',
            "세 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_3.png"])',
            "네 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_4.png"])'
        }

        # Uptie 버튼 클릭 및 슬라이더 조작과 변화 추적
        for button_name, uptie_button_selector in uptie_buttons.items():
            # 상위 FAB 버튼 클릭
            await page.click(fab_button_selector)
            print(f"[{button_name}] 상위 FAB 버튼 클릭 완료")

            # Uptie 버튼 클릭
            await page.wait_for_selector(uptie_button_selector)  # 버튼이 보일 때까지 기다림
            await page.click(uptie_button_selector)
            print(f"[{button_name}] Uptie 버튼 클릭 완료")

            # 슬라이더 조작 및 값/상태 추적
            await monitor_slider_and_skill_change(page, slider_selector, skill_text_selector, button_name)

        # 일정 시간 대기 후 브라우저 닫기
        await asyncio.sleep(5)
        await browser.close()

# Jupyter Notebook에서 실행
await main()


페이지 로드 완료
[첫 번째 Uptie] 상위 FAB 버튼 클릭 완료
[첫 번째 Uptie] Uptie 버튼 클릭 완료
[디버깅] 슬라이더 이동 시도: 1
[디버깅] 현재 슬라이더 값: 50, 목표값: 1
[디버깅] 슬라이더 값을 1로 설정 완료.
[디버깅] 슬라이더 이동 후 값 확인: 50
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 50
[첫 번째 Uptie] 슬라이더 값: 50, 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 1 Sinking
[디버깅] 슬라이더 이동 시도: 25
[디버깅] 현재 슬라이더 값: 50, 목표값: 25
[디버깅] 슬라이더 값을 25로 설정 완료.
[디버깅] 슬라이더 이동 후 값 확인: 50
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 50
[첫 번째 Uptie] 슬라이더 값: 50, 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 1 Sinking
[디버깅] 슬라이더 이동 시도: 50
[디버깅] 현재 슬라이더 값: 50, 목표값: 50
[디버깅] 슬라이더가 이미 50에 설정되어 있습니다. 이동하지 않습니다.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 50
[첫 번째 Uptie] 슬라이더 값: 50, 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 1 Sinking
[첫 번째 Uptie] 슬라이더를 최소값(1), 중간값(25), 최대값(50)으로 이동 완료.
[두 번째 Uptie] 상위 FAB 버튼 클릭 완료
[두 번째 Uptie] Uptie 버튼 클릭 완료
[디버깅] 슬라이더 이동 시도: 1
[디버깅] 현재 슬라이더 값: 50, 목표값: 1
[디버깅] 슬라이더 값을 1로 설정 완료.
[디버깅] 슬라이더 이동 후 값 확인: 50
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 50
[두 번째 Upti

In [108]:
from playwright.async_api import async_playwright
import asyncio

async def move_slider_to_value(page, slider_selector, target_value):
    """
    슬라이더를 주어진 값으로 이동시킵니다.
    target_value는 슬라이더의 최소값부터 최대값 사이여야 합니다.
    """
    # 슬라이더의 범위 확인
    min_value = int(await page.get_attribute(slider_selector, "aria-valuemin"))
    max_value = int(await page.get_attribute(slider_selector, "aria-valuemax"))

    if target_value < min_value or target_value > max_value:
        raise ValueError(f"Target value {target_value} is out of bounds ({min_value}, {max_value})")

    # 슬라이더 thumb 요소와 위치 가져오기
    slider_thumb = await page.query_selector(f"{slider_selector} .q-slider__thumb")
    thumb_box = await slider_thumb.bounding_box()
    
    # 슬라이더의 현재 위치 및 목표 위치 계산
    track = await page.query_selector(f"{slider_selector} .q-slider__track")
    track_box = await track.bounding_box()
    
    # 목표 x 위치 계산 (슬라이더 트랙 내에서 비율 기반)
    target_percentage = (target_value - min_value) / (max_value - min_value)
    target_x = track_box["x"] + target_percentage * track_box["width"]
    current_x = thumb_box["x"] + thumb_box["width"] / 2
    y = thumb_box["y"] + thumb_box["height"] / 2

    # 슬라이더를 드래그하여 목표 위치로 이동
    await page.mouse.move(current_x, y)
    await page.mouse.down()
    await page.mouse.move(target_x, y, steps=10)  # 부드럽게 이동
    await page.mouse.up()

    print(f"슬라이더를 {target_value}로 이동 완료.")

    # 슬라이더 값 확인 및 강제 이벤트 트리거
    await page.evaluate(
        f"""
        (slider) => {{
            slider.dispatchEvent(new Event('input'));  // oninput 이벤트 트리거
            slider.dispatchEvent(new Event('change'));  // onchange 이벤트 트리거
        }}
        """,
        await page.query_selector(slider_selector)
    )
    await asyncio.sleep(0.5)  # 값 업데이트를 위한 대기 시간

    # 이동 후 값 확인
    current_value = await page.get_attribute(slider_selector, "aria-valuenow")
    if current_value != str(target_value):
        print(f"경고: 슬라이더 값이 예상과 다릅니다. 현재 값: {current_value}, 예상 값: {target_value}")

async def monitor_slider_and_skill_change(page, slider_selector, skill_text_selector, button_name):
    """
    슬라이더를 최소값, 중간값, 최대값으로 이동시키며 각 값 변화와 스킬 텍스트 변화를 추적합니다.
    """
    # 슬라이더 범위 가져오기
    min_value = int(await page.get_attribute(slider_selector, "aria-valuemin"))
    max_value = int(await page.get_attribute(slider_selector, "aria-valuemax"))
    mid_value = (min_value + max_value) // 2  # 중간값 계산

    # 이동할 값들: 최소값, 중간값, 최대값
    values_to_move = [min_value, mid_value, max_value]

    for value in values_to_move:
        print(f"[디버깅] 슬라이더 이동 시도: {value}")
        # 슬라이더 값을 이동
        await move_slider_to_value(page, slider_selector, value)

        # 이동 후 슬라이더 속성 확인
        current_value = await page.get_attribute(slider_selector, "aria-valuenow")
        print(f"[디버깅] 이동 후 슬라이더 값 (aria-valuenow): {current_value}")

        # 스킬 텍스트 확인
        skill_text = await page.text_content(skill_text_selector)
        print(f"[{button_name}] 슬라이더 값: {current_value}, 스킬 텍스트: {skill_text}")

    print(f"[{button_name}] 슬라이더를 최소값({min_value}), 중간값({mid_value}), 최대값({max_value})으로 이동 완료.")

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("페이지 로드 완료")

        # 상위 FAB 버튼 선택자
        fab_button_selector = ".q-btn.q-btn--fab"

        # 슬라이더 선택자
        slider_selector = ".q-slider"

        # 스킬 텍스트 선택자
        skill_text_selector = ".col.middle.q-mt-xs.skilltext"

        # Uptie 버튼 선택자 딕셔너리
        uptie_buttons = {
            "첫 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_1.png"])'
            ,"두 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_2.png"])',
            #"세 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_3.png"])',
            #"네 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_4.png"])'
        }

        # Uptie 버튼 클릭 및 슬라이더 조작과 변화 추적
        for button_name, uptie_button_selector in uptie_buttons.items():
            # 상위 FAB 버튼 클릭
            await page.click(fab_button_selector)
            print(f"[{button_name}] 상위 FAB 버튼 클릭 완료")

            # Uptie 버튼 클릭
            await page.wait_for_selector(uptie_button_selector)  # 버튼이 보일 때까지 기다림
            await page.click(uptie_button_selector)
            print(f"[{button_name}] Uptie 버튼 클릭 완료")

            # 슬라이더 조작 및 값/상태 추적
            await monitor_slider_and_skill_change(page, slider_selector, skill_text_selector, button_name)

        # 일정 시간 대기 후 브라우저 닫기
        await asyncio.sleep(5)
        await browser.close()

# Jupyter Notebook에서 실행
await main()


페이지 로드 완료
[첫 번째 Uptie] 상위 FAB 버튼 클릭 완료
[첫 번째 Uptie] Uptie 버튼 클릭 완료
[디버깅] 슬라이더 이동 시도: 1
슬라이더를 1로 이동 완료.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 1
[첫 번째 Uptie] 슬라이더 값: 1, 스킬 텍스트: SKILL 13xDeflect1Atk Weight1[Heads Hit] Inflict 1 Sinking
[디버깅] 슬라이더 이동 시도: 25
슬라이더를 25로 이동 완료.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 25
[첫 번째 Uptie] 슬라이더 값: 25, 스킬 텍스트: SKILL 13xDeflect25Atk Weight1[Heads Hit] Inflict 1 Sinking
[디버깅] 슬라이더 이동 시도: 50
슬라이더를 50로 이동 완료.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 50
[첫 번째 Uptie] 슬라이더 값: 50, 스킬 텍스트: SKILL 13xDeflect50Atk Weight1[Heads Hit] Inflict 1 Sinking
[첫 번째 Uptie] 슬라이더를 최소값(1), 중간값(25), 최대값(50)으로 이동 완료.
[두 번째 Uptie] 상위 FAB 버튼 클릭 완료
[두 번째 Uptie] Uptie 버튼 클릭 완료
[디버깅] 슬라이더 이동 시도: 1
슬라이더를 1로 이동 완료.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 1
[두 번째 Uptie] 슬라이더 값: 1, 스킬 텍스트: SKILL 13xDeflect1Atk Weight1[Heads Hit] Inflict 2 Sinking
[디버깅] 슬라이더 이동 시도: 25
슬라이더를 25로 이동 완료.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 25
[두 번째 Uptie] 슬라이더 값: 25, 스킬 텍스트: SKILL 13xDeflect25Atk Weight1[Heads Hit] Inflict 2 S

In [8]:
from playwright.async_api import async_playwright
import asyncio

async def change_language_to_korean(page, combobox_selector, korean_option_selector):
    """
    언어 선택 콤보박스를 열고, 한국어를 선택합니다.
    """
    # 콤보박스 클릭하여 리스트 박스 열기
    await page.click(combobox_selector)
    print("언어 선택 콤보박스 클릭 완료.")

    # "한국어" 옵션 선택
    await page.click(korean_option_selector)
    print("한국어 옵션 선택 완료.")

    # 변경 완료 대기
    await asyncio.sleep(1)  # 변경이 반영되도록 대기 (필요시 wait_for_selector로 변경 가능)

    # 결과 확인
    body_text = await page.text_content("body")
    if "한국어" in body_text:
        print("언어가 한국어로 변경되었습니다.")
    else:
        print("언어 변경에 실패했습니다.")

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("페이지 로드 완료")

        # 언어 선택 콤보박스 및 "한국어" 옵션 선택자
        combobox_selector = 'input[aria-label="Language"]'  # 언어 콤보박스
        korean_option_selector = 'div.q-item__label:has-text("한국어")'  # "한국어" 옵션

        # 언어를 한국어로 변경
        await change_language_to_korean(page, combobox_selector, korean_option_selector)

        # 일정 시간 대기 후 브라우저 닫기
        await asyncio.sleep(2)
        await browser.close()

# Jupyter Notebook에서 실행
await main()


페이지 로드 완료
언어 선택 콤보박스 클릭 완료.
한국어 옵션 선택 완료.
언어가 한국어로 변경되었습니다.


In [12]:
from playwright.async_api import async_playwright
import asyncio

async def change_language_to_korean(page, combobox_selector, korean_option_selector):
    """
    언어 선택 콤보박스를 열고, 한국어를 선택합니다.
    """
    # 콤보박스 클릭하여 리스트 박스 열기
    await page.click(combobox_selector)
    print("언어 선택 콤보박스 클릭 완료.")

    # "한국어" 옵션 선택
    await page.click(korean_option_selector)
    print("한국어 옵션 선택 완료.")

    # 변경 완료 대기
    await asyncio.sleep(1)  # 변경이 반영되도록 대기 (필요시 wait_for_selector로 변경 가능)

    # 결과 확인
    body_text = await page.text_content("body")
    if "한국어" in body_text:
        print("언어가 한국어로 변경되었습니다.")
    else:
        print("언어 변경에 실패했습니다.")

async def move_slider_to_value(page, slider_selector, target_value):
    """
    슬라이더를 주어진 값으로 이동시킵니다.
    target_value는 슬라이더의 최소값부터 최대값 사이여야 합니다.
    """
    # 슬라이더의 범위 확인
    min_value = int(await page.get_attribute(slider_selector, "aria-valuemin"))
    max_value = int(await page.get_attribute(slider_selector, "aria-valuemax"))

    if target_value < min_value or target_value > max_value:
        raise ValueError(f"Target value {target_value} is out of bounds ({min_value}, {max_value})")

    # 슬라이더 thumb 요소와 위치 가져오기
    slider_thumb = await page.query_selector(f"{slider_selector} .q-slider__thumb")
    thumb_box = await slider_thumb.bounding_box()
    
    # 슬라이더의 현재 위치 및 목표 위치 계산
    track = await page.query_selector(f"{slider_selector} .q-slider__track")
    track_box = await track.bounding_box()
    
    # 목표 x 위치 계산 (슬라이더 트랙 내에서 비율 기반)
    target_percentage = (target_value - min_value) / (max_value - min_value)
    target_x = track_box["x"] + target_percentage * track_box["width"]
    current_x = thumb_box["x"] + thumb_box["width"] / 2
    y = thumb_box["y"] + thumb_box["height"] / 2

    # 슬라이더를 드래그하여 목표 위치로 이동
    await page.mouse.move(current_x, y)
    await page.mouse.down()
    await page.mouse.move(target_x, y, steps=10)  # 부드럽게 이동
    await page.mouse.up()

    print(f"슬라이더를 {target_value}로 이동 완료.")

    # 슬라이더 값 확인 및 강제 이벤트 트리거
    await page.evaluate(
        f"""
        (slider) => {{
            slider.dispatchEvent(new Event('input'));  // oninput 이벤트 트리거
            slider.dispatchEvent(new Event('change'));  // onchange 이벤트 트리거
        }}
        """,
        await page.query_selector(slider_selector)
    )
    await asyncio.sleep(0.5)  # 값 업데이트를 위한 대기 시간

    # 이동 후 값 확인
    current_value = await page.get_attribute(slider_selector, "aria-valuenow")
    if current_value != str(target_value):
        print(f"경고: 슬라이더 값이 예상과 다릅니다. 현재 값: {current_value}, 예상 값: {target_value}")

async def monitor_slider_and_skill_change(page, slider_selector, skill_text_selector, button_name):
    """
    슬라이더를 최소값, 중간값, 최대값으로 이동시키며 각 값 변화와 스킬 텍스트 변화를 추적합니다.
    """
    # 슬라이더 범위 가져오기
    min_value = int(await page.get_attribute(slider_selector, "aria-valuemin"))
    max_value = int(await page.get_attribute(slider_selector, "aria-valuemax"))
    mid_value = (min_value + max_value) // 2  # 중간값 계산

    # 이동할 값들: 최소값, 중간값, 최대값
    values_to_move = [min_value, mid_value, max_value]

    for value in values_to_move:
        print(f"[디버깅] 슬라이더 이동 시도: {value}")
        # 슬라이더 값을 이동
        await move_slider_to_value(page, slider_selector, value)

        # 이동 후 슬라이더 속성 확인
        current_value = await page.get_attribute(slider_selector, "aria-valuenow")
        print(f"[디버깅] 이동 후 슬라이더 값 (aria-valuenow): {current_value}")

        # 스킬 텍스트 확인
        skill_text = await page.text_content(skill_text_selector)
        print(f"[{button_name}] 슬라이더 값: {current_value}, 스킬 텍스트: {skill_text}")

    print(f"[{button_name}] 슬라이더를 최소값({min_value}), 중간값({mid_value}), 최대값({max_value})으로 이동 완료.")

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("페이지 로드 완료")

        # 언어 선택 콤보박스 및 "한국어" 옵션 선택자
        combobox_selector = 'input[aria-label="Language"]'  # 언어 콤보박스
        korean_option_selector = 'div.q-item__label:has-text("한국어")'  # "한국어" 옵션

        # 언어를 한국어로 변경
        await change_language_to_korean(page, combobox_selector, korean_option_selector)

        # 상위 FAB 버튼 선택자
        fab_button_selector = ".q-btn.q-btn--fab"

        # 슬라이더 선택자
        slider_selector = ".q-slider"

        # 스킬 텍스트 선택자
        skill_text_selector = ".col.middle.q-mt-xs.skilltext"

        # Uptie 버튼 선택자 딕셔너리
        uptie_buttons = {
            "첫 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_1.png"])'
            ,"두 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_2.png"])'
            #,"세 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_3.png"])'
            #,"네 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_4.png"])'
        }

        # Uptie 버튼 클릭 및 슬라이더 조작과 변화 추적
        for button_name, uptie_button_selector in uptie_buttons.items():
            # 상위 FAB 버튼 클릭
            await page.click(fab_button_selector)
            print(f"[{button_name}] 상위 FAB 버튼 클릭 완료")

            # Uptie 버튼 클릭
            await page.wait_for_selector(uptie_button_selector)  # 버튼이 보일 때까지 기다림
            await page.click(uptie_button_selector)
            print(f"[{button_name}] Uptie 버튼 클릭 완료")

            # 슬라이더 조작 및 값/상태 추적
            await monitor_slider_and_skill_change(page, slider_selector, skill_text_selector, button_name)

        # 일정 시간 대기 후 브라우저 닫기
        await asyncio.sleep(5)
        await browser.close()

# Jupyter Notebook에서 실행
await main()

페이지 로드 완료
언어 선택 콤보박스 클릭 완료.
한국어 옵션 선택 완료.
언어가 한국어로 변경되었습니다.
[첫 번째 Uptie] 상위 FAB 버튼 클릭 완료
[첫 번째 Uptie] Uptie 버튼 클릭 완료
[디버깅] 슬라이더 이동 시도: 1
슬라이더를 1로 이동 완료.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 1
[첫 번째 Uptie] 슬라이더 값: 1, 스킬 텍스트: SKILL 13x쳐내기1공격 가중치1[앞면 적중시]침잠 1 부여
[디버깅] 슬라이더 이동 시도: 50
슬라이더를 50로 이동 완료.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 50
[첫 번째 Uptie] 슬라이더 값: 50, 스킬 텍스트: SKILL 13x쳐내기50공격 가중치1[앞면 적중시]침잠 1 부여


NameError: name 'mid_value' is not defined

In [14]:
from playwright.async_api import async_playwright
import asyncio

async def change_language_to_korean(page, combobox_selector, korean_option_selector):
    """
    언어 선택 콤보박스를 열고, 한국어를 선택합니다.
    """
    # 콤보박스 클릭하여 리스트 박스 열기
    await page.click(combobox_selector)
    print("언어 선택 콤보박스 클릭 완료.")

    # "한국어" 옵션 선택
    await page.click(korean_option_selector)
    print("한국어 옵션 선택 완료.")

    # 변경 완료 대기
    await asyncio.sleep(1)  # 변경이 반영되도록 대기 (필요시 wait_for_selector로 변경 가능)

    # 결과 확인
    body_text = await page.text_content("body")
    if "한국어" in body_text:
        print("언어가 한국어로 변경되었습니다.")
    else:
        print("언어 변경에 실패했습니다.")

async def move_slider_to_value(page, slider_selector, target_value):
    """
    슬라이더를 주어진 값으로 이동시킵니다.
    target_value는 슬라이더의 최소값부터 최대값 사이여야 합니다.
    """
    # 슬라이더의 범위 확인
    min_value = int(await page.get_attribute(slider_selector, "aria-valuemin"))
    max_value = int(await page.get_attribute(slider_selector, "aria-valuemax"))

    if target_value < min_value or target_value > max_value:
        raise ValueError(f"Target value {target_value} is out of bounds ({min_value}, {max_value})")

    # 슬라이더 thumb 요소와 위치 가져오기
    slider_thumb = await page.query_selector(f"{slider_selector} .q-slider__thumb")
    thumb_box = await slider_thumb.bounding_box()
    
    # 슬라이더의 현재 위치 및 목표 위치 계산
    track = await page.query_selector(f"{slider_selector} .q-slider__track")
    track_box = await track.bounding_box()
    
    # 목표 x 위치 계산 (슬라이더 트랙 내에서 비율 기반)
    target_percentage = (target_value - min_value) / (max_value - min_value)
    target_x = track_box["x"] + target_percentage * track_box["width"]
    current_x = thumb_box["x"] + thumb_box["width"] / 2
    y = thumb_box["y"] + thumb_box["height"] / 2

    # 슬라이더를 드래그하여 목표 위치로 이동
    await page.mouse.move(current_x, y)
    await page.mouse.down()
    await page.mouse.move(target_x, y, steps=10)  # 부드럽게 이동
    await page.mouse.up()

    print(f"슬라이더를 {target_value}로 이동 완료.")

    # 슬라이더 값 확인 및 강제 이벤트 트리거
    await page.evaluate(
        f"""
        (slider) => {{
            slider.dispatchEvent(new Event('input'));  // oninput 이벤트 트리거
            slider.dispatchEvent(new Event('change'));  // onchange 이벤트 트리거
        }}
        """,
        await page.query_selector(slider_selector)
    )
    await asyncio.sleep(0.5)  # 값 업데이트를 위한 대기 시간

    # 이동 후 값 확인
    current_value = await page.get_attribute(slider_selector, "aria-valuenow")
    if current_value != str(target_value):
        print(f"경고: 슬라이더 값이 예상과 다릅니다. 현재 값: {current_value}, 예상 값: {target_value}")

async def monitor_slider_and_skill_change(page, slider_selector, skill_text_selector, button_name):
    """
    슬라이더를 최소값, 중간값, 최대값으로 이동시키며 각 값 변화와 스킬 텍스트 변화를 추적합니다.
    """
    # 슬라이더 범위 가져오기
    min_value = int(await page.get_attribute(slider_selector, "aria-valuemin"))
    max_value = int(await page.get_attribute(slider_selector, "aria-valuemax"))
    mid_value = (min_value + max_value) // 2  # 중간값 계산

    # 이동할 값들: 최소값 부터 최대값까지
    #values_to_move = [min_value...max_value]
    values_to_move = [i for i in range(min_value, max_value +1)]
                      #, mid_value
    '''
    number_list = [i for i in range(1, 12 + 1)]
    print(number_list)
    '''

    for value in values_to_move:
        print(f"[디버깅] 슬라이더 이동 시도: {value}")
        # 슬라이더 값을 이동
        await move_slider_to_value(page, slider_selector, value)

        # 이동 후 슬라이더 속성 확인
        current_value = await page.get_attribute(slider_selector, "aria-valuenow")
        print(f"[디버깅] 이동 후 슬라이더 값 (aria-valuenow): {current_value}")

        # 스킬 텍스트 확인
        skill_text = await page.text_content(skill_text_selector)
        print(f"[{button_name}] 슬라이더 값: {current_value}, 스킬 텍스트: {skill_text}")

    print(f"[{button_name}] 슬라이더를 최소값({min_value}), 최대값({max_value})으로 이동 완료.")

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("페이지 로드 완료")

        # 언어 선택 콤보박스 및 "한국어" 옵션 선택자
        combobox_selector = 'input[aria-label="Language"]'  # 언어 콤보박스
        korean_option_selector = 'div.q-item__label:has-text("한국어")'  # "한국어" 옵션

        # 언어를 한국어로 변경
        await change_language_to_korean(page, combobox_selector, korean_option_selector)

        # 상위 FAB 버튼 선택자
        fab_button_selector = ".q-btn.q-btn--fab"

        # 슬라이더 선택자
        slider_selector = ".q-slider"

        # 스킬 텍스트 선택자
        skill_text_selector = ".col.middle.q-mt-xs.skilltext"

        # Uptie 버튼 선택자 딕셔너리
        uptie_buttons = {
            "첫 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_1.png"])'
            ,"두 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_2.png"])'
            ,"세 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_3.png"])'
            ,"네 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_4.png"])'
        }

        # Uptie 버튼 클릭 및 슬라이더 조작과 변화 추적
        for button_name, uptie_button_selector in uptie_buttons.items():
            # 상위 FAB 버튼 클릭
            await page.click(fab_button_selector)
            print(f"[{button_name}] 상위 FAB 버튼 클릭 완료")

            # Uptie 버튼 클릭
            await page.wait_for_selector(uptie_button_selector)  # 버튼이 보일 때까지 기다림
            await page.click(uptie_button_selector)
            print(f"[{button_name}] Uptie 버튼 클릭 완료")

            # 슬라이더 조작 및 값/상태 추적
            await monitor_slider_and_skill_change(page, slider_selector, skill_text_selector, button_name)

        # 일정 시간 대기 후 브라우저 닫기
        await asyncio.sleep(5)
        await browser.close()

# Jupyter Notebook에서 실행
await main()

페이지 로드 완료
언어 선택 콤보박스 클릭 완료.
한국어 옵션 선택 완료.
언어가 한국어로 변경되었습니다.
[첫 번째 Uptie] 상위 FAB 버튼 클릭 완료
[첫 번째 Uptie] Uptie 버튼 클릭 완료
[디버깅] 슬라이더 이동 시도: 1
슬라이더를 1로 이동 완료.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 1
[첫 번째 Uptie] 슬라이더 값: 1, 스킬 텍스트: SKILL 13x쳐내기1공격 가중치1[앞면 적중시]침잠 1 부여
[디버깅] 슬라이더 이동 시도: 2
슬라이더를 2로 이동 완료.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 2
[첫 번째 Uptie] 슬라이더 값: 2, 스킬 텍스트: SKILL 13x쳐내기2공격 가중치1[앞면 적중시]침잠 1 부여
[디버깅] 슬라이더 이동 시도: 3
슬라이더를 3로 이동 완료.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 3
[첫 번째 Uptie] 슬라이더 값: 3, 스킬 텍스트: SKILL 13x쳐내기3공격 가중치1[앞면 적중시]침잠 1 부여
[디버깅] 슬라이더 이동 시도: 4
슬라이더를 4로 이동 완료.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 4
[첫 번째 Uptie] 슬라이더 값: 4, 스킬 텍스트: SKILL 13x쳐내기4공격 가중치1[앞면 적중시]침잠 1 부여
[디버깅] 슬라이더 이동 시도: 5
슬라이더를 5로 이동 완료.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 5
[첫 번째 Uptie] 슬라이더 값: 5, 스킬 텍스트: SKILL 13x쳐내기5공격 가중치1[앞면 적중시]침잠 1 부여
[디버깅] 슬라이더 이동 시도: 6
슬라이더를 6로 이동 완료.
[디버깅] 이동 후 슬라이더 값 (aria-valuenow): 6
[첫 번째 Uptie] 슬라이더 값: 6, 스킬 텍스트: SKILL 13x쳐내기6공격 가중치1[앞면 적중시]침잠 1 부여
[디버깅] 슬라이더 이동 시도: 7
슬라이더를 7로 이동 완료.
[

In [15]:
!pip install pandas



In [16]:
import asyncio
import pandas as pd
from playwright.async_api import async_playwright

async def change_language_to_korean(page, combobox_selector, korean_option_selector):
    """
    언어 선택 콤보박스를 열고, 한국어를 선택합니다.
    """
    await page.click(combobox_selector)
    print("언어 선택 콤보박스 클릭 완료.")
    await page.click(korean_option_selector)
    print("한국어 옵션 선택 완료.")
    await asyncio.sleep(1)  # 변경이 반영되도록 대기

async def move_slider_to_value(page, slider_selector, target_value):
    """
    슬라이더를 주어진 값으로 이동시킵니다.
    """
    min_value = int(await page.get_attribute(slider_selector, "aria-valuemin"))
    max_value = int(await page.get_attribute(slider_selector, "aria-valuemax"))

    if target_value < min_value or target_value > max_value:
        raise ValueError(f"Target value {target_value} is out of bounds ({min_value}, {max_value})")

    slider_thumb = await page.query_selector(f"{slider_selector} .q-slider__thumb")
    thumb_box = await slider_thumb.bounding_box()
    track = await page.query_selector(f"{slider_selector} .q-slider__track")
    track_box = await track.bounding_box()

    target_percentage = (target_value - min_value) / (max_value - min_value)
    target_x = track_box["x"] + target_percentage * track_box["width"]
    current_x = thumb_box["x"] + thumb_box["width"] / 2
    y = thumb_box["y"] + thumb_box["height"] / 2

    await page.mouse.move(current_x, y)
    await page.mouse.down()
    await page.mouse.move(target_x, y, steps=10)
    await page.mouse.up()

    print(f"슬라이더를 {target_value}로 이동 완료.")

    await page.evaluate(
        f"""
        (slider) => {{
            slider.dispatchEvent(new Event('input'));  // oninput 이벤트 트리거
            slider.dispatchEvent(new Event('change'));  // onchange 이벤트 트리거
        }}
        """,
        await page.query_selector(slider_selector)
    )
    await asyncio.sleep(0.5)

async def monitor_slider_and_skill_change(page, slider_selector, skill_text_selector, button_name, csv_data):
    """
    슬라이더를 이동시키며 각 값 변화와 스킬 텍스트 변화를 추적하고 데이터를 CSV로 저장합니다.
    """
    min_value = int(await page.get_attribute(slider_selector, "aria-valuemin"))
    max_value = int(await page.get_attribute(slider_selector, "aria-valuemax"))
    values_to_move = [i for i in range(min_value, max_value + 1)]

    for value in values_to_move:
        await move_slider_to_value(page, slider_selector, value)
        current_value = await page.get_attribute(slider_selector, "aria-valuenow")
        skill_text = await page.text_content(skill_text_selector)

        print(f"[{button_name}] 슬라이더 값: {current_value}, 스킬 텍스트: {skill_text}")

        # 데이터 저장
        csv_data.append({
            "Button Name": button_name,
            "Slider Value": current_value,
            "Skill Text": skill_text.strip()
        })

async def extract_and_save_to_csv(data, file_name="output.csv"):
    """
    추출한 데이터를 CSV로 저장합니다.
    """
    df = pd.DataFrame(data)
    df.to_csv(file_name, index=False, encoding="utf-8-sig")
    print(f"데이터가 {file_name}에 저장되었습니다.")

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        context = await browser.new_context()
        page = await context.new_page()

        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("페이지 로드 완료")

        # 언어 선택 관련
        combobox_selector = 'input[aria-label="Language"]'
        korean_option_selector = 'div.q-item__label:has-text("한국어")'
        await change_language_to_korean(page, combobox_selector, korean_option_selector)

        # 상위 FAB 버튼 선택자
        fab_button_selector = ".q-btn.q-btn--fab"

        # 슬라이더와 스킬 텍스트 선택자
        slider_selector = ".q-slider"
        skill_text_selector = ".col.middle.q-mt-xs.skilltext"

        # Uptie 버튼 선택자
        uptie_buttons = {
            "첫 번째 Uptie": 'a:has(img[src="https://img.kusoge.xyz/limbus/img/ui/uptie_1.png"])'
        }

        # CSV 데이터 저장용 리스트
        csv_data = []

        # Uptie 버튼 클릭 및 슬라이더 조작과 변화 추적
        for button_name, uptie_button_selector in uptie_buttons.items():
            await page.click(fab_button_selector)
            print(f"[{button_name}] 상위 FAB 버튼 클릭 완료")

            await page.wait_for_selector(uptie_button_selector)
            await page.click(uptie_button_selector)
            print(f"[{button_name}] Uptie 버튼 클릭 완료")

            await monitor_slider_and_skill_change(page, slider_selector, skill_text_selector, button_name, csv_data)

        # CSV로 저장
        await extract_and_save_to_csv(csv_data, file_name="webpage_data.csv")

        await asyncio.sleep(2)
        await browser.close()

# Jupyter Notebook에서 실행
await main()


페이지 로드 완료
언어 선택 콤보박스 클릭 완료.
한국어 옵션 선택 완료.
[첫 번째 Uptie] 상위 FAB 버튼 클릭 완료
[첫 번째 Uptie] Uptie 버튼 클릭 완료
슬라이더를 1로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 1, 스킬 텍스트: SKILL 13x쳐내기1공격 가중치1[앞면 적중시]침잠 1 부여
슬라이더를 2로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 2, 스킬 텍스트: SKILL 13x쳐내기2공격 가중치1[앞면 적중시]침잠 1 부여
슬라이더를 3로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 3, 스킬 텍스트: SKILL 13x쳐내기3공격 가중치1[앞면 적중시]침잠 1 부여
슬라이더를 4로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 4, 스킬 텍스트: SKILL 13x쳐내기4공격 가중치1[앞면 적중시]침잠 1 부여
슬라이더를 5로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 5, 스킬 텍스트: SKILL 13x쳐내기5공격 가중치1[앞면 적중시]침잠 1 부여
슬라이더를 6로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 6, 스킬 텍스트: SKILL 13x쳐내기6공격 가중치1[앞면 적중시]침잠 1 부여
슬라이더를 7로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 7, 스킬 텍스트: SKILL 13x쳐내기7공격 가중치1[앞면 적중시]침잠 1 부여
슬라이더를 8로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 8, 스킬 텍스트: SKILL 13x쳐내기8공격 가중치1[앞면 적중시]침잠 1 부여
슬라이더를 9로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 9, 스킬 텍스트: SKILL 13x쳐내기9공격 가중치1[앞면 적중시]침잠 1 부여
슬라이더를 10로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 10, 스킬 텍스트: SKILL 13x쳐내기10공격 가중치1[앞면 적중시]침잠 1 부여
슬라이더를 11로 이동 완료.
[첫 번째 Uptie] 슬라이더 값: 11, 스킬 텍스트: SKILL 13

In [6]:
from playwright.async_api import async_playwright
import asyncio

async def extract_identity(page):
    """
    Playwright를 사용해 'Identity' 정보를 추출합니다.
    """
    try:
        # 아이덴티티 정보를 담고 있는 div 요소의 텍스트를 가져옵니다.
        identity_selector = 'div.flex.flex-center.q-pr-md.title'
        identity = await page.text_content(identity_selector)
        identity = identity.strip() if identity else "Unknown"
        print(f"아이덴티티: {identity}")
        return identity
    except Exception as e:
        print(f"아이덴티티 추출 중 오류 발생: {e}")
        return "Unknown"

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 웹페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # 아이덴티티 추출
        identity = await extract_identity(page)

        # 추출 결과 출력
        print(f"추출된 아이덴티티: {identity}")

        await browser.close()

# Jupyter Notebook에서 실행
await main()

  def get_debug(self):


웹페이지 로드 완료
아이덴티티: [LCB Sinner] Yi Sang
추출된 아이덴티티: [LCB Sinner] Yi Sang


In [7]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio

async def extract_identity(page):
    """
    Playwright를 사용해 'Identity' 정보를 추출합니다.
    """
    try:
        # 아이덴티티 정보를 담고 있는 div 요소의 텍스트를 가져옵니다.
        identity_selector = 'div.flex.flex-center.q-pr-md.title'
        identity = await page.text_content(identity_selector)
        identity = identity.strip() if identity else "Unknown"
        print(f"아이덴티티: {identity}")
        return identity
    except Exception as e:
        print(f"아이덴티티 추출 중 오류 발생: {e}")
        return "Unknown"

async def save_identity_to_csv(identity, file_name):
    """
    추출한 Identity 정보를 CSV 파일로 저장합니다.
    """
    try:
        # 데이터프레임 생성
        df = pd.DataFrame({"Identity": [identity]})
        # CSV 파일로 저장
        df.to_csv(file_name, index=False, encoding="utf-8-sig")
        print(f"데이터가 {file_name}에 저장되었습니다.")
    except Exception as e:
        print(f"CSV 저장 중 오류 발생: {e}")

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 웹페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # 아이덴티티 추출
        identity = await extract_identity(page)

        # 추출 결과를 CSV 파일로 저장
        await save_identity_to_csv(identity, "[LCB Sinner] Yi Sang.csv")

        await browser.close()

# Jupyter Notebook에서 실행
await main()


웹페이지 로드 완료
아이덴티티: [LCB Sinner] Yi Sang
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [8]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re  # 정규식을 사용하여 rarity 숫자 추출

async def extract_identity(page):
    """
    Playwright를 사용해 'Identity' 정보를 추출합니다.
    """
    try:
        # 아이덴티티 정보를 담고 있는 div 요소의 텍스트를 가져옵니다.
        identity_selector = 'div.flex.flex-center.q-pr-md.title'
        identity = await page.text_content(identity_selector)
        identity = identity.strip() if identity else "Unknown"
        print(f"아이덴티티: {identity}")
        return identity
    except Exception as e:
        print(f"아이덴티티 추출 중 오류 발생: {e}")
        return "Unknown"

async def extract_rarity(page):
    """
    Playwright를 사용해 'Rarity' 정보를 추출합니다.
    """
    try:
        # Rarity 정보를 담고 있는 img 태그의 src 속성에서 숫자를 추출합니다.
        rarity_selector = 'img.q-img__image.q-img__image--without-transition'
        rarity_img_src = await page.get_attribute(rarity_selector, "src")
        print(f"Rarity 이미지 소스: {rarity_img_src}")

        # 정규식을 사용하여 rarity 숫자를 추출
        match = re.search(r'rarity_(\d+)\.png', rarity_img_src)
        rarity = match.group(1) if match else "Unknown"
        print(f"Rarity: {rarity}")
        return rarity
    except Exception as e:
        print(f"Rarity 추출 중 오류 발생: {e}")
        return "Unknown"

async def save_to_csv(data, file_name):
    """
    추출한 정보를 CSV 파일로 저장합니다.
    """
    try:
        # 데이터프레임 생성
        df = pd.DataFrame(data)
        # CSV 파일로 저장
        df.to_csv(file_name, index=False, encoding="utf-8-sig")
        print(f"데이터가 {file_name}에 저장되었습니다.")
    except Exception as e:
        print(f"CSV 저장 중 오류 발생: {e}")

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 웹페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Identity와 Rarity 정보 추출
        identity = await extract_identity(page)
        rarity = await extract_rarity(page)

        # 추출된 정보를 리스트로 저장
        data = [{"Identity": identity, "Rarity": rarity}]

        # CSV로 저장
        await save_to_csv(data, "[LCB Sinner] Yi Sang.csv")

        await browser.close()

# Jupyter Notebook에서 실행
await main()


웹페이지 로드 완료
아이덴티티: [LCB Sinner] Yi Sang
Rarity 이미지 소스: https://img.kusoge.xyz/limbus/img/ui/rarity_1.png
Rarity: 1
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [9]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re  # 정규식을 사용하여 rarity와 uptie 숫자 추출

async def extract_identity(page):
    """
    Playwright를 사용해 'Identity' 정보를 추출합니다.
    """
    try:
        # 아이덴티티 정보를 담고 있는 div 요소의 텍스트를 가져옵니다.
        identity_selector = 'div.flex.flex-center.q-pr-md.title'
        identity = await page.text_content(identity_selector)
        identity = identity.strip() if identity else "Unknown"
        print(f"아이덴티티: {identity}")
        return identity
    except Exception as e:
        print(f"아이덴티티 추출 중 오류 발생: {e}")
        return "Unknown"

async def extract_rarity(page):
    """
    Playwright를 사용해 'Rarity' 정보를 추출합니다.
    """
    try:
        # Rarity 정보를 담고 있는 img 태그의 src 속성에서 숫자를 추출합니다.
        rarity_selector = 'img.q-img__image.q-img__image--without-transition'
        rarity_img_src = await page.get_attribute(rarity_selector, "src")
        print(f"Rarity 이미지 소스: {rarity_img_src}")

        # 정규식을 사용하여 rarity 숫자를 추출
        match = re.search(r'rarity_(\d+)\.png', rarity_img_src)
        rarity = match.group(1) if match else "Unknown"
        print(f"Rarity: {rarity}")
        return rarity
    except Exception as e:
        print(f"Rarity 추출 중 오류 발생: {e}")
        return "Unknown"

async def extract_uptie(page):
    """
    Playwright를 사용해 'Uptie' 정보를 추출합니다.
    """
    try:
        # Uptie 정보를 담고 있는 img 태그의 src 속성에서 숫자를 추출합니다.
        uptie_selector = 'i.q-icon.q-fab__icon img'
        uptie_img_src = await page.get_attribute(uptie_selector, "src")
        print(f"Uptie 이미지 소스: {uptie_img_src}")

        # 정규식을 사용하여 uptie 숫자를 추출
        match = re.search(r'uptie_(\d+)\.png', uptie_img_src)
        uptie = match.group(1) if match else "Unknown"
        print(f"Uptie: {uptie}")
        return uptie
    except Exception as e:
        print(f"Uptie 추출 중 오류 발생: {e}")
        return "Unknown"

async def save_to_csv(data, file_name):
    """
    추출한 정보를 CSV 파일로 저장합니다.
    """
    try:
        # 데이터프레임 생성
        df = pd.DataFrame(data)
        # CSV 파일로 저장
        df.to_csv(file_name, index=False, encoding="utf-8-sig")
        print(f"데이터가 {file_name}에 저장되었습니다.")
    except Exception as e:
        print(f"CSV 저장 중 오류 발생: {e}")

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 웹페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Identity, Rarity, Uptie 정보 추출
        identity = await extract_identity(page)
        rarity = await extract_rarity(page)
        uptie = await extract_uptie(page)

        # 추출된 정보를 리스트로 저장
        data = [{"Identity": identity, "Rarity": rarity, "Uptie": uptie}]

        # CSV로 저장
        await save_to_csv(data, "[LCB Sinner] Yi Sang.csv")

        await browser.close()

# Jupyter Notebook에서 실행
await main()


웹페이지 로드 완료
아이덴티티: [LCB Sinner] Yi Sang
Rarity 이미지 소스: https://img.kusoge.xyz/limbus/img/ui/rarity_1.png
Rarity: 1
Uptie 이미지 소스: https://img.kusoge.xyz/limbus/img/ui/uptie_4.png
Uptie: 4
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [10]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 웹페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Identity 추출
        identity = await page.text_content('div.flex.flex-center.q-pr-md.title')
        identity = identity.strip() if identity else "Unknown"

        # Rarity 추출
        rarity_img_src = await page.get_attribute('img.q-img__image.q-img__image--without-transition', "src")
        rarity = re.search(r'rarity_(\d+)\.png', rarity_img_src).group(1) if rarity_img_src else "Unknown"

        # Uptie 추출
        uptie_img_src = await page.get_attribute('i.q-icon.q-fab__icon img', "src")
        uptie = re.search(r'uptie_(\d+)\.png', uptie_img_src).group(1) if uptie_img_src else "Unknown"

        # Level 추출
        level_text = await page.text_content('div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary')
        level = re.search(r'level:\s*(\d+)', level_text).group(1) if level_text else "Unknown"

        # 추출된 정보를 리스트로 저장
        data = [{"Identity": identity, "Rarity": rarity, "Uptie": uptie, "Level": level}]

        # CSV로 저장
        df = pd.DataFrame(data)
        df.to_csv("[LCB Sinner] Yi Sang.csv", index=False, encoding="utf-8-sig")
        print("데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.")

        await browser.close()

# Jupyter Notebook에서 실행
await main()


웹페이지 로드 완료
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [20]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re
# 트리 구조를 출력하는 코드
async def print_tree_structure(page):
    # q-img.q-img--menu 요소를 찾고, 그 요소의 자식 트리 구조를 확인
    elements = await page.query_selector_all('div.q-img.q-img--menu')
    
    for idx, element in enumerate(elements):
        # 각 요소의 HTML 구조 출력
        html_content = await element.inner_html()
        print(f"Element {idx+1} HTML: {html_content}")

        # 각 요소의 부모와 자식 트리 정보 확인
        parent_element = await element.evaluate('el => el.parentElement')
        if parent_element:
            parent_html = await page.evaluate('(el) => el.outerHTML', parent_element)
            print(f"  Parent HTML: {parent_html}")

        # 196이 포함된 요소를 찾기 위해 텍스트 탐색
        text_content = await element.text_content()
        if text_content and "196" in text_content:
            print(f"  Found value '196' in element {idx+1}: {text_content}")
            # 필요한 정보를 추출 후 종료
            break
        print("  No '196' value found in this element.")

# 사용법
async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 웹페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Identity 추출
        identity = await page.text_content('div.flex.flex-center.q-pr-md.title')
        identity = identity.strip() if identity else "Unknown"

        # Rarity 추출
        rarity_img_src = await page.get_attribute('img.q-img__image.q-img__image--without-transition', "src")
        rarity = re.search(r'rarity_(\d+)\.png', rarity_img_src).group(1) if rarity_img_src else "Unknown"

        # Uptie 추출
        uptie_img_src = await page.get_attribute('i.q-icon.q-fab__icon img', "src")
        uptie = re.search(r'uptie_(\d+)\.png', uptie_img_src).group(1) if uptie_img_src else "Unknown"

        # Level 추출
        level_text = await page.text_content('div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary')
        level = re.search(r'level:\s*(\d+)', level_text).group(1) if level_text else "Unknown"

        # HP 추출 (구조 반영)
        hp_selector = 'div.q-img.q-img--menu + div'  # HP 값은 아이콘(div.q-img) 바로 다음 div에 있음
        hp_text = await page.text_content(hp_selector)
        hp = hp_text.strip() if hp_text else "Unknown"
        await print_tree_structure(page)

        # 추출된 정보를 리스트로 저장
        data = [{"Identity": identity, "Rarity": rarity, "Uptie": uptie, "Level": level, "HP": hp}]
        
        # CSV로 저장
        df = pd.DataFrame(data)
        df.to_csv("[LCB Sinner] Yi Sang.csv", index=False, encoding="utf-8-sig")
        print("데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.")

        await browser.close()

# Jupyter Notebook에서 실행
await main()


웹페이지 로드 완료
Element 1 HTML: <div style="padding-bottom: 168.485%;"></div><div class="q-img__container absolute-full"><img class="q-img__image q-img__image--without-transition q-img__image--loaded" height="30px" loading="lazy" fetchpriority="auto" aria-hidden="true" draggable="false" src="https://img.kusoge.xyz/limbus/img/ui/rarity_1.png" style="object-fit: scale-down; object-position: 50% 50%;"></div><div class="q-img__loading absolute-full flex flex-center q-transition--fade-leave-active q-transition--fade-leave-to"></div><div class="q-img__content absolute-full q-anchor--skip q-transition--fade-enter-active q-transition--fade-enter-to"></div>
  Parent HTML: None
  No '196' value found in this element.
Element 2 HTML: <div style="padding-bottom: 154.217%;"></div><div class="q-img__container absolute-full"><img class="q-img__image q-img__image--without-transition q-img__image--loaded" loading="lazy" fetchpriority="auto" aria-hidden="true" draggable="false" src="https://img.kusoge.xyz/li

In [30]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re
async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 웹페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Identity 추출
        identity = await page.text_content('div.flex.flex-center.q-pr-md.title')
        identity = identity.strip() if identity else "Unknown"

        # Rarity 추출
        rarity_img_src = await page.get_attribute('img.q-img__image.q-img__image--without-transition', "src")
        rarity = re.search(r'rarity_(\d+)\.png', rarity_img_src).group(1) if rarity_img_src else "Unknown"

        # Uptie 추출
        uptie_img_src = await page.get_attribute('i.q-icon.q-fab__icon img', "src")
        uptie = re.search(r'uptie_(\d+)\.png', uptie_img_src).group(1) if uptie_img_src else "Unknown"

        # Level 추출
        level_text = await page.text_content('div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary')
        level = re.search(r'level:\s*(\d+)', level_text).group(1) if level_text else "Unknown"

        # 추출된 정보를 리스트로 저장
        data = [{"Identity": identity, "Rarity": rarity, "Uptie": uptie, "Level": level}]
        
        # CSV로 저장
        df = pd.DataFrame(data)
        df.to_csv("[LCB Sinner] Yi Sang.csv", index=False, encoding="utf-8-sig")
        print("데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.")

        await browser.close()

# Jupyter Notebook에서 실행
await main()

웹페이지 로드 완료
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [46]:
from playwright.async_api import async_playwright
import asyncio

async def extract_sibling_of_grandparent(page):
    # 이미지 요소들을 선택
    images = await page.query_selector_all('img.q-img__image.q-img__image--without-transition.q-img__image--loaded')
    print(f"Imgs: {len(images)} images found.")

    # 각 이미지에서 src 속성 추출
    for i, image in enumerate(images):
        src = await image.get_attribute('src')
        #print(f"Image {i + 1} src: {src}")

        # 특정 src 값을 가진 이미지 찾기
        if src == "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png":
            # 이미지의 부모 두 단계 위로 올라가서 형제 요소 찾기
            img_parent = await image.evaluate_handle('node => node.parentElement.parentElement.parentElement')

            # 부모의 부모의 형제 요소 찾기 (next sibling)
            sibling = await img_parent.evaluate_handle('node => node.nextElementSibling')
            sibling_html = await sibling.text_content()
            print(f"sibling {sibling_html}")
    return None

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")

        # 부모의 부모의 형제 요소 추출
        sibling_text = await extract_sibling_of_grandparent(page)
        if sibling_text:
            print(f"Extracted text: {sibling_text}")
        else:
            print("Failed to extract text.")

        await browser.close()

# Jupyter Notebook에서 실행
await main()


Imgs: 49 images found.
sibling 196
Failed to extract text.


In [47]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def extract_data_from_page(page):
    # Identity 추출
    identity = await page.text_content('div.flex.flex-center.q-pr-md.title')
    identity = identity.strip() if identity else "Unknown"

    # Rarity 추출
    rarity_img_src = await page.get_attribute('img.q-img__image.q-img__image--without-transition', "src")
    rarity = re.search(r'rarity_(\d+)\.png', rarity_img_src).group(1) if rarity_img_src else "Unknown"

    # Uptie 추출
    uptie_img_src = await page.get_attribute('i.q-icon.q-fab__icon img', "src")
    uptie = re.search(r'uptie_(\d+)\.png', uptie_img_src).group(1) if uptie_img_src else "Unknown"

    # Level 추출
    level_text = await page.text_content('div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary')
    level = re.search(r'level:\s*(\d+)', level_text).group(1) if level_text else "Unknown"

    # HP 값 (196) 추출
    images = await page.query_selector_all('img.q-img__image.q-img__image--without-transition.q-img__image--loaded')
    for image in images:
        src = await image.get_attribute('src')
        if src == "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png":
            # 부모 세 단계 위로 올라가 형제 요소에서 196 추출
            sibling = await image.evaluate_handle('node => node.parentElement.parentElement.parentElement.nextElementSibling')
            hp_value = await sibling.text_content()
            break
    else:
        hp_value = "Unknown"  # 찾을 수 없으면 Unknown 처리

    # 추출된 데이터를 딕셔너리 형태로 반환
    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        "HP": hp_value.strip() if hp_value else "Unknown"
    }

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # 데이터 추출
        data = await extract_data_from_page(page)

        # 데이터프레임으로 변환 후 CSV로 저장
        df = pd.DataFrame([data])
        df.to_csv("[LCB Sinner] Yi Sang.csv", index=False, encoding="utf-8-sig")
        print("데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.")

        await browser.close()

# Jupyter Notebook에서 실행
await main()


웹페이지 로드 완료
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [48]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def extract_value_from_image(page, image_src):
    """
    주어진 이미지의 src를 찾고, 해당 이미지의 부모에서 형제 요소의 값을 추출하는 함수
    """
    images = await page.query_selector_all('img.q-img__image.q-img__image--without-transition.q-img__image--loaded')
    value = "Unknown"
    for image in images:
        src = await image.get_attribute('src')
        if src == image_src:
            sibling = await image.evaluate_handle('node => node.parentElement.parentElement.parentElement.nextElementSibling')
            value = await sibling.text_content()
            break
    return value.strip() if value != "Unknown" else "Unknown"

async def extract_data_from_page(page):
    """
    페이지에서 필요한 정보를 추출하는 함수
    """
    # Identity 추출
    identity = await page.text_content('div.flex.flex-center.q-pr-md.title')
    identity = identity.strip() if identity else "Unknown"

    # Rarity 추출
    rarity_img_src = await page.get_attribute('img.q-img__image.q-img__image--without-transition', "src")
    rarity = re.search(r'rarity_(\d+)\.png', rarity_img_src).group(1) if rarity_img_src else "Unknown"

    # Uptie 추출
    uptie_img_src = await page.get_attribute('i.q-icon.q-fab__icon img', "src")
    uptie = re.search(r'uptie_(\d+)\.png', uptie_img_src).group(1) if uptie_img_src else "Unknown"

    # Level 추출
    level_text = await page.text_content('div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary')
    level = re.search(r'level:\s*(\d+)', level_text).group(1) if level_text else "Unknown"

    # HP 값 (196) 추출
    hp_value = await extract_value_from_image(page, "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png")
    
    # Speed 값 (spd) 추출
    speed_value = await extract_value_from_image(page, "https://img.kusoge.xyz/limbus/img/ui/stats_spd.png")
    
    # 추출된 데이터를 딕셔너리 형태로 반환
    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        "HP": hp_value,
        "Speed": speed_value
    }

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # 데이터 추출
        data = await extract_data_from_page(page)

        # 데이터프레임으로 변환 후 CSV로 저장
        df = pd.DataFrame([data])
        df.to_csv("[LCB Sinner] Yi Sang.csv", index=False, encoding="utf-8-sig")
        print("데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.")

        await browser.close()

# Jupyter Notebook에서 실행
await main()


웹페이지 로드 완료
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [49]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def get_attribute_value(page, selector, attribute, default="Unknown"):
    """
    주어진 셀렉터에서 attribute 값을 추출하는 함수
    """
    element = await page.query_selector(selector)
    if element:
        return await element.get_attribute(attribute)
    return default

async def get_text_content(page, selector, default="Unknown"):
    """
    주어진 셀렉터에서 텍스트 값을 추출하는 함수
    """
    element = await page.query_selector(selector)
    if element:
        return await element.text_content()
    return default

async def extract_value_with_regex(text, pattern, default="Unknown"):
    """
    주어진 텍스트에서 정규식 패턴을 사용하여 값을 추출하는 함수
    """
    match = re.search(pattern, text)
    return match.group(1) if match else default

async def extract_value_from_image(page, image_src):
    """
    주어진 이미지의 src를 찾고, 해당 이미지의 부모에서 형제 요소의 값을 추출하는 함수
    """
    images = await page.query_selector_all('img.q-img__image.q-img__image--without-transition.q-img__image--loaded')
    value = "Unknown"
    for image in images:
        src = await image.get_attribute('src')
        if src == image_src:
            sibling = await image.evaluate_handle('node => node.parentElement.parentElement.parentElement.nextElementSibling')
            value = await sibling.text_content()
            break
    return value.strip() if value != "Unknown" else "Unknown"

async def extract_identity(page):
    """
    Identity 값을 추출하는 함수
    """
    return await get_text_content(page, 'div.flex.flex-center.q-pr-md.title')

async def extract_uptie(page):
    """
    Uptie 값을 추출하는 함수
    """
    uptie_img_src = await get_attribute_value(page, 'i.q-icon.q-fab__icon img', "src")
    return re.search(r'uptie_(\d+)\.png', uptie_img_src).group(1) if uptie_img_src else "Unknown"

async def extract_data_from_page(page):
    """
    페이지에서 필요한 정보를 추출하는 함수
    """
    # Identity 추출
    identity = await extract_identity(page)

    # Rarity 추출 (정규식)
    rarity_img_src = await get_attribute_value(page, 'img.q-img__image.q-img__image--without-transition', "src")
    rarity = await extract_value_with_regex(rarity_img_src, r'rarity_(\d+)\.png')

    # Uptie 추출
    uptie = await extract_uptie(page)

    # Level 추출 (정규식)
    level_text = await get_text_content(page, 'div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary')
    level = await extract_value_with_regex(level_text, r'level:\s*(\d+)')

    # HP 값 (196) 추출
    hp_value = await extract_value_from_image(page, "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png")
    
    # Speed 값 (spd) 추출
    speed_value = await extract_value_from_image(page, "https://img.kusoge.xyz/limbus/img/ui/stats_spd.png")
    
    # Defense 값 (def) 추출
    defense_value = await extract_value_from_image(page, "https://img.kusoge.xyz/limbus/img/ui/stats_def.png")
    
    # 추출된 데이터를 딕셔너리 형태로 반환
    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        "HP": hp_value,
        "Speed": speed_value,
        "Defense": defense_value
    }

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # 데이터 추출
        data = await extract_data_from_page(page)

        # 데이터프레임으로 변환 후 CSV로 저장
        df = pd.DataFrame([data])
        df.to_csv("[LCB Sinner] Yi Sang.csv", index=False, encoding="utf-8-sig")
        print("데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.")

        await browser.close()

# Jupyter Notebook에서 실행
await main()


웹페이지 로드 완료
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [50]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def get_attribute_value(page, selector, attribute, default="Unknown"):
    """
    주어진 셀렉터에서 attribute 값을 추출하는 함수
    """
    element = await page.query_selector(selector)
    if element:
        return await element.get_attribute(attribute)
    return default

async def get_text_content(page, selector, default="Unknown"):
    """
    주어진 셀렉터에서 텍스트 값을 추출하는 함수
    """
    element = await page.query_selector(selector)
    if element:
        return await element.text_content()
    return default

async def extract_value_with_regex(text, pattern, default="Unknown"):
    """
    주어진 텍스트에서 정규식 패턴을 사용하여 값을 추출하는 함수
    """
    match = re.search(pattern, text)
    return match.group(1) if match else default

async def extract_value_from_image(page, image_src, depth):
    """
    특정 이미지의 src를 기반으로, 부모 노드에서 특정 깊이(depth)의 형제 요소의 값을 추출하는 함수
    :param page: Playwright의 page 객체
    :param image_src: 찾고자 하는 이미지의 src 속성 값
    :param depth: 부모 노드를 몇 단계 위로 올라가야 하는지 설정
    :return: 형제 요소의 텍스트 값
    """
    images = await page.query_selector_all('img.q-img__image.q-img__image--without-transition.q-img__image--loaded')
    value = "Unknown"

    for image in images:
        src = await image.get_attribute('src')
        if src == image_src:
            # 부모 노드를 depth 단계만큼 올라가기
            parent = image
            for _ in range(depth):
                parent = await parent.evaluate_handle('node => node.parentElement')
                if not parent:
                    break
            
            if parent:
                # 최종 부모 노드의 형제 노드(next sibling)에서 텍스트 추출
                sibling = await parent.evaluate_handle('node => node.nextElementSibling')
                if sibling:
                    value = await sibling.text_content()
            break

    return value.strip() if value != "Unknown" else "Unknown"

async def extract_identity(page):
    """
    Identity 값을 추출하는 함수
    """
    return await get_text_content(page, 'div.flex.flex-center.q-pr-md.title')

async def extract_uptie(page):
    """
    Uptie 값을 추출하는 함수
    """
    uptie_img_src = await get_attribute_value(page, 'i.q-icon.q-fab__icon img', "src")
    return re.search(r'uptie_(\d+)\.png', uptie_img_src).group(1) if uptie_img_src else "Unknown"

async def extract_data_from_page(page):
    """
    페이지에서 필요한 정보를 추출하는 함수
    """
    # Identity 추출
    identity = await extract_identity(page)

    # Rarity 추출 (정규식)
    rarity_img_src = await get_attribute_value(page, 'img.q-img__image.q-img__image--without-transition', "src")
    rarity = await extract_value_with_regex(rarity_img_src, r'rarity_(\d+)\.png')

    # Uptie 추출
    uptie = await extract_uptie(page)

    # Level 추출 (정규식)
    level_text = await get_text_content(page, 'div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary')
    level = await extract_value_with_regex(level_text, r'level:\s*(\d+)')

    # HP 값 (196) 추출
    hp_value = await extract_value_from_image(page, "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png", 3)
    
    # Speed 값 (spd) 추출
    speed_value = await extract_value_from_image(page, "https://img.kusoge.xyz/limbus/img/ui/stats_spd.png", 3)
    
    # Defense 값 (def) 추출
    defense_value = await extract_value_from_image(page, "https://img.kusoge.xyz/limbus/img/ui/stats_def.png", 3)
    
    # 추출된 데이터를 딕셔너리 형태로 반환
    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        "HP": hp_value,
        "Speed": speed_value,
        "Defense": defense_value
    }

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # 데이터 추출
        data = await extract_data_from_page(page)

        # 데이터프레임으로 변환 후 CSV로 저장
        df = pd.DataFrame([data])
        df.to_csv("[LCB Sinner] Yi Sang.csv", index=False, encoding="utf-8-sig")
        print("데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.")

        await browser.close()

# Jupyter Notebook에서 실행
await main()


웹페이지 로드 완료
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [51]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def get_attribute_value(page, selector, attribute, default="Unknown"):
    """
    주어진 셀렉터에서 attribute 값을 추출하는 함수
    """
    element = await page.query_selector(selector)
    if element:
        return await element.get_attribute(attribute)
    return default

async def get_text_content(page, selector, default="Unknown"):
    """
    주어진 셀렉터에서 텍스트 값을 추출하는 함수
    """
    element = await page.query_selector(selector)
    if element:
        return await element.text_content()
    return default

async def extract_value_with_regex(text, pattern, default="Unknown"):
    """
    주어진 텍스트에서 정규식 패턴을 사용하여 값을 추출하는 함수
    """
    match = re.search(pattern, text)
    return match.group(1) if match else default

async def extract_stat_value(page, image_src, depth):
    images = await page.query_selector_all('img[fit="scale-down"]')
    value = "Unknown"

    for image in images:
        src = await image.get_attribute('src')
        if src == image_src:
            parent = image
            for _ in range(depth):
                parent = await parent.evaluate_handle('node => node.parentElement')
                if not parent:
                    break
            
            if parent:
                sibling = await parent.evaluate_handle('node => node.nextElementSibling')
                if sibling:
                    value = await sibling.text_content()
            break

    return value.strip() if value != "Unknown" else "Unknown"

async def extract_main_value(page, image_src, depth):
    images = await page.query_selector_all('img.q-img__image.q-img__image--without-transition.q-img__image--loaded')
    value = "Unknown"

    for image in images:
        src = await image.get_attribute('src')
        if src == image_src:
            parent = image
            for _ in range(depth):
                parent = await parent.evaluate_handle('node => node.parentElement')
                if not parent:
                    break
            
            if parent:
                sibling = await parent.evaluate_handle('node => node.nextElementSibling')
                if sibling:
                    value = await sibling.text_content()
            break

    return value.strip() if value != "Unknown" else "Unknown"

async def extract_identity(page):
    """
    Identity 값을 추출하는 함수
    """
    return await get_text_content(page, 'div.flex.flex-center.q-pr-md.title')

async def extract_uptie(page):
    """
    Uptie 값을 추출하는 함수
    """
    uptie_img_src = await get_attribute_value(page, 'i.q-icon.q-fab__icon img', "src")
    return re.search(r'uptie_(\d+)\.png', uptie_img_src).group(1) if uptie_img_src else "Unknown"

async def extract_data_from_page(page):
    # Identity 추출
    identity = await extract_identity(page)

    # Rarity 추출
    rarity_img_src = await get_attribute_value(page, 'img.q-img__image.q-img__image--without-transition', "src")
    rarity = await extract_value_with_regex(rarity_img_src, r'rarity_(\d+)\.png')

    # Uptie 추출
    uptie = await extract_uptie(page)

    # Level 추출
    level_text = await get_text_content(page, 'div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary')
    level = await extract_value_with_regex(level_text, r'level:\s*(\d+)')

    # HP, Speed, Defense 값 추출 (stats 관련)
    hp_value = await extract_stat_value(page, "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png", 3)
    speed_value = await extract_stat_value(page, "https://img.kusoge.xyz/limbus/img/ui/stats_spd.png", 3)
    defense_value = await extract_stat_value(page, "https://img.kusoge.xyz/limbus/img/ui/stats_def.png", 3)

    # Atk Type HIT 값 추출
    atk_type_hit_value = await extract_stat_value(page, "https://img.kusoge.xyz/limbus/img/ui/atk_type_HIT.png", 1)

    # 데이터 반환
    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        "HP": hp_value,
        "Speed": speed_value,
        "Defense": defense_value,
        "atk_type_HIT": atk_type_hit_value
    }


async def save_data_to_csv(data, file_name):
    """
    데이터를 CSV 파일로 저장하는 함수
    :param data: 데이터 딕셔너리
    :param file_name: 저장할 파일 이름
    """
    df = pd.DataFrame([data])  # 리스트로 변환하여 DataFrame 생성
    df.to_csv(file_name, index=False, encoding="utf-8-sig")
    print(f"데이터가 {file_name}에 저장되었습니다.")


async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        context = await browser.new_context()
        page = await context.new_page()

        # 웹페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # 데이터 추출
        data = await extract_data_from_page(page)

        # CSV 저장
        await save_data_to_csv(data, "[LCB Sinner] Yi Sang.csv")

        await browser.close()

# Jupyter Notebook에서 실행
await main()

웹페이지 로드 완료
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [53]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def get_attribute_value(page, selector, attribute, default="Unknown"):
    """
    주어진 셀렉터에서 attribute 값을 추출하는 함수
    """
    element = await page.query_selector(selector)
    if element:
        return await element.get_attribute(attribute)
    return default

async def get_text_content(page, selector, default="Unknown"):
    """
    주어진 셀렉터에서 텍스트 값을 추출하는 함수
    """
    element = await page.query_selector(selector)
    if element:
        return await element.text_content()
    return default

async def extract_value_with_regex(text, pattern, default="Unknown"):
    """
    주어진 텍스트에서 정규식 패턴을 사용하여 값을 추출하는 함수
    """
    match = re.search(pattern, text)
    return match.group(1) if match else default

async def extract_stat_value(page, image_src, depth):
    # 이미지 요소 검색
    image = await page.query_selector(f'img[src="{image_src}"]')
    if not image:
        return "Unknown"

    # 부모 노드로 depth만큼 올라가기
    parent = image
    for _ in range(depth):
        parent = await parent.evaluate_handle('node => node.parentElement')
        if not parent:
            return "Unknown"

    # 부모 노드의 형제 요소(nextElementSibling)에서 값 추출
    sibling = await parent.evaluate_handle('node => node.nextElementSibling')
    if sibling:
        value = await sibling.text_content()
        return value.strip()

    return "Unknown"
               
# Identity 추출
async def extract_identity(page):
    identity = await page.text_content('div.flex.flex-center.q-pr-md.title')
    return identity.strip() if identity else "Unknown"

# Rarity 추출
async def extract_rarity(page):
    rarity_img_src = await page.get_attribute('img.q-img__image.q-img__image--without-transition', "src")
    return re.search(r'rarity_(\d+)\.png', rarity_img_src).group(1) if rarity_img_src else "Unknown"

# Uptie 추출
async def extract_uptie(page):
    uptie_img_src = await page.get_attribute('i.q-icon.q-fab__icon img', "src")
    return re.search(r'uptie_(\d+)\.png', uptie_img_src).group(1) if uptie_img_src else "Unknown"

# Level 추출
async def extract_level(page):
    level_text = await page.text_content('div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary')
    return re.search(r'level:\s*(\d+)', level_text).group(1) if level_text else "Unknown"


async def extract_data_from_page(page):
    # Identity, Rarity, Uptie, Level 추출
    identity = await extract_identity(page)
    rarity = await extract_rarity(page)
    uptie = await extract_uptie(page)
    level = await extract_level(page)

    # Stat 정보 (이미지 src와 depth 값을 리스트로 관리)
    stats_to_extract = [
        {"name": "HP", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png", "depth": 3},
        {"name": "Speed", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_spd.png", "depth": 3},
        {"name": "Defense", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_def.png", "depth": 3},
        {"name": "Atk_Type_HIT", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_HIT.png", "depth": 1}
    ]

    # Stat 값 추출
    stats = {}
    for stat in stats_to_extract:
        stats[stat["name"]] = await extract_stat_value(page, stat["image_src"], stat["depth"])

    # 데이터 반환
    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        **stats  # 추출된 Stat 값 병합
    }

async def save_data_to_csv(data, file_name):
    """
    데이터를 CSV 파일로 저장하는 함수
    :param data: 데이터 딕셔너리
    :param file_name: 저장할 파일 이름
    """
    df = pd.DataFrame([data])  # 리스트로 변환하여 DataFrame 생성
    df.to_csv(file_name, index=False, encoding="utf-8-sig")
    print(f"데이터가 {file_name}에 저장되었습니다.")


async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)  # 브라우저 표시
        context = await browser.new_context()
        page = await context.new_page()

        # 웹페이지 열기
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # 데이터 추출
        data = await extract_data_from_page(page)

        # CSV 저장
        await save_to_csv(data, "[LCB Sinner] Yi Sang.csv")
        print("데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.")

        await browser.close()

# Jupyter Notebook에서 실행
await main()

웹페이지 로드 완료
CSV 저장 중 오류 발생: If using all scalar values, you must pass an index
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [55]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def get_attribute_value(page, selector, attribute, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.get_attribute(attribute) if element else default

async def get_text_content(page, selector, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.text_content() if element else default

async def extract_value_with_regex(text, pattern, default="Unknown"):
    match = re.search(pattern, text)
    return match.group(1) if match else default

async def extract_stat_value(page, image_src, depth):
    image = await page.query_selector(f'img[src="{image_src}"]')
    if not image:
        return "Unknown"

    parent = image
    for _ in range(depth):
        if not parent:
            return "Unknown"
        parent = await parent.evaluate_handle('node => node.parentElement')

    sibling = await parent.evaluate_handle('node => node.nextElementSibling')
    if sibling:
        value = await sibling.text_content()
        return value.strip()

    return "Unknown"

async def extract_identity(page):
    return await get_text_content(page, 'div.flex.flex-center.q-pr-md.title')

async def extract_rarity(page):
    rarity_img_src = await get_attribute_value(page, 'img.q-img__image.q-img__image--without-transition', "src")
    return await extract_value_with_regex(rarity_img_src, r'rarity_(\d+)\.png')

async def extract_uptie(page):
    uptie_img_src = await get_attribute_value(page, 'i.q-icon.q-fab__icon img', "src")
    return await extract_value_with_regex(uptie_img_src, r'uptie_(\d+)\.png')

async def extract_level(page):
    level_text = await get_text_content(page, 'div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary')
    return await extract_value_with_regex(level_text, r'level:\s*(\d+)')

async def extract_data_from_page(page):
    identity = await extract_identity(page)
    rarity = await extract_rarity(page)
    uptie = await extract_uptie(page)
    level = await extract_level(page)

    stats_to_extract = [
        {"name": "HP", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png", "depth": 3},
        {"name": "Speed", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_spd.png", "depth": 3},
        {"name": "Defense", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_def.png", "depth": 3},
        {"name": "Atk_Type_HIT", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_HIT.png", "depth": 1}
    ]

    stats = {}
    for stat in stats_to_extract:
        value = await extract_stat_value(page, stat["image_src"], stat["depth"])
        print(f"{stat['name']} extracted value: {value}")  # 디버깅 출력
        stats[stat["name"]] = value

    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        **stats
    }

async def save_data_to_csv(data, file_name):
    df = pd.DataFrame([data])
    df.to_csv(file_name, index=False, encoding="utf-8-sig")
    print(f"데이터가 {file_name}에 저장되었습니다.")

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        context = await browser.new_context()
        page = await context.new_page()

        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        data = await extract_data_from_page(page)
        await save_data_to_csv(data, "[LCB Sinner] Yi Sang.csv")

        await browser.close()

await main()


웹페이지 로드 완료
HP extracted value: 196
Speed extracted value: 4-8
Defense extracted value: 48
Atk_Type_HIT extracted value: Normal
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [56]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def get_attribute_value(page, selector, attribute, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.get_attribute(attribute) if element else default

async def get_text_content(page, selector, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.text_content() if element else default

async def extract_value_with_regex(text, pattern, default="Unknown"):
    match = re.search(pattern, text)
    return match.group(1) if match else default

async def extract_stat_value(page, image_src, depth):
    image = await page.query_selector(f'img[src="{image_src}"]')
    if not image:
        return "Unknown"

    parent = image
    for _ in range(depth):
        if not parent:
            return "Unknown"
        parent = await parent.evaluate_handle('node => node.parentElement')

    sibling = await parent.evaluate_handle('node => node.nextElementSibling')
    if sibling:
        value = await sibling.text_content()
        return value.strip()

    return "Unknown"

async def extract_identity(page):
    return await get_text_content(page, 'div.flex.flex-center.q-pr-md.title')

async def extract_rarity(page):
    rarity_img_src = await get_attribute_value(page, 'img.q-img__image.q-img__image--without-transition', "src")
    return await extract_value_with_regex(rarity_img_src, r'rarity_(\d+)\.png')

async def extract_uptie(page):
    uptie_img_src = await get_attribute_value(page, 'i.q-icon.q-fab__icon img', "src")
    return await extract_value_with_regex(uptie_img_src, r'uptie_(\d+)\.png')

async def extract_level(page):
    level_text = await get_text_content(page, 'div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary')
    return await extract_value_with_regex(level_text, r'level:\s*(\d+)')

async def extract_data_from_page(page):
    identity = await extract_identity(page)
    rarity = await extract_rarity(page)
    uptie = await extract_uptie(page)
    level = await extract_level(page)

    stats_to_extract = [
        {"name": "HP", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png", "depth": 3},
        {"name": "Speed", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_spd.png", "depth": 3},
        {"name": "Defense", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_def.png", "depth": 3},
        {"name": "Atk_Type_HIT", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_HIT.png", "depth": 1},
        {"name": "Atk_Type_PENETRATE", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_PENETRATE.png", "depth": 1},
        {"name": "Atk_Type_SLASH", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_SLASH.png", "depth": 1}
    ]

    stats = {}
    for stat in stats_to_extract:
        value = await extract_stat_value(page, stat["image_src"], stat["depth"])
        print(f"{stat['name']} extracted value: {value}")  # 디버깅 출력
        stats[stat["name"]] = value

    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        **stats
    }

async def save_data_to_csv(data, file_name):
    df = pd.DataFrame([data])
    df.to_csv(file_name, index=False, encoding="utf-8-sig")
    print(f"데이터가 {file_name}에 저장되었습니다.")

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        context = await browser.new_context()
        page = await context.new_page()

        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        data = await extract_data_from_page(page)
        await save_data_to_csv(data, "[LCB Sinner] Yi Sang.csv")

        await browser.close()

await main()


웹페이지 로드 완료
HP extracted value: 196
Speed extracted value: 4-8
Defense extracted value: 48
Atk_Type_HIT extracted value: Normal
Atk_Type_PENETRATE extracted value: Ineff.
Atk_Type_SLASH extracted value: Fatal
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [57]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def get_attribute_value(page, selector, attribute, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.get_attribute(attribute) if element else default

async def get_text_content(page, selector, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.text_content() if element else default

async def extract_value_with_regex(text, pattern, default="Unknown"):
    match = re.search(pattern, text)
    return match.group(1) if match else default

async def debug_log(name, value):
    """
    디버깅 로그 출력 함수.
    """
    print(f"{name} extracted value: {value}")

async def extract_stat_value(page, image_src, depth):
    image = await page.query_selector(f'img[src="{image_src}"]')
    if not image:
        return "Unknown"

    parent = image
    for _ in range(depth):
        if not parent:
            return "Unknown"
        parent = await parent.evaluate_handle('node => node.parentElement')

    sibling = await parent.evaluate_handle('node => node.nextElementSibling')
    if sibling:
        value = await sibling.text_content()
        await debug_log(image_src, value.strip())  # 디버깅 로그
        return value.strip()

    return "Unknown"

async def extract_identity(page):
    return await get_text_content(page, 'div.flex.flex-center.q-pr-md.title')

async def extract_value_from_attribute(page, selector, attribute, pattern, default="Unknown"):
    """
    선택자의 속성에서 값을 추출한 뒤 정규식을 사용하여 필요한 값을 반환하는 함수.
    """
    attribute_value = await get_attribute_value(page, selector, attribute, default)
    return await extract_value_with_regex(attribute_value, pattern, default)

async def extract_rarity(page):
    return await extract_value_from_attribute(
        page,
        'img.q-img__image.q-img__image--without-transition',
        "src",
        r'rarity_(\d+)\.png'
    )

async def extract_uptie(page):
    return await extract_value_from_attribute(
        page,
        'i.q-icon.q-fab__icon img',
        "src",
        r'uptie_(\d+)\.png'
    )

async def extract_level(page):
    level_text = await get_text_content(page, 'div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary')
    return await extract_value_with_regex(level_text, r'level:\s*(\d+)')

async def extract_stats(page, stats_to_extract):
    """
    주어진 이미지 src와 depth 리스트를 사용하여 Stat 값을 추출하는 함수.
    """
    stats = {}
    for stat in stats_to_extract:
        value = await extract_stat_value(page, stat["image_src"], stat["depth"])
        print(f"{stat['name']} extracted value: {value}")  # 디버깅 출력
        stats[stat["name"]] = value
    return stats

async def extract_data_from_page(page):
    identity = await extract_identity(page)
    rarity = await extract_rarity(page)
    uptie = await extract_uptie(page)
    level = await extract_level(page)

    stats_to_extract = [
        {"name": "HP", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png", "depth": 3},
        {"name": "Speed", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_spd.png", "depth": 3},
        {"name": "Defense", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_def.png", "depth": 3},
        {"name": "Atk_Type_HIT", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_HIT.png", "depth": 1},
        {"name": "Atk_Type_PENETRATE", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_PENETRATE.png", "depth": 1},
        {"name": "Atk_Type_SLASH", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_SLASH.png", "depth": 1}
    ]

    stats = await extract_stats(page, stats_to_extract)

    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        **stats
    }

async def save_data_to_csv(data, file_name, mode='w'):
    """
    데이터를 CSV 파일로 저장하는 함수.
    :param data: 데이터 딕셔너리
    :param file_name: 저장할 파일 이름
    :param mode: 파일 쓰기 모드 ('w': 덮어쓰기, 'a': 추가)
    """
    df = pd.DataFrame([data])
    df.to_csv(file_name, index=False, mode=mode, encoding="utf-8-sig", header=(mode == 'w'))
    print(f"데이터가 {file_name}에 저장되었습니다.")

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        context = await browser.new_context()
        page = await context.new_page()

        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        data = await extract_data_from_page(page)
        await save_data_to_csv(data, "[LCB Sinner] Yi Sang.csv", mode='w')

        await browser.close()

await main()

웹페이지 로드 완료
https://img.kusoge.xyz/limbus/img/ui/stats_hp.png extracted value: 196
HP extracted value: 196
https://img.kusoge.xyz/limbus/img/ui/stats_spd.png extracted value: 4-8
Speed extracted value: 4-8
https://img.kusoge.xyz/limbus/img/ui/stats_def.png extracted value: 48
Defense extracted value: 48
https://img.kusoge.xyz/limbus/img/ui/atk_type_HIT.png extracted value: Normal
Atk_Type_HIT extracted value: Normal
https://img.kusoge.xyz/limbus/img/ui/atk_type_PENETRATE.png extracted value: Ineff.
Atk_Type_PENETRATE extracted value: Ineff.
https://img.kusoge.xyz/limbus/img/ui/atk_type_SLASH.png extracted value: Fatal
Atk_Type_SLASH extracted value: Fatal
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [58]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def get_attribute_value(page, selector, attribute, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.get_attribute(attribute) if element else default

async def get_text_content(page, selector, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.text_content() if element else default

async def extract_value_with_regex(text, pattern, default="Unknown"):
    match = re.search(pattern, text)
    return match.group(1) if match else default

async def extract_value_from_attribute(page, selector, attribute, pattern, default="Unknown"):
    attribute_value = await get_attribute_value(page, selector, attribute, default)
    return await extract_value_with_regex(attribute_value, pattern, default)

async def extract_stat_value(page, image_src, depth):
    image = await page.query_selector(f'img[src="{image_src}"]')
    if not image:
        return "Unknown"

    parent = image
    for _ in range(depth):
        if not parent:
            return "Unknown"
        parent = await parent.evaluate_handle('node => node.parentElement')

    sibling = await parent.evaluate_handle('node => node.nextElementSibling')
    if sibling:
        value = await sibling.text_content()
        return value.strip()

    return "Unknown"

async def extract_stats(page, stats_to_extract):
    stats = {}
    for stat in stats_to_extract:
        value = await extract_stat_value(page, stat["image_src"], stat["depth"])
        print(f"{stat['name']} extracted value: {value}")
        stats[stat["name"]] = value
    return stats

async def save_data_to_csv(data, file_name, mode='w'):
    df = pd.DataFrame([data])
    df.to_csv(file_name, index=False, mode=mode, encoding="utf-8-sig", header=(mode == 'w'))
    print(f"데이터가 {file_name}에 저장되었습니다.")

async def extract_data_from_page(page):
    identity = await get_text_content(page, 'div.flex.flex-center.q-pr-md.title')
    rarity = await extract_value_from_attribute(page, 'img.q-img__image.q-img__image--without-transition', "src", r'rarity_(\d+)\.png')
    uptie = await extract_value_from_attribute(page, 'i.q-icon.q-fab__icon img', "src", r'uptie_(\d+)\.png')
    level = await extract_value_with_regex(await get_text_content(page, 'div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary'), r'level:\s*(\d+)')

    stats_to_extract = [
        {"name": "HP", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png", "depth": 3},
        {"name": "Speed", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_spd.png", "depth": 3},
        {"name": "Defense", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_def.png", "depth": 3},
        {"name": "Atk_Type_HIT", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_HIT.png", "depth": 1},
        {"name": "Atk_Type_PENETRATE", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_PENETRATE.png", "depth": 1},
        {"name": "Atk_Type_SLASH", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_SLASH.png", "depth": 1}
    ]

    stats = await extract_stats(page, stats_to_extract)

    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        **stats
    }

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        context = await browser.new_context()
        page = await context.new_page()

        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        data = await extract_data_from_page(page)
        await save_data_to_csv(data, "[LCB Sinner] Yi Sang.csv")

        await browser.close()

await main()

웹페이지 로드 완료
HP extracted value: 196
Speed extracted value: 4-8
Defense extracted value: 48
Atk_Type_HIT extracted value: Normal
Atk_Type_PENETRATE extracted value: Ineff.
Atk_Type_SLASH extracted value: Fatal
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [71]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def get_attribute_value(page, selector, attribute, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.get_attribute(attribute) if element else default

async def get_text_content(page, selector, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.text_content() if element else default

async def extract_value_with_regex(text, pattern, default="Unknown"):
    match = re.search(pattern, text)
    return match.group(1) if match else default

async def extract_value_from_attribute(page, selector, attribute, pattern, default="Unknown"):
    attribute_value = await get_attribute_value(page, selector, attribute, default)
    return await extract_value_with_regex(attribute_value, pattern, default)

async def extract_stat_value(page, image_src, depth):
    image = await page.query_selector(f'img[src="{image_src}"]')
    if not image:
        return "Unknown"

    parent = image
    for _ in range(depth):
        if not parent:
            return "Unknown"
        parent = await parent.evaluate_handle('node => node.parentElement')

    sibling = await parent.evaluate_handle('node => node.nextElementSibling')
    if sibling:
        value = await sibling.text_content()
        return value.strip()

    return "Unknown"

async def extract_stats(page, stats_to_extract):
    stats = {}
    for stat in stats_to_extract:
        value = await extract_stat_value(page, stat["image_src"], stat["depth"])
        print(f"{stat['name']} extracted value: {value}")
        stats[stat["name"]] = value
    return stats

async def extract_stagger_threshold_values(page):
    # 'div.row.center.flex-center.q-pt-xs' 요소들 찾기
    elements = await page.query_selector_all('div.row.center.flex-center.q-pt-xs')
    
    # 각 요소의 텍스트 내용 출력하여 'Stagger Threshold' 요소를 찾기
    for element in elements:
        text = await element.text_content()
        
        if text and "Stagger Threshold" in text:
            # 'Stagger Threshold'가 있는 요소를 찾았다면, 그 이후 형제 요소들에서 값을 추출
            parent = await element.evaluate_handle('node => node.parentElement')
            sibling_elements = await parent.query_selector_all('div.row.justify-evenly div')  # Threshold 값이 들어있는 div들
            
            stagger_values = []
            for sibling in sibling_elements:
                text_content = await sibling.text_content()
                match = re.search(r'(\d+%)', text_content)
                if match:
                    stagger_values.append(match.group(1))  # 퍼센트 값만 리스트에 추가
            
            return stagger_values  # 추출된 퍼센트 값 반환
    
    return ["Unknown"]  # 만약 'Stagger Threshold'를 찾지 못한 경우

async def save_data_to_csv(data, file_name, mode='w'):
    df = pd.DataFrame([data])
    df.to_csv(file_name, index=False, mode=mode, encoding="utf-8-sig", header=(mode == 'w'))
    print(f"데이터가 {file_name}에 저장되었습니다.")

async def extract_data_from_page(page):
    identity = await get_text_content(page, 'div.flex.flex-center.q-pr-md.title')
    rarity = await extract_value_from_attribute(page, 'img.q-img__image.q-img__image--without-transition', "src", r'rarity_(\d+)\.png')
    uptie = await extract_value_from_attribute(page, 'i.q-icon.q-fab__icon img', "src", r'uptie_(\d+)\.png')
    level = await extract_value_with_regex(await get_text_content(page, 'div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary'), r'level:\s*(\d+)')

    stats_to_extract = [
        {"name": "HP", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png", "depth": 3},
        {"name": "Speed", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_spd.png", "depth": 3},
        {"name": "Defense", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_def.png", "depth": 3},
        {"name": "Atk_Type_HIT", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_HIT.png", "depth": 1},
        {"name": "Atk_Type_PENETRATE", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_PENETRATE.png", "depth": 1},
        {"name": "Atk_Type_SLASH", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_SLASH.png", "depth": 1}
    ]

    stats = await extract_stats(page, stats_to_extract)

    # Stagger Threshold 값 추출
    stagger_thresholds = await extract_stagger_threshold_values(page)

    # Stagger Threshold 값을 딕셔너리로 만들기
    stagger_data = {
        "Stagger_Threshold_One": stagger_thresholds[0] if len(stagger_thresholds) > 0 else "Unknown",
        "Stagger_Threshold_Two": stagger_thresholds[1] if len(stagger_thresholds) > 1 else "Unknown",
        "Stagger_Threshold_Three": stagger_thresholds[2] if len(stagger_thresholds) > 2 else "Unknown",
    }
    

    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        **stats,
        **stagger_data  # stagger_data 딕셔너리 값 삽입
    }

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        context = await browser.new_context()
        page = await context.new_page()

        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        data = await extract_data_from_page(page)
        await save_data_to_csv(data, "[LCB Sinner] Yi Sang.csv")

        await browser.close()

await main()

웹페이지 로드 완료
HP extracted value: 196
Speed extracted value: 4-8
Defense extracted value: 48
Atk_Type_HIT extracted value: Normal
Atk_Type_PENETRATE extracted value: Ineff.
Atk_Type_SLASH extracted value: Fatal
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [3]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def get_attribute_value(page, selector, attribute, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.get_attribute(attribute) if element else default

async def get_text_content(page, selector, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.text_content() if element else default

async def extract_value_with_regex(text, pattern, default="Unknown"):
    match = re.search(pattern, text)
    return match.group(1) if match else default

async def extract_value_from_attribute(page, selector, attribute, pattern, default="Unknown"):
    attribute_value = await get_attribute_value(page, selector, attribute, default)
    return await extract_value_with_regex(attribute_value, pattern, default)

async def extract_stat_value(page, image_src, depth):
    # 이미지 요소 찾기
    image = await page.query_selector(f'img[src="{image_src}"]')
    if not image:
        return "Unknown"

    # 이미지의 부모 요소를 찾아서 올라감
    parent = image
    for _ in range(depth):
        parent = await parent.evaluate_handle('node => node.parentElement')
        if not parent:
            return "Unknown"

    # 부모의 형제 요소 찾기
    sibling = await parent.evaluate_handle('node => node.nextElementSibling')
    
    if sibling:
        value = await sibling.evaluate('node => node.textContent')
        if value:
            return value.strip()
    
    return "Unknown"

async def extract_stats(page, stats_to_extract):
    stats = {}
    for stat in stats_to_extract:
        value = await extract_stat_value(page, stat["image_src"], stat["depth"])
        print(f"{stat['name']} extracted value: {value}")
        stats[stat["name"]] = value
    return stats

async def extract_stagger_threshold_values(page):
    # 'div.row.center.flex-center.q-pt-xs' 요소들 찾기
    elements = await page.query_selector_all('div.row.center.flex-center.q-pt-xs')
    
    # 각 요소의 텍스트 내용 출력하여 'Stagger Threshold' 요소를 찾기
    for element in elements:
        text = await element.text_content()
        
        if text and "Stagger Threshold" in text:
            # 'Stagger Threshold'가 있는 요소를 찾았다면, 그 이후 형제 요소들에서 값을 추출
            parent = await element.evaluate_handle('node => node.parentElement')
            sibling_elements = await parent.query_selector_all('div.row.justify-evenly div')  # Threshold 값이 들어있는 div들
            
            stagger_values = []
            for sibling in sibling_elements:
                text_content = await sibling.text_content()
                match = re.search(r'(\d+%)', text_content)
                if match:
                    stagger_values.append(match.group(1))  # 퍼센트 값만 리스트에 추가
            
            return stagger_values  # 추출된 퍼센트 값 반환
    
    return ["Unknown"]  # 만약 'Stagger Threshold'를 찾지 못한 경우

async def save_data_to_csv(data, file_name, mode='w'):
    df = pd.DataFrame([data])
    df.to_csv(file_name, index=False, mode=mode, encoding="utf-8-sig", header=(mode == 'w'))
    print(f"데이터가 {file_name}에 저장되었습니다.")

async def extract_data_from_page(page):
    identity = await get_text_content(page, 'div.flex.flex-center.q-pr-md.title')
    rarity = await extract_value_from_attribute(page, 'img.q-img__image.q-img__image--without-transition', "src", r'rarity_(\d+)\.png')
    uptie = await extract_value_from_attribute(page, 'i.q-icon.q-fab__icon img', "src", r'uptie_(\d+)\.png')
    level = await extract_value_with_regex(await get_text_content(page, 'div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary'), r'level:\s*(\d+)')

    stats_to_extract = [
        {"name": "HP", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png", "depth": 3},
        {"name": "Speed", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_spd.png", "depth": 3},
        {"name": "Defense", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_def.png", "depth": 3},
        {"name": "Atk_Type_HIT", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_HIT.png", "depth": 1},
        {"name": "Atk_Type_PENETRATE", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_PENETRATE.png", "depth": 1},
        {"name": "Atk_Type_SLASH", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_SLASH.png", "depth": 1}
    ]

    stats = await extract_stats(page, stats_to_extract)

    # Stagger Threshold 값 추출
    stagger_thresholds = await extract_stagger_threshold_values(page)

    # Stagger Threshold 값을 딕셔너리로 만들기
    stagger_data = {
        "Stagger_Threshold_One": stagger_thresholds[0] if len(stagger_thresholds) > 0 else "Unknown",
        "Stagger_Threshold_Two": stagger_thresholds[1] if len(stagger_thresholds) > 1 else "Unknown",
        "Stagger_Threshold_Three": stagger_thresholds[2] if len(stagger_thresholds) > 2 else "Unknown",
    }
    

    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        **stats,
        **stagger_data  # stagger_data 딕셔너리 값 삽입
    }

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        context = await browser.new_context()
        page = await context.new_page()

        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        data = await extract_data_from_page(page)
        await save_data_to_csv(data, "[LCB Sinner] Yi Sang.csv")

        await browser.close()

await main()

웹페이지 로드 완료
HP extracted value: 196
Speed extracted value: 4-8
Defense extracted value: 48
Atk_Type_HIT extracted value: Normal
Atk_Type_PENETRATE extracted value: Ineff.
Atk_Type_SLASH extracted value: Fatal
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


In [2]:
from playwright.async_api import async_playwright

# 캐릭터 목록 크롤링 (페이지 내부에서 정보만 추출)
async def scrape_character_list(page):
    # 페이지 로드
    await page.goto("https://limbus.kusoge.xyz/identity")

    # 캐릭터 목록 가져오기
    character_links = await page.query_selector_all('a[href^="/identity/"]')

    characters = []
    for link in character_links:
        # 캐릭터 링크와 이름 추출
        character_name = (await link.inner_text()).strip()
        character_url = f"https://limbus.kusoge.xyz{await link.get_attribute('href')}"
        characters.append({
            'name': character_name,
            'url': character_url
        })
    
    return characters

# 메인 크롤링 함수 (한 개의 캐릭터만 크롤링)
async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()
        
        # 캐릭터 목록 정보 크롤링
        characters = await scrape_character_list(page)
        print("Character List:")
        for character in characters:
            print(f"Name: {character['name']}, URL: {character['url']}")
        
        await browser.close()

# Jupyter 환경에서 실행 시 asyncio 이벤트 루프 사용
await main()

Character List:
Name: [LCB Sinner]
Yi Sang, URL: https://limbus.kusoge.xyz/identity/10101
Name: [Seven Assoc. South Section 6]
Yi Sang, URL: https://limbus.kusoge.xyz/identity/10102
Name: [Blade Lineage Salsu]
Yi Sang, URL: https://limbus.kusoge.xyz/identity/10103
Name: [Effloresced E.G.O::Spicebush]
Yi Sang, URL: https://limbus.kusoge.xyz/identity/10104
Name: [Molar Office Fixer]
Yi Sang, URL: https://limbus.kusoge.xyz/identity/10105
Name: [W Corp. L3 Cleanup Agent]
Yi Sang, URL: https://limbus.kusoge.xyz/identity/10106
Name: [The Pequod First Mate]
Yi Sang, URL: https://limbus.kusoge.xyz/identity/10107
Name: [Dieci Assoc. South Section 4]
Yi Sang, URL: https://limbus.kusoge.xyz/identity/10108
Name: [The Ring Pointillist Student]
Yi Sang, URL: https://limbus.kusoge.xyz/identity/10109
Name: [Lobotomy E.G.O::Solemn Lament]
Yi Sang, URL: https://limbus.kusoge.xyz/identity/10110
Name: [LCB Sinner]
Faust, URL: https://limbus.kusoge.xyz/identity/10201
Name: [W Corp. L2 Cleanup Agent]
Faust,

In [5]:
from playwright.async_api import async_playwright

# 캐릭터 목록 크롤링 (첫 번째 캐릭터만 추출)
async def scrape_character_list(page):
    # 페이지 로드
    await page.goto("https://limbus.kusoge.xyz/identity")

    # 캐릭터 목록 가져오기
    character_links = await page.query_selector_all('a[href^="/identity/"]')

    if character_links:
        # 첫 번째 캐릭터 링크와 이름 추출
        first_character_name_parts = await character_links[0].query_selector_all('div')
        
        # 각 div의 텍스트를 합쳐서 하나의 문자열로 만듦
        first_character_name = ' '.join([await part.text_content() for part in first_character_name_parts]).strip()
        
        first_character_url = f"https://limbus.kusoge.xyz{await character_links[0].get_attribute('href')}"
        
        return {'name': first_character_name, 'url': first_character_url}
    else:
        return None

# 메인 크롤링 함수 (한 개의 캐릭터만 크롤링)
async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()
        
        # 첫 번째 캐릭터 정보 크롤링
        character = await scrape_character_list(page)
        if character:
            print("Character Info:")
            print(f"Name: {character['name']}")
            print(f"URL: {character['url']}")
        else:
            print("No characters found.")
        
        await browser.close()

# Jupyter 환경에서 실행 시 asyncio 이벤트 루프 사용
await main()


Character Info:
Name: [LCB Sinner] Yi Sang
URL: https://limbus.kusoge.xyz/identity/10101


In [7]:
async def extract_rarity(row, page):
    try:
        print("Attempting to locate rarity...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 다음 형제 td를 찾기
            next_sibling_td = await parent_td.evaluate_handle('(node) => node.parentElement.nextElementSibling')

            # 그 후 그 td 내부에서 이미지(src)를 찾기
            rarity_img = await next_sibling_td.query_selector('img[src]')
            if rarity_img:
                rarity_src = await rarity_img.get_attribute('src')
                print(f"Found rarity image src: {rarity_src}")  # 이미지 경로 출력
                rarity_level = rarity_src.split('_')[-1].split('.')[0]  # rarity_1.png -> 1
                print(f"Extracted rarity level: {rarity_level}")  # 희귀도 출력
                return rarity_level
            else:
                print("Rarity image not found in the next sibling TD.")
        else:
            print("No valid <a> tag found.")

    except Exception as e:
        print(f"Error extracting rarity: {e}")
    return "Unknown"

# 캐릭터 이름과 URL 추출 함수
async def extract_character_name_and_url(row):
    character_link = await row.query_selector('a[href^="/identity/"]')
    if character_link:
        name = (await character_link.inner_text()).replace("\n", " ").strip()
        url = f"https://limbus.kusoge.xyz{await character_link.get_attribute('href')}"
        return {'name': name, 'url': url}
    return None

# 캐릭터 리스트에서 필요한 정보를 추출하는 메인 함수
async def scrape_character_list(page):
    await page.goto("https://limbus.kusoge.xyz/identity")
    character_rows = await page.query_selector_all('tr')
    if len(character_rows) > 1:
        first_row = character_rows[1]
        character_info = await extract_character_name_and_url(first_row)
        if character_info:
            character_info['rarity'] = await extract_rarity(first_row, page)  # page 인자 추가
            return character_info
    return None

# 메인 크롤링 함수
async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()

        character_info = await scrape_character_list(page)
        if character_info:
            print("Character Info:")
            print(f"Name: {character_info['name']}")
            print(f"URL: {character_info['url']}")
            print(f"Rarity: {character_info['rarity']} 단계")
        else:
            print("No characters found.")
        
        await browser.close()

# Jupyter 환경에서 실행
await main()

Attempting to locate rarity...
Found rarity image src: https://img.kusoge.xyz/limbus/img/ui/rarity_1.png
Extracted rarity level: 1
Character Info:
Name: [LCB Sinner] Yi Sang
URL: https://limbus.kusoge.xyz/identity/10101
Rarity: 1 단계


In [15]:
async def get_element_attribute(element, selector, attribute):
    """ 주어진 선택자(selector)로 요소를 찾고, 해당 요소의 지정된 속성(attribute)을 반환하는 함수 """
    try:
        target_element = await element.query_selector(selector)
        if target_element:
            return await target_element.get_attribute(attribute)
        return None
    except Exception as e:
        print(f"Error getting element attribute: {e}")
        return None

async def extract_rarity(row):
    """ 캐릭터의 희귀도 추출 함수 """
    try:
        print("Attempting to locate rarity...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 다음 형제 td를 찾기
            next_sibling_td = await parent_td.evaluate_handle('(node) => node.parentElement.nextElementSibling')

            # 그 후 그 td 내부에서 이미지(src)를 찾기
            rarity_src = await get_element_attribute(next_sibling_td, 'img[src]', 'src')
            if rarity_src:
                print(f"Found rarity image src: {rarity_src}")  # 이미지 경로 출력
                rarity_level = rarity_src.split('_')[-1].split('.')[0]  # rarity_1.png -> 1
                print(f"Extracted rarity level: {rarity_level}")  # 희귀도 출력
                return rarity_level
            else:
                print("Rarity image not found in the next sibling TD.")
        else:
            print("No valid <a> tag found.")

    except Exception as e:
        print(f"Error extracting rarity: {e}")
    return "Unknown"

async def extract_character_name_and_url(row):
    """ 캐릭터의 이름과 URL 추출 함수 """
    try:
        character_link = await row.query_selector('a[href^="/identity/"]')
        if character_link:
            name = (await character_link.inner_text()).replace("\n", " ").strip()
            url = f"https://limbus.kusoge.xyz{await character_link.get_attribute('href')}"
            return {'name': name, 'url': url}
        return None
    except Exception as e:
        print(f"Error extracting character name and URL: {e}")
        return None

async def scrape_character_list(page):
    """ 캐릭터 리스트에서 정보 추출 함수 """
    await page.goto("https://limbus.kusoge.xyz/identity")
    character_rows = await page.query_selector_all('tr')
    if len(character_rows) > 1:
        first_row = character_rows[1]
        character_info = await extract_character_name_and_url(first_row)
        if character_info:
            character_info['rarity'] = await extract_rarity(first_row)  # 희귀도 추출
            return character_info
    return None

async def main():
    """ 메인 크롤링 함수 """
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()

        character_info = await scrape_character_list(page)
        if character_info:
            print("Character Info:")
            print(f"Name: {character_info['name']}")
            print(f"URL: {character_info['url']}")
            print(f"Rarity: {character_info['rarity']}")
        else:
            print("No characters found.")
        
        await browser.close()

# Jupyter 환경에서 실행
await main()

Attempting to locate rarity...
Found rarity image src: https://img.kusoge.xyz/limbus/img/ui/rarity_1.png
Extracted rarity level: 1
Character Info:
Name: [LCB Sinner] Yi Sang
URL: https://limbus.kusoge.xyz/identity/10101
Rarity: 1


In [41]:
async def extract_rarity(row):
    """ 희귀도 추출 함수 """
    try:
        print("Attempting to locate rarity...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 첫 번째 형제 td로 이동 (희귀도 이미지가 있는 <td>)
            sibling = await parent.evaluate_handle('node => node.nextElementSibling')

            if sibling:
                # 희귀도 이미지 찾기
                rarity_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/rarity_"]', 'src')
                if rarity_img_src:
                    rarity_level = rarity_img_src.split('_')[-1].split('.')[0]  # rarity_1.png -> 1
                    print(f"Extracted rarity level: {rarity_level}")
                    return rarity_level

        print("Rarity image not found.")
    except Exception as e:
        print(f"Error extracting rarity: {e}")
    
    return "Unknown"

async def extract_skill1_and_resource(row):
    """ 스킬1 공격 타입(ATK Type)과 자원(Attribute) 추출 함수 """
    try:
        print("Attempting to locate skill type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 두 번째 형제 td로 이동 (스킬1 관련 정보가 있는 <td>)
            sibling = await parent.evaluate_handle('node => node.nextElementSibling')
            sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            atk_type, resource = "Unknown", "Unknown"

            if sibling:
                # 공격 타입 이미지 (atk_type) 찾기
                atk_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/atk_type_"]', 'src')
                if atk_type_img_src:
                    atk_type = atk_type_img_src.split('_')[-1].split('.')[0]  # atk_type_SLASH.png -> SLASH
                    print(f"Extracted attack type: {atk_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted resource: {resource}")

            return {'skill1_atk_type': atk_type, 'skill1_resource': resource}
        
    except Exception as e:
        print(f"Error extracting skill type and resource: {e}")
    
    return {'skill1_atk_type': "Unknown", 'skill1_resource': "Unknown"}

async def extract_skill2_and_resource(row):
    """ 스킬2 공격 타입(ATK Type)과 자원(Attribute) 추출 함수 """
    try:
        print("Attempting to locate skill type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 두 번째 형제 td로 이동 (스킬1 관련 정보가 있는 <td>)
            sibling = await parent.evaluate_handle('node => node.nextElementSibling')
            sibling = await sibling.evaluate_handle('node => node.nextElementSibling')
            sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            atk_type, resource = "Unknown", "Unknown"

            if sibling:
                # 공격 타입 이미지 (atk_type) 찾기
                atk_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/atk_type_"]', 'src')
                if atk_type_img_src:
                    atk_type = atk_type_img_src.split('_')[-1].split('.')[0]  # atk_type_SLASH.png -> SLASH
                    print(f"Extracted attack type: {atk_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted resource: {resource}")

            return {'skill2_atk_type': atk_type, 'skill2_resource': resource}
        
    except Exception as e:
        print(f"Error extracting skill type and resource: {e}")
    
    return {'skill2_atk_type': "Unknown", 'skill2_resource': "Unknown"}

async def extract_skill3_and_resource(row):
    """ 스킬3 공격 타입(ATK Type)과 자원(Attribute) 추출 함수 """
    try:
        print("Attempting to locate skill type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 두 번째 형제 td로 이동 (스킬1 관련 정보가 있는 <td>)
            sibling = await parent.evaluate_handle('node => node.nextElementSibling')
            sibling = await sibling.evaluate_handle('node => node.nextElementSibling')
            sibling = await sibling.evaluate_handle('node => node.nextElementSibling')
            sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            atk_type, resource = "Unknown", "Unknown"

            if sibling:
                # 공격 타입 이미지 (atk_type) 찾기
                atk_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/atk_type_"]', 'src')
                if atk_type_img_src:
                    atk_type = atk_type_img_src.split('_')[-1].split('.')[0]  # atk_type_SLASH.png -> SLASH
                    print(f"Extracted attack type: {atk_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted resource: {resource}")

            return {'skill3_atk_type': atk_type, 'skill3_resource': resource}
        
    except Exception as e:
        print(f"Error extracting skill type and resource: {e}")
    
    return {'skill3_atk_type': "Unknown", 'skill3_resource': "Unknown"}

async def extract_defense_and_resource(row):
    """ 방어 타입(Def Type)과 자원(Attribute) 추출 함수 """
    try:
        print("Attempting to locate skill type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 두 번째 형제 td로 이동 (스킬1 관련 정보가 있는 <td>)
            sibling = await parent.evaluate_handle('node => node.nextElementSibling')
            sibling = await sibling.evaluate_handle('node => node.nextElementSibling')
            sibling = await sibling.evaluate_handle('node => node.nextElementSibling')
            sibling = await sibling.evaluate_handle('node => node.nextElementSibling')
            sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            def_type, resource = "Unknown", "Unknown"

            if sibling:
                # 공격 타입 이미지 (atk_type) 찾기
                def_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/def_type_"]', 'src')
                if def_type_img_src:
                    def_type = def_type_img_src.split('_')[-1].split('.')[0]  # def_type_GUARD.png -> GUARD
                    print(f"Extracted defense type: {def_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    def_resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted resource: {resource}")

            return {'def_type': def_type, 'def_resource': def_resource}
        
    except Exception as e:
        print(f"Error extracting skill type and resource: {e}")
    
    return {'def_type': "Unknown", 'def_resource': "Unknown"}

async def scrape_character_name_and_url(row):
    """ 캐릭터 이름과 URL 추출 함수 """
    try:
        # 캐릭터 이름 추출
        character_name = await row.query_selector('a[href^="/identity/"]')
        name = await character_name.inner_text() if character_name else "Unknown"

        # 캐릭터 URL 추출
        character_url = await character_name.get_attribute('href') if character_name else ""
        full_url = f"https://limbus.kusoge.xyz{character_url}" if character_url else ""

        return {'name': name.strip(), 'url': full_url}

    except Exception as e:
        print(f"Error extracting character name and URL: {e}")
        return None

async def scrape_character_list(page):
    """ 캐릭터 리스트에서 정보 추출 함수 """
    await page.goto("https://limbus.kusoge.xyz/identity")
    character_rows = await page.query_selector_all('tr')
    if len(character_rows) > 1:
        first_row = character_rows[1]
        
        # 캐릭터 이름과 URL을 추출
        character_info = await scrape_character_name_and_url(first_row)
        if character_info:
            character_info['rarity'] = await extract_rarity(first_row)  # 희귀도 추출
            skill1_and_resource = await extract_skill1_and_resource(first_row)  # 스킬1 추출
            character_info.update(skill1_and_resource)  # 스킬 정보 추가
            skill2_and_resource = await extract_skill2_and_resource(first_row)  # 스킬1 추출
            character_info.update(skill2_and_resource)  # 스킬 정보 추가
            skill3_and_resource = await extract_skill3_and_resource(first_row)  # 스킬1 추출
            character_info.update(skill3_and_resource)  # 스킬 정보 추가
            defense_and_resource = await extract_defense_and_resource(first_row)  # 스킬1 추출
            character_info.update(defense_and_resource)  # 스킬 정보 추가
            return character_info
    return None

async def main():
    """ 메인 크롤링 함수 """
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()

        character_info = await scrape_character_list(page)
        if character_info:
            print("Character Info:")
            print(f"Name: {character_info['name']}")
            print(f"URL: {character_info['url']}")
            print(f"Rarity: {character_info['rarity']} 단계")
            print(f"Skill1 Attack Type: {character_info['skill1_atk_type']}")
            print(f"Skill1 Resource: {character_info['skill1_resource']}")
            print(f"Skill2 Attack Type: {character_info['skill2_atk_type']}")
            print(f"Skill2 Resource: {character_info['skill2_resource']}")
            print(f"Skill3 Attack Type: {character_info['skill3_atk_type']}")
            print(f"Skill3 Resource: {character_info['skill3_resource']}")
            print(f"Defense Type: {character_info['def_type']}")
            print(f"Defense Resource: {character_info['def_resource']}")
        else:
            print("No characters found.")
        
        await browser.close()

# Jupyter 환경에서 실행
await main()

  @classmethod
Future exception was never retrieved
future: <Future finished exception=TargetClosedError('Target page, context or browser has been closed')>
playwright._impl._errors.TargetClosedError: Target page, context or browser has been closed


Attempting to locate rarity...
Extracted rarity level: 1
Attempting to locate skill type and resource...
Extracted attack type: SLASH
Extracted resource: AZURE
Attempting to locate skill type and resource...
Extracted attack type: PENETRATE
Extracted resource: VIOLET
Attempting to locate skill type and resource...
Extracted attack type: SLASH
Extracted resource: AMBER
Attempting to locate skill type and resource...
Extracted defense type: GUARD
Extracted resource: Unknown
Character Info:
Name: [LCB Sinner]
Yi Sang
URL: https://limbus.kusoge.xyz/identity/10101
Rarity: 1 단계
Skill1 Attack Type: SLASH
Skill1 Resource: AZURE
Skill2 Attack Type: PENETRATE
Skill2 Resource: VIOLET
Skill3 Attack Type: SLASH
Skill3 Resource: AMBER
Defense Type: GUARD
Defense Resource: AZURE


In [44]:
async def extract_rarity(row):
    """ 희귀도 추출 함수 """
    try:
        print("Attempting to locate rarity...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 첫 번째 형제 td로 이동 (희귀도 이미지가 있는 <td>)
            sibling = await parent.evaluate_handle('node => node.nextElementSibling')

            if sibling:
                # 희귀도 이미지 찾기
                rarity_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/rarity_"]', 'src')
                if rarity_img_src:
                    rarity_level = rarity_img_src.split('_')[-1].split('.')[0]  # rarity_1.png -> 1
                    print(f"Extracted rarity level: {rarity_level}")
                    return rarity_level

        print("Rarity image not found.")
    except Exception as e:
        print(f"Error extracting rarity: {e}")
    
    return "Unknown"
    
async def extract_atk_and_resource(row, skill_number):
    """ 공격 타입(ATK Type)과 자원(Attribute) 추출 함수 - 스킬 번호에 따라 처리 """
    try:
        print(f"Attempting to locate skill{skill_number} type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 해당 스킬 번호에 맞는 형제로 이동
            sibling = parent
            for _ in range(skill_number + 1):  # 스킬 번호에 맞게 이동
                sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            atk_type, resource = "Unknown", "Unknown"

            if sibling:
                # 공격 타입 이미지 (atk_type) 찾기
                atk_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/atk_type_"]', 'src')
                if atk_type_img_src:
                    atk_type = atk_type_img_src.split('_')[-1].split('.')[0]  # atk_type_SLASH.png -> SLASH
                    print(f"Extracted attack type: {atk_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted resource: {resource}")

            return {f'skill{skill_number}_atk_type': atk_type, f'skill{skill_number}_resource': resource}
        
    except Exception as e:
        print(f"Error extracting skill{skill_number} type and resource: {e}")
    
    return {f'skill{skill_number}_atk_type': "Unknown", f'skill{skill_number}_resource': "Unknown"}

async def extract_defense_and_resource(row):
    """ 방어 타입(Def Type)과 자원(Attribute) 추출 함수 """
    try:
        print("Attempting to locate defense type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 다섯 번째 형제 td로 이동 (방어 관련 정보가 있는 <td>)
            sibling = parent
            for _ in range(5):  # 방어 정보는 5번째 형제에 있음
                sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            def_type, def_resource = "Unknown", "Unknown"

            if sibling:
                # 방어 타입 이미지 (def_type) 찾기
                def_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/def_type_"]', 'src')
                if def_type_img_src:
                    def_type = def_type_img_src.split('_')[-1].split('.')[0]  # def_type_GUARD.png -> GUARD
                    print(f"Extracted defense type: {def_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    def_resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted defense resource: {def_resource}")

            return {'def_type': def_type, 'def_resource': def_resource}
        
    except Exception as e:
        print(f"Error extracting defense type and resource: {e}")
    
    return {'def_type': "Unknown", 'def_resource': "Unknown"}

async def scrape_character_name_and_url(row):
    """ 캐릭터 이름과 URL 추출 함수 """
    try:
        # 캐릭터 이름 추출
        character_name = await row.query_selector('a[href^="/identity/"]')
        name = await character_name.inner_text() if character_name else "Unknown"

        # 캐릭터 URL 추출
        character_url = await character_name.get_attribute('href') if character_name else ""
        full_url = f"https://limbus.kusoge.xyz{character_url}" if character_url else ""

        return {'name': name.strip(), 'url': full_url}

    except Exception as e:
        print(f"Error extracting character name and URL: {e}")
        return None

async def scrape_character_list(page):
    """ 캐릭터 리스트에서 정보 추출 함수 """
    await page.goto("https://limbus.kusoge.xyz/identity")
    character_rows = await page.query_selector_all('tr')
    if len(character_rows) > 1:
        first_row = character_rows[1]
        
        # 캐릭터 이름과 URL을 추출
        character_info = await scrape_character_name_and_url(first_row)
        if character_info:
            character_info['rarity'] = await extract_rarity(first_row)  # 희귀도 추출
            for i in range(1, 4):  # 스킬1~3 정보 추출
                skill_and_resource = await extract_atk_and_resource(first_row, i)
                character_info.update(skill_and_resource)  # 스킬 정보 추가
            defense_and_resource = await extract_defense_and_resource(first_row)  # 방어 정보 추출
            character_info.update(defense_and_resource)  # 방어 정보 추가
            return character_info
    return None

async def main():
    """ 메인 크롤링 함수 """
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()

        character_info = await scrape_character_list(page)
        if character_info:
            print("Character Info:")
            print(f"Name: {character_info['name']}")
            print(f"URL: {character_info['url']}")
            print(f"Rarity: {character_info['rarity']} 단계")
            print(f"Skill1 Attack Type: {character_info['skill1_atk_type']}")
            print(f"Skill1 Resource: {character_info['skill1_resource']}")
            print(f"Skill2 Attack Type: {character_info['skill2_atk_type']}")
            print(f"Skill2 Resource: {character_info['skill2_resource']}")
            print(f"Skill3 Attack Type: {character_info['skill3_atk_type']}")
            print(f"Skill3 Resource: {character_info['skill3_resource']}")
            print(f"Defense Type: {character_info['def_type']}")
            print(f"Defense Resource: {character_info['def_resource']}")
        else:
            print("No characters found.")
        
        await browser.close()

# Jupyter 환경에서 실행
await main()

Attempting to locate rarity...
Extracted rarity level: 1
Attempting to locate skill1 type and resource...
Extracted attack type: SLASH
Extracted resource: AZURE
Attempting to locate skill2 type and resource...
Extracted attack type: PENETRATE
Extracted resource: VIOLET
Attempting to locate skill3 type and resource...
Extracted attack type: SLASH
Extracted resource: AMBER
Attempting to locate defense type and resource...
Extracted defense type: GUARD
Extracted defense resource: AZURE
Character Info:
Name: [LCB Sinner]
Yi Sang
URL: https://limbus.kusoge.xyz/identity/10101
Rarity: 1 단계
Skill1 Attack Type: SLASH
Skill1 Resource: AZURE
Skill2 Attack Type: PENETRATE
Skill2 Resource: VIOLET
Skill3 Attack Type: SLASH
Skill3 Resource: AMBER
Defense Type: GUARD
Defense Resource: AZURE


In [5]:
async def get_element_attribute(element, selector, attribute):
    """ 지정된 요소에서 특정 속성 값을 추출하는 함수 """
    try:
        target_element = await element.query_selector(selector)
        if target_element:
            return await target_element.get_attribute(attribute)
    except Exception as e:
        print(f"Error getting element attribute: {e}")
    return None

async def extract_rarity(row):
    """ 희귀도 추출 함수 """
    try:
        print("Attempting to locate rarity...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 첫 번째 형제 td로 이동 (희귀도 이미지가 있는 <td>)
            sibling = await parent.evaluate_handle('node => node.nextElementSibling')

            if sibling:
                # 희귀도 이미지 찾기
                rarity_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/rarity_"]', 'src')
                if rarity_img_src:
                    rarity_level = rarity_img_src.split('_')[-1].split('.')[0]  # rarity_1.png -> 1
                    print(f"Extracted rarity level: {rarity_level}")
                    return rarity_level

        print("Rarity image not found.")
    except Exception as e:
        print(f"Error extracting rarity: {e}")
    
    return "Unknown"
    
async def extract_atk_and_resource(row, skill_number):
    """ 공격 타입(ATK Type)과 자원(Attribute) 추출 함수 - 스킬 번호에 따라 처리 """
    try:
        print(f"Attempting to locate skill{skill_number} type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 해당 스킬 번호에 맞는 형제로 이동
            sibling = parent
            for _ in range(skill_number + 1):  # 스킬 번호에 맞게 이동
                sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            atk_type, resource = "Unknown", "Unknown"

            if sibling:
                # 공격 타입 이미지 (atk_type) 찾기
                atk_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/atk_type_"]', 'src')
                if atk_type_img_src:
                    atk_type = atk_type_img_src.split('_')[-1].split('.')[0]  # atk_type_SLASH.png -> SLASH
                    print(f"Extracted attack type: {atk_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted resource: {resource}")

            return {f'skill{skill_number}_atk_type': atk_type, f'skill{skill_number}_resource': resource}
        
    except Exception as e:
        print(f"Error extracting skill{skill_number} type and resource: {e}")
    
    return {f'skill{skill_number}_atk_type': "Unknown", f'skill{skill_number}_resource': "Unknown"}

async def extract_defense_and_resource(row):
    """ 방어 타입(Def Type)과 자원(Attribute) 추출 함수 """
    try:
        print("Attempting to locate defense type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 다섯 번째 형제 td로 이동 (방어 관련 정보가 있는 <td>)
            sibling = parent
            for _ in range(5):  # 방어 정보는 5번째 형제에 있음
                sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            def_type, def_resource = "Unknown", "Unknown"

            if sibling:
                # 방어 타입 이미지 (def_type) 찾기
                def_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/def_type_"]', 'src')
                if def_type_img_src:
                    def_type = def_type_img_src.split('_')[-1].split('.')[0]  # def_type_GUARD.png -> GUARD
                    print(f"Extracted defense type: {def_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    def_resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted defense resource: {def_resource}")

            return {'def_type': def_type, 'def_resource': def_resource}
        
    except Exception as e:
        print(f"Error extracting defense type and resource: {e}")
    
    return {'def_type': "Unknown", 'def_resource': "Unknown"}

async def handle_request_interception(route, request):
    """ 이미지 요청을 차단하는 함수 """
    if "image" in request.resource_type:
        print(f"Blocking image request: {url}")
        await route.abort()  # 이미지 요청 차단
    else:
        await route.continue_()  # 다른 요청은 그대로 진행

async def scrape_character_name_and_url(row):
    """ 캐릭터 이름과 URL 추출 함수 """
    try:
        # 캐릭터 이름 추출
        character_name = await row.query_selector('a[href^="/identity/"]')
        name = await character_name.inner_text() if character_name else "Unknown"

        # 캐릭터 URL 추출
        character_url = await character_name.get_attribute('href') if character_name else ""
        full_url = f"https://limbus.kusoge.xyz{character_url}" if character_url else ""

        return {'name': name.strip(), 'url': full_url}

    except Exception as e:
        print(f"Error extracting character name and URL: {e}")
        return None

async def scrape_character_list(page):
    """ 캐릭터 리스트에서 정보 추출 함수 """
    await page.goto("https://limbus.kusoge.xyz/identity")
    
    # 이미지 요청 차단
    page.on("route", handle_request_interception)

    character_rows = await page.query_selector_all('tr')
    if len(character_rows) > 1:
        first_row = character_rows[1]
        
        # 캐릭터 이름과 URL을 추출
        character_info = await scrape_character_name_and_url(first_row)
        if character_info:
            character_info['rarity'] = await extract_rarity(first_row)  # 희귀도 추출
            for i in range(1, 4):  # 스킬1~3 정보 추출
                skill_and_resource = await extract_atk_and_resource(first_row, i)
                character_info.update(skill_and_resource)  # 스킬 정보 추가
            defense_and_resource = await extract_defense_and_resource(first_row)  # 방어 정보 추출
            character_info.update(defense_and_resource)  # 방어 정보 추가
            return character_info
    return None

async def main():
    """ 메인 크롤링 함수 """
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()

        character_info = await scrape_character_list(page)
        if character_info:
            print("Character Info:")
            print(f"Name: {character_info['name']}")
            print(f"URL: {character_info['url']}")
            print(f"Rarity: {character_info['rarity']} 단계")
            print(f"Skill1 Attack Type: {character_info['skill1_atk_type']}")
            print(f"Skill1 Resource: {character_info['skill1_resource']}")
            print(f"Skill2 Attack Type: {character_info['skill2_atk_type']}")
            print(f"Skill2 Resource: {character_info['skill2_resource']}")
            print(f"Skill3 Attack Type: {character_info['skill3_atk_type']}")
            print(f"Skill3 Resource: {character_info['skill3_resource']}")
            print(f"Defense Type: {character_info['def_type']}")
            print(f"Defense Resource: {character_info['def_resource']}")
        else:
            print("No characters found.")
        
        await browser.close()

# Jupyter 환경에서 실행
await main()

Attempting to locate rarity...
Extracted rarity level: 1
Attempting to locate skill1 type and resource...
Extracted attack type: SLASH
Extracted resource: AZURE
Attempting to locate skill2 type and resource...
Extracted attack type: PENETRATE
Extracted resource: VIOLET
Attempting to locate skill3 type and resource...
Extracted attack type: SLASH
Extracted resource: AMBER
Attempting to locate defense type and resource...
Extracted defense type: GUARD
Extracted defense resource: AZURE
Character Info:
Name: [LCB Sinner]
Yi Sang
URL: https://limbus.kusoge.xyz/identity/10101
Rarity: 1 단계
Skill1 Attack Type: SLASH
Skill1 Resource: AZURE
Skill2 Attack Type: PENETRATE
Skill2 Resource: VIOLET
Skill3 Attack Type: SLASH
Skill3 Resource: AMBER
Defense Type: GUARD
Defense Resource: AZURE


In [12]:
async def get_element_attribute(element, selector, attribute):
    """ 지정된 요소에서 특정 속성 값을 추출하는 함수 """
    try:
        target_element = await element.query_selector(selector)
        if target_element:
            return await target_element.get_attribute(attribute)
    except Exception as e:
        print(f"Error getting element attribute: {e}")
    return None

async def extract_rarity(row):
    """ 희귀도 추출 함수 """
    try:
        print("Attempting to locate rarity...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 첫 번째 형제 td로 이동 (희귀도 이미지가 있는 <td>)
            sibling = await parent.evaluate_handle('node => node.nextElementSibling')

            if sibling:
                # 희귀도 이미지 찾기
                rarity_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/rarity_"]', 'src')
                if rarity_img_src:
                    rarity_level = rarity_img_src.split('_')[-1].split('.')[0]  # rarity_1.png -> 1
                    print(f"Extracted rarity level: {rarity_level}")
                    return rarity_level

        print("Rarity image not found.")
    except Exception as e:
        print(f"Error extracting rarity: {e}")
    
    return "Unknown"
    
async def extract_atk_and_resource(row, skill_number):
    """ 공격 타입(ATK Type)과 자원(Attribute) 추출 함수 - 스킬 번호에 따라 처리 """
    try:
        print(f"Attempting to locate skill{skill_number} type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 해당 스킬 번호에 맞는 형제로 이동
            sibling = parent
            for _ in range(skill_number + 1):  # 스킬 번호에 맞게 이동
                sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            atk_type, resource = "Unknown", "Unknown"

            if sibling:
                # 공격 타입 이미지 (atk_type) 찾기
                atk_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/atk_type_"]', 'src')
                if atk_type_img_src:
                    atk_type = atk_type_img_src.split('_')[-1].split('.')[0]  # atk_type_SLASH.png -> SLASH
                    print(f"Extracted attack type: {atk_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted resource: {resource}")

            return {f'skill{skill_number}_atk_type': atk_type, f'skill{skill_number}_resource': resource}
        
    except Exception as e:
        print(f"Error extracting skill{skill_number} type and resource: {e}")
    
    return {f'skill{skill_number}_atk_type': "Unknown", f'skill{skill_number}_resource': "Unknown"}

async def extract_defense_and_resource(row):
    """ 방어 타입(Def Type)과 자원(Attribute) 추출 함수 """
    try:
        print("Attempting to locate defense type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 다섯 번째 형제 td로 이동 (방어 관련 정보가 있는 <td>)
            sibling = parent
            for _ in range(5):  # 방어 정보는 5번째 형제에 있음
                sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            def_type, def_resource = "Unknown", "Unknown"

            if sibling:
                # 방어 타입 이미지 (def_type) 찾기
                def_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/def_type_"]', 'src')
                if def_type_img_src:
                    def_type = def_type_img_src.split('_')[-1].split('.')[0]  # def_type_GUARD.png -> GUARD
                    print(f"Extracted defense type: {def_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    def_resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted defense resource: {def_resource}")

            return {'def_type': def_type, 'def_resource': def_resource}
        
    except Exception as e:
        print(f"Error extracting defense type and resource: {e}")
    
    return {'def_type': "Unknown", 'def_resource': "Unknown"}

async def scrape_character_name_and_url(row):
    """ 캐릭터 이름과 URL 추출 함수 """
    try:
        # 캐릭터 이름 추출
        character_name = await row.query_selector('a[href^="/identity/"]')
        name = await character_name.inner_text() if character_name else "Unknown"

        # 캐릭터 URL 추출
        character_url = await character_name.get_attribute('href') if character_name else ""
        full_url = f"https://limbus.kusoge.xyz{character_url}" if character_url else ""

        return {'name': name.strip(), 'url': full_url}

    except Exception as e:
        print(f"Error extracting character name and URL: {e}")
        return None

async def handle_request_interception(route, request):
    """ 이미지 요청을 차단하는 함수 """
    if "image" in request.resource_type:
        print(f"Blocking image request: {url}")
        await route.abort()  # 이미지 요청 차단
    else:
        await route.continue_()  # 다른 요청은 그대로 진행

async def scrape_character_list(page):

    # 이미지 요청 차단
    page.on("route", handle_request_interception)
    
    """ 캐릭터 리스트에서 정보 추출 함수 """
    await page.goto("https://limbus.kusoge.xyz/identity")
    
    character_rows = await page.query_selector_all('tr')
    if len(character_rows) > 1:
        first_row = character_rows[1]
        
        # 캐릭터 이름과 URL을 추출
        character_info = await scrape_character_name_and_url(first_row)
        if character_info:
            character_info['rarity'] = await extract_rarity(first_row)  # 희귀도 추출
            for i in range(1, 4):  # 스킬1~3 정보 추출
                skill_and_resource = await extract_atk_and_resource(first_row, i)
                character_info.update(skill_and_resource)  # 스킬 정보 추가
            defense_and_resource = await extract_defense_and_resource(first_row)  # 방어 정보 추출
            character_info.update(defense_and_resource)  # 방어 정보 추가
            return character_info
    return None

async def main():
    """ 메인 크롤링 함수 """
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()

        character_info = await scrape_character_list(page)
        if character_info:
            print("Character Info:")
            print(f"Name: {character_info['name']}")
            print(f"URL: {character_info['url']}")
            print(f"Rarity: {character_info['rarity']} 단계")
            print(f"Skill1 Attack Type: {character_info['skill1_atk_type']}")
            print(f"Skill1 Resource: {character_info['skill1_resource']}")
            print(f"Skill2 Attack Type: {character_info['skill2_atk_type']}")
            print(f"Skill2 Resource: {character_info['skill2_resource']}")
            print(f"Skill3 Attack Type: {character_info['skill3_atk_type']}")
            print(f"Skill3 Resource: {character_info['skill3_resource']}")
            print(f"Defense Type: {character_info['def_type']}")
            print(f"Defense Resource: {character_info['def_resource']}")
        else:
            print("No characters found.")
        
        await browser.close()

# Jupyter 환경에서 실행
await main()

Attempting to locate rarity...
Extracted rarity level: 1
Attempting to locate skill1 type and resource...
Extracted attack type: SLASH
Extracted resource: AZURE
Attempting to locate skill2 type and resource...
Extracted attack type: PENETRATE
Extracted resource: VIOLET
Attempting to locate skill3 type and resource...
Extracted attack type: SLASH
Extracted resource: AMBER
Attempting to locate defense type and resource...
Extracted defense type: GUARD
Extracted defense resource: AZURE
Character Info:
Name: [LCB Sinner]
Yi Sang
URL: https://limbus.kusoge.xyz/identity/10101
Rarity: 1 단계
Skill1 Attack Type: SLASH
Skill1 Resource: AZURE
Skill2 Attack Type: PENETRATE
Skill2 Resource: VIOLET
Skill3 Attack Type: SLASH
Skill3 Resource: AMBER
Defense Type: GUARD
Defense Resource: AZURE


In [27]:
import time
from playwright.async_api import async_playwright
async def handle_request(route, request):
    print(f"Request: {request.resource_type} - {request.url}")
    if request.resource_type in ["image", "stylesheet", "font", "script"]:
        print(f"Blocking: {request.url}")
        await route.abort()
    else:
        await route.continue_()

async def main():
    """ 메인 크롤링 함수 """
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()
        #page.set_cache_enabled(False)
        # 이미지 요청 차단 핸들러 등록
        await page.route("**/*", handle_request)
        start_time = time.time()
        await page.goto("https://limbus.kusoge.xyz/identity")
        end_time = time.time()
        #await page.wait_for_timeout(5000)
        print(f"페이지 로드 완료! 소요 시간: {end_time - start_time:.2f}초")
        await browser.close()

await main()

Request: document - https://limbus.kusoge.xyz/identity
Request: script - https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js?client=ca-pub-4728065552438864
Blocking: https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js?client=ca-pub-4728065552438864
Request: script - https://www.googletagmanager.com/gtag/js?id=G-5Z841NVBZP
Blocking: https://www.googletagmanager.com/gtag/js?id=G-5Z841NVBZP
Request: script - https://limbus.kusoge.xyz/assets/index.887356d1.js
Blocking: https://limbus.kusoge.xyz/assets/index.887356d1.js
Request: stylesheet - https://limbus.kusoge.xyz/assets/index.214db582.css
Blocking: https://limbus.kusoge.xyz/assets/index.214db582.css
Request: font - https://limbus.kusoge.xyz/assets/KFOkCnqEu92Fr1MmgVxIIzQ.34e9582c.woff
Blocking: https://limbus.kusoge.xyz/assets/KFOkCnqEu92Fr1MmgVxIIzQ.34e9582c.woff
Request: font - https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmSU5fBBc-.bf14c7d7.woff
Blocking: https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmSU5fBB

In [33]:
import time
from playwright.async_api import async_playwright

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font", "script"]:
        await route.abort()
    else:
        await route.continue_()

async def measure_page_size(page):
    """ 페이지 크기 측정 함수 """
    response = await page.goto("https://limbus.kusoge.xyz")
    body = await response.body()
    return len(body)

async def main():
    """ 페이지 크기 비교 메인 함수 """
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()

        # 이미지 차단 전 페이지 크기 측정
        start_time = time.time()
        await page.goto("https://limbus.kusoge.xyz")
        original_size = await measure_page_size(page)
        print(f"원본 페이지 크기: {original_size}")
        
        # 이미지 차단 후 페이지 크기 측정
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz")
        reduced_size = await measure_page_size(page)
        print(f"이미지 차단 후 페이지 크기: {reduced_size}")

        # 크기 차이 계산
        size_difference = original_size - reduced_size
        print(f"차이: {size_difference}")
        
        await browser.close()

await main()

원본 페이지 크기: 325408
이미지 차단 후 페이지 크기: 325408
차이: 0


In [36]:
import time
from playwright.async_api import async_playwright

# 요청이 차단된 리소스 추적을 위한 변수
original_size = 0
reduced_size = 0

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font", "script"]:
        print(f"차단된 리소스: {request.url}")
        await route.abort()
    else:
        await route.continue_()

async def on_response(response):
    global original_size, reduced_size
    # 응답의 크기 측정
    if response.status == 200:
        if "image" not in response.url:  # 이미지 제외
            response_body = await response.body()
            size = len(response_body)
            if 'limbus.kusoge.xyz' in response.url:
                if "image" in response.url:
                    reduced_size += size
                else:
                    original_size += size
            print(f"응답 크기: {response.url} -> {size} 바이트")

async def measure_page_size(page):
    global original_size, reduced_size
    """ 페이지 크기 측정 함수 """
    original_size = 0
    reduced_size = 0

    # 페이지에서 모든 요청 응답을 추적
    page.on("response", on_response)

    response = await page.goto("https://limbus.kusoge.xyz/identity")
    return original_size, reduced_size

async def main():
    """ 페이지 크기 비교 메인 함수 """
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()

        # 이미지 차단 전 페이지 크기 측정
        await page.goto("https://limbus.kusoge.xyz/identity")
        original_size, reduced_size = await measure_page_size(page)
        print(f"원본 페이지 크기: {original_size / 1024:.2f}")

        # 이미지 차단 후 페이지 크기 측정
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity")
        print(f"이미지 차단 후 페이지 크기: {reduced_size / 1024:.2f} KB")

        # 크기 차이 계산
        size_difference = original_size - reduced_size
        print(f"차이: {size_difference / 1024:.2f} KB")
        
        await browser.close()

await main()

응답 크기: https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js?client=ca-pub-4728065552438864 -> 190887 바이트
응답 크기: https://www.googletagmanager.com/gtag/js?id=G-5Z841NVBZP -> 324379 바이트
응답 크기: https://limbus.kusoge.xyz/assets/index.887356d1.js -> 222944 바이트
응답 크기: https://limbus.kusoge.xyz/assets/index.214db582.css -> 618189 바이트
응답 크기: https://limbus.kusoge.xyz/assets/MainLayout.20685840.js -> 15594 바이트
응답 크기: https://limbus.kusoge.xyz/assets/MainLayout.b69da28d.css -> 258 바이트
응답 크기: https://limbus.kusoge.xyz/assets/UnitList.e0355fc2.js -> 15134 바이트
응답 크기: https://limbus.kusoge.xyz/assets/AL.27a7b696.js -> 839 바이트
응답 크기: https://limbus.kusoge.xyz/assets/AL.b0ad58a1.css -> 46 바이트
응답 크기: https://limbus.kusoge.xyz/identity -> 917622 바이트
응답 크기: https://pagead2.googlesyndication.com/pagead/managed/js/adsense/m202412090101/show_ads_impl.js -> 516638 바이트
응답 크기: https://limbus.kusoge.xyz/assets/KFOkCnqEu92Fr1MmgVxIIzQ.34e9582c.woff -> 20436 바이트
응답 크기: https://limbus.kusoge.xyz/assets/KF

In [37]:
import time
from playwright.async_api import async_playwright

# 요청이 차단된 리소스 추적을 위한 변수
original_size = 0
reduced_size = 0

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font", "script"]:
        print(f"차단된 리소스: {request.url}")
        await route.abort()
    else:
        await route.continue_()

async def on_response(response):
    global original_size, reduced_size
    # 응답의 크기 측정
    if response.status == 200:
        size = int(response.headers.get("content-length", 0))
        if "limbus.kusoge.xyz" in response.url:
            if "image" in response.url:
                reduced_size += size  # 차단 후 크기만 추적
            else:
                original_size += size  # 전체 리소스 크기 추적

async def measure_page_size(page):
    global original_size, reduced_size
    """ 페이지 크기 측정 함수 """
    original_size = 0
    reduced_size = 0

    # 페이지에서 모든 요청 응답을 추적
    page.on("response", on_response)

    response = await page.goto("https://limbus.kusoge.xyz/identity")
    return original_size, reduced_size

async def main():
    """ 페이지 크기 비교 메인 함수 """
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()

        # 이미지 차단 전 페이지 크기 측정
        await page.goto("https://limbus.kusoge.xyz/identity")
        original_size, reduced_size = await measure_page_size(page)
        print(f"원본 페이지 크기: {original_size / 1024:.2f} KB")

        # 이미지 차단 후 페이지 크기 측정
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity")
        print(f"이미지 차단 후 페이지 크기: {reduced_size / 1024:.2f} KB")

        # 크기 차이 계산
        size_difference = original_size - reduced_size
        print(f"차이: {size_difference / 1024:.2f} KB")
        
        await browser.close()

await main()


원본 페이지 크기: 1955.40 KB
차단된 리소스: https://ep2.adtrafficquality.google/sodar/sodar2.js
차단된 리소스: https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js?client=ca-pub-4728065552438864
차단된 리소스: https://www.googletagmanager.com/gtag/js?id=G-5Z841NVBZP
차단된 리소스: https://limbus.kusoge.xyz/assets/index.887356d1.js
차단된 리소스: https://limbus.kusoge.xyz/assets/index.214db582.css
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOkCnqEu92Fr1MmgVxIIzQ.34e9582c.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmSU5fBBc-.bf14c7d7.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOmCnqEu92Fr1Mu4mxM.f2abf7fb.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmEU9fBBc-.9ce7f3ac.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmWUlfBBc-.e0fd57c0.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmYUtfBBc-.f6537e32.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/flUhRq6tzZclQEJ-Vdg-IuiaDsNcIhQ8tQ.4a4dbc62.woff2
차단된 리소스: https://limbus.kusoge.xyz/assets/flUhRq6tzZcl

In [38]:
import time
from playwright.async_api import async_playwright

# 요청이 차단된 리소스 추적을 위한 변수
original_size = 0
reduced_size = 0

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font", "script"]:
        print(f"차단된 리소스: {request.url}")
        await route.abort()
    else:
        await route.continue_()

async def on_response(response):
    global original_size, reduced_size
    # 응답의 크기 측정
    if response.status == 200:
        size = int(response.headers.get("content-length", 0))
        if "limbus.kusoge.xyz" in response.url:
            if "image" in response.url:
                # 이미지 리소스는 차단된 후 크기 합산하지 않음
                return
            else:
                original_size += size  # 이미지 차단 전 리소스 크기
        # 이미지 차단 후 크기 합산
        reduced_size += size

async def measure_page_size(page):
    global original_size, reduced_size
    """ 페이지 크기 측정 함수 """
    original_size = 0
    reduced_size = 0

    # 페이지에서 모든 요청 응답을 추적
    page.on("response", on_response)

    response = await page.goto("https://limbus.kusoge.xyz/identity")
    return original_size, reduced_size

async def main():
    """ 페이지 크기 비교 메인 함수 """
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()

        # 이미지 차단 전 페이지 크기 측정
        await page.goto("https://limbus.kusoge.xyz/identity")
        original_size, reduced_size = await measure_page_size(page)
        print(f"원본 페이지 크기: {original_size / 1024:.2f} KB")

        # 이미지 차단 후 페이지 크기 측정
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity")
        print(f"이미지 차단 후 페이지 크기: {reduced_size / 1024:.2f} KB")

        # 크기 차이 계산
        size_difference = original_size - reduced_size
        print(f"차이: {size_difference / 1024:.2f} KB")
        
        await browser.close()

await main()


원본 페이지 크기: 0.00 KB
차단된 리소스: https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js?client=ca-pub-4728065552438864
차단된 리소스: https://www.googletagmanager.com/gtag/js?id=G-5Z841NVBZP
차단된 리소스: https://limbus.kusoge.xyz/assets/index.887356d1.js
차단된 리소스: https://limbus.kusoge.xyz/assets/index.214db582.css
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOkCnqEu92Fr1MmgVxIIzQ.34e9582c.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmSU5fBBc-.bf14c7d7.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOmCnqEu92Fr1Mu4mxM.f2abf7fb.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmEU9fBBc-.9ce7f3ac.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmWUlfBBc-.e0fd57c0.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmYUtfBBc-.f6537e32.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/flUhRq6tzZclQEJ-Vdg-IuiaDsNcIhQ8tQ.4a4dbc62.woff2
차단된 리소스: https://limbus.kusoge.xyz/assets/flUhRq6tzZclQEJ-Vdg-IuiaDsNa.fd84f88b.woff
차단된 리소스: https://limbus.kusoge.xy

In [43]:
import time
from playwright.async_api import async_playwright

# 요청이 차단된 리소스 추적을 위한 변수
original_size = 0
reduced_size = 0

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font", "script"]:
        print(f"차단된 리소스: {request.url}")
        await route.abort()
    else:
        await route.continue_()

async def on_response(response):
    global original_size, reduced_size
    # 응답의 크기 측정
    if response.status == 200:
        size = int(response.headers.get("content-length", 0))
        if "limbus.kusoge.xyz" in response.url:
            if "image" in response.url:
                # 이미지 리소스는 차단된 후 크기 합산하지 않음
                return
            else:
                reduced_size += size  # 이미지를 제외한 크기 합산
        # 전체 이미지 크기
        original_size += size

async def measure_page_size(page):
    global original_size, reduced_size
    """ 페이지 크기 측정 함수 """
    original_size = 0
    reduced_size = 0

    # 페이지에서 모든 요청 응답을 추적
    page.on("response", on_response)

    # 페이지 로딩 후 모든 응답에 대해 크기 측정
    response = await page.goto("https://limbus.kusoge.xyz")
    return original_size, reduced_size

async def main():
    """ 페이지 크기 비교 메인 함수 """
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()

        # 이미지 차단 전 페이지 크기 측정
        await page.goto("https://limbus.kusoge.xyz")
        original_size, reduced_size = await measure_page_size(page)
        print(f"원본 페이지 크기: {original_size / 1024:.2f} KB")

        # 이미지 차단 후 페이지 크기 측정
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz")
        print(f"이미지 차단 후 페이지 크기: {reduced_size / 1024:.2f} KB")

        # 크기 차이 계산
        size_difference = original_size - reduced_size
        print(f"차이: {size_difference / 1024:.2f} KB")
        
        await browser.close()

await main()

원본 페이지 크기: 4032.41 KB
차단된 리소스: https://ep2.adtrafficquality.google/sodar/sodar2.js
차단된 리소스: https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js?client=ca-pub-4728065552438864
차단된 리소스: https://www.googletagmanager.com/gtag/js?id=G-5Z841NVBZP
차단된 리소스: https://limbus.kusoge.xyz/assets/index.887356d1.js
차단된 리소스: https://limbus.kusoge.xyz/assets/index.214db582.css
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOkCnqEu92Fr1MmgVxIIzQ.34e9582c.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmSU5fBBc-.bf14c7d7.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOmCnqEu92Fr1Mu4mxM.f2abf7fb.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmEU9fBBc-.9ce7f3ac.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmWUlfBBc-.e0fd57c0.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/KFOlCnqEu92Fr1MmYUtfBBc-.f6537e32.woff
차단된 리소스: https://limbus.kusoge.xyz/assets/flUhRq6tzZclQEJ-Vdg-IuiaDsNcIhQ8tQ.4a4dbc62.woff2
차단된 리소스: https://limbus.kusoge.xyz/assets/flUhRq6tzZcl

In [51]:
from playwright.async_api import async_playwright

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        #print(f"차단된 리소스: {request.url}")
        await route.abort()
    else:
        await route.continue_()
        
async def get_element_attribute(element, selector, attribute):
    """ 지정된 요소에서 특정 속성 값을 추출하는 함수 """
    try:
        target_element = await element.query_selector(selector)
        if target_element:
            return await target_element.get_attribute(attribute)
    except Exception as e:
        print(f"Error getting element attribute: {e}")
    return None

async def extract_rarity(row):
    """ 희귀도 추출 함수 """
    try:
        print("Attempting to locate rarity...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 첫 번째 형제 td로 이동 (희귀도 이미지가 있는 <td>)
            sibling = await parent.evaluate_handle('node => node.nextElementSibling')

            if sibling:
                # 희귀도 이미지 찾기
                rarity_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/rarity_"]', 'src')
                if rarity_img_src:
                    rarity_level = rarity_img_src.split('_')[-1].split('.')[0]  # rarity_1.png -> 1
                    print(f"Extracted rarity level: {rarity_level}")
                    return rarity_level

        print("Rarity image not found.")
    except Exception as e:
        print(f"Error extracting rarity: {e}")
    
    return "Unknown"

resource_mapping = {
    "AZURE": "Gloom",
    "VIOLET": "Envy",
    "AMBER": "Sloth",
    "SHAMROCK": "Gluttony",
    "CRIMSON": "Wrath",
    "SCARLET": "Lust"
}

def convert_resource(resource_name):
    """리소스 이름을 변환하는 함수"""
    return resource_mapping.get(resource_name, resource_name)  # 매핑이 없으면 원래 값을 그대로 반환

async def extract_atk_and_resource(row, skill_number):
    """ 공격 타입(ATK Type)과 자원(Attribute) 추출 함수 - 스킬 번호에 따라 처리 """
    try:
        print(f"Attempting to locate skill{skill_number} type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 해당 스킬 번호에 맞는 형제로 이동
            sibling = parent
            for _ in range(skill_number + 1):  # 스킬 번호에 맞게 이동
                sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            atk_type, resource = "Unknown", "Unknown"

            if sibling:
                # 공격 타입 이미지 (atk_type) 찾기
                atk_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/atk_type_"]', 'src')
                if atk_type_img_src:
                    atk_type = atk_type_img_src.split('_')[-1].split('.')[0]  # atk_type_SLASH.png -> SLASH
                    print(f"Extracted attack type: {atk_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted resource: {resource}")
                    
                    # 리소스를 변환
                    resource = convert_resource(resource)
                    print(f"Converted resource: {resource}")

            return {f'skill{skill_number}_atk_type': atk_type, f'skill{skill_number}_resource': resource}
        
    except Exception as e:
        print(f"Error extracting skill{skill_number} type and resource: {e}")
    
    return {f'skill{skill_number}_atk_type': "Unknown", f'skill{skill_number}_resource': "Unknown"}

async def extract_defense_and_resource(row):
    """ 방어 타입(Def Type)과 자원(Attribute) 추출 함수 """
    try:
        print("Attempting to locate defense type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 다섯 번째 형제 td로 이동 (방어 관련 정보가 있는 <td>)
            sibling = parent
            for _ in range(5):  # 방어 정보는 5번째 형제에 있음
                sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            def_type, def_resource = "Unknown", "Unknown"

            if sibling:
                # 방어 타입 이미지 (def_type) 찾기
                def_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/def_type_"]', 'src')
                if def_type_img_src:
                    def_type = def_type_img_src.split('_')[-1].split('.')[0]  # def_type_GUARD.png -> GUARD
                    print(f"Extracted defense type: {def_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    def_resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted defense resource: {def_resource}")
                    
                    # 방어 리소스를 변환
                    def_resource = convert_resource(def_resource)
                    print(f"Converted defense resource: {def_resource}")

            return {'def_type': def_type, 'def_resource': def_resource}
        
    except Exception as e:
        print(f"Error extracting defense type and resource: {e}")
    
    return {'def_type': "Unknown", 'def_resource': "Unknown"}


async def scrape_character_name_and_url(row):
    """ 캐릭터 이름과 URL 추출 함수 """
    try:
        # 캐릭터 이름 추출
        character_name = await row.query_selector('a[href^="/identity/"]')
        name = await character_name.inner_text() if character_name else "Unknown"

        # 캐릭터 URL 추출
        character_url = await character_name.get_attribute('href') if character_name else ""
        full_url = f"https://limbus.kusoge.xyz{character_url}" if character_url else ""

        return {'name': name.strip(), 'url': full_url}

    except Exception as e:
        print(f"Error extracting character name and URL: {e}")
        return None

async def handle_request_interception(route, request):
    """ 이미지 요청을 차단하는 함수 """
    if "image" in request.resource_type:
        print(f"Blocking image request: {url}")
        await route.abort()  # 이미지 요청 차단
    else:
        await route.continue_()  # 다른 요청은 그대로 진행

async def scrape_character_list(page):

    # 이미지 요청 차단
    page.on("route", handle_request_interception)
    
    """ 캐릭터 리스트에서 정보 추출 함수 """
    await page.goto("https://limbus.kusoge.xyz/identity")
    
    character_rows = await page.query_selector_all('tr')
    if len(character_rows) > 1:
        first_row = character_rows[1]
        
        # 캐릭터 이름과 URL을 추출
        character_info = await scrape_character_name_and_url(first_row)
        if character_info:
            character_info['rarity'] = await extract_rarity(first_row)  # 희귀도 추출
            for i in range(1, 4):  # 스킬1~3 정보 추출
                skill_and_resource = await extract_atk_and_resource(first_row, i)
                character_info.update(skill_and_resource)  # 스킬 정보 추가
            defense_and_resource = await extract_defense_and_resource(first_row)  # 방어 정보 추출
            character_info.update(defense_and_resource)  # 방어 정보 추가
            return character_info
    return None

async def main():
    """ 메인 크롤링 함수 """
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()
        await page.route("**/*", handle_request)
        character_info = await scrape_character_list(page)
        if character_info:
            print("Character Info:")
            print(f"Name: {character_info['name']}")
            print(f"URL: {character_info['url']}")
            print(f"Rarity: {character_info['rarity']} 단계")
            print(f"Skill1 Attack Type: {character_info['skill1_atk_type']}")
            print(f"Skill1 Resource: {character_info['skill1_resource']}")
            print(f"Skill2 Attack Type: {character_info['skill2_atk_type']}")
            print(f"Skill2 Resource: {character_info['skill2_resource']}")
            print(f"Skill3 Attack Type: {character_info['skill3_atk_type']}")
            print(f"Skill3 Resource: {character_info['skill3_resource']}")
            print(f"Defense Type: {character_info['def_type']}")
            print(f"Defense Resource: {character_info['def_resource']}")
        else:
            print("No characters found.")
        
        await browser.close()

# Jupyter 환경에서 실행
await main()

Attempting to locate rarity...
Extracted rarity level: 1
Attempting to locate skill1 type and resource...
Extracted attack type: SLASH
Extracted resource: AZURE
Converted resource: Gloom
Attempting to locate skill2 type and resource...
Extracted attack type: PENETRATE
Extracted resource: VIOLET
Converted resource: Envy
Attempting to locate skill3 type and resource...
Extracted attack type: SLASH
Extracted resource: AMBER
Converted resource: Sloth
Attempting to locate defense type and resource...
Extracted defense type: GUARD
Extracted defense resource: AZURE
Converted defense resource: Gloom
Character Info:
Name: [LCB Sinner]
Yi Sang
URL: https://limbus.kusoge.xyz/identity/10101
Rarity: 1 단계
Skill1 Attack Type: SLASH
Skill1 Resource: Gloom
Skill2 Attack Type: PENETRATE
Skill2 Resource: Envy
Skill3 Attack Type: SLASH
Skill3 Resource: Sloth
Defense Type: GUARD
Defense Resource: Gloom


In [52]:
from playwright.async_api import async_playwright

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        #print(f"차단된 리소스: {request.url}")
        await route.abort()
    else:
        await route.continue_()
        
async def get_element_attribute(element, selector, attribute):
    """ 지정된 요소에서 특정 속성 값을 추출하는 함수 """
    try:
        target_element = await element.query_selector(selector)
        if target_element:
            return await target_element.get_attribute(attribute)
    except Exception as e:
        print(f"Error getting element attribute: {e}")
    return None

async def extract_rarity(row):
    """ 희귀도 추출 함수 """
    try:
        print("Attempting to locate rarity...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 첫 번째 형제 td로 이동 (희귀도 이미지가 있는 <td>)
            sibling = await parent.evaluate_handle('node => node.nextElementSibling')

            if sibling:
                # 희귀도 이미지 찾기
                rarity_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/rarity_"]', 'src')
                if rarity_img_src:
                    rarity_level = rarity_img_src.split('_')[-1].split('.')[0]  # rarity_1.png -> 1
                    print(f"Extracted rarity level: {rarity_level}")
                    return rarity_level

        print("Rarity image not found.")
    except Exception as e:
        print(f"Error extracting rarity: {e}")
    
    return "Unknown"

resource_mapping = {
    "AZURE": "Gloom",
    "VIOLET": "Envy",
    "AMBER": "Sloth",
    "SHAMROCK": "Gluttony",
    "CRIMSON": "Wrath",
    "SCARLET": "Lust"
}

def convert_resource(resource_name):
    """리소스 이름을 변환하는 함수"""
    return resource_mapping.get(resource_name, resource_name)  # 매핑이 없으면 원래 값을 그대로 반환

async def extract_atk_and_resource(row, skill_number):
    """ 공격 타입(ATK Type)과 자원(Attribute) 추출 함수 - 스킬 번호에 따라 처리 """
    try:
        print(f"Attempting to locate skill{skill_number} type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 해당 스킬 번호에 맞는 형제로 이동
            sibling = parent
            for _ in range(skill_number + 1):  # 스킬 번호에 맞게 이동
                sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            atk_type, resource = "Unknown", "Unknown"

            if sibling:
                # 공격 타입 이미지 (atk_type) 찾기
                atk_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/atk_type_"]', 'src')
                if atk_type_img_src:
                    atk_type = atk_type_img_src.split('_')[-1].split('.')[0]  # atk_type_SLASH.png -> SLASH
                    print(f"Extracted attack type: {atk_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted resource: {resource}")
                    
                    # 리소스를 변환
                    resource = convert_resource(resource)
                    print(f"Converted resource: {resource}")

            return {f'skill{skill_number}_atk_type': atk_type, f'skill{skill_number}_resource': resource}
        
    except Exception as e:
        print(f"Error extracting skill{skill_number} type and resource: {e}")
    
    return {f'skill{skill_number}_atk_type': "Unknown", f'skill{skill_number}_resource': "Unknown"}

async def extract_defense_and_resource(row):
    """ 방어 타입(Def Type)과 자원(Attribute) 추출 함수 """
    try:
        print("Attempting to locate defense type and resource...")

        # <a> 태그의 부모 <td>로 이동
        parent_td = await row.query_selector('a[href^="/identity/"]')
        if parent_td:
            # 부모 td에서 형제로 이동
            parent = await parent_td.evaluate_handle('(node) => node.parentElement')

            # 다섯 번째 형제 td로 이동 (방어 관련 정보가 있는 <td>)
            sibling = parent
            for _ in range(5):  # 방어 정보는 5번째 형제에 있음
                sibling = await sibling.evaluate_handle('node => node.nextElementSibling')

            def_type, def_resource = "Unknown", "Unknown"

            if sibling:
                # 방어 타입 이미지 (def_type) 찾기
                def_type_img_src = await get_element_attribute(sibling, 'img[src^="https://img.kusoge.xyz/limbus/img/ui/def_type_"]', 'src')
                if def_type_img_src:
                    def_type = def_type_img_src.split('_')[-1].split('.')[0]  # def_type_GUARD.png -> GUARD
                    print(f"Extracted defense type: {def_type}")

                # 자원 이미지 (resource) 찾기
                resource_img_src = await get_element_attribute(sibling, 'div.q-py-xs img[src^="https://img.kusoge.xyz/limbus/img/ui/attr_"]', 'src')
                if resource_img_src:
                    def_resource = resource_img_src.split('_')[-1].split('.')[0]  # attr_AZURE.png -> AZURE
                    print(f"Extracted defense resource: {def_resource}")
                    
                    # 방어 리소스를 변환
                    def_resource = convert_resource(def_resource)
                    print(f"Converted defense resource: {def_resource}")

            return {'def_type': def_type, 'def_resource': def_resource}
        
    except Exception as e:
        print(f"Error extracting defense type and resource: {e}")
    
    return {'def_type': "Unknown", 'def_resource': "Unknown"}


async def scrape_character_name_and_url(row):
    """ 캐릭터 이름과 URL 추출 함수 """
    try:
        # 캐릭터 이름 추출
        character_name = await row.query_selector('a[href^="/identity/"]')
        name = await character_name.inner_text() if character_name else "Unknown"

        # 캐릭터 URL 추출
        character_url = await character_name.get_attribute('href') if character_name else ""
        full_url = f"https://limbus.kusoge.xyz{character_url}" if character_url else ""

        return {'name': name.strip(), 'url': full_url}

    except Exception as e:
        print(f"Error extracting character name and URL: {e}")
        return None

async def handle_request_interception(route, request):
    """ 이미지 요청을 차단하는 함수 """
    if "image" in request.resource_type:
        print(f"Blocking image request: {url}")
        await route.abort()  # 이미지 요청 차단
    else:
        await route.continue_()  # 다른 요청은 그대로 진행

async def scrape_character_list(page):

    # 이미지 요청 차단
    page.on("route", handle_request_interception)
    
    """ 캐릭터 리스트에서 정보 추출 함수 """
    await page.goto("https://limbus.kusoge.xyz/identity")
    
    character_rows = await page.query_selector_all('tr')
    if len(character_rows) > 1:
        first_row = character_rows[1]
        
        # 캐릭터 이름과 URL을 추출
        character_info = await scrape_character_name_and_url(first_row)
        if character_info:
            character_info['rarity'] = await extract_rarity(first_row)  # 희귀도 추출
            for i in range(1, 4):  # 스킬1~3 정보 추출
                skill_and_resource = await extract_atk_and_resource(first_row, i)
                character_info.update(skill_and_resource)  # 스킬 정보 추가
            defense_and_resource = await extract_defense_and_resource(first_row)  # 방어 정보 추출
            character_info.update(defense_and_resource)  # 방어 정보 추가
            return character_info
    return None

async def main():
    """ 메인 크롤링 함수 """
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        page = await browser.new_page()
        await page.route("**/*", handle_request)
        character_info = await scrape_character_list(page)
        if character_info:
            print("Character Info:")
            print(f"Name: {character_info['name']}")
            print(f"URL: {character_info['url']}")
            print(f"Rarity: {character_info['rarity']} 단계")
            print(f"Skill1 Attack Type: {character_info['skill1_atk_type']}")
            print(f"Skill1 Resource: {character_info['skill1_resource']}")
            print(f"Skill2 Attack Type: {character_info['skill2_atk_type']}")
            print(f"Skill2 Resource: {character_info['skill2_resource']}")
            print(f"Skill3 Attack Type: {character_info['skill3_atk_type']}")
            print(f"Skill3 Resource: {character_info['skill3_resource']}")
            print(f"Defense Type: {character_info['def_type']}")
            print(f"Defense Resource: {character_info['def_resource']}")
        else:
            print("No characters found.")
        
        await browser.close()

# Jupyter 환경에서 실행
await main()

Attempting to locate rarity...
Extracted rarity level: 1
Attempting to locate skill1 type and resource...
Extracted attack type: SLASH
Extracted resource: AZURE
Converted resource: Gloom
Attempting to locate skill2 type and resource...
Extracted attack type: PENETRATE
Extracted resource: VIOLET
Converted resource: Envy
Attempting to locate skill3 type and resource...
Extracted attack type: SLASH
Extracted resource: AMBER
Converted resource: Sloth
Attempting to locate defense type and resource...
Extracted defense type: GUARD
Extracted defense resource: AZURE
Converted defense resource: Gloom
Character Info:
Name: [LCB Sinner]
Yi Sang
URL: https://limbus.kusoge.xyz/identity/10101
Rarity: 1 단계
Skill1 Attack Type: SLASH
Skill1 Resource: Gloom
Skill2 Attack Type: PENETRATE
Skill2 Resource: Envy
Skill3 Attack Type: SLASH
Skill3 Resource: Sloth
Defense Type: GUARD
Defense Resource: Gloom


In [98]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def get_attribute_value(page, selector, attribute, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.get_attribute(attribute) if element else default

async def get_text_content(page, selector, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.text_content() if element else default

async def extract_value_with_regex(text, pattern, default="Unknown"):
    match = re.search(pattern, text)
    return match.group(1) if match else default

async def extract_value_from_attribute(page, selector, attribute, pattern, default="Unknown"):
    attribute_value = await get_attribute_value(page, selector, attribute, default)
    return await extract_value_with_regex(attribute_value, pattern, default)

async def extract_stat_value(page, image_src, depth):
    # 이미지 요소 찾기
    image = await page.query_selector(f'img[src="{image_src}"]')
    if not image:
        return "Unknown"

    # 이미지의 부모 요소를 찾아서 올라감
    parent = image
    for _ in range(depth):
        parent = await parent.evaluate_handle('node => node.parentElement')
        if not parent:
            return "Unknown"

    # 부모의 형제 요소 찾기
    sibling = await parent.evaluate_handle('node => node.nextElementSibling')
    
    if sibling:
        value = await sibling.evaluate('node => node.textContent')
        if value:
            return value.strip()
    
    return "Unknown"

async def extract_stats(page, stats_to_extract):
    stats = {}
    for stat in stats_to_extract:
        value = await extract_stat_value(page, stat["image_src"], stat["depth"])
        print(f"{stat['name']} extracted value: {value}")
        stats[stat["name"]] = value
    return stats

async def extract_stagger_threshold_values(page):
    # 'div.row.center.flex-center.q-pt-xs' 요소들 찾기
    elements = await page.query_selector_all('div.row.center.flex-center.q-pt-xs')
    
    # 각 요소의 텍스트 내용 출력하여 'Stagger Threshold' 요소를 찾기
    for element in elements:
        text = await element.text_content()
        
        if text and "Stagger Threshold" in text:
            # 'Stagger Threshold'가 있는 요소를 찾았다면, 그 이후 형제 요소들에서 값을 추출
            parent = await element.evaluate_handle('node => node.parentElement')
            sibling_elements = await parent.query_selector_all('div.row.justify-evenly div')  # Threshold 값이 들어있는 div들
            
            stagger_values = []
            for sibling in sibling_elements:
                text_content = await sibling.text_content()
                match = re.search(r'(\d+%)', text_content)
                if match:
                    stagger_values.append(match.group(1))  # 퍼센트 값만 리스트에 추가
            
            return stagger_values  # 추출된 퍼센트 값 반환
    
    return ["Unknown"]  # 만약 'Stagger Threshold'를 찾지 못한 경우

async def save_data_to_csv(data, file_name, mode='w'):
    df = pd.DataFrame([data])
    df.to_csv(file_name, index=False, mode=mode, encoding="utf-8-sig", header=(mode == 'w'))
    print(f"데이터가 {file_name}에 저장되었습니다.")

async def extract_data_from_page(page):
    identity = await get_text_content(page, 'div.flex.flex-center.q-pr-md.title')
    rarity = await extract_value_from_attribute(page, 'img.q-img__image.q-img__image--without-transition', "src", r'rarity_(\d+)\.png')
    uptie = await extract_value_from_attribute(page, 'i.q-icon.q-fab__icon img', "src", r'uptie_(\d+)\.png')
    level = await extract_value_with_regex(await get_text_content(page, 'div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary'), r'level:\s*(\d+)')

    stats_to_extract = [
        {"name": "HP", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_hp.png", "depth": 3},
        {"name": "Speed", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_spd.png", "depth": 3},
        {"name": "Defense", "image_src": "https://img.kusoge.xyz/limbus/img/ui/stats_def.png", "depth": 3},
        {"name": "Atk_Type_HIT", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_HIT.png", "depth": 1},
        {"name": "Atk_Type_PENETRATE", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_PENETRATE.png", "depth": 1},
        {"name": "Atk_Type_SLASH", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_SLASH.png", "depth": 1}
    ]

    stats = await extract_stats(page, stats_to_extract)

    # Stagger Threshold 값 추출
    stagger_thresholds = await extract_stagger_threshold_values(page)

    # Stagger Threshold 값을 딕셔너리로 만들기
    stagger_data = {
        "Stagger_Threshold_One": stagger_thresholds[0] if len(stagger_thresholds) > 0 else "Unknown",
        "Stagger_Threshold_Two": stagger_thresholds[1] if len(stagger_thresholds) > 1 else "Unknown",
        "Stagger_Threshold_Three": stagger_thresholds[2] if len(stagger_thresholds) > 2 else "Unknown",
    }
    
    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        **stats,
        **stagger_data  # stagger_data 딕셔너리 값 삽입
    }

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        #print(f"차단된 리소스: {request.url}")
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        context = await browser.new_context()
        page = await context.new_page()
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        data = await extract_data_from_page(page)
        await save_data_to_csv(data, "[LCB Sinner] Yi Sang.csv")
        await asyncio.sleep(1000)
        #await browser.close()

await main()

웹페이지 로드 완료
HP extracted value: Unknown
Speed extracted value: Unknown
Defense extracted value: Unknown
Atk_Type_HIT extracted value: Normal
Atk_Type_PENETRATE extracted value: Ineff.
Atk_Type_SLASH extracted value: Fatal
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.


CancelledError: 

In [17]:
from playwright.async_api import async_playwright
import asyncio

async def extract_status_data(page):
    # Status 텍스트 찾기
    status_element = await page.query_selector("text=Status")
    if not status_element:
        return {"HP": "Unknown", "Speed": "Unknown", "Defense": "Unknown"}
    
    # Status 텍스트 아래 열(column) 요소들 찾기
    parent_element = await status_element.evaluate_handle("node => node.parentElement.nextElementSibling")
    columns = await parent_element.query_selector_all("div.column.center.flex-center")
    
    # 열 요소에서 각각의 값을 추출
    stats = ["HP", "Speed", "Defense"]
    data = {}
    for i, stat_name in enumerate(stats):
        if i < len(columns):
            value_element = await columns[i].query_selector("div:nth-child(2)")
            value = await value_element.text_content() if value_element else "Unknown"
            data[stat_name] = value.strip()
        else:
            data[stat_name] = "Unknown"
    
    return data

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        #print(f"차단된 리소스: {request.url}")
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()
        
        # 타겟 페이지 이동
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")
        
        # Status 정보를 기반으로 데이터 추출
        status_data = await extract_status_data(page)
        print("추출된 데이터:", status_data)
        
        await browser.close()

await main()

웹페이지 로드 완료


AttributeError: 'JSHandle' object has no attribute 'query_selector_all'

In [18]:
from playwright.async_api import async_playwright
import asyncio

async def extract_status_data(page):
    # Status 텍스트 찾기
    status_element = await page.query_selector("text=Status")
    if not status_element:
        return {"HP": "Unknown", "Speed": "Unknown", "Defense": "Unknown"}
    
    # Status 텍스트 아래 열(column) 요소들 찾기
    parent_element_handle = await status_element.evaluate_handle("node => node.parentElement.nextElementSibling")
    parent_element = await parent_element_handle.as_element()  # JSHandle을 ElementHandle로 변환
    if not parent_element:
        return {"HP": "Unknown", "Speed": "Unknown", "Defense": "Unknown"}
    
    columns = await parent_element.query_selector_all("div.column.center.flex-center")
    
    # 열 요소에서 각각의 값을 추출
    stats = ["HP", "Speed", "Defense"]
    data = {}
    for i, stat_name in enumerate(stats):
        if i < len(columns):
            value_element = await columns[i].query_selector("div:nth-child(2)")
            value = await value_element.text_content() if value_element else "Unknown"
            data[stat_name] = value.strip()
        else:
            data[stat_name] = "Unknown"
    
    return data

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()
        
        # 리소스 차단 설정
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")
        
        # Status 정보를 기반으로 데이터 추출
        status_data = await extract_status_data(page)
        print("추출된 데이터:", status_data)
        
        await browser.close()

await main()

웹페이지 로드 완료


TypeError: object NoneType can't be used in 'await' expression

In [19]:
from playwright.async_api import async_playwright
import asyncio

async def debug_status_data(page):
    # Step 1: Status 텍스트 찾기
    status_element = await page.query_selector("text=Status")
    if not status_element:
        print("Status 텍스트를 찾을 수 없습니다.")
        return
    
    # Step 2: Status의 형제의 nextElementSibling 확인
    next_sibling_handle = await status_element.evaluate_handle("node => node.nextElementSibling")
    if next_sibling_handle:
        sibling_html = await next_sibling_handle.evaluate("node => node.outerHTML")
        print("\nStatus의 부모의 다음 형제 요소:\n", sibling_html)
    else:
        print("\nStatus의 부모의 다음 형제 요소를 찾을 수 없습니다.")
        return
    
    # Step 4: 열(column) 요소 확인
    next_sibling_element = await next_sibling_handle.as_element()
    columns = await next_sibling_element.query_selector_all("div.column.center.flex-center")
    print("\n열 요소의 개수:", len(columns))
    
    for i, column in enumerate(columns):
        column_html = await column.evaluate("node => node.outerHTML")
        print(f"\n열 {i+1}의 HTML:\n", column_html)

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()
        
        # 리소스 차단 설정
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")
        
        # 디버깅 데이터 출력
        await debug_status_data(page)
        
        await browser.close()

await main()


웹페이지 로드 완료

Status의 부모 요소:
 <div data-v-02146f54="" class="q-item__section column q-item__section--main justify-center"><div data-v-02146f54="" class="q-item__label">STATUS EFFECT</div></div>


Error: JSHandle.evaluate: TypeError: Cannot read properties of null (reading 'outerHTML')
    at eval (eval at evaluate (:234:30), <anonymous>:1:14)
    at UtilityScript.evaluate (<anonymous>:241:19)
    at UtilityScript.<anonymous> (<anonymous>:1:44)

In [20]:
from playwright.async_api import async_playwright

async def debug_status_data(page):
    # Step 1: Status 텍스트 찾기
    status_element = await page.query_selector("text=Status")
    if not status_element:
        print("Status 텍스트를 찾을 수 없습니다.")
        return
    
    # Step 2: Status의 부모 요소 확인
    parent_element_handle = await status_element.evaluate_handle("node => node.parentElement")
    if parent_element_handle:
        parent_html = await parent_element_handle.evaluate("node => node.outerHTML")
        print("\nStatus의 부모 요소:\n", parent_html)
    else:
        print("\nStatus의 부모 요소를 찾을 수 없습니다.")
        return
    
    # Step 3: 부모 요소의 조부모 요소 확인
    grandparent_handle = await parent_element_handle.evaluate_handle("node => node.nextElementSibling")
    if grandparent_handle:
        grandparent_html = await grandparent_handle.evaluate("node => node.outerHTML")
        print("\nStatus의 조부모 요소:\n", grandparent_html)
    else:
        print("\nStatus의 조부모 요소를 찾을 수 없습니다.")
    
    # Step 4: 부모 요소의 자식 요소들 확인
    children_handles = await parent_element_handle.evaluate_handle("node => Array.from(node.children)")
    children_list = await children_handles.evaluate("nodes => nodes.map(node => node.outerHTML)")
    print("\nStatus 부모의 자식 요소들:")
    for i, child_html in enumerate(children_list):
        print(f"자식 {i+1}:\n{child_html}\n")

async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.goto("https://limbus.kusoge.xyz/identity")
        print("웹페이지 로드 완료")

        # 디버깅 데이터 출력
        await debug_status_data(page)

        await browser.close()

# 실행
await main()


웹페이지 로드 완료

Status의 부모 요소:
 <div data-v-02146f54="" class="q-item__section column q-item__section--main justify-center"><div data-v-02146f54="" class="q-item__label">STATUS EFFECT</div></div>

Status의 조부모 요소:
 <div data-v-02146f54="" class="q-item q-item-type row no-wrap q-item--dark q-item--clickable q-link cursor-pointer q-focusable q-hoverable" role="listitem" tabindex="0"><div class="q-focus-helper" tabindex="-1"></div><!----><!----><div data-v-02146f54="" class="q-item__section column q-item__section--main justify-center"><div data-v-02146f54="" class="q-item__label">STATUS EFFECT</div></div></div>

Status 부모의 자식 요소들:
자식 1:
<div data-v-02146f54="" class="q-item__label">STATUS EFFECT</div>



In [85]:
from playwright.async_api import async_playwright

async def debug_status_data(page):
    # Step 1: Status 텍스트 찾기
    status_element = await page.query_selector("text=Status")
    if not status_element:
        print("Status 텍스트를 찾을 수 없습니다.")
        return
    
    # Step 2: Status의 부모 요소 확인
    parent_element_handle = await status_element.evaluate_handle("node => node.parentElement")
    if parent_element_handle:
        parent_html = await parent_element_handle.evaluate("node => node.outerHTML")
        print("\nStatus의 부모 요소:\n", parent_html)
    else:
        print("\nStatus의 부모 요소를 찾을 수 없습니다.")
        return
    
    # Step 3: Status 텍스트가 포함된 내부 자식 요소 탐색
    child_elements_handle = await parent_element_handle.evaluate_handle("node => Array.from(node.children)")
    child_elements = await child_elements_handle.evaluate("nodes => nodes.map(node => node.outerHTML)")
    
    print("\nStatus 부모의 자식 요소들:")
    for i, child_html in enumerate(child_elements):
        print(f"자식 {i+1}:\n{child_html}\n")
    
    # Step 4: 'Status'와 관련된 다른 정보를 포함하는 영역 찾기
    # 여기서 추가적인 탐색을 통해 데이터를 찾을 수 있을 것입니다.
    # 예시로, 다음은 해당 부모 요소 아래에서 더 많은 데이터를 찾는 방법입니다.
    status_details = await parent_element_handle.query_selector_all(".status-detail-class")  # 정확한 클래스로 변경 필요
    for i, detail in enumerate(status_details):
        detail_text = await detail.text_content()
        print(f"상세 정보 {i+1}: {detail_text}")

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # 디버깅 데이터 출력
        await debug_status_data(page)

        await browser.close()

await main()


웹페이지 로드 완료


Error: JSHandle.evaluate: TypeError: Cannot read properties of null (reading 'outerHTML')
    at eval (eval at evaluate (:234:30), <anonymous>:1:14)
    at UtilityScript.evaluate (<anonymous>:241:19)
    at UtilityScript.<anonymous> (<anonymous>:1:44)

In [42]:
from playwright.async_api import async_playwright

async def extract_sibling_nodes(page):
    # Step 1: Status 텍스트 찾기
    status_element = await page.query_selector("text=Status")
    if not status_element:
        print("Status 텍스트를 찾을 수 없습니다.")
        return
    
    # Step 2: Status 텍스트의 부모 요소 찾기
    parent_element_handle = await status_element.evaluate_handle("node => node.parentElement")
    
    # Step 3: 부모의 모든 자식 요소들 가져오기
    sibling_nodes = await parent_element_handle.evaluate("node => Array.from(node.children")
    
    print("\nStatus의 형제 노드들:")
    for sibling in sibling_nodes:
        sibling_html = await sibling.evaluate("node => node.outerHTML")
        print(sibling_html)

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()


async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity")
        print("웹페이지 로드 완료")

        # 형제 노드 추출
        await extract_sibling_nodes(page)

        await browser.close()


await main()

웹페이지 로드 완료

Status의 형제 노드들:


AttributeError: 'str' object has no attribute 'evaluate'

In [82]:
from playwright.async_api import async_playwright

async def extract_sibling_nodes(page):
    # Step 1: Status 텍스트 찾기
    status_element = await page.query_selector("text=Season")
    if not status_element:
        print("Status 텍스트를 찾을 수 없습니다.")
        return
    
    # Step 2: Status 텍스트의 부모 요소 찾기
    parent_element_handle = await status_element.evaluate_handle("node => node.parentElement")
    
    # Step 3: 부모의 모든 자식 요소들 가져오기
    sibling_nodes = await parent_element_handle.evaluate("node => Array.from(node.children)")
    
    print("\nStatus의 형제 노드들:")
    for sibling in sibling_nodes:
        sibling_html = await sibling.evaluate("node => node.outerHTML")
        print(sibling_html)


async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()


async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity")
        print("웹페이지 로드 완료")

        # 형제 노드 추출
        await extract_sibling_nodes(page)

        await browser.close()

await main()


웹페이지 로드 완료

Status의 형제 노드들:


AttributeError: 'str' object has no attribute 'evaluate'

In [80]:
from playwright.async_api import async_playwright

async def extract_sibling_nodes(page):
    # Step 1: Status 텍스트 찾기
    status_element = await page.query_selector("text=Status")
    if not status_element:
        print("Status 텍스트를 찾을 수 없습니다.")
        return
    
    # Step 2: Status 텍스트의 부모 요소 찾기
    sibling_element_handle = await status_element.evaluate_handle("node => node.nextElementSibling")
    
    # Step 3: 부모 요소 모든 자식 요소들 가져오기
    #sibling_nodes = await sibling_element_handle.evaluate("node => Array.from(node.children)")
    
    print("\nStatus의 형제 노드들:")
    #for sibling in sibling_nodes:
    #    # sibling은 JSHandle 객체, evaluate()를 사용하여 HTML 내용 가져오기
        #sibling_html = await sibling.evaluate("node => node.outerHTML")
    #    print(sibling)

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()


async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # 형제 노드 추출
        await extract_sibling_nodes(page)

        await browser.close()

await main()


  if any(filename.endswith(s) for s in all_bytecode_suffixes):


웹페이지 로드 완료


CancelledError: 

In [88]:
from playwright.async_api import async_playwright

async def extract_status(page):
    # Step 1: 페이지에서 "Status" 텍스트를 가진 모든 요소 찾기
    status_elements = await page.query_selector_all("text=Status")
    if not status_elements:
        print("Status 텍스트를 가진 요소를 찾을 수 없습니다.")
        return
    
    print(f"총 {len(status_elements)}개의 'Status' 요소가 있습니다.")

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Status 요소 추출
        await extract_status(page)

        await browser.close()

await main()

웹페이지 로드 완료
총 2개의 'Status' 요소가 있습니다.


In [89]:
from playwright.async_api import async_playwright

async def extract_status(page):
    # Step 1: 페이지에서 "Status" 텍스트를 가진 모든 요소 찾기
    status_elements = await page.query_selector_all("text=Status")
    if not status_elements:
        print("Status 텍스트를 가진 요소를 찾을 수 없습니다.")
        return
    
    print(f"총 {len(status_elements)}개의 'Status' 요소가 있습니다.")
    
    # Step 2: 두 번째 'Status' 요소 선택
    if len(status_elements) > 1:
        second_status_element = status_elements[1]
        print("두 번째 'Status' 요소에 접근합니다.")
        
        # 예시: 해당 요소의 HTML 출력
        second_status_html = await second_status_element.evaluate("node => node.outerHTML")
        print("두 번째 'Status' 요소 HTML:", second_status_html)

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Status 요소 추출 및 두 번째 요소 출력
        await extract_status(page)

        await browser.close()

await main()


웹페이지 로드 완료
총 2개의 'Status' 요소가 있습니다.
두 번째 'Status' 요소에 접근합니다.
두 번째 'Status' 요소 HTML: <div class="row center flex-center q-pt-xs" data-v-387841ec="">Status</div>


In [90]:
from playwright.async_api import async_playwright

async def extract_status(page):
    # Step 1: 페이지에서 "Status" 텍스트를 가진 모든 요소 찾기
    status_elements = await page.query_selector_all("text=Status")
    if not status_elements:
        print("Status 텍스트를 가진 요소를 찾을 수 없습니다.")
        return
    
    print(f"총 {len(status_elements)}개의 'Status' 요소가 있습니다.")
    
    # Step 2: 두 번째 'Status' 요소 선택
    if len(status_elements) > 1:
        second_status_element = status_elements[1]
        print("두 번째 'Status' 요소에 접근합니다.")
        
        # Step 3: 형제 요소들에 접근
        sibling_handle = await second_status_element.evaluate_handle("node => node.nextElementSibling")
        
        # 형제 요소들의 HTML 출력
        sibling_html = await sibling_handle.evaluate("node => node.outerHTML")
        print("두 번째 'Status' 요소의 형제 요소 HTML:", sibling_html)

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Status 요소 추출 및 형제 요소 출력
        await extract_status(page)

        await browser.close()

await main()


웹페이지 로드 완료
총 2개의 'Status' 요소가 있습니다.
두 번째 'Status' 요소에 접근합니다.
두 번째 'Status' 요소의 형제 요소 HTML: <div class="row center flex-center" data-v-387841ec=""><div class="column center flex-center" style="width:50px;" data-v-387841ec=""><div data-v-387841ec=""><div class="q-img q-img--menu" style="width:30px;height:30px;" role="img" data-v-387841ec=""><div style="padding-bottom:56.24929688378895%;"></div><div class="q-img__content absolute-full q-anchor--skip"></div></div><!----></div><div data-v-387841ec="">196</div></div><div class="column center flex-center" style="width:50px;" data-v-387841ec=""><div data-v-387841ec=""><div class="q-img q-img--menu" style="width:30px;height:30px;" role="img" data-v-387841ec=""><div style="padding-bottom:56.24929688378895%;"></div><div class="q-img__content absolute-full q-anchor--skip"></div></div><!----></div><div data-v-387841ec="">4-8</div></div><div class="column center flex-center" style="width:50px;" data-v-387841ec=""><div data-v-387841ec=""><div class="

In [91]:
from playwright.async_api import async_playwright

async def extract_status(page):
    # Step 1: 페이지에서 "Status" 텍스트를 가진 모든 요소 찾기
    status_elements = await page.query_selector_all("text=Status")
    if not status_elements:
        print("Status 텍스트를 가진 요소를 찾을 수 없습니다.")
        return
    
    print(f"총 {len(status_elements)}개의 'Status' 요소가 있습니다.")
    
    # Step 2: 두 번째 'Status' 요소 선택
    if len(status_elements) > 1:
        second_status_element = status_elements[1]
        print("두 번째 'Status' 요소에 접근합니다.")
        
        # Step 3: 형제 요소들에 접근
        sibling_handle = await second_status_element.evaluate_handle("node => node.nextElementSibling")
        
        # Step 4: 형제 요소들에서 필요한 값 추출 (HP, Speed, Defense)
        hp_value = await sibling_handle.evaluate("node => node.querySelector('div.column:nth-child(1) div:nth-child(2)').textContent.trim()")
        speed_value = await sibling_handle.evaluate("node => node.querySelector('div.column:nth-child(2) div:nth-child(2)').textContent.trim()")
        defense_value = await sibling_handle.evaluate("node => node.querySelector('div.column:nth-child(3) div:nth-child(2)').textContent.trim()")
        
        # Step 5: 값 출력
        print(f"HP: {hp_value}")
        print(f"Speed: {speed_value}")
        print(f"Defense: {defense_value}")
        
        # Step 6: 변수에 저장 (필요시)
        hp = hp_value
        speed = speed_value
        defense = defense_value
        
        # 필요시 이 값들을 저장하거나 반환할 수 있음
        print(f"저장된 값 - HP: {hp}, Speed: {speed}, Defense: {defense}")

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Status 요소 추출 및 형제 요소 출력
        await extract_status(page)

        await browser.close()

await main()


웹페이지 로드 완료
총 2개의 'Status' 요소가 있습니다.
두 번째 'Status' 요소에 접근합니다.
HP: 
Speed: 
Defense: 
저장된 값 - HP: , Speed: , Defense: 


In [92]:
from playwright.async_api import async_playwright

async def extract_status(page):
    # Step 1: 페이지에서 "Status" 텍스트를 가진 모든 요소 찾기
    status_elements = await page.query_selector_all("text=Status")
    if not status_elements:
        print("Status 텍스트를 가진 요소를 찾을 수 없습니다.")
        return
    
    print(f"총 {len(status_elements)}개의 'Status' 요소가 있습니다.")
    
    # Step 2: 두 번째 'Status' 요소 선택
    if len(status_elements) > 1:
        second_status_element = status_elements[1]
        print("두 번째 'Status' 요소에 접근합니다.")
        
        # Step 3: 형제 요소들에 접근
        sibling_handle = await second_status_element.evaluate_handle("node => node.nextElementSibling")
        
        # Step 4: 형제 요소들에서 필요한 값 추출 (HP, Speed, Defense)
        hp_value = await sibling_handle.evaluate("node => node.querySelector('div.column:nth-child(1) div:nth-child(2)') ? node.querySelector('div.column:nth-child(1) div:nth-child(2)').textContent.trim() : null")
        speed_value = await sibling_handle.evaluate("node => node.querySelector('div.column:nth-child(2) div:nth-child(2)') ? node.querySelector('div.column:nth-child(2) div:nth-child(2)').textContent.trim() : null")
        defense_value = await sibling_handle.evaluate("node => node.querySelector('div.column:nth-child(3) div:nth-child(2)') ? node.querySelector('div.column:nth-child(3) div:nth-child(2)').textContent.trim() : null")
        
        # Step 5: 추출한 값 출력하여 디버그
        print(f"HP 값: {hp_value}")
        print(f"Speed 값: {speed_value}")
        print(f"Defense 값: {defense_value}")
        
        # Step 6: 변수에 저장 (필요시)
        if hp_value and speed_value and defense_value:
            hp = hp_value
            speed = speed_value
            defense = defense_value
            print(f"저장된 값 - HP: {hp}, Speed: {speed}, Defense: {defense}")
        else:
            print("값이 제대로 추출되지 않았습니다.")

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Status 요소 추출 및 형제 요소 출력
        await extract_status(page)

        await browser.close()

await main()


웹페이지 로드 완료
총 2개의 'Status' 요소가 있습니다.
두 번째 'Status' 요소에 접근합니다.
HP 값: 
Speed 값: 
Defense 값: 
값이 제대로 추출되지 않았습니다.


In [93]:
from playwright.async_api import async_playwright

async def extract_status(page):
    # Step 1: 페이지에서 "Status" 텍스트를 가진 모든 요소 찾기
    status_elements = await page.query_selector_all("text=Status")
    if not status_elements:
        print("Status 텍스트를 가진 요소를 찾을 수 없습니다.")
        return
    
    print(f"총 {len(status_elements)}개의 'Status' 요소가 있습니다.")
    
    # Step 2: 두 번째 'Status' 요소 선택
    if len(status_elements) > 1:
        second_status_element = status_elements[1]
        print("두 번째 'Status' 요소에 접근합니다.")
        
        # Step 3: 형제 요소들에 접근
        sibling_handle = await second_status_element.evaluate_handle("node => node.nextElementSibling")
        
        # Step 4: 형제 요소 HTML을 출력하여 정확한 구조 확인
        sibling_html = await sibling_handle.evaluate("node => node.outerHTML")
        print(f"형제 요소 HTML: {sibling_html}")

        # Step 5: 각 값을 정확하게 추출하기 위해 다시 한 번 querySelector로 접근
        hp_value = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(1) div') ? node.querySelector('.column:nth-child(1) div').textContent.trim() : null")
        speed_value = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(2) div') ? node.querySelector('.column:nth-child(2) div').textContent.trim() : null")
        defense_value = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(3) div') ? node.querySelector('.column:nth-child(3) div').textContent.trim() : null")
        
        # Step 6: 추출한 값 출력하여 디버그
        print(f"HP 값: {hp_value}")
        print(f"Speed 값: {speed_value}")
        print(f"Defense 값: {defense_value}")
        
        # Step 7: 변수에 저장 (필요시)
        if hp_value and speed_value and defense_value:
            hp = hp_value
            speed = speed_value
            defense = defense_value
            print(f"저장된 값 - HP: {hp}, Speed: {speed}, Defense: {defense}")
        else:
            print("값이 제대로 추출되지 않았습니다.")

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Status 요소 추출 및 형제 요소 출력
        await extract_status(page)

        await browser.close()

await main()


웹페이지 로드 완료
총 2개의 'Status' 요소가 있습니다.
두 번째 'Status' 요소에 접근합니다.
형제 요소 HTML: <div class="row center flex-center" data-v-387841ec=""><div class="column center flex-center" style="width:50px;" data-v-387841ec=""><div data-v-387841ec=""><div class="q-img q-img--menu" style="width:30px;height:30px;" role="img" data-v-387841ec=""><div style="padding-bottom:56.24929688378895%;"></div><div class="q-img__content absolute-full q-anchor--skip"></div></div><!----></div><div data-v-387841ec="">196</div></div><div class="column center flex-center" style="width:50px;" data-v-387841ec=""><div data-v-387841ec=""><div class="q-img q-img--menu" style="width:30px;height:30px;" role="img" data-v-387841ec=""><div style="padding-bottom:56.24929688378895%;"></div><div class="q-img__content absolute-full q-anchor--skip"></div></div><!----></div><div data-v-387841ec="">4-8</div></div><div class="column center flex-center" style="width:50px;" data-v-387841ec=""><div data-v-387841ec=""><div class="q-img q-img--menu"

In [95]:
from playwright.async_api import async_playwright

async def extract_status(page):
    # Step 1: 페이지에서 "Status" 텍스트를 가진 모든 요소 찾기
    status_elements = await page.query_selector_all("text=Status")
    if not status_elements:
        print("Status 텍스트를 가진 요소를 찾을 수 없습니다.")
        return
    
    print(f"총 {len(status_elements)}개의 'Status' 요소가 있습니다.")
    
    # Step 2: 두 번째 'Status' 요소 선택
    if len(status_elements) > 1:
        second_status_element = status_elements[1]
        print("두 번째 'Status' 요소에 접근합니다.")
        
        # Step 3: 형제 요소들에 접근
        sibling_handle = await second_status_element.evaluate_handle("node => node.nextElementSibling")
        
        # Step 4: 형제 요소 HTML을 출력하여 정확한 구조 확인
        sibling_html = await sibling_handle.evaluate("node => node.outerHTML")
        print(f"형제 요소 HTML: {sibling_html}")

        # Step 5: 각 값을 정확하게 추출하기 위해 다시 한 번 querySelector로 접근
        hp_value = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(1) div:last-child') ? node.querySelector('.column:nth-child(1) div:last-child').textContent.trim() : null")
        speed_value = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(2) div:last-child') ? node.querySelector('.column:nth-child(2) div:last-child').textContent.trim() : null")
        defense_value = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(3) div:last-child') ? node.querySelector('.column:nth-child(3) div:last-child').textContent.trim() : null")
        
        # Step 6: 추출한 값 출력하여 디버그
        print(f"HP 값: {hp_value}")
        print(f"Speed 값: {speed_value}")
        print(f"Defense 값: {defense_value}")
        
        # Step 7: 변수에 저장 (필요시)
        if hp_value and speed_value and defense_value:
            hp = hp_value
            speed = speed_value
            defense = defense_value
            print(f"저장된 값 - HP: {hp}, Speed: {speed}, Defense: {defense}")
        else:
            print("값이 제대로 추출되지 않았습니다.")

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Status 요소 추출 및 형제 요소 출력
        await extract_status(page)

        await browser.close()

await main()


웹페이지 로드 완료
총 2개의 'Status' 요소가 있습니다.
두 번째 'Status' 요소에 접근합니다.
형제 요소 HTML: <div class="row center flex-center" data-v-387841ec=""><div class="column center flex-center" style="width:50px;" data-v-387841ec=""><div data-v-387841ec=""><div class="q-img q-img--menu" style="width:30px;height:30px;" role="img" data-v-387841ec=""><div style="padding-bottom:56.24929688378895%;"></div><div class="q-img__content absolute-full q-anchor--skip"></div></div><!----></div><div data-v-387841ec="">196</div></div><div class="column center flex-center" style="width:50px;" data-v-387841ec=""><div data-v-387841ec=""><div class="q-img q-img--menu" style="width:30px;height:30px;" role="img" data-v-387841ec=""><div style="padding-bottom:56.24929688378895%;"></div><div class="q-img__content absolute-full q-anchor--skip"></div></div><!----></div><div data-v-387841ec="">4-8</div></div><div class="column center flex-center" style="width:50px;" data-v-387841ec=""><div data-v-387841ec=""><div class="q-img q-img--menu"

In [96]:
from playwright.async_api import async_playwright

async def extract_status(page):
    # Step 1: 페이지에서 "Status" 텍스트를 가진 모든 요소 찾기
    status_elements = await page.query_selector_all("text=Status")
    if not status_elements:
        print("Status 텍스트를 가진 요소를 찾을 수 없습니다.")
        return
    
    print(f"총 {len(status_elements)}개의 'Status' 요소가 있습니다.")
    
    # Step 2: 두 번째 'Status' 요소 선택
    if len(status_elements) > 1:
        second_status_element = status_elements[1]
        print("두 번째 'Status' 요소에 접근합니다.")
        
        # Step 3: 형제 요소들에 접근
        sibling_handle = await second_status_element.evaluate_handle("node => node.nextElementSibling")
        
        # Step 4: 각 값 추출 (간단히 div:nth-child(n)로 접근)
        hp_value = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(1) div:last-child').textContent.trim()")
        speed_value = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(2) div:last-child').textContent.trim()")
        defense_value = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(3) div:last-child').textContent.trim()")
        
        # Step 5: 추출한 값 출력하여 디버그
        print(f"HP 값: {hp_value}")
        print(f"Speed 값: {speed_value}")
        print(f"Defense 값: {defense_value}")
        
        # Step 6: 변수에 저장 (필요시)
        if hp_value and speed_value and defense_value:
            hp = hp_value
            speed = speed_value
            defense = defense_value
            print(f"저장된 값 - HP: {hp}, Speed: {speed}, Defense: {defense}")
        else:
            print("값이 제대로 추출되지 않았습니다.")

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Status 요소 추출 및 형제 요소 출력
        await extract_status(page)

        await browser.close()

await main()

웹페이지 로드 완료
총 2개의 'Status' 요소가 있습니다.
두 번째 'Status' 요소에 접근합니다.
HP 값: 
Speed 값: 
Defense 값: 
값이 제대로 추출되지 않았습니다.


In [97]:
from playwright.async_api import async_playwright

async def extract_status(page):
    # Step 1: 페이지에서 "Status" 텍스트를 가진 모든 요소 찾기
    status_elements = await page.query_selector_all("text=Status")
    if not status_elements:
        print("Status 텍스트를 가진 요소를 찾을 수 없습니다.")
        return
    
    print(f"총 {len(status_elements)}개의 'Status' 요소가 있습니다.")
    
    # Step 2: 두 번째 'Status' 요소 선택
    if len(status_elements) > 1:
        second_status_element = status_elements[1]
        print("두 번째 'Status' 요소에 접근합니다.")
        
        # Step 3: 형제 요소에 접근하고 HP, Speed, Defense 값 추출
        sibling_handle = await second_status_element.evaluate_handle("node => node.nextElementSibling")
        
        # Step 4: 각 값 추출 (단순히 각 column의 텍스트를 직접 가져오기)
        hp_value = await sibling_handle.evaluate("node => node.children[0].lastChild.textContent.trim()")
        speed_value = await sibling_handle.evaluate("node => node.children[1].lastChild.textContent.trim()")
        defense_value = await sibling_handle.evaluate("node => node.children[2].lastChild.textContent.trim()")
        
        # Step 5: 추출한 값 출력
        print(f"HP 값: {hp_value}")
        print(f"Speed 값: {speed_value}")
        print(f"Defense 값: {defense_value}")
        
        # Step 6: 변수에 저장 (필요시)
        if hp_value and speed_value and defense_value:
            hp = hp_value
            speed = speed_value
            defense = defense_value
            print(f"저장된 값 - HP: {hp}, Speed: {speed}, Defense: {defense}")
        else:
            print("값이 제대로 추출되지 않았습니다.")

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "stylesheet", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as playwright:
        browser = await playwright.chromium.launch(headless=True)
        context = await browser.new_context()
        page = await context.new_page()

        # 접속할 URL 입력
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        # Status 요소 추출 및 형제 요소 출력
        await extract_status(page)

        await browser.close()

await main()


웹페이지 로드 완료
총 2개의 'Status' 요소가 있습니다.
두 번째 'Status' 요소에 접근합니다.
HP 값: 196
Speed 값: 4-8
Defense 값: 48
저장된 값 - HP: 196, Speed: 4-8, Defense: 48


In [131]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def get_attribute_value(page, selector, attribute, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.get_attribute(attribute) if element else default

async def get_text_content(page, selector, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.text_content() if element else default

async def extract_value_with_regex(text, pattern, default="Unknown"):
    match = re.search(pattern, text)
    return match.group(1) if match else default

async def extract_value_from_attribute(page, selector, attribute, pattern, default="Unknown"):
    attribute_value = await get_attribute_value(page, selector, attribute, default)
    return await extract_value_with_regex(attribute_value, pattern, default)

async def extract_status(page):
    # Step 1: 페이지에서 "Status" 텍스트를 가진 모든 요소 찾기
    status_elements = await page.query_selector_all("text=Status")
    if not status_elements:
        print("Status 텍스트를 가진 요소를 찾을 수 없습니다.")
        return []
    
    print(f"총 {len(status_elements)}개의 'Status' 요소가 있습니다.")
    
    # Step 2: 두 번째 'Status' 요소 선택
    if len(status_elements) > 1:
        second_status_element = status_elements[1]
        print("두 번째 'Status' 요소에 접근합니다.")
        
        # Step 3: 형제 요소들에 접근
        sibling_handle = await second_status_element.evaluate_handle("node => node.nextElementSibling")
        
        # Step 4: 각 컬럼의 HTML 출력하여 확인
        column_1_html = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(1)').innerHTML")
        column_2_html = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(2)').innerHTML")
        column_3_html = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(3)').innerHTML")
        
        print(f"첫 번째 컬럼 HTML: {column_1_html}")
        print(f"두 번째 컬럼 HTML: {column_2_html}")
        print(f"세 번째 컬럼 HTML: {column_3_html}")
        
        # Step 5: 각 값 추출
        hp_value = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(1) div:last-child').textContent.trim()")
        speed_value = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(2) div:last-child').textContent.trim()")
        defense_value = await sibling_handle.evaluate("node => node.querySelector('.column:nth-child(3) div:last-child').textContent.trim()")
        
        print(f"형제 요소에서 추출된 값들: HP={hp_value}, Speed={speed_value}, Defense={defense_value}")
        
        if hp_value and speed_value and defense_value:
            return [
                {"name": "HP", "value": hp_value},
                {"name": "Speed", "value": speed_value},
                {"name": "Defense", "value": defense_value}
            ]
        else:
            print("값이 제대로 추출되지 않았습니다.")
            return []



async def extract_stat_value(page, image_src, depth):
    # 이미지 요소 찾기
    image = await page.query_selector(f'img[src="{image_src}"]')
    if not image:
        return "Unknown"

    # 이미지의 부모 요소를 찾아서 올라감
    parent = image
    for _ in range(depth):
        parent = await parent.evaluate_handle('node => node.parentElement')
        if not parent:
            return "Unknown"

    # 부모의 형제 요소 찾기
    sibling = await parent.evaluate_handle('node => node.nextElementSibling')
    
    if sibling:
        value = await sibling.evaluate('node => node.textContent')
        if value:
            return value.strip()
    
    return "Unknown"

async def extract_atks(page, atks_to_extract):
    stats = {}
    for atk in atks_to_extract:
        value = await extract_stat_value(page, atk["image_src"], atk["depth"])
        print(f"{atk['name']} extracted value: {value}")
        stats[atk["name"]] = value
    return atk

async def extract_stagger_threshold_values(page):
    # 'div.row.center.flex-center.q-pt-xs' 요소들 찾기
    elements = await page.query_selector_all('div.row.center.flex-center.q-pt-xs')
    
    # 각 요소의 텍스트 내용 출력하여 'Stagger Threshold' 요소를 찾기
    for element in elements:
        text = await element.text_content()
        
        if text and "Stagger Threshold" in text:
            # 'Stagger Threshold'가 있는 요소를 찾았다면, 그 이후 형제 요소들에서 값을 추출
            parent = await element.evaluate_handle('node => node.parentElement')
            sibling_elements = await parent.query_selector_all('div.row.justify-evenly div')  # Threshold 값이 들어있는 div들
            
            stagger_values = []
            for sibling in sibling_elements:
                text_content = await sibling.text_content()
                match = re.search(r'(\d+%)', text_content)
                if match:
                    stagger_values.append(match.group(1))  # 퍼센트 값만 리스트에 추가
            
            return stagger_values  # 추출된 퍼센트 값 반환
    
    return ["Unknown"]  # 만약 'Stagger Threshold'를 찾지 못한 경우

async def save_data_to_csv(data, file_name, mode='w'):
    df = pd.DataFrame([data])
    df.to_csv(file_name, index=False, mode=mode, encoding="utf-8-sig", header=(mode == 'w'))
    print(f"데이터가 {file_name}에 저장되었습니다.")

async def extract_data_from_page(page):
    identity = await get_text_content(page, 'div.flex.flex-center.q-pr-md.title')
    rarity = await extract_value_from_attribute(page, 'img.q-img__image.q-img__image--without-transition', "src", r'rarity_(\d+)\.png')
    uptie = await extract_value_from_attribute(page, 'i.q-icon.q-fab__icon img', "src", r'uptie_(\d+)\.png')
    level = await extract_value_with_regex(await get_text_content(page, 'div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary'), r'level:\s*(\d+)')

    status = await extract_status(page)
    
    atks_to_extract = [
        {"name": "Atk_Type_HIT", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_HIT.png", "depth": 1},
        {"name": "Atk_Type_PENETRATE", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_PENETRATE.png", "depth": 1},
        {"name": "Atk_Type_SLASH", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_SLASH.png", "depth": 1}
    ]

    atks_stats = await extract_atks(page, atks_to_extract)

    # Stagger Threshold 값 추출
    stagger_thresholds = await extract_stagger_threshold_values(page)

    # Stagger Threshold 값을 딕셔너리로 만들기
    stagger_data = {
        "Stagger_Threshold_One": stagger_thresholds[0] if len(stagger_thresholds) > 0 else "Unknown",
        "Stagger_Threshold_Two": stagger_thresholds[1] if len(stagger_thresholds) > 1 else "Unknown",
        "Stagger_Threshold_Three": stagger_thresholds[2] if len(stagger_thresholds) > 2 else "Unknown",
    }
    

    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        status,
        **atks_stats,
        **stagger_data  # stagger_data 딕셔너리 값 삽입
    }

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        context = await browser.new_context()
        page = await context.new_page()
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        data = await extract_data_from_page(page)
        await save_data_to_csv(data, "[LCB Sinner] Yi Sang.csv")

        await browser.close()

await main()

SyntaxError: ':' expected after dictionary key (601576370.py, line 159)

In [140]:
from playwright.async_api import async_playwright
import pandas as pd
import asyncio
import re

async def get_attribute_value(page, selector, attribute, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.get_attribute(attribute) if element else default

async def get_text_content(page, selector, default="Unknown"):
    element = await page.query_selector(selector)
    return await element.text_content() if element else default

async def extract_value_with_regex(text, pattern, default="Unknown"):
    match = re.search(pattern, text)
    return match.group(1) if match else default

async def extract_value_from_attribute(page, selector, attribute, pattern, default="Unknown"):
    attribute_value = await get_attribute_value(page, selector, attribute, default)
    return await extract_value_with_regex(attribute_value, pattern, default)


async def extract_status(page):
    # 페이지 로딩 후 'Status' 요소가 완전히 로드되었는지 대기
    await page.wait_for_selector("text=Status", timeout=5000)  # 5초 대기
    
    # "Status" 텍스트를 가진 요소 찾기
    status_elements = await page.query_selector_all("text=Status")
    if not status_elements:
        print("Status 텍스트를 가진 요소를 찾을 수 없습니다.")
        return []
    
    print(f"총 {len(status_elements)}개의 'Status' 요소가 있습니다.")
    
    # 두 번째 'Status' 요소 선택
    if len(status_elements) > 1:
        second_status_element = status_elements[1]
        print("두 번째 'Status' 요소에 접근합니다.")
        
        # 첫 번째 컬럼 -> HP (196)
        hp_value = await second_status_element.evaluate(
            "node => node.nextElementSibling.children[0].children[0].nextElementSibling.textContent.trim()"
        )
        
        # 두 번째 컬럼 -> Speed (4-8)
        speed_value = await second_status_element.evaluate(
            "node => node.nextElementSibling.children[0].nextElementSibling.children[0].nextElementSibling.textContent.trim()"
        )
        
        # 세 번째 컬럼 -> Defense (48)
        defense_value = await second_status_element.evaluate(
            "node => node.nextElementSibling.children[0].nextElementSibling.nextElementSibling.children[0].nextElementSibling.textContent.trim()"
        )
        # 값이 제대로 추출되었는지 확인
        print(f"형제 요소에서 추출된 값들: HP={hp_value}), Speed={speed_value}, Defense={defense_value}")
        
        # 추출된 값이 있으면 결과 반환
        if hp_value and speed_value and defense_value:
            return {
                "HP": hp_value,
                "Speed": speed_value,
                "Defense": defense_value
            }
        else:
            print("값이 제대로 추출되지 않았습니다.")
            return {}


async def extract_stat_value(page, image_src, depth):
    # 이미지 요소 찾기
    image = await page.query_selector(f'img[src="{image_src}"]')
    if not image:
        return "Unknown"

    # 이미지의 부모 요소를 찾아서 올라감
    parent = image
    for _ in range(depth):
        parent = await parent.evaluate_handle('node => node.parentElement')
        if not parent:
            return "Unknown"

    # 부모의 형제 요소 찾기
    sibling = await parent.evaluate_handle('node => node.nextElementSibling')
    
    if sibling:
        value = await sibling.evaluate('node => node.textContent')
        if value:
            return value.strip()
    
    return "Unknown"

async def extract_atks(page, atks_to_extract):
    stats = {}
    for atk in atks_to_extract:
        value = await extract_stat_value(page, atk["image_src"], atk["depth"])
        print(f"{atk['name']} extracted value: {value}")
        stats[atk["name"]] = value
    return stats

async def extract_stagger_threshold_values(page):
    # 'div.row.center.flex-center.q-pt-xs' 요소들 찾기
    elements = await page.query_selector_all('div.row.center.flex-center.q-pt-xs')
    
    # 각 요소의 텍스트 내용 출력하여 'Stagger Threshold' 요소를 찾기
    for element in elements:
        text = await element.text_content()
        
        if text and "Stagger Threshold" in text:
            # 'Stagger Threshold'가 있는 요소를 찾았다면, 그 이후 형제 요소들에서 값을 추출
            parent = await element.evaluate_handle('node => node.parentElement')
            sibling_elements = await parent.query_selector_all('div.row.justify-evenly div')  # Threshold 값이 들어있는 div들
            
            stagger_values = []
            for sibling in sibling_elements:
                text_content = await sibling.text_content()
                match = re.search(r'(\d+%)', text_content)
                if match:
                    stagger_values.append(match.group(1))  # 퍼센트 값만 리스트에 추가
            
            return stagger_values  # 추출된 퍼센트 값 반환
    
    return ["Unknown"]  # 만약 'Stagger Threshold'를 찾지 못한 경우

async def save_data_to_csv(data, file_name, mode='w'):
    df = pd.DataFrame([data])
    df.to_csv(file_name, index=False, mode=mode, encoding="utf-8-sig", header=(mode == 'w'))
    print(f"데이터가 {file_name}에 저장되었습니다.")

async def extract_data_from_page(page):
    identity = await get_text_content(page, 'div.flex.flex-center.q-pr-md.title')
    rarity = await extract_value_from_attribute(page, 'img.q-img__image.q-img__image--without-transition', "src", r'rarity_(\d+)\.png')
    uptie = await extract_value_from_attribute(page, 'i.q-icon.q-fab__icon img', "src", r'uptie_(\d+)\.png')
    level = await extract_value_with_regex(await get_text_content(page, 'div.q-badge.flex.inline.items-center.no-wrap.q-badge--single-line.bg-secondary'), r'level:\s*(\d+)')

    status = await extract_status(page)
    
    atks_to_extract = [
        {"name": "Atk_Type_HIT", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_HIT.png", "depth": 1},
        {"name": "Atk_Type_PENETRATE", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_PENETRATE.png", "depth": 1},
        {"name": "Atk_Type_SLASH", "image_src": "https://img.kusoge.xyz/limbus/img/ui/atk_type_SLASH.png", "depth": 1}
    ]

    atks_stats = await extract_atks(page, atks_to_extract)

    # Stagger Threshold 값 추출
    stagger_thresholds = await extract_stagger_threshold_values(page)

    # Stagger Threshold 값을 딕셔너리로 만들기
    stagger_data = {
        "Stagger_Threshold_One": stagger_thresholds[0] if len(stagger_thresholds) > 0 else "Unknown",
        "Stagger_Threshold_Two": stagger_thresholds[1] if len(stagger_thresholds) > 1 else "Unknown",
        "Stagger_Threshold_Three": stagger_thresholds[2] if len(stagger_thresholds) > 2 else "Unknown",
    }
    

    return {
        "Identity": identity,
        "Rarity": rarity,
        "Uptie": uptie,
        "Level": level,
        "HP": status.get("HP", "Unknown"),
        "Speed": status.get("Speed", "Unknown"),
        "Defense": status.get("Defense", "Unknown"),
        **atks_stats,
        **stagger_data  # stagger_data 딕셔너리 값 삽입
    }

async def handle_request(route, request):
    # 이미지, 스타일시트, 폰트, 스크립트 차단
    if request.resource_type in ["image", "font"]:
        await route.abort()
    else:
        await route.continue_()

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        context = await browser.new_context()
        page = await context.new_page()
        await page.route("**/*", handle_request)
        await page.goto("https://limbus.kusoge.xyz/identity/10101")
        print("웹페이지 로드 완료")

        data = await extract_data_from_page(page)
        await save_data_to_csv(data, "[LCB Sinner] Yi Sang.csv")

        await browser.close()

await main()

웹페이지 로드 완료
총 2개의 'Status' 요소가 있습니다.
두 번째 'Status' 요소에 접근합니다.
형제 요소에서 추출된 값들: HP=196), Speed=4-8, Defense=48
Atk_Type_HIT extracted value: Normal
Atk_Type_PENETRATE extracted value: Ineff.
Atk_Type_SLASH extracted value: Fatal
데이터가 [LCB Sinner] Yi Sang.csv에 저장되었습니다.
