# Задание 2: Динамический веб-скрейпинг и анализ финансовых коэффициентов

**Цель:** Продемонстрировать навыки извлечения данных с динамических веб-сайтов и проведения базового финансового анализа.

### Задача 1: Установка библиотек

Установите `playwright` и необходимые браузеры.

In [None]:
!pip install playwright
!playwright install

### Задача 2: Извлечение данных

Используя `playwright`, напишите асинхронный скрипт для перехода на страницу **Yahoo Finance** для компании **Tesla (TSLA)**. Перейдите в раздел **Financials -> Income Statement**.

**URL:** `https://finance.yahoo.com/quote/TSLA/financials`

Извлеките следующие данные за последние 4 года (включая 'TTM' - Trailing Twelve Months):
-   Годы/Периоды
-   Total Revenue (Общая выручка)
-   Net Income (Чистая прибыль)

Затем перейдите на вкладку **Balance Sheet** и извлеките:
-   Total Assets (Всего активов)
-   Total Liabilities Net Minority Interest (Всего обязательств)

*Подсказка: Yahoo Finance загружает данные динамически. Вам нужно будет использовать `page.wait_for_selector` и, возможно, `locator` с `xpath` для надежного извлечения.*

In [None]:
import pandas as pd
from playwright.async_api import async_playwright
import asyncio

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch()
        page = await browser.new_page()

        # --- ШАГ 1: Извлечение данных из Income Statement ---
        url_income = 'https://finance.yahoo.com/quote/TSLA/financials'
        await page.goto(url_income, timeout=60000)
        print("Страница Income Statement загружена")

        # Ожидание загрузки таблицы
        await page.wait_for_selector("//div[contains(@class, 'table-container')]")

        # Ваш код для извлечения данных (годы, выручка, чистая прибыль)


        # --- ШАГ 2: Извлечение данных из Balance Sheet ---
        url_balance = 'https://finance.yahoo.com/quote/TSLA/balance-sheet'
        await page.goto(url_balance, timeout=60000)
        print("Страница Balance Sheet загружена")

        # Ожидание загрузки таблицы
        await page.wait_for_selector("//div[contains(@class, 'table-container')]")

        # Ваш код для извлечения данных (активы, обязательства)


        await browser.close()

        # --- ШАГ 3: Создание DataFrame ---
        # Соберите все извлеченные данные в один pandas DataFrame
        # Колонки: Period, Total Revenue, Net Income, Total Assets, Total Liabilities

        # Глобальная переменная для доступа к DataFrame после выполнения
        global df_financials
        # df_financials = pd.DataFrame(....)

# Запуск асинхронной функции
await main()

### Задача 3: Очистка данных и расчет коэффициентов

Данные, извлеченные с сайта, скорее всего будут в текстовом формате с запятыми (e.g., `'9,677,319'`).
1.  Очистите данные, удалив запятые, и преобразуйте их в числовой формат (float или int). Умножьте значения на 1000, так как на сайте они представлены в тысячах.
2.  Рассчитайте два коэффициента для каждого периода:
    -   **ROA (Return on Assets)** = `Net Income / Total Assets`
    -   **Debt-to-Equity** = `Total Liabilities / (Total Assets - Total Liabilities)`

In [None]:
# Ваш код для очистки данных
# df_financials['Total Revenue'] = df_financials['Total Revenue'].str.replace(',', '').astype(float) * 1000

# Ваш код для расчета коэффициентов
# df_financials['ROA'] = ...

display(df_financials)

### Задача 4: Визуализация

Постройте два графика для визуализации динамики рассчитанных коэффициентов по годам. Сделайте выводы.

In [None]:
import matplotlib.pyplot as plt

# Ваш код для построения графиков ROA и Debt-to-Equity


### Выводы

Напишите краткий вывод по результатам анализа. Как изменилась рентабельность и финансовая устойчивость компании за последние годы?

**Ваш вывод:**

*