# Encontrar o K-ésimo Maior Valor em uma Árvore de Busca Binária (BST)

Encontrar o K-ésimo Maior Valor em uma Árvore de Busca Binária (BST)

Escreva uma função que receba uma Árvore de Busca Binária (BST) e um número inteiro positivo `k`, e retorne o k-ésimo maior número contido na BST.

Você pode assumir que a árvore conterá apenas valores inteiros e que `k` é menor ou igual ao número de nós na árvore.

Além disso, para os fins desta questão, inteiros duplicados serão tratados como valores distintos. Em outras palavras, o segundo maior valor em uma BST contendo os valores {5, 7, 7} será 7 — e não 5.

Cada nó da BST possui um valor inteiro, um nó filho à esquerda e um nó filho à direita. Um nó é considerado um nó válido de uma BST se e somente se satisfizer a propriedade da BST:

- Seu valor é estritamente maior do que os valores de qualquer nó à sua esquerda;
- Seu valor é menor ou igual aos valores de qualquer nó à sua direita;
- Seus nós filhos são, ou nós válidos de uma BST ou None/nulo.

## Exemplo de entrada

In [88]:
'''
tree =   10
       /     \
      5       20
    /   \   /   \
   2    5  17    22
  / \          
 1   3 
'''
k = 3

## Exemplo de saída

In [89]:
17

17

**Dica 1**

Certifique-se de considerar o fato de que a árvore fornecida é uma Árvore de Busca Binária (BST) — não apenas uma Árvore Binária comum. Como esse fato pode ajudá-lo a resolver o problema de forma mais otimizada em termos de complexidade de tempo?

**Dica 2**

A abordagem de força bruta para este problema é simplesmente realizar uma travessia em ordem desta BST e armazenar todos os valores de seus nós na ordem em que são visitados. Como uma travessia em ordem de uma BST visita os nós em ordem crescente, o k-ésimo valor a partir do final da ordem de travessia será o k-ésimo maior valor.

**Dica 3**

Na verdade, você pode resolver esse problema em O(h + k) de tempo, onde h é a altura da árvore. Em vez de olhar para os nós na ordem crescente, você deve olhá-los na ordem decrescente.

**Dica 4**

Para resolver esse problema em O(h + k) de tempo, como mencionado na Dica 3, você precisa realizar uma travessia em ordem reversa. Como você estará olhando para os nós na ordem decrescente, pode simplesmente retornar o k-ésimo nó visitado na travessia em ordem reversa.

**Complexidade de Tempo e Espaço Ótima**

O(h+k) tempo | O(h) espaço - onde h é a altura da árvore e k é o parâmetro de entrada.

## Definição de classes

In [90]:
!pip install pytest pytest-sugar



In [91]:
import plotly.graph_objs as go
import time
import numpy as np
import pytest


class Node:
    def __init__(self, value):
        self.value = value
        self.left_child = None
        self.right_child = None


class BST:
    def __init__(self):
        self.root = None

    def add(self, value):
        if self.root is None:
            self.root = Node(value)
        else:
            self._add_recursive(self.root, value)

    def _add_recursive(self, current_node, value):
        if value <= current_node.value:
            if current_node.left_child is None:
                current_node.left_child = Node(value)
            else:
                self._add_recursive(current_node.left_child, value)
        else:
            if current_node.right_child is None:
                current_node.right_child = Node(value)
            else:
                self._add_recursive(current_node.right_child, value)


def find_kth_largest_value(tree, k):
    sorted_values = []
    in_order_traverse(tree.root, sorted_values)
    return sorted_values[len(sorted_values) - k]


def in_order_traverse(node, sorted_values):
    if node is None:
        return
    in_order_traverse(node.left_child, sorted_values)
    sorted_values.append(node.value)
    in_order_traverse(node.right_child, sorted_values)


def measure_execution_time(array_sizes, num_trials, k):
    times = []
    for size in array_sizes:
        trial_times = []
        for _ in range(num_trials):
            values = np.random.randint(1, 100000, size)
            bst = BST()
            for value in values:
                bst.add(value)
            start_time = time.time()
            find_kth_largest_value(bst, k)
            trial_times.append(time.time() - start_time)
        mean_time = np.mean(trial_times)
        conf_interval = 1.96 * np.std(trial_times) / np.sqrt(num_trials)
        times.append((mean_time, conf_interval))
    return times


def plot_execution_times(array_sizes, times):
    mean_times = [t[0] for t in times]
    conf_intervals = [t[1] for t in times]

    fig = go.Figure()
    fig.add_trace(go.Scatter(
        x=array_sizes,
        y=mean_times,
        mode='lines+markers',
        name='Execution Time',
        error_y=dict(type='data', array=conf_intervals, visible=True)
    ))

    fig.update_layout(
        title="Execution Time vs Input Size",
        xaxis=dict(title="Input Size"),
        yaxis=dict(title="Execution Time (s)"),
        template="plotly_white"
    )
    fig.show()


In [92]:
%run -i binarysearchtree.py

In [93]:
def test_find_kth_largest_value():
    bst = BST()
    for value in [15, 5, 20, 17, 22, 2, 5, 1, 3]:
        bst.add(value)
    assert find_kth_largest_value(bst, 3) == 17
    assert find_kth_largest_value(bst, 1) == 22
    assert find_kth_largest_value(bst, 5) == 5


@pytest.fixture(scope="session")
def test_performance():
    array_sizes = [100, 200, 300, 400, 500, 600, 700, 800, 900, 1000]
    times = measure_execution_time(array_sizes, num_trials=10, k=5)
    plot_execution_times(array_sizes, times)


In [94]:
%%file closestvalue.py
import pytest
from binarysearchtree import *

def findKthLargestValue(tree, k):
    """
    Finds the kth largest integer in a Binary Search Tree (BST).

    The function traverses the BST in an in-order manner to collect the node values in a sorted list.
    It then returns the kth largest value from this list. The BST is assumed to contain only integer values.
    In case of duplicate integers, they are treated as distinct values.
    The kth largest integer is determined in the context of these distinct values.

    Parameters:
    tree (BST): the Binary Search Tree (BST).
    k (int): A positive integer representing the kth position.

    Returns:
    int: The kth largest integer present in the BST.
    """

    sortedNodeValues = []
    inOrderTraverse(tree.root,sortedNodeValues)
    return sortedNodeValues[len(sortedNodeValues) - k]

def inOrderTraverse(node, sortedNodeValues):
    if node is None:
        return

    inOrderTraverse(node.left_child, sortedNodeValues)
    sortedNodeValues.append(node.value)
    inOrderTraverse(node.right_child, sortedNodeValues)


@pytest.fixture(scope="session")
def data():

    array = [[15,5,20,17,22,2,5,1,3],
             [5,4,6,3,7],
             [5],
             [20,15,25,10,19,21,30,22],
             [1,2,3,4,5],
             [10,8,6,4,2],
             [10,8,6,9,4,7,2,5,3],
             [99727,99,727],
             [15,5,20,17,22,24,23,25,2,5,1,3],
             [15,5,20,17,22,2,5,1,3],
             [15,5,20,17,22,2,5,1,3]
             ]
    return array

def test_1(data):
    bst = BST()
    for value in data[0]:
      bst.add(value)
    assert findKthLargestValue(bst, 3) == 17

def test_2(data):
    bst = BST()
    for value in data[1]:
      bst.add(value)
    assert findKthLargestValue(bst, 1) == 7

def test_3(data):
    bst = BST()
    for value in data[2]:
      bst.add(value)
    assert findKthLargestValue(bst, 1) == 5

def test_4(data):
    bst = BST()
    for value in data[3]:
      bst.add(value)
    assert findKthLargestValue(bst, 3) == 22

def test_5(data):
    bst = BST()
    for value in data[4]:
      bst.add(value)
    assert findKthLargestValue(bst, 5) == 1

def test_6(data):
    bst = BST()
    for value in data[5]:
      bst.add(value)
    assert findKthLargestValue(bst, 2) == 8

def test_7(data):
    bst = BST()
    for value in data[6]:
      bst.add(value)
    assert findKthLargestValue(bst, 5) == 6

def test_8(data):
    bst = BST()
    for value in data[7]:
      bst.add(value)
    assert findKthLargestValue(bst, 1) == 99727

def test_9(data):
    bst = BST()
    for value in data[8]:
      bst.add(value)
    assert findKthLargestValue(bst, 7) == 15

def test_10(data):
    bst = BST()
    for value in data[9]:
      bst.add(value)
    assert findKthLargestValue(bst, 5) == 5

def test_11(data):
    bst = BST()
    for value in data[10]:
      bst.add(value)
    assert findKthLargestValue(bst, 6) == 5

Overwriting closestvalue.py


In [95]:
!pytest closestvalue.py -vv

platform win32 -- Python 3.10.11, pytest-8.3.4, pluggy-1.5.0 -- C:\Users\polia\AppData\Local\Programs\Python\Python310\python.exe
cachedir: .pytest_cache
rootdir: c:\Users\polia\OneDrive\Documentos\repos\aed2\U2T2
plugins: sugar-1.0.0
[1mcollecting ... [0mcollected 11 items

closestvalue.py::test_1 [32mPASSED[0m[32m                                           [  9%][0m
closestvalue.py::test_2 [32mPASSED[0m[32m                                           [ 18%][0m
closestvalue.py::test_3 [32mPASSED[0m[32m                                           [ 27%][0m
closestvalue.py::test_4 [32mPASSED[0m[32m                                           [ 36%][0m
closestvalue.py::test_5 [32mPASSED[0m[32m                                           [ 45%][0m
closestvalue.py::test_6 [32mPASSED[0m[32m                                           [ 54%][0m
closestvalue.py::test_7 [32mPASSED[0m[32m                                           [ 63%][0m
closestvalue.py::test_8 [32mPASSED

In [96]:
!pytest closestvalue.py --capture=no


platform win32 -- Python 3.10.11, pytest-8.3.4, pluggy-1.5.0
rootdir: c:\Users\polia\OneDrive\Documentos\repos\aed2\U2T2
plugins: sugar-1.0.0
collected 11 items

closestvalue.py [32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m



In [97]:
array_sizes = [100, 200, 300, 400, 500, 600, 700, 800, 900, 1000]
times = measure_execution_time(array_sizes, num_trials=10, k=5)
plot_execution_times(array_sizes, times)


In [98]:
import plotly.graph_objs as go

class Node:
    def __init__(self, value):
        self.value = value
        self.left_child = None
        self.right_child = None

class BST:
    def __init__(self):
        self.root = None

    def add(self, value):
        if self.root is None:
            self.root = Node(value)
        else:
            self._add_recursive(self.root, value)

    def _add_recursive(self, current_node, value):
        if value <= current_node.value:
            if current_node.left_child is None:
                current_node.left_child = Node(value)
            else:
                self._add_recursive(current_node.left_child, value)
        else:
            if current_node.right_child is None:
                current_node.right_child = Node(value)
            else:
                self._add_recursive(current_node.right_child, value)

    def plot(self):
        """Plota a árvore binária usando Plotly."""
        positions = {}
        edges = []

        # Define as posições dos nós e as conexões (arestas)
        self._get_positions(self.root, 0, 0, 10, positions, edges)

        # Prepara os dados para o Plotly
        x_nodes = [positions[node][0] for node in positions]
        y_nodes = [positions[node][1] for node in positions]
        labels = [node.value for node in positions]
        
        # Arestas
        x_edges = []
        y_edges = []
        for edge in edges:
            x_edges.extend([positions[edge[0]][0], positions[edge[1]][0], None])
            y_edges.extend([positions[edge[0]][1], positions[edge[1]][1], None])

        # Cria as linhas das arestas
        edge_trace = go.Scatter(
            x=x_edges,
            y=y_edges,
            mode='lines',
            line=dict(color='black', width=1),
            hoverinfo='none'
        )

        # Cria os nós
        node_trace = go.Scatter(
            x=x_nodes,
            y=y_nodes,
            mode='markers+text',
            marker=dict(size=20, color='lightblue', line=dict(color='black', width=1)),
            text=[str(label) for label in labels],
            textposition="top center",
            hoverinfo='text'
        )

        # Configura o layout
        layout = go.Layout(
            title='Árvore Binária',
            showlegend=False,
            xaxis=dict(showgrid=False, zeroline=False),
            yaxis=dict(showgrid=False, zeroline=False),
            template="plotly_white"
        )

        # Plota a árvore
        fig = go.Figure(data=[edge_trace, node_trace], layout=layout)
        fig.show()

    def _get_positions(self, node, x, y, offset, positions, edges):
        """Recursivamente determina as posições dos nós e as conexões."""
        if node is not None:
            positions[node] = (x, y)
            if node.left_child:
                edges.append((node, node.left_child))
                self._get_positions(node.left_child, x - offset, y - 10, offset / 2, positions, edges)
            if node.right_child:
                edges.append((node, node.right_child))
                self._get_positions(node.right_child, x + offset, y - 10, offset / 2, positions, edges)


In [99]:
# Construindo a árvore binária
bst = BST()
for value in [15, 5, 20, 17, 22, 2, 5, 1, 3]:
    bst.add(value)

# Plotando a árvore
bst.plot()