# 1. Estatísticas de Ordem

Nesta aula, estudaremos assuntos relacionados à temática de estatísticas de ordem.

## 1.1. Problemas de Seleção

Problemas de **seleção** são comumente encontrados em nosso cotidiano. Suponha que estejamos interessados em determinar o $i$-ésimo menor elemento de um conjunto $A$ com $n$ elementos. Como alguns casos particulares importantes, podemos citar:
* Menor elemento: $i=1$
* Maior elemento: $i=n$

Para obter o **menor** elemento de um conjunto de dados, podemos considerar a seguinte implementação:

In [3]:
import numpy

In [17]:
def Min(A):
    
    n = len(A)
    min = A[0]
    
    for i in range(1,n):
        if(A[i] < min):
            min = A[i]
    
    return min

No algoritmo acima, o temos $n-1$ comparações, ou seja, encontrar o menor elemento em um conjunto de dados quaisquer possui complexidade de tempo de $\theta(n)$. Exemplo de funcionamento:

In [18]:
A = numpy.random.randint(0, 20, 20)
print('Vetor de entrada: '+ str(A))
print('Menor elemento: '+ str(Min(A)))

Vetor de entrada: [ 7  9 13 13  5 11 17 15 12 17  4 14 13 12  7 14  1  0  5 18]
Menor elemento: 0


Suponha, agora, que desejemos encontrar o **menor** e o **maior** valor de um conjunto de dados quaisquer $A$ com $n$ elementos. Podemos considerar a seguinte implementação:

In [39]:
def Min_Max(A):
    
    n = len(A)
    min = max = A[0]
    counter = 0 # armazena o número de comparações
    
    for i in range(1, n):
        
        counter = counter + 1
        if(A[i] < min):
            min = A[i]
        
        counter = counter + 1
        if(A[i] > max):
            max = A[i]
    
    return min,max,counter

No algoritmo acima, temos $2(n-1)\in\theta(n)$ comparações, ou seja, encontrar o menor e o maior elemento em um conjunto de dados quaisquer possui complexidade de tempo de $\theta(n)$. Exemplo de funcionamento:

In [42]:
A = numpy.random.randint(0, 20, 20)
print('Vetor de entrada: '+ str(A))
min, max, counter = Min_Max(A)
print('Menor elemento: '+ str(min))
print('Maior elemento: '+ str(max))
print('Número de elementos: '+ str(len(A)))
print('Número de comparações: '+ str(counter))

Vetor de entrada: [19 13  7  1 15  7 16 13  6 16  3 16  7  4  9 15  5  6 14  2]
Menor elemento: 1
Maior elemento: 19
Número de elementos: 20
Número de comparações: 38


In [45]:
def Min_Max_Melhorado(A):
    
    n = len(A)
    counter = 0 # armazena o número de compações
    
    if(n % 2 == 1):
        min = max = A[0]
        i = 1
    else:
        i = 2
        if(A[0] < A[1]):
            min = A[0]
            max = A[1]
        else:
            min = A[1]
            max = A[0]
        
    while (i+1 < n):
        
        counter = counter + 1
        if(A[i] > A[i+1]):
            counter = counter + 1
            if(A[i] > max):
                max = A[i]
        else:
            counter = counter + 1
            if(A[i] < min):
                min = A[i]
        
        i = i+2
        
    return min,max,counter

Entretanto, podemos projetar uma versão mais rápida do algoritmo acima, na qual processamos os elementos por **pares**. A ideia consiste em comparar o menor atual com o menor elemento do par, bem como o maior valor atual com o maior elemento do par. Quando $n$ é **ímpar**, inicializamos o menor e maior valores como sendo o primeiro elemento do conjunto de dados. Caso contrário, inicializamos o máximo e mínimo comparando os dois primeiros elementos do conjunto de dados. 

Nesta versão melhorada, realizamos $2n/2-2=n-2\in\theta(n)$ comparações, ou seja, como o índice $i$ é incrementado em duas unidades, o laço executa $n/2$ vezes, sendo que temos $2$ comparações em cada iteração do mesmo. Desta forma, perfazemos $2n/2$ comparações. Como o primeiro par, em geral, já foi comparado antes da execução do laço, subamtraímos duas unidades do número de comparações anterior, ou seja, $2n/2-2 = n-2$. Muito embora ambas versões possuam a mesma complexidade nominal, o algoritmo `Min_Max_Melhorado` realiza um número menor de comparações na prática.

In [51]:
A = numpy.random.randint(0, 20, 20)
print('Vetor de entrada: '+ str(A))
min, max, counter = Min_Max_Melhorado(A)
print('Menor elemento: '+ str(min))
print('Maior elemento: '+ str(max))
print('Número de elementos: '+ str(len(A)))
print('Número de comparações: '+ str(counter))

Vetor de entrada: [15 16  4  0  6  7  8 19  7 11 12 14 10 17 16 10 14 16  1 11]
Menor elemento: 1
Maior elemento: 16
Número de elementos: 20
Número de comparações: 18
