# Minitrabalho 1 – Filtro colaborativo

## 1) Algoritmo de força-bruta


##### 1.a) [1 valor] Descreva brevemente qual seria o algoritmo de força-bruta que resolve o problema do número de inversões num array.

__R:__ O algoritmo de força-bruta que resolve o problema do número de inversões num array seria percorrer o array e para cada elemento, percorrer o restante do array e verificar se o elemento atual é maior do que o elemento que estamos a comparar. Caso seja, incrementa-se o contador de inversões. No final, devolve-se o contador de inversões que contém o número de inversões no array.

##### 1.b) [1 valor] Implemente em Python o algoritmo descrito na alínea anterior. O algoritmo deve receber como entrada uma coleção de inteiros, e devolver o número de inversões encontrados nesta coleção.

In [2]:
def count_inversions_brute_force(arr):
    count = 0
    n = len(arr)
    for i in range(n):                  
        for j in range(i+1, n):         
            if arr[i] > arr[j]:         
                count += 1
    return count

##### 1.c) [3 valores] Apresente uma análise assintótica do seu algoritmo, considerando o número de acessos ao array (ou seja, o número de acessos para leitura e escrita de uma posição do array) que são executados para o seu algoritmo em função do tamanho, n, do array. Nota: É esperado que sejam apresentados os cálculos completos do número de acessos assim como a correspondente conclusão sobre o tempo de execução do algoritmo (utilizando notação assintótica).

**R: Análise assintótica do algoritmo:**

Quando se obtém o tamanho do array acede-se 1 vez à memória: `n = len(arr)`

No loop externo, faz se variar i de 0 a n-1, enquanto que no loop interno faz se variar `j` de `i+1` a `n-1`, pelo que dentro dos loops se aceda à memória 2 vezes em cada iteração `(if arr[i] > arr[j]:)`:

$$
\sum_{i=0}^{n-1} \sum_{j=i+1}^{n-1} 2
$$

Percebe-se que para cada iteração i, o loop internoio executa-se `n-i-1` vezes pelo que podemso simplificar a expressão para:

$$
\sum_{i=0}^{n-1} 2*(n - i - 1)
$$

Por sua vez, deparamo-nos com uma soma de sucessões aritméticas, e assim temos:

$$
2 * \frac{n*(n-1)}{2} = n^2 - n
$$

Finalmente, em termos de notação assintótica descartamos os termos constantes e de ordem inferior pelo que o algorimo tem uma complexidade de:

$$O(n^2)$$






## 2) Algoritmo dividir-e-conquistar

##### 2.a) [3 valores] Proponha uma solução melhorada que utilize a estratégia dividir-e-conquistar para resolver o problema do número de inversões num array de forma mais eficiente. 
Nota: É esperado que sejam descritos os passos básicos para a conceção do seu algoritmo. Deve também apresentar o pseudocódigo correspondente.

Dica: A solução passará por utilizar um dos algoritmos de ordenação abordados nas aulas.

**R:** Uma solução que utiliza a estratégia dividir-e-conquistar que resolve o problema do número de inversões seria criar uma adaptação do Merge Sort que conta o numero de inversões durante o processo de ordenação.

Inicialmente verifica-se se o array é constituído por 1 ou 0 elementos e caso o seja o número de inversões é 0 uma vez que o array se encontra já ordenado

Seguidamente divide-se a lista em duas metades(left e right) e aplica-se recursivamente o algoritmo a ambas as metades

Numa outra função combinamos as duas metades ordenadas e durante a mesclagem, se um elemento da metade left for maior que um elemento da metade right, incrementa o contador pelo numero de elementos nao analisados na metade left

##### 2.b) [2 valores] Implemente em Python o algoritmo descrito na alínea anterior. O algoritmo deve receber como entrada uma coleção de inteiros, e devolver o número de inversões encontrados nesta coleção.

In [2]:
def mergeSortInversions(arr):
    if len(arr) <= 1:
        return 0
    else:
        mid = len(arr) // 2
        left = arr[:mid]
        right = arr[mid:]
        count = mergeSortInversions(left)
        count += mergeSortInversions(right)
        count += merge(left, right, arr)
        return count
    
def merge(left, right, arr):
    i,j,k,count = 0,0,0,0
    while i < len(left) and j < len(right):
        if left[i] <= right[j]:
            arr[k] = left[i]
            i += 1
        else:
            arr[k] = right[j]
            j += 1
            count += (len(left) - i)
        k += 1
    while i < len(left):
        arr[k] = left[i]
        i += 1
        k += 1
    while j < len(right):
        arr[k] = right[j]
        j += 1
        k += 1
    return count

#testes

print(mergeSortInversions([4,5,1,2,3]))

6


##### 2.c) [3 valores] Utilizando o método de indução, mostre que o seu algoritmo está correto.
Nota: Inicie por apresentar um pseudocódigo simplificado do seu algoritmo (se ainda não o fez na
alínea 2.a)). Para facilitar, pode também considerar que o tamanho n do array é uma potência de 2.

**R:** **Hipótese de Indução:** O algoritmo mergeSortInversions calcula corretamente o número de inversões para todos os arrays de tamanho menor que n.

**Caso Base (len(arr)<=1):** Numa lista com 1 ou 0 elementos não há inversões, pelo que o algoritmo devolve 0

**Passo Indutivo:** Supondo que o algoritmo está correto para todas as listas com tamanho menor que n, temos de provar que o algoritmo é correto para uma lista de tamanho n.

O algoritmo divide a lista em duas metades, left e right, e recursivamente determina o numero de inversoes em cada uma das metades. Como cada metade tem tamanho menor que n pela H.I., sabemos que o algoritmo calcula corretamente o numero de inversoes em cada metade

Seguidamente, o algoritmo calcula as inversões entre as duas metades na função merge. Quando um elemento em right é menor que um elemento em left, sabemos que há (len(left) - i) inversões, uma vez que left e right estão ordenados. Portanto, o algoritmo calcula corretamente as inversões entre as duas metades.

**Conclusão:** Assim, o algoritmo mergeSortInversions calcula corretamente o número total de inversões em um array de tamanho n.




**R:** **Invariante do ciclo:** No início de cada iteração do ciclo while na funçã merge, os primeiros i elementos de left já foram ordenados e os primeiros j elementos de right tambem ja foram ordenados e combinados na lista

**Inicialização:** Antes da primeira iteração, i, j e k são 0, logo left e right não têm prefixos e, por isso, o numero de inversões é 0

**Manutenção:** Se o invariante de loop é verdadeiro antes de uma iteração do loop, permanece verdadeiro para a próxima iteração. O loop extrai o menor elemento dos prefixos restantes de left e right, coloca-o na lista arr e incrementa i ou j e k. Se um elemento de right é selecionado, o número de inversões é incrementado por (len(left) - i)

**Finalização:** No final do ciclo, i e j terão percorrido completamente left e right, respectivamente, o que significa que todos os elementos foram ordenados e combinados na lista arr, e todas as inversões foram contabilizadas. Isto mostra que o algoritmo mergeSortInversions está correto.

##### 2.d) [3 valores] Apresente uma análise assintótica do seu algoritmo, utilizando uma das técnicas abordadas em aula, ou seja, o teorema principal, ou o método da indução e substituição.
Nota: É esperado que apresente a fórmula recorrente do cálculo do trabalho do seu algoritmo bem
como os passos necessários para estabelecer a ordem de complexidade do algoritmo (utilizando
notação assintótica).

## 3) Análise empírica

##### 3.a) [1 valores] Crie uma bateria de testes e cronometre o tempo de execução de cada um dos algoritmos desenvolvidos em 1) e 2). Repita cada cronometragem, pelo menos, 35 vezes e registe o tempo médio de execução para cada algoritmo.
Nota: Exatamente a mesma coleção deve ser gerada antes das invocações dos diferentes algoritmos
nos respetivos testes. Esta coleção deve conter números inteiros aleatórios sem repetição.

In [4]:
import time
import random

def test_sorting_algorithm(algorithm, array_size):
    # Generate the input array
    array = list(range(array_size))
    
    # Test scenario 3: Random array
    random.shuffle(array)
    start_time = time.time()
    for _ in range(35):
        algorithm(array)
    end_time = time.time()
    random_time = (end_time - start_time) / 35
    
    return sorted_time, reverse_sorted_time, random_time

def plot_test_results(algorithm, algorithm_name):
    array_sizes = list(range(100, 1000, 100))
    sorted_times = []
    reverse_sorted_times = []
    random_times = []
    for size in array_sizes:
        sorted_time, reverse_sorted_time, random_time = test_sorting_algorithm(algorithm, size)
        sorted_times.append(sorted_time)
        reverse_sorted_times.append(reverse_sorted_time)
        random_times.append(random_time)
    plt.plot(array_sizes, sorted_times, label='Sorted array')
    plt.plot(array_sizes, reverse_sorted_times, label='Reverse sorted array')
    plt.plot(array_sizes, random_times, label='Random array')
    plt.xlabel('Array size')
    plt.ylabel('Time (s)')
    plt.title(algorithm_name)
    plt.legend()
    plt.show()

plot_test_results(quickSort, 'Quick sort')


TypeError: 'int' object is not subscriptable

##### 3.b) [2 valores] Faça o plot dos tempos de execução dos dois algoritmos propostos em 1) e em 2). Que conclusões tira?
Nota: É esperado que verifique se é possível estabelecer ligações entre as ordens de complexidade de
cada algoritmo.

## 4) Extra

##### 4.a) [1 valor] Proponha possíveis melhorias ao algoritmo apresentado em 2) e refaça os testes empíricos realizados em 3) para avaliar se as melhorias são visíveis na prática.
Nota: É esperado que fundamente o porquê de estar a propor cada melhoria. É também esperada uma
breve discussão sobre a ordem de complexidade do algoritmo melhorado.

## 5) Questões Éticas

##### Tente resolver os problemas apenas com os integrantes do seu grupo antes de colaborar. Escreva as suas respostas por suas próprias palavras. Nunca deve partilhar o ficheiro fonte com as suas soluções com integrantes de outros grupos

##### 5.a) Se colaborou com alguém fora do seu grupo, indique aqui os respetivos nomes.

##### 5.b) Deve citar todas as fontes que utilizou fora do material da UC.