
# **Counting Sort**


Importação da biblioteca Pandas:

In [None]:
import pandas as pd

---

Importação da biblioteca para importar dados do drive

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


---

Importação de dados do Drive

In [74]:
data = pd.read_csv('/content/drive/MyDrive/Google-Playstore.csv')

---

Colunas:

In [None]:
print(data.columns)

Index(['App Name', 'App Id', 'Category', 'Rating', 'Rating Count', 'Installs',
       'Minimum Installs', 'Maximum Installs', 'Free', 'Price', 'Currency',
       'Size', 'Minimum Android', 'Developer Id', 'Developer Website',
       'Developer Email', 'Released', 'Last Updated', 'Content Rating',
       'Privacy Policy', 'Ad Supported', 'In App Purchases', 'Editors Choice',
       'Scraped Time'],
      dtype='object')


---

Lista que recebe os valores da coluna **Rating Count**:

In [27]:
lista = []

for d in data['Rating Count']:
    if isinstance(d, float) and str(d) != 'nan':
        lista.append(int(d))
    else:
        lista.append(0)

---

**Algoritmo de ordenação em contagem:**

In [69]:
def counting_sort(l):
    counting_values = [0] * (max(l) + 1)
    for number in l:
        counting_values[number] += 1

    positions = [0] * len(l)
    current = 0

    for index, value in enumerate(counting_values):
        for pos in range(value):
            positions[current] = index
            current += 1

    return positions

### Análise de código:

---- Considere **```n```** como o tamanho da lista **```l```**, que é parâmetro da função.

> Na linha 2, deste trecho, tem-se:
```
counting_values = [0] * (max(l) + 1)
```
> A quantidade de passos é determinada pelo tamanho da lista, ou seja, ```n``` passos.

> Em sequência, tem-se:
```
for number in l:
    counting_values[number] += 1
```
> Aqui, para cada número em ```l```, faz se umaz soma, totalizando também ```n``` passos.

> Depois, outra atribuição semelhante, de ```n``` passos:
```
positions = [0] * len(l)
current = 0
```

> Por fim, tem-se:
```
for index, value in enumerate(counting_values):
    for pos in range(value):
        positions[current] = index
        current += 1
```
> Aqui, para cada ```len(n)``` operações, são realizdas ```k``` operações, onde ```k``` é o número do intervalo de valores da lista.

Como o algoritmo depende apenas das duas contagens, sua complexidade é **```O(n+k)```**.



---

Atribuição dos elementos da lista em ordem com a **ordenação em contagem**:

In [21]:
sorted_elements = counting_sort(lista)

---

O tempo de execução foi:

In [None]:
import time
import matplotlib.pyplot as plot

In [None]:
start = time.process_time()
counting_sort(lista)
end = time.process_time()

print("Tempo de execução: {:.5f} segundos".format(end-start))

Tempo de execução: 23.82882 segundos


---

Adicionando uma nova coluna no dataframe com os valores ordenados:

In [66]:
data['Sorted Rating Count'] = counting_sort(lista)

---

Ordenando o dataframe com base na coluna "Rating Count":

In [77]:
data = data.sort_values(by="Rating Count")

---

### Especificações de execução:

- Sistema: Windows 7 Pro
- Tipo SO: 64 bits
- RAM: 2 GB
- Ambiente: Google Colaboratory © 2023
- Linguagem: Python 3
- Análise de código: Manual
- Tempo de execução total médio da função: 23s