
# **Counting Sort**


Importação da biblioteca Pandas:

In [5]:
import pandas as pd

---

Importação da biblioteca para importar dados do drive

In [6]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


---

Importação de dados do Drive

In [7]:
data = pd.read_csv('/content/drive/MyDrive/Google-Playstore.csv')

---

Colunas:

In [8]:
for i in data:
    print(i)

App Name
App Id
Category
Rating
Rating Count
Installs
Minimum Installs
Maximum Installs
Free
Price
Currency
Size
Minimum Android
Developer Id
Developer Website
Developer Email
Released
Last Updated
Content Rating
Privacy Policy
Ad Supported
In App Purchases
Editors Choice
Scraped Time


---

Lista que recebe os valores da coluna **Rating Count**:

In [9]:
lista = []

for d in data['Rating Count']:
    if isinstance(d, float) and str(d) != 'nan':
        lista.append(int(d))

---

**Algoritmo de ordenação em contagem:**

In [10]:
def counting_sort(l):
    counting_values = [0] * (max(l) + 1)
    for number in l:
        counting_values[number] += 1

    positions = [0] * len(l)
    current = 0

    for index, value in enumerate(counting_values):
        for pos in range(value):
            positions[current] = index
            current += 1

    return positions

### Análise de código:

---- Considere **```n```** como o tamanho da lista **```l```**, que é parâmetro da função.

> Na linha 2, deste trecho, tem-se:
```
counting_values = [0] * (max(l) + 1)
```
> A quantidade de passos é determinada pelo tamanho da lista, ou seja, ```n``` passos.

> Em sequência, tem-se:
```
for number in l:
    counting_values[number] += 1
```
> Aqui, para cada número em ```l```, faz se umaz soma, totalizando também ```n``` passos.

> Depois, outra atribuição semelhante, de ```n``` passos:
```
positions = [0] * len(l)
current = 0
```

> Por fim, tem-se:
```
for index, value in enumerate(counting_values):
    for pos in range(value):
        positions[current] = index
        current += 1
```
> Aqui, para cada ```len(n)``` operações, são realizdas ```k``` operações, onde ```k``` é o número do intervalo de valores da lista.

Como o algoritmo depende apenas das duas contagens, sua complexidade é **```O(n+k)```**.



---

Impressão dos elementos:

In [None]:
for i in lista:
    print(i)

[1;30;43mA saída de streaming foi truncada nas últimas 5000 linhas.[0m
0
38
101
2367
20
0
0
0
0
0
0
106
5
60
0
1147
17
6
12
25
37
0
5
9
0
8
517
0
0
0
26
0
0
1092
110
0
0
27
0
0
20
6
120
0
0
72
0
0
0
9
41
44
0
0
0
107
19
0
0
0
599
0
19
41
5
0
0
0
17
11
0
0
150
0
0
0
0
46
12
71
0
0
2746
0
11
0
0
0
0
38
15
7
1501
0
86415
78
32
13
5
33
119
8
0
13
67
18
1270
47
792
0
0
5
113
35
10
15
0
5
0
0
53
0
55
20
30
7
274
17
0
0
0
11
0
34330
17
13
679
8
7
4337
0
5
0
404713
0
0
0
74
0
0
305
0
7
0
0
39
0
24
100
0
59
0
6
398
0
0
735
6
29
0
0
13
0
654
17
0
52
0
224
1375
152
0
26
0
0
0
42
0
0
0
880
0
7
0
0
0
0
0
0
67412
55
2191
8
370
469
0
27
119
0
0
0
16
0
116
0
0
0
0
0
0
0
786
12
0
0
0
388
0
0
0
78
0
5
12
0
45
102
47
57
52
15
0
186
6
206
0
23
38
13
0
212
0
119
0
8
0
0
18
0
21
0
64
3638
7
0
0
58
149
206
0
17
0
0
0
0
0
0
13
400
0
172
0
0
9
82
19
0
9
0
7
28
336
8
0
0
0
17
0
5024
8
0
0
10
0
0
21
132
0
0
7
57
30
10983
5
0
60
107
180
0
0
0
0
1289
13
0
16
9
0
6
43
20
0
320
0
254
444
0
0
0
0
0
0
0
0
0
0
71
0
0

---

Atribuição dos elementos da lista em ordem com a **ordenação em contagem**:

In [13]:
sorted_elements = counting_sort(lista)

---

Impressão dos elementos da nova lista:

In [None]:
for e in sorted_elements:
    print(e)

[1;30;43mA saída de streaming foi truncada nas últimas 5000 linhas.[0m
156299
156387
156446
156464
156507
156517
156553
156595
156674
156745
156805
156808
156845
156925
156954
156955
156960
156971
157002
157003
157029
157032
157046
157122
157155
157166
157169
157201
157219
157232
157254
157268
157288
157345
157366
157449
157483
157499
157505
157510
157579
157795
157820
157851
157869
157935
157962
157963
157978
157993
157993
158069
158081
158094
158133
158170
158269
158274
158295
158329
158439
158475
158559
158566
158667
158716
158823
158857
158910
158959
159000
159053
159108
159165
159195
159213
159220
159238
159243
159259
159274
159298
159330
159334
159347
159348
159395
159397
159437
159488
159507
159510
159651
159747
159757
159766
159786
159814
159853
159855
159903
159955
160048
160049
160061
160079
160081
160286
160294
160308
160318
160334
160348
160350
160360
160380
160427
160495
160537
160586
160604
160638
160648
160672
160672
160686
160749
160762
160859
160894
160951
160993
161

---

O tempo de execução foi:

In [35]:
import time
import matplotlib.pyplot as plot

In [36]:
start = time.process_time()
counting_sort(lista)
end = time.process_time()

print("Tempo de execução: {:.5f} segundos".format(end-start))

Tempo de execução: 22.89999 segundos


---

### Especificações de execução:

- Sistema: Windows 7 Pro
- Tipo SO: 64 bits
- RAM: 2 GB
- Ambiente: Google Colaboratory © 2023
- Linguagem: Python 3
- Análise de código: Manual
- Tempo de execução total médio da função: 23s 