# Algo - les k premiers éléments

Rechercher les k premiers éléments est un exercice classique d'algorithmie, souvent appelé *top-k*et qu'on peut résoudre à l'aide d'un [algorithme de sélection](https://fr.wikipedia.org/wiki/Algorithme_de_s%C3%A9lection). C'est très utile en machine learning pour retourner les 3, 4, ou 5 premiers résultats d'un modèle prédictif.

In [1]:
from jyquickhelper import add_notebook_menu
add_notebook_menu()

## Enoncé

On part d'une liste toute simple, une permutation aléatoire des premiers entiers. On connaît donc les *k* plus petits éléments qu'il faut obtenir.

In [2]:
import numpy
perm = numpy.random.permutation(numpy.arange(20))
perm

array([ 5,  7,  1, 15, 18,  9,  3,  0,  4, 11, 17,  2, 14, 16,  6, 10,  8,
       19, 12, 13])

### Exercice 1 : on trie tout et on prend les k plus petit

C'est la méthode la plus simple mais pas la plus efficace.

In [3]:
def topk_sortall(ensemble, k):
    # à vous
    # ...
    pass

topk_sortall(perm, 4)

### Exercice 2 : version plus rapide au choix

A vois de choisir entre l'une et l'autre voire les deux si vous allez vite.

**Idée 1**

On garde un tableau de *k* éléments triés *T*, on parcourt tous les éléments du tableau initial. Si l'élément est plus petit que le plus grand des éléments dans le tableau *T*, on l'ajoute à ce tableau de façon à le garder trier. On continue jusqu'à la fin et le tableau *T* est l'ensemble des *k* plus petits éléments.

**Idée 2**

On découpe le tableau en $\left[\frac{n}{k}\right]$ tableaux de taille *k* qu'on trie. On fusionne ensuite ces $\left[\frac{n}{k}\right]$ pour garder ensuite les *k* plus petits éléments.

In [4]:
def topk_idee1ou2(ensemble, k):
    pass

Vous avez aussi le droit de tricher pour une troisième idée [Heap / Tas](http://www.xavierdupre.fr/app/ensae_teaching_cs/helpsphinx3/notebooks/nbheap.html) mais il faudra vous débrouiller tout seul.

### Exercice 3 : algorithme de sélection

L'idée est assez simple : on prend un élément du tableau au hasard - le pivot - , on range à droite tous les éléments supérieurs, à gauche tous les éléments inférieurs. Si ce pivot se trouve à la position *k* alors on a trouvé les *k* plus petits éléments. Sinon, on sait où chercher.

### Exercice 4 : utiliser la fonction perf_counter pour comparer les vitessses de chaque solution

Et bien sûr, il faudra expliquer pourquoi l'algorithme le plus rapide est bien le plus rapide. Faire varier la taille du tableau initial.

In [6]:
from time import perf_counter

## Réponses