<h1> Collection de vignettes</h1>

<h2>Présentation</h2>

On souhaite collectionner des vignettes (de joueurs de foot, de héros de dessins animés,...) vendues avec des tablettes de chocolat .Chaque tablette contient une vignette et la collection complète comporte $n$ vignettes.

La probabilité de tirer une vignette donnée dans une tablette est supposée uniforme sur $[1,\dots, n]$.

<i>
Références: The Double Dixie Cup Problem, D.J. Newman, The American Mathematical Monthly, Vol. 67, No. 1 (Jan., 1960), pp. 58-6 https://statistics.wharton.upenn.edu/files/?whdmsaction=public:main.file&fileID=735
et G. Lavaud et A. Bégyn, Bulletin vert de l'Union des Professeurs de classes préparatoires Scientifiques. N$^\circ$250 (printemps 2015), pp. 39-45.
</i>

<h3>Questions</h3>

<ol>
<li> Une collection

<ul>
<li> Pour $n=500$, effectuer une simulation pour déterminer le nombre $Z_{n,1}$ de tablettes à acheter pour obtenir une unique collection complète de vignettes.
<li> Ré-itérer le calcul précédent une centaine de fois pour déterminer l'espérance de $Z_{n,1}$: $E(Z_{n,1})$
</ul>

<li> Deux collections
<ul>
<li> Pour $n=500$, effectuer une simulation pour déterminer le nombre $Z_{n,2}$ de tablettes à acheter pour obtenir deux collections complètes de vignettes.
<li> Ré-itérer le calcul précédent une centaine de fois pour déterminer l'espérance de $Z_{n,2}$: $E(Z_{n,2})$
</ul>

<li> Pour $n\in[2,2\,000]$, écrire dans un fichier les valeurs $n$, $Z_{n,1}$ et $Z_{n,2}$ (sans refaire le calcul une centaine de fois pour chaque $n$).

<li>À l'aide de <tt>scipy.signal.savgol\_filter(liste,21,3)</tt>, lisser les listes de valeurs (liste) de $Z_{n,1}$ et $Z_{n,2}$.
<li> Tracer, en bleu, sur un même graphique:<br> 
$Z_{n,1,liss\acute e}$, &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;$\displaystyle n.\sum_{k=1}^n \frac1k$ &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;et &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;$n.\ln(n)$.
<li> Tracer, en rouge, sur le même graphique:<br>
$Z_{n,2,liss\acute e}$, &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;$\displaystyle n.\int_{0}^\infty \left[1-(1-(1+t).e^{-t})^n\right].\textrm{d} t$ &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;et &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;$n.\ln(n)+n.\ln(\ln(n))$.
</ol>

<h2>Solution</h2>

In [1]:
open Random;;
Random.self_init;;

In [2]:
let collection n =
    "à compléter"

In [3]:
let rec loop num_essai count1 count2 =
    "à compléter"

In [4]:
open Printf;;

In [5]:
let file_name = "data_ocaml.txt";;

In [5]:
let f = open_out file_name ;;    (* create or truncate file, return channel *)

    "à compléter"
close_out f;; (* flush and close the channel *)

100 470 625
200 1582 1722
300 1427 2847
400 2911 3534
500 3040 3626
600 3863 6914
700 5093 7225
800 5234 6508
900 6496 7467
1000 6756 9006
1100 8776 10149
1200 8498 15101
1300 12423 14593
1400 12006 14291
1500 11604 18107
1600 13254 16026
1700 10427 19517
1800 11726 18400
1900 14713 19072


In [6]:
let f = open_in file_name;;
try
    "à compléter"
with End_of_file ->
  close_in f;;

In [7]:
#use "topfind";;
#require "plplot";;
open Plplot;;
module P = Plot;;
let couleurs_list = [[ 0;255;255;255]; (*`white*)
                     [ 1;  0;  0;  0]; (*`black*)
                     [ 2;  0;  0;255]; (*`blue*)
                     [ 3;255;  0;  0]; (*`red*)
                     [ 4;165; 42; 42]; (*`brown*)
                     [ 5;  0;  0;  0]; [ 6;  0;  0;  0]; [ 7;  0;  0;  0]; [ 8;  0;  0;  0]; [ 9;  0;  0;  0]; 
                     [10;200;200;200]; (*`gray*)
                     [11;  0;255;255]; (*`light_blue*)
                     [12;  0;255;  0]; (*`green*)
                     [13;255;255;  0]; (*`yellow*)
                     [14;255;  0;255]; (*`pink*)
                     [15;160;  0;213]; (*`purple*) ]
let rec loop couleurs_list = match couleurs_list with
    | [n;r;g;b]::tl -> plscol0 n r g b; loop tl
    | _ -> ();;
let couleurs = (fun () -> plscolbg 255 255 255; loop couleurs_list)
let initialisation filename xmin xmax ymin ymax = 
        P.init (xmin, ymin) (xmax, ymax) `greedy (`svg `core) ~filename:(filename^".svg") ~pre:couleurs
let xlabel texte = P.text_outside `black (`bottom 0.5) 3. texte
let ylabel texte = P.text_outside `black (`left 0.5) 5. texte 

- : unit = ()
Findlib has been successfully loaded. Additional directives:
  #require "package";;      to load a package
  #list;;                   to list the available packages
  #camlp4o;;                to load camlp4 (standard syntax)
  #camlp4r;;                to load camlp4 (revised syntax)
  #predicates "p,q,...";;   to set these predicates
  Topfind.reset();;         to force that packages will be reloaded
  #thread;;                 to enable threads

- : unit = ()


/usr/lib/ocaml/plplot: added to search path
/usr/lib/ocaml/plplot/plplot.cma: loaded


In [8]:
let liste_n' = List.map float_of_int (List.rev !liste_n) in
let xs = Array.of_list liste_n' in
let ys = Array.of_list (List.map float_of_int (List.rev !liste_c1)) in
let ys' = Array.of_list (List.map float_of_int (List.rev !liste_c2)) in

let p = initialisation "graph" xs.(0) xs.(Array.length xs-1) 0. ys'.(Array.length ys'-1) in
P.plot ~stream:p [P.lines `green xs ys;
                  P.lines `black xs (Array.of_list (List.map (fun n->n*.(log n)) liste_n'));
                  P.lines `blue xs ys';
                  P.lines `black xs (Array.of_list (List.map (fun n->n*.(log n)+.n*.(log(log n))) liste_n'));
                  xlabel "Nbre n de vignettes dans une collection";
                  P.text_outside `black (`left 0.5) 7. "Nbre de vignettes à réunir pour";
                  P.text_outside `black (`left 0.5) 5. "une/deux collection(s) complete(s)";
                  P.legend ~pos:(P.viewport_pos 0.5 0.)
                      [[P.line_legend "une collection" `green]; 
                       [P.line_legend "deux collections" `blue]]];
P.finish ~stream:p ();;

<img src="./graph.svg" width=750 />