In [1]:
# -*- coding: utf-8 -*-
from IPython.display import display , Markdown
from modules.Utils import (read_decimal_file , group_digits)
from modules.Generators import (PythonGenerator, OurGenerator)
from modules.Tests import (Chi2Test, KSTest, CouponCollectorTest , GapTest,PokerTest,MaximumTest)
from modules.Analysing import ( SequenceAnalyzer, GeneratorAnalyzer)
from numpy import asarray , clip


# Analyse des décimales de e

Pour Dans le but d'approfondir notre étude , nous testerons la séquence sous plusieurs sous 3 formes
- la séquence initiale de décimales constituée de chiffre
- les séquences des nombres qui sont le regroupement de 2 (puis 3) chiffres  consécutifs de la séquence initiale
- les sous séquences des 1000 , 7000 , 10000 , et 100_000 premiers décimaux

on prendra les seuils `` α  = [0.01 , 0.05 , 0.1 ]``

les tests utilisées seront :
- Kolmogorov smirnov : avec la fonction de repartition de la loi uniforme entre : 
  - [0,9] pour la séquences initiales et ses sous séquences (sinon le test serait biaisé)
  - [0,99] pour la séquence de chiffres regroupées par 2 
- $\chi^2$ : prennant ``n_bins = 10 `` , car on suppose que la séquences contient tous les chiffres {0 à 10}
- le test du Gap : avec comme borne ``a = 0.1 , b = 0.4``
- le Collectionneur de coupons : avec les paramètres :
  - nb_coupon = 10 pour la séquence initiale et ses sous séquences
  - nb_coupon = 100 pour 

In [2]:
seuils = [0.01 , 0.05 , 0.1]
gran = [0.000023, 0.00034, 0.0045, 0.035, 0.4, 1.0]

In [11]:
def cdf_ab(x,a=0,b=1):
    """fonction de répartition de la loi uniforme sur [a,b]"""
    x = asarray(x)
    return clip((x-a)/(b-a), 0, 1)

# tests pour l'analyse des décimales de e
tests_for_decimals = [Chi2Test() ,
                      KSTest(cdf=lambda x :cdf_ab(x,0,9)) ,
                      CouponCollectorTest(nb_coupons=10),
                      GapTest(max_gap=1000),
                      MaximumTest(),PokerTest()]
# Lecture et stockage des décimales dans une liste
decimals = read_decimal_file("data/e2M.txt")


In [27]:
Analysers1 = [SequenceAnalyzer(decimals,tests=[tes],name="decimals") for tes in tests_for_decimals]

for ana in Analysers1:
    ana.run()
    display(Markdown(f"# Pour  test : {ana.tests[0]}"))
    display(Markdown(ana.report(detail=True)))
    print("-"*50)

start computing SequenceAnalyzer_decimals(alpha=5.0%)
compute for Chi2Test(nbbins=10)...100.0%...
end computing


# Pour  test : Chi2Test(nbbins=10)

## Rapport Analyse decimals(alpha=5.0%)
### synthèse Global

- P-value moyenne : 0.470 (attendu 0.5 , IC à 95% : [0.000, 1.000])
- P-value conforme aux attentes
- Taux d'accept moyen : 100.0% (attendu 95% IC à 95% : [0.0%, 100.0%])
- Taux d'acceptation conforme aux attentes
- Conclusion : On accepte l'uniformité

--------------------------------------------------
start computing SequenceAnalyzer_decimals(alpha=5.0%)
compute for KSTest(customed)...100.0%...
end computing


# Pour  test : KSTest(customed)

## Rapport Analyse decimals(alpha=5.0%)
### synthèse Global

- P-value moyenne : 0.000 (attendu 0.5 , IC à 95% : [0.000, 1.000])
- P-value conforme aux attentes
- Taux d'accept moyen : 0.0% (attendu 95% IC à 95% : [0.0%, 100.0%])
- Taux d'acceptation conforme aux attentes
- Conclusion : On accepte l'uniformité

--------------------------------------------------
start computing SequenceAnalyzer_decimals(alpha=5.0%)
compute for CouponCollectorTest(nbcoupon=10)...100.0%...
end computing


# Pour  test : CouponCollectorTest(nbcoupon=10)

## Rapport Analyse decimals(alpha=5.0%)
### synthèse Global

- P-value moyenne : 0.485 (attendu 0.5 , IC à 95% : [0.000, 1.000])
- P-value conforme aux attentes
- Taux d'accept moyen : 100.0% (attendu 95% IC à 95% : [0.0%, 100.0%])
- Taux d'acceptation conforme aux attentes
- Conclusion : On accepte l'uniformité

--------------------------------------------------
start computing SequenceAnalyzer_decimals(alpha=5.0%)
compute for GapTest([ 0.1 , 0.4 ])...100.0%...
end computing


# Pour  test : GapTest([ 0.1 , 0.4 ])

## Rapport Analyse decimals(alpha=5.0%)
### synthèse Global

- P-value moyenne : 0.321 (attendu 0.5 , IC à 95% : [0.000, 1.000])
- P-value conforme aux attentes
- Taux d'accept moyen : 100.0% (attendu 95% IC à 95% : [0.0%, 100.0%])
- Taux d'acceptation conforme aux attentes
- Conclusion : On accepte l'uniformité

--------------------------------------------------
start computing SequenceAnalyzer_decimals(alpha=5.0%)
compute for MaximumTest(groupsize=5)...100.0%...
end computing


# Pour  test : MaximumTest(groupsize=5)

## Rapport Analyse decimals(alpha=5.0%)
### synthèse Global

- P-value moyenne : 0.000 (attendu 0.5 , IC à 95% : [0.000, 1.000])
- P-value conforme aux attentes
- Taux d'accept moyen : 0.0% (attendu 95% IC à 95% : [0.0%, 100.0%])
- Taux d'acceptation conforme aux attentes
- Conclusion : On accepte l'uniformité

--------------------------------------------------
start computing SequenceAnalyzer_decimals(alpha=5.0%)
compute for PokerTest(groupsize=5,nbbins=6)...100.0%...
end computing


# Pour  test : PokerTest(groupsize=5,nbbins=6)

## Rapport Analyse decimals(alpha=5.0%)
### synthèse Global

- P-value moyenne : 0.576 (attendu 0.5 , IC à 95% : [0.000, 1.000])
- P-value conforme aux attentes
- Taux d'accept moyen : 100.0% (attendu 95% IC à 95% : [0.0%, 100.0%])
- Taux d'acceptation conforme aux attentes
- Conclusion : On accepte l'uniformité

--------------------------------------------------


In [29]:
Analysers2 = [SequenceAnalyzer(decimals,
                               granularities=[0.0000023],
                               tests=[tes],
                               name="decimals") for tes in tests_for_decimals]

for ana in Analysers2:
    ana.run()
    display(Markdown(f"# Pour  test : {ana.tests[0]}"))
    display(Markdown(ana.report(detail=True)))
    print("-"*50)

start computing SequenceAnalyzer_decimals(alpha=5.0%)
compute for Chi2Test(nbbins=10)...100.0%...
end computing


# Pour  test : Chi2Test(nbbins=10)

## Rapport Analyse decimals(alpha=5.0%)
### synthèse Global

- P-value moyenne : nan (attendu 0.5 , IC à 95% : [0.000, 1.000])
- P-value conforme aux attentes
- Taux d'accept moyen : nan% (attendu 95% IC à 95% : [0.0%, 100.0%])
- Taux d'acceptation conforme aux attentes
- Conclusion : On accepte l'uniformité

--------------------------------------------------
start computing SequenceAnalyzer_decimals(alpha=5.0%)
compute for KSTest(customed)...100.0%...
end computing


# Pour  test : KSTest(customed)

## Rapport Analyse decimals(alpha=5.0%)
### synthèse Global

- P-value moyenne : 0.546 (attendu 0.5 , IC à 95% : [0.545, 0.547])
- P-value élevée : sur-ajustement probable ou tests biaisés (trop permissifs)
- Taux d'accept moyen : 97.8% (attendu 95% IC à 95% : [97.8%, 97.9%])
- Taux d'accept moyen élevé : sur-ajustement probable ou test(s) biaisé(s) (trop permissifs)
- Conclusion : Sur-ajustement probable ou le/l'un des test(s) est(sont) biaisé(s)

--------------------------------------------------
start computing SequenceAnalyzer_decimals(alpha=5.0%)
compute for CouponCollectorTest(nbcoupon=10)...100.0%...
end computing


# Pour  test : CouponCollectorTest(nbcoupon=10)

## Rapport Analyse decimals(alpha=5.0%)
### synthèse Global

- P-value moyenne : nan (attendu 0.5 , IC à 95% : [0.000, 1.000])
- P-value conforme aux attentes
- Taux d'accept moyen : nan% (attendu 95% IC à 95% : [0.0%, 100.0%])
- Taux d'acceptation conforme aux attentes
- Conclusion : On accepte l'uniformité

--------------------------------------------------
start computing SequenceAnalyzer_decimals(alpha=5.0%)
compute for GapTest([ 0.1 , 0.4 ])...100.0%...


  data = (data-min_data)/(max_data-min_data)


end computing


# Pour  test : GapTest([ 0.1 , 0.4 ])

## Rapport Analyse decimals(alpha=5.0%)
### synthèse Global

- P-value moyenne : nan (attendu 0.5 , IC à 95% : [0.000, 1.000])
- P-value conforme aux attentes
- Taux d'accept moyen : nan% (attendu 95% IC à 95% : [0.0%, 100.0%])
- Taux d'acceptation conforme aux attentes
- Conclusion : On accepte l'uniformité

--------------------------------------------------
start computing SequenceAnalyzer_decimals(alpha=5.0%)
compute for MaximumTest(groupsize=5)...100.0%...


ValueError: La taille de l'échantillon (4) doit être au moins égale à group_size (5)

# Evaluation et comparaison des Générateurs

Le but ici c'est d'évaluer nos générateurs contre celui de python puis comparer les résultats obtenus , cela via des des instances de comprarateurs impléméntés pour cela et selon plusieurs seuil

In [None]:
# tests pour l'évaluation et la comparaison de  générateurs
test_for_gen = [Chi2Test(), KSTest(),CouponCollectorTest(),GapTest()]