# **Modele BERT** 
**Réponse aux questions avec un BERT affiné**

Représentations d'encodeurs bidirectionnels à partir de transformateurs

Au lieu de regarder les mots isolément, BERT, un modèle basé sur un transformateur, tente d'utiliser le contexte des mots pour obtenir des incorporations. BERT utilise plusieurs concepts d'apprentissage en profondeur pour proposer un modèle qui examine le contexte de manière bidirectionnelle, en tirant parti des informations de l'ensemble des phrases dans leur ensemble grâce à l'attention personnelle.

In [1]:
!pip install transformers==3.1.0

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting transformers==3.1.0
  Downloading transformers-3.1.0-py3-none-any.whl (884 kB)
[K     |████████████████████████████████| 884 kB 8.6 MB/s 
[?25hCollecting tokenizers==0.8.1.rc2
  Downloading tokenizers-0.8.1rc2-cp37-cp37m-manylinux1_x86_64.whl (3.0 MB)
[K     |████████████████████████████████| 3.0 MB 52.3 MB/s 
Collecting sentencepiece!=0.1.92
  Downloading sentencepiece-0.1.97-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.3 MB)
[K     |████████████████████████████████| 1.3 MB 39.3 MB/s 
[?25hCollecting sacremoses
  Downloading sacremoses-0.0.53.tar.gz (880 kB)
[K     |████████████████████████████████| 880 kB 19.6 MB/s 
Building wheels for collected packages: sacremoses
  Building wheel for sacremoses (setup.py) ... [?25l[?25hdone
  Created wheel for sacremoses: filename=sacremoses-0.0.53-py3-none-any.whl size=895259 sha256=1c19f380e6290ef49457f0847baa8402

Télechagement d'un modèle BERT pré-entrainé. Celui-ci est issue de la base de données SQUAD. 
uncased= pas de différence entre miniscule et majuscule

In [2]:
import torch
from transformers import BertForQuestionAnswering
model = BertForQuestionAnswering.from_pretrained('bert-large-uncased-whole-word-masking-finetuned-squad')

Downloading:   0%|          | 0.00/443 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/1.34G [00:00<?, ?B/s]

In [3]:
from transformers import BertTokenizer
tokenizer = BertTokenizer.from_pretrained('bert-large-uncased-whole-word-masking-finetuned-squad')
# Téléchargement d'un tokenizer préentrainé

Downloading:   0%|          | 0.00/232k [00:00<?, ?B/s]

In [4]:
pip install nltk

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


Création d'une variable pdf_txt qui contient un texte. Nous pouvons aussi extraire le texte directement d'un pdf comme pour le modele word2vec avec les commandes suivantes: 

'import pdfplumber

pdf = pdfplumber.open('lic_policy.pdf')

page = pdf.pages[0]

page1 = pdf.pages[1]

pdf_txt = page.extract_text() + page1.extract_text()

pdf.close()'

In [5]:
pdf_txt= """ Un chatbot est une application qui peut imiter une vraie conversation avec un utilisateur dans sa langue naturelle. 
Les chatbots permettent la communication via texte ou audio sur des sites Web, des applications de messagerie, des applications mobiles ou par téléphone.
 Avec SendPulse, vous pouvez facilement créer un robot conversationnel sans connaissances en programmation et gratuitement.
 Les chatbots utilisent l'apprentissage machine pour identifier les modèles de communication. 
 Au cours des interactions continues avec les humains, ils apprennent à imiter des conversations réelles et à réagir aux demandes verbales ou écrites, à leur tour, en fournissant un service particulier. 
 Comme les chatbots utilisent l'IA, ils comprennent le langage, pas seulement les commandes. 
 Ainsi, au fur et à mesure qu’ils ont plus de conversations avec les utilisateurs ils deviennent plus intelligents. 
 Il est important de noter qu'en dehors des chatbots basés sur l'IA, il existe des chatbots qui utilisent des scripts à choix multiples; en substance, l'option X mène au chemin Y et ainsi de suite.

 """
import nltk
nltk.download('punkt')
tokens = nltk.sent_tokenize(pdf_txt)
for t in tokens:
    print(t, "\n")

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Unzipping tokenizers/punkt.zip.


 Un chatbot est une application qui peut imiter une vraie conversation avec un utilisateur dans sa langue naturelle. 

Les chatbots permettent la communication via texte ou audio sur des sites Web, des applications de messagerie, des applications mobiles ou par téléphone. 

Avec SendPulse, vous pouvez facilement créer un robot conversationnel sans connaissances en programmation et gratuitement. 

Les chatbots utilisent l'apprentissage machine pour identifier les modèles de communication. 

Au cours des interactions continues avec les humains, ils apprennent à imiter des conversations réelles et à réagir aux demandes verbales ou écrites, à leur tour, en fournissant un service particulier. 

Comme les chatbots utilisent l'IA, ils comprennent le langage, pas seulement les commandes. 

Ainsi, au fur et à mesure qu’ils ont plus de conversations avec les utilisateurs ils deviennent plus intelligents. 

Il est important de noter qu'en dehors des chatbots basés sur l'IA, il existe des chatbots

In [6]:
question = "Comment s'effectue la communication avec un chatbot ?"

Tokenisation du texte

In [7]:
input_ids = tokenizer.encode(question, pdf_txt, max_length=512, truncation=True)
print('The input has a total of {:} tokens.'.format(len(input_ids)))


The input has a total of 314 tokens.


Impression des jetons avec et de leurs identifiants pour voir exactement ce que fait le tokenizer

In [9]:
tokens = tokenizer.convert_ids_to_tokens(input_ids)
for token, id in zip(tokens, input_ids):
    if id == tokenizer.sep_token_id:
        print('')
    print('{:<12} {:>6,}'.format(token, id))

    if id == tokenizer.sep_token_id:
        print('')

[CLS]           101
comment       7,615
s             1,055
'             1,005
effect        3,466
##ue          5,657
la            2,474
communication  4,807
ave          13,642
##c           2,278
un            4,895
chat         11,834
##bot        18,384
?             1,029

[SEP]           102

un            4,895
chat         11,834
##bot        18,384
est           9,765
une          16,655
application   4,646
qui          21,864
pe           21,877
##ut          4,904
im           10,047
##iter       21,646
une          16,655
vr           27,830
##ai          4,886
##e           2,063
conversation  4,512
ave          13,642
##c           2,278
un            4,895
ut           21,183
##ilis       24,411
##ate         3,686
##ur          3,126
dans         18,033
sa            7,842
lang         11,374
##ue          5,657
nature        3,267
##lle         6,216
.             1,012
les           4,649
chat         11,834
##bots       27,014
per           2,566
##met        11,3

La question et pdf_txt ( le texte) peuvent être concatener ensemble, mais BERT a toujours besoin d'un moyen de les distinguer. BERT a deux encastrements spéciaux "Segment", un pour le segment "A" et un pour le segment "B". Avant que les intégrations de mots n'entrent dans les couches BERT, l'intégration du segment A doit être ajoutée aux jetons de question, et l'intégration du segment B doit être ajoutée à chacun des jetons answer_text.
Celles-ci sont gérées par la bibliothèque de transformateurs et tout ce que nous avons à faire est de spécifier '0' et '1' pour le jeton.

In [10]:
sep_index = input_ids.index(tokenizer.sep_token_id)
num_seg_a = sep_index + 1
num_seg_b = len(input_ids) - num_seg_a
#Here We Construct the list of 0s and 1s.
segment_ids = [0]*num_seg_a + [1]*num_seg_b
# There should be a segment_id for every input token.
assert len(segment_ids) == len(input_ids)

Ici, nous alimentons pdf_txt et la question dans le modèle

In [11]:
start_scores, end_scores = model(torch.tensor([input_ids]), token_type_ids=torch.tensor([segment_ids]))

Ici, nous trouvons les scores 'début' et 'fin' les plus élevés et combinons les jetons dans la réponse et imprimons la réponse

In [12]:
answer_start = torch.argmax(start_scores)
answer_end = torch.argmax(end_scores)

answer = ' '.join(tokens[answer_start:answer_end+1])
print ('Question "' + question + '"' )
print('Answer: "' + answer + '"')

Question "Comment s'effectue la communication avec un chatbot ?"
Answer: "les chat ##bots"


Nous pouvons reconstruire tous les mots qui ont été décomposés en sous-mots.

In [13]:
answer = tokens[answer_start]
answer = tokens[answer_start]

# Select the remaining answer tokens and join them with whitespace.
for i in range(answer_start + 1, answer_end + 1):
  # If it's a subword token, then recombine it with the previous token.
    if tokens[i][0:2] == '##':
        answer += tokens[i][2:]
        # Otherwise, add a space then the token.
    else:
        answer += ' ' + tokens[i]
print('Answer: "' + answer + '"')

Answer: "les chatbots"


Cette partie est une fonction regroupant les commandes précédentes

In [None]:
def answer_question(question, pdf_txt):

    input_ids = tokenizer.encode(question, pdf_txt, max_length=512, truncation=True)

    print('Query has {:,} tokens.\n'.format(len(input_ids)))

    sep_index = input_ids.index(tokenizer.sep_token_id)

    num_seg_a = sep_index + 1

    num_seg_b = len(input_ids) - num_seg_a

    segment_ids = [0]*num_seg_a + [1]*num_seg_b

    assert len(segment_ids) == len(input_ids)

    start_scores, end_scores = model(torch.tensor([input_ids]), token_type_ids=torch.tensor([segment_ids]))

    all_tokens = tokenizer.convert_ids_to_tokens(input_ids)

    #print(' '.join(all_tokens[torch.argmax(start_scores) : torch.argmax(end_scores)+1]))
    #print(f'score: {torch.max(start_scores)}')
    score = float(torch.max(start_scores))
    answer_start = torch.argmax(start_scores)
    answer_end = torch.argmax(end_scores)
    tokens = tokenizer.convert_ids_to_tokens(input_ids)
    answer = tokens[answer_start]

    for i in range(answer_start + 1, answer_end + 1):

        if tokens[i][0:2] == ' ':
            answer += tokens[i][2:]

        else:
            answer += ' ' + tokens[i]
    return answer, score
    print('Answer: "' + answer + '"')

In [None]:
answer_question(question, pdf_txt)
# On applique la fonction sur la question et le texte pour obtenir une réponse

Query has 459 tokens.



('chat ##bots are convenient for providing customer service and support 24 hours a day , 7 days a week . they also free up phone lines and are far less expensive over the long run than hiring people to perform support',
 4.012147903442383)

* Ici, nous utilisons la méthode tokenizers encode_plus pour créer nos jetons à partir de la chaîne de texte
* add_special_tokens=True ajoute des jetons BERT spéciaux comme [CLS], [SEP] et [PAD] à nos nouveaux encodages "tokénisés"
* max_length=512 indique à l'encodeur la longueur cible de nos encodages
* truncation=True garantit que nous coupons toutes les séquences qui sont plus longues que le
max_length spécifié.
* padding="max_length" indique à l'encodeur de remplir toutes les séquences plus courtes que le max_length avec des jetons de remplissage.

In [None]:
tokens = tokenizer.encode_plus(question, pdf_txt, add_special_tokens=True, max_length=512, truncation=True, padding="max_length")
tokens

{'input_ids': [101, 2054, 2024, 12637, 1997, 11834, 18384, 1029, 102, 1037, 11834, 18384, 2003, 1037, 3274, 2565, 2008, 26633, 2015, 2529, 4512, 2083, 2376, 10954, 2030, 3793, 11834, 2015, 2030, 2119, 1012, 11834, 18384, 1010, 2460, 2005, 24691, 18384, 1010, 2003, 2019, 7976, 4454, 1006, 9932, 1007, 3444, 2008, 2064, 2022, 11157, 1998, 2109, 2083, 2151, 2350, 24732, 4646, 1012, 2045, 2024, 1037, 2193, 1997, 10675, 2015, 2005, 11834, 18384, 1010, 2164, 1000, 2831, 18384, 1010, 1000, 1000, 28516, 1010, 1000, 1000, 10047, 28516, 1010, 1000, 1000, 9123, 4005, 1000, 2030, 1000, 7976, 4512, 9178, 1012, 1000, 1996, 6555, 5083, 1997, 2974, 2038, 2464, 2019, 3623, 1999, 5661, 3048, 2013, 3151, 2000, 3617, 7248, 2000, 9099, 18908, 2007, 10390, 1012, 15106, 2083, 2974, 2003, 2108, 3344, 2041, 2011, 5661, 2011, 14972, 9932, 5461, 2006, 2037, 3617, 7248, 1012, 2028, 9932, 6028, 2008, 2003, 3652, 1999, 2049, 4646, 1998, 2224, 2003, 11834, 27014, 1012, 2070, 4973, 1997, 11834, 18384, 2974, 2024, 7484

Il renvoie un dictionnaire contenant trois paires clé-valeur, input_ids,
token_type_ids et attention_mask .
Nous avons également ajouté return_tensors='pt' pour renvoyer les tenseurs PyTorch du
tokenizer (plutôt que des listes Python).

In [None]:
tokens = tokenizer.encode_plus(pdf_txt, add_special_tokens=False, return_tensors='pt')
tokens

{'input_ids': tensor([[ 1037, 11834, 18384,  2003,  1037,  3274,  2565,  2008, 26633,  2015,
          2529,  4512,  2083,  2376, 10954,  2030,  3793, 11834,  2015,  2030,
          2119,  1012, 11834, 18384,  1010,  2460,  2005, 24691, 18384,  1010,
          2003,  2019,  7976,  4454,  1006,  9932,  1007,  3444,  2008,  2064,
          2022, 11157,  1998,  2109,  2083,  2151,  2350, 24732,  4646,  1012,
          2045,  2024,  1037,  2193,  1997, 10675,  2015,  2005, 11834, 18384,
          1010,  2164,  1000,  2831, 18384,  1010,  1000,  1000, 28516,  1010,
          1000,  1000, 10047, 28516,  1010,  1000,  1000,  9123,  4005,  1000,
          2030,  1000,  7976,  4512,  9178,  1012,  1000,  1996,  6555,  5083,
          1997,  2974,  2038,  2464,  2019,  3623,  1999,  5661,  3048,  2013,
          3151,  2000,  3617,  7248,  2000,  9099, 18908,  2007, 10390,  1012,
         15106,  2083,  2974,  2003,  2108,  3344,  2041,  2011,  5661,  2011,
         14972,  9932,  5461,  2006,  

In [None]:
input_id_chunks = tokens['input_ids'][0].split(510)
mask_chunks = tokens['attention_mask'][0].split(510)

for tensor in input_id_chunks:
  print(len(tensor))

449


In [None]:
a = torch.arange(10)
a

tensor([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [None]:
torch.cat(
    [torch.Tensor([101]), a, torch.Tensor([102])]
)

tensor([101.,   0.,   1.,   2.,   3.,   4.,   5.,   6.,   7.,   8.,   9., 102.])

***Préparer les morceaux***

Nous avons maintenant notre tenseur tokenisé ; nous devons le diviser en morceaux ne dépassant pas 510 jetons. Nous choisissons 510 plutôt que 512 pour laisser deux places libres pour ajouter nos jetons [CLS] et [SEP].

***Diviser***


Nous appliquons la méthode de fractionnement à la fois à nos ID d'entrée et aux tenseurs de masque d'attention (nous
n'ont pas besoin des ID de type de jeton et peuvent les supprimer). Nous avons maintenant trois morceaux pour chaque ensemble de tenseurs. Notez que nous devrons ajouter un rembourrage au dernier morceau car il ne satisfera pas la taille de tenseur de 512 requise par BERT.


***CLS et SEP***


Ensuite, nous ajoutons les jetons de début de séquence [CLS] et de séparateur [SEP]. Pour cela, nous pouvons utiliser la fonction torch.cat, qui concatène une liste de tenseurs.
Nos jetons sont déjà au format d'identification de jeton, nous pouvons donc nous référer aux jetons spéciaux
tableau ci-dessus pour créer les versions d'ID de jeton de nos jetons [CLS] et [SEP].
Parce que nous faisons cela pour plusieurs tenseurs, nous plaçons la fonction torch.cat dans
une boucle for et effectuer la concaténation pour chacun de nos morceaux individuellement.
De plus, nos blocs de masque d'attention sont concaténés avec des 1 au lieu de 101
et 102. Nous faisons cela parce que le masque d'attention ne contient pas d'ID de jeton mais
à la place un ensemble de 1 et de 0.
Les zéros dans le masque d'attention représentent l'emplacement des jetons de remplissage (que nous allons
add next), et comme [CLS] et [SEP] ne sont pas des jetons de remplissage, ils sont représentés
avec 1s.

***Rembourrage***


Nous devons ajouter un rembourrage à nos morceaux de tenseur pour nous assurer qu'ils satisfont à la longueur de tenseur de 512 requise par BERT. Nos deux premiers morceaux ne nécessitent aucun rembourrage car ils satisfont déjà à cette exigence de longueur, mais les derniers morceaux le font.
Pour vérifier si un morceau nécessite un remplissage, nous ajoutons une instruction if qui vérifie la longueur du tenseur. Si le tenseur est plus court que 512 jetons, nous ajoutons un rembourrage à l'aide de la fonction torch.cat. Nous devrions ajouter cette déclaration à la même boucle for où nous ajoutons nos jetons [CLS] et [SEP] - si vous avez besoin d'aide, j'ai inclus les scripts complets à la fin de l'article.

In [None]:
chunksize = 512

input_id_chunks = list(tokens['input_ids'][0].split(chunksize - 2))
mask_chunks = list(tokens['attention_mask'][0].split(chunksize - 2))

for i in range(len(input_id_chunks)):
    input_id_chunks[i] = torch.cat([
        torch.tensor([101]), input_id_chunks[i], torch.tensor([102])
    ])
    mask_chunks[i] = torch.cat([
        torch.tensor([1]), mask_chunks[i], torch.tensor([1])
    ])

    pad_len = chunksize - input_id_chunks[i].shape[0]
    if pad_len > 0:
        input_id_chunks[i] = torch.cat([
            input_id_chunks[i], torch.Tensor([0] * pad_len)
        ])
        mask_chunks[i] = torch.cat([
            mask_chunks[i], torch.Tensor([0] * pad_len)
        ])

for chunk in input_id_chunks:
    print(chunk)

tensor([  101.,  1037., 11834., 18384.,  2003.,  1037.,  3274.,  2565.,  2008.,
        26633.,  2015.,  2529.,  4512.,  2083.,  2376., 10954.,  2030.,  3793.,
        11834.,  2015.,  2030.,  2119.,  1012., 11834., 18384.,  1010.,  2460.,
         2005., 24691., 18384.,  1010.,  2003.,  2019.,  7976.,  4454.,  1006.,
         9932.,  1007.,  3444.,  2008.,  2064.,  2022., 11157.,  1998.,  2109.,
         2083.,  2151.,  2350., 24732.,  4646.,  1012.,  2045.,  2024.,  1037.,
         2193.,  1997., 10675.,  2015.,  2005., 11834., 18384.,  1010.,  2164.,
         1000.,  2831., 18384.,  1010.,  1000.,  1000., 28516.,  1010.,  1000.,
         1000., 10047., 28516.,  1010.,  1000.,  1000.,  9123.,  4005.,  1000.,
         2030.,  1000.,  7976.,  4512.,  9178.,  1012.,  1000.,  1996.,  6555.,
         5083.,  1997.,  2974.,  2038.,  2464.,  2019.,  3623.,  1999.,  5661.,
         3048.,  2013.,  3151.,  2000.,  3617.,  7248.,  2000.,  9099., 18908.,
         2007., 10390.,  1012., 15106., 

In [None]:
for tensor in range(len(input_id_chunks)):
  ans = answer_question(question, ' '.join(tokenizer.convert_ids_to_tokens(input_id_chunks[tensor])))
  print(ans)

Query has 512 tokens.

('free up phone lines and are far less expensive over the long run than hiring people to perform support', 3.8189876079559326)


In [None]:
def expand_split_sentences(pdf_txt):
  import nltk
  nltk.download('punkt')
  new_chunks = nltk.sent_tokenize(pdf_txt)
  length = len(new_chunks)
  #for i in range(length):
    #tmp_token = tokenizer.encode(new_chunks[i])
    #print('The input has a total of {:} tokens.'.format(len(tmp_token)))

  new_df = [];
  for i in range(length):
    paragraph = ""
    for j in range(i, length):
      #tmp_str = paragraph + new_chunks[j]
      tmp_token = tokenizer.encode(paragraph + new_chunks[j])
      length_token = len(tmp_token)
      if length_token < 510:
        #print(length_token)
        paragraph = paragraph + new_chunks[j]
      else:
        #print(length_token)
        break;
    #print(len(tokenizer.encode(paragraph)))
    new_df.append(paragraph)
  return new_df
  #for i in new_df:
    #print(i)

In [None]:
max_score = 0;
final_answer = ""
new_df = expand_split_sentences(pdf_txt)
for new_context in new_df:
  #new_paragrapgh = new_paragrapgh + answer_question(question, answer_text)
  ans, score = answer_question(question, new_context)
  if score > max_score:
    max_score = score
    final_answer = ans
print(question)
print(final_answer)
print(max_score)

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!


Query has 459 tokens.

Query has 437 tokens.

Query has 409 tokens.

Query has 372 tokens.

Query has 349 tokens.

Query has 331 tokens.

Query has 316 tokens.

Query has 283 tokens.

Query has 258 tokens.

Query has 234 tokens.

Query has 207 tokens.

Query has 187 tokens.

Query has 165 tokens.

Query has 141 tokens.

Query has 117 tokens.

Query has 108 tokens.

Query has 83 tokens.

Query has 63 tokens.

Query has 42 tokens.

free up phone lines and are far less expensive over the long run than hiring people to perform support
5.080368995666504


Nous pouvons voir que nous obtenons un ensemble de trois valeurs d'activation pour chaque morceau.
Ces valeurs d'activation ne sont pas encore nos probabilités de sortie. Pour les transformer en
probabilités de sortie, nous devons appliquer une fonction softmax au tenseur de sortie.

Enfin, nous prenons la moyenne des valeurs de chaque classe (ou colonne) pour obtenir notre probabilité finale de sentiment positif, négatif ou neutre.

In [None]:
input_ids = torch.stack(input_id_chunks)
attention_mask = torch.stack(mask_chunks)

input_dict = {
    'input_ids': input_ids.long(),
    'attention_mask': attention_mask.int()
}
input_dict

{'input_ids': tensor([[  101,  2166,  5427,  ...,  1012,  2107,   102],
         [  101, 29361,  2024,  ...,  2064,  2022,   102],
         [  101,  3876,  2006,  ...,     0,     0,     0]]),
 'attention_mask': tensor([[1, 1, 1,  ..., 1, 1, 1],
         [1, 1, 1,  ..., 1, 1, 1],
         [1, 1, 1,  ..., 0, 0, 0]], dtype=torch.int32)}

In [None]:
outputs = model(**input_dict)
probs = torch.nn.functional.softmax(outputs[0], dim=-1)
probs = probs.mean(dim=0)
probs

tensor([4.2047e-01, 7.3233e-03, 3.8704e-04, 3.7146e-04, 2.4710e-04, 4.9905e-04,
        9.1580e-05, 7.2339e-04, 2.8726e-04, 2.7150e-04, 2.2355e-04, 5.9827e-05,
        1.0277e-03, 5.1559e-05, 4.3810e-05, 1.1908e-04, 2.0978e-04, 1.3863e-04,
        4.2432e-05, 5.6722e-05, 7.6533e-05, 6.9248e-04, 9.3073e-05, 3.7591e-04,
        4.3682e-05, 4.0332e-04, 6.2978e-05, 8.4359e-05, 1.1684e-04, 4.9767e-05,
        2.4577e-04, 2.9513e-05, 1.8508e-04, 9.6008e-04, 1.3457e-04, 5.4936e-05,
        5.5473e-05, 1.6459e-04, 6.7666e-05, 1.0982e-04, 6.5894e-05, 5.0604e-05,
        8.9084e-05, 1.5366e-04, 4.3831e-05, 1.7032e-04, 6.9928e-04, 5.5394e-05,
        2.6971e-04, 4.2740e-05, 2.9958e-05, 8.3827e-05, 7.3587e-05, 1.0709e-04,
        5.4899e-04, 5.5681e-05, 3.9024e-05, 3.3720e-04, 4.9262e-05, 9.6260e-05,
        5.3931e-05, 1.5222e-04, 7.0258e-04, 2.5524e-03, 1.5948e-04, 1.0690e-03,
        6.7079e-05, 8.0789e-04, 2.0365e-03, 6.5701e-05, 1.2064e-04, 2.8996e-04,
        2.1347e-04, 5.6888e-05, 2.1249e-