# Try date detection from CamemBERT
https://huggingface.co/Jean-Baptiste/camembert-ner-with-dates

In [None]:
#!pip install transformers

In [1]:
from transformers import AutoTokenizer, AutoModelForTokenClassification

In [2]:
tokenizer = AutoTokenizer.from_pretrained("Jean-Baptiste/camembert-ner-with-dates")
model = AutoModelForTokenClassification.from_pretrained("Jean-Baptiste/camembert-ner-with-dates")

Downloading:   0%|          | 0.00/423 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/970 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/792k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/210 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/420M [00:00<?, ?B/s]

In [3]:
from transformers import pipeline

In [4]:
##### Process text sample (from wikipedia)
nlp = pipeline('ner', model=model, tokenizer=tokenizer, aggregation_strategy="simple")
nlp("Apple est créée le 1er avril 1976 dans le garage de la maison d'enfance de Steve Jobs à Los Altos en Californie par Steve Jobs, Steve Wozniak et Ronald Wayne14, puis constituée sous forme de société le 3 janvier 1977 à l'origine sous le nom d'Apple Computer, mais pour ses 30 ans et pour refléter la diversification de ses produits, le mot « computer » est retiré le 9 janvier 2015.")


[{'entity_group': 'ORG',
  'score': 0.977638,
  'word': 'Apple',
  'start': 0,
  'end': 5},
 {'entity_group': 'DATE',
  'score': 0.97937775,
  'word': 'le 1er avril 1976 dans le',
  'start': 15,
  'end': 41},
 {'entity_group': 'PER',
  'score': 0.9958226,
  'word': 'Steve Jobs',
  'start': 74,
  'end': 85},
 {'entity_group': 'LOC',
  'score': 0.99508715,
  'word': 'Los Altos',
  'start': 87,
  'end': 97},
 {'entity_group': 'LOC',
  'score': 0.99533045,
  'word': 'Californie',
  'start': 100,
  'end': 111},
 {'entity_group': 'PER',
  'score': 0.9961076,
  'word': 'Steve Jobs',
  'start': 115,
  'end': 126},
 {'entity_group': 'PER',
  'score': 0.99603254,
  'word': 'Steve Wozniak',
  'start': 127,
  'end': 141},
 {'entity_group': 'PER',
  'score': 0.9957776,
  'word': 'Ronald Wayne',
  'start': 144,
  'end': 157},
 {'entity_group': 'DATE',
  'score': 0.9940308,
  'word': 'le 3 janvier 1977 à',
  'start': 198,
  'end': 218},
 {'entity_group': 'ORG',
  'score': 0.972081,
  'word': "d'Apple

## We see that it works well to detect dates in our data

In [16]:
sentence = "Réalisation d'une prise de sang chez monsieur Didier Nicolas Prise de \
sang réalisée le 12 février 2022 à 9h15 à domicile, patient en ald merci."
sentence = "Ordonnance pour la réalisation d'un test PCR covid-19 à madame gauthier monique. \
Test réalisé à domicile le 28 03 2022 à 9h15 test pris en charge car ordonnance pour \
intervention programmée et patiente au parcours vaccinal complet. Merci."
sentence = "Vaccin fait le 11/11/2020 au domicile de la patiente merci."
sentence = "Prise de sang, réaliser au cabinet le 10 août à 9h10 dans le cadre du 100% ald."
sentence = "Je sang fait au domicile de la patiente le 9 janvier attention, changement de nom, \
reprise du nom de jeune fille au nom de marie-claude, à la place de vader. \
Mutuelle, numériser, merci. Prise de sang fait le 9, merci."

In [17]:
print(sentence)
nlp(sentence)

Je sang fait au domicile de la patiente le 9 janvier attention, changement de nom, reprise du nom de jeune fille au nom de marie-claude, à la place de vader. Mutuelle, numériser, merci. Prise de sang fait le 9, merci.


[{'entity_group': 'DATE',
  'score': 0.9947311,
  'word': 'le 9 janvier',
  'start': 39,
  'end': 52},
 {'entity_group': 'PER',
  'score': 0.9652222,
  'word': 'marie-claude',
  'start': 122,
  'end': 135},
 {'entity_group': 'PER',
  'score': 0.9703687,
  'word': 'vader',
  'start': 150,
  'end': 156}]

## But it can't detect durations and durations mess up with the date detection
But this is expected since this model was not trained to detect durations. It was only trained to detect dates

In [20]:
sentence = "Prise de sang tous les trois jours, 2 fois par semaine. Et RDV pour le 5 juin."
sentence = "Faire pratiquer par une infirmière à domicile, dimanche et jours fériés compris. Une \
injection en intramusculaire une fois par jour pendant 6 jours. Ainsi qu'une perfusion longue une fois par jour \
pendant 5 jours en sous-cutanée. Début des soins le 11 mars 2022 à 18h merci."
print(sentence)
nlp(sentence)

Faire pratiquer par une infirmière à domicile, dimanche et jours fériés compris. Une injection en intramusculaire une fois par jour pendant 6 jours. Ainsi qu'une perfusion longue une fois par jour pendant 5 jours en sous-cutanée. Début des soins le 11 mars 2022 à 18h merci.


[{'entity_group': 'DATE',
  'score': 0.96709746,
  'word': 'dimanche',
  'start': 46,
  'end': 55},
 {'entity_group': 'DATE',
  'score': 0.99601805,
  'word': '6 jours',
  'start': 139,
  'end': 147},
 {'entity_group': 'DATE',
  'score': 0.9827482,
  'word': '5 jours en',
  'start': 204,
  'end': 215},
 {'entity_group': 'DATE',
  'score': 0.9877873,
  'word': 'le 11 mars 2022 à 18h',
  'start': 245,
  'end': 267}]