In [29]:
# !git clone https://github.com/urchade/GLiNER.git
#%cd GLiNER
!pip install -r requirements.txt
!pip install transformers==4.38.2



In [30]:
from model import GLiNER

model = GLiNER.from_pretrained("urchade/gliner_base")

In [31]:
text = """
Cristiano Ronaldo dos Santos Aveiro (Portuguese pronunciation: [kɾiʃˈtjɐnu ʁɔˈnaldu]; born 5 February 1985) is a Portuguese professional footballer who plays as a forward for and captains both Saudi Pro League club Al Nassr and the Portugal national team. Widely regarded as one of the greatest players of all time, Ronaldo has won five Ballon d'Or awards,[note 3] a record three UEFA Men's Player of the Year Awards, and four European Golden Shoes, the most by a European player. He has won 33 trophies in his career, including seven league titles, five UEFA Champions Leagues, the UEFA European Championship and the UEFA Nations League. Ronaldo holds the records for most appearances (183), goals (140) and assists (42) in the Champions League, goals in the European Championship (14), international goals (128) and international appearances (205). He is one of the few players to have made over 1,200 professional career appearances, the most by an outfield player, and has scored over 850 official senior career goals for club and country, making him the top goalscorer of all time.
"""

labels = ["person", "award", "date", "competitions", "teams"]

entities = model.predict_entities(text, labels)

for entity in entities:
    print(entity["text"], "=>", entity["label"])

Cristiano Ronaldo dos Santos Aveiro => person
5 February 1985 => date
Al Nassr => teams
Portugal national team => teams
Ballon d'Or => award
UEFA Men's Player of the Year Awards => award
European Golden Shoes => award
UEFA Champions Leagues => competitions
UEFA European Championship => competitions
UEFA Nations League => competitions
Champions League => competitions
European Championship => competitions


In [32]:
german_sentences = [
    "Das Meeting ist für den 15. März um 10:00 Uhr angesetzt.",
    "Ihr Geburtstag fällt auf den 4. Juli, und sie plant eine große Party.",
    "Ich habe morgen um 14:30 Uhr einen Termin beim Zahnarzt.",
    "Denken Sie daran, die Sommerzeit beginnt am zweiten Sonntag im März.",
    "Wir landeten am 20. Juli 1969 um 20:17 Uhr UTC auf dem Mond.",
    "Der Laden öffnet am Black Friday, dem 25. November, früh um 5:00 Uhr.",
    "Das Konzert war fantastisch und endete spät, gegen 23:45 Uhr am 9. August.",
    "Unser Jahrestag ist am 14. Februar, und ich habe einen Tisch für 19:00 Uhr reserviert.",
    "Die Sonnenfinsternis wird hier am 8. April sichtbar sein, beginnend um 9:00 Uhr.",
    "Das Feuerwerk zum Neujahr beginnt um Mitternacht am 31. Dezember.",
    "Wie hat Leverkusen am 12. Spieltag der Bundesliga Saison Jahr 2023 und 2024 gespielt?"
]


In [45]:

labels = ["date", "time", "club", "league", "month", "day", "year"]

recognitions = []

for text in german_sentences:
    entities = model.predict_entities(text, labels)
    print(text)
    for entity in entities:
        print("Entity: " , entity["text"], "=>", entity["label"])
        recognitions.append((entity["label"], entity["text"]))        
    print("---------")
                            
recognitions

Das Meeting ist für den 15. März um 10:00 Uhr angesetzt.
Entity:  15. März => date
Entity:  10:00 Uhr => time
---------
Ihr Geburtstag fällt auf den 4. Juli, und sie plant eine große Party.
Entity:  Geburtstag => day
Entity:  4. Juli => date
Entity:  Party => time
---------
Ich habe morgen um 14:30 Uhr einen Termin beim Zahnarzt.
Entity:  morgen => day
Entity:  14:30 Uhr => time
---------
Denken Sie daran, die Sommerzeit beginnt am zweiten Sonntag im März.
Entity:  Sommerzeit => time
Entity:  zweiten Sonntag => day
Entity:  März => month
---------
Wir landeten am 20. Juli 1969 um 20:17 Uhr UTC auf dem Mond.
Entity:  20. Juli 1969 => date
Entity:  20:17 Uhr => time
Entity:  UTC => time
---------
Der Laden öffnet am Black Friday, dem 25. November, früh um 5:00 Uhr.
Entity:  Laden => club
Entity:  Black Friday => day
Entity:  25. November => date
Entity:  früh => time
Entity:  5:00 Uhr => time
---------
Das Konzert war fantastisch und endete spät, gegen 23:45 Uhr am 9. August.
Entity:  23

[('date', '15. März'),
 ('time', '10:00 Uhr'),
 ('day', 'Geburtstag'),
 ('date', '4. Juli'),
 ('time', 'Party'),
 ('day', 'morgen'),
 ('time', '14:30 Uhr'),
 ('time', 'Sommerzeit'),
 ('day', 'zweiten Sonntag'),
 ('month', 'März'),
 ('date', '20. Juli 1969'),
 ('time', '20:17 Uhr'),
 ('time', 'UTC'),
 ('club', 'Laden'),
 ('day', 'Black Friday'),
 ('date', '25. November'),
 ('time', 'früh'),
 ('time', '5:00 Uhr'),
 ('time', '23:45 Uhr'),
 ('date', '9. August'),
 ('day', 'Jahrestag'),
 ('date', '14. Februar'),
 ('time', '19:00 Uhr'),
 ('date', '8. April'),
 ('time', '9:00 Uhr'),
 ('year', 'Neujahr'),
 ('time', 'Mitternacht'),
 ('date', '31. Dezember'),
 ('club', 'Leverkusen'),
 ('day', '12. Spieltag'),
 ('league', 'Bundesliga'),
 ('year', 'Jahr 2023'),
 ('year', '2024')]

In [42]:
import gliner_ner

In [43]:
model_gli = gliner_ner.GlinerNER()
results = model_gli.predict_tags(german_sentences, verbose = True)
[item for item in results if item["label"] in ["date", "time"]]

[{'start': 24, 'end': 32, 'text': '15. März', 'label': 'date'},
 {'start': 36, 'end': 45, 'text': '10:00 Uhr', 'label': 'time'},
 {'start': 29, 'end': 36, 'text': '4. Juli', 'label': 'date'},
 {'start': 9, 'end': 15, 'text': 'morgen', 'label': 'date'},
 {'start': 19, 'end': 28, 'text': '14:30 Uhr', 'label': 'time'},
 {'start': 22, 'end': 32, 'text': 'Sommerzeit', 'label': 'time'},
 {'start': 44, 'end': 59, 'text': 'zweiten Sonntag', 'label': 'date'},
 {'start': 63, 'end': 67, 'text': 'März', 'label': 'date'},
 {'start': 16, 'end': 29, 'text': '20. Juli 1969', 'label': 'date'},
 {'start': 33, 'end': 42, 'text': '20:17 Uhr', 'label': 'time'},
 {'start': 43, 'end': 46, 'text': 'UTC', 'label': 'time'},
 {'start': 20, 'end': 32, 'text': 'Black Friday', 'label': 'date'},
 {'start': 38, 'end': 50, 'text': '25. November', 'label': 'date'},
 {'start': 52, 'end': 56, 'text': 'früh', 'label': 'time'},
 {'start': 60, 'end': 68, 'text': '5:00 Uhr', 'label': 'time'},
 {'start': 51, 'end': 60, 'text'

In [44]:
import datefinder
import dateparser
from dateparser.search import search_dates

for item in results:
    if item["label"] in ["date"]:
#         
        if search_dates(item["text"]) is None:
            print(item["text"])
            matches = list(datefinder.find_dates(item["text"]))

            if len(matches) > 0:
                # date returned will be a datetime.datetime object. here we are only using the first match.
                date = matches[0]
                print (date)
            else:
                print ('No dates found')
        else:
            print(search_dates(item["text"]))

[('15. März', datetime.datetime(2024, 3, 15, 0, 0))]
[('4. Juli', datetime.datetime(2024, 7, 4, 0, 0))]
[('morgen', datetime.datetime(2024, 3, 11, 8, 51, 44, 517156))]
[('Sonntag', datetime.datetime(2024, 3, 10, 0, 0))]
[('März', datetime.datetime(2024, 3, 10, 0, 0))]
[('20. Juli 1969', datetime.datetime(1969, 7, 20, 0, 0))]
[('Friday', datetime.datetime(2024, 3, 8, 0, 0))]
[('November', datetime.datetime(2024, 11, 10, 0, 0))]
[('August', datetime.datetime(2024, 8, 10, 0, 0))]
[('14. Februar', datetime.datetime(2024, 2, 14, 0, 0))]
[('April', datetime.datetime(2024, 4, 10, 0, 0))]
[('31. Dezember', datetime.datetime(2024, 12, 31, 0, 0))]
12. Spieltag
No dates found
[('Jahr 2023', datetime.datetime(2023, 3, 10, 0, 0))]
[('2024', datetime.datetime(2024, 3, 10, 0, 0))]
