<a href="https://colab.research.google.com/github/s20488/PJN/blob/main/Anastasiia_Ponkratova_spacy_matcher_extract_text_using_pattern.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

https://spacy.io/api/matcher

# Czym jest Token Matcher
Spacy zapewnia oparty na regułach silnik dopasowujący, którym jest Matcher. Działa on na tokenach wyodrębnionych z tekstu. Matcher reguł umożliwia również przekazywanie niestandardowych wywołań zwrotnych w celu działania na dopasowaniach. Wszystkie dopasowania są wykonywane przy użyciu wzorców zdefiniowanych przez Matcher.

# Import bibliotek

In [None]:
import spacy
from spacy.matcher import Matcher

# Załadowanie modelu języka
Istnieje wiele języków, w których można zaimplementować matcher Spacy. W pierwszym przykładzie używamy modelu języka angielskiego, więc załadujmy go za pomocą metody spacy.load().

In [None]:
nlp = spacy.load("en_core_web_sm")

# Wywołanie Spacy Matchera
Trzecim krokiem jest wywołanie całego słownictwa NLP i przekazanie go do konstruktora Matcher().

In [None]:
matcher = Matcher(nlp.vocab)

# Definicja wzorca
Stwórzmy wzorzec, który zostanie użyty do dopasowania całego dokumentu i znalezienia tekstu zgodnie z tym wzorcem. Na przykład, chcę znaleźć adres e-mail

In [None]:
pattern = [{"LIKE_EMAIL":True}]

Więcej wzorców można znaleźć w dokumentacji Spacy.
https://spacy.io/api/matcher

Następnie należy dodać wzorzec do Matchera, który będzie używany do wyszukiwania tekstu.

In [None]:
matcher.add("EMAIL",[pattern])

Można użyć dowolnej nazwy dla wzorca. W tym przypadku defniujemy nazwę wzorca „EMAIL”.

# Zastosowanie wzorzec
Po zdefiniowaniu wzorca należy teraz zastosować ten wzorzec do dokumentu.


In [None]:
text = "You can contact Data Science Learner through email address contact@datasciencelearner.com"
doc = nlp(text)

Następnie przekazujemy dokument jako parametr do matchera.

In [None]:
matches = matcher(doc)

In [None]:
matches

[(17587345535198158200, 9, 10)]

# Wyświetlenie dopasowanego tekstu
Ostatnim krokiem jest znalezienie dopasowanego tekstu z dokumentu. W tym przypadku jest to adres e-mail. W dokumencie może być więcej niż jedno dopasowanie. Dlatego musimy uruchomić nad nim pętlę.

In [None]:
for match_id,start,end in matches:
    print(doc[start:end])

contact@datasciencelearner.com


Można również zdefiniować więcej niż jeden wzorzec i znaleźć tekst w dokumencie. Na przykład, chcę również znaleźć wszystkie nazwy lub **rzeczowniki** w tekście, a następnie użyję wzorca [{„POS”: „PROPN”}].


In [None]:
import spacy
from spacy.matcher import Matcher

nlp = spacy.load("en_core_web_sm")
matcher = Matcher(nlp.vocab)

pattern = [[{"LIKE_EMAIL": True}], [{"POS": "PROPN"}]]
matcher.add("My_Pattern",pattern)

text = "You can contact Data Science Learner through email address contact@datasciencelearner.com"
doc = nlp(text)
matches = matcher(doc)

for match_id,start,end in matches:
    print(doc[start:end])


Data
Science
Learner
contact@datasciencelearner.com


# Spacy dla języka polskiego

Język polski nie jest dostępny domyślnie w spacy więc musimy zainstalować go ręcznie https://spacy.io/models/pl

In [None]:
!wget https://github.com/explosion/spacy-models/releases/download/pl_core_news_sm-3.8.0/pl_core_news_sm-3.8.0-py3-none-any.whl

--2024-10-18 17:18:25--  https://github.com/explosion/spacy-models/releases/download/pl_core_news_sm-3.8.0/pl_core_news_sm-3.8.0-py3-none-any.whl
Resolving github.com (github.com)... 140.82.116.4
Connecting to github.com (github.com)|140.82.116.4|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://objects.githubusercontent.com/github-production-release-asset-2e65be/84940268/63a2f15c-9158-40b5-824d-5fd58418e1b6?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=releaseassetproduction%2F20241018%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20241018T171826Z&X-Amz-Expires=300&X-Amz-Signature=b6f261ae37492b85c8b0f330e0527f6704270f385e9314697949fc643c351ef0&X-Amz-SignedHeaders=host&response-content-disposition=attachment%3B%20filename%3Dpl_core_news_sm-3.8.0-py3-none-any.whl&response-content-type=application%2Foctet-stream [following]
--2024-10-18 17:18:26--  https://objects.githubusercontent.com/github-production-release-asset-2e65be/84940268/63a2f15c-9158-40

In [None]:
!pip install /content/pl_core_news_sm-3.8.0-py3-none-any.whl

Processing ./pl_core_news_sm-3.8.0-py3-none-any.whl
pl-core-news-sm is already installed with the same version as the provided wheel. Use --force-reinstall to force an installation of the wheel.


Teraz możemy załadować model

In [None]:
nlp = spacy.load("pl_core_news_sm")

Przykład oznaczeń części mowy (Part of Speech)


In [None]:
from spacy.lang.pl.examples import sentences

nlp = spacy.load("pl_core_news_sm")
doc = nlp(sentences[0])
print(doc.text)
for token in doc:
    print(token.text, token.pos_, token.dep_)

Poczuł przyjemną woń mocnej kawy.
Poczuł VERB ROOT
przyjemną ADJ amod
woń NOUN obj
mocnej ADJ amod
kawy NOUN nmod:arg
. PUNCT punct


# Zadanie

In [None]:
import spacy
from spacy.matcher import Matcher

nlp = spacy.load("pl_core_news_sm")

matcher = Matcher(nlp.vocab)

In [None]:
job_title_pattern = [
    [{"TEXT": {"IN": ["doświadczonego", "stanowisko", "Poszukujemy", "rekrutuje", "szukamy", "szuka", "poszukuje"]}}, {"IS_TITLE": True, "OP": "+"}, {"POS": "X"}, {"IS_PUNCT": True}, {"IS_UPPER": True, "OP": "{1}"}, {"TEXT": "-", "OP": "?"}, {"POS": {"IN": ["PROPN", "NOUN", "ADJ"]}, "OP": "?"}],
    [{"TEXT": {"IN": ["doświadczonego", "stanowisko", "Poszukujemy", "rekrutuje", "szukamy", "szuka", "poszukuje"]}}, {"IS_TITLE": True, "OP": "+"}, {"POS": "X"}, {"IS_PUNCT": True}, {"IS_UPPER": True, "OP": "{1}"}, {"TEXT": "/", "OP": "?"}, {"IS_UPPER": True, "OP": "{1}"}],
    [{"TEXT": {"IN": ["doświadczonego", "stanowisko", "Poszukujemy", "rekrutuje", "szukamy", "szuka", "poszukuje"]}}, {"IS_TITLE": True, "OP": "+"}, {"POS": "X"}, {"IS_PUNCT": True}, {"IS_TITLE": True, "OP": "+"}],
    [{"TEXT": {"IN": ["doświadczonego", "stanowisko", "Poszukujemy", "rekrutuje", "szukamy", "szuka", "poszukuje"]}}, {"IS_TITLE": True, "OP": "+"}, {"TEXT": "-", "OP": "?"}, {"IS_TITLE": True, "OP": "{,2}"}],
    [{"TEXT": {"IN": ["doświadczonego", "stanowisko", "Poszukujemy", "rekrutuje", "szukamy", "szuka", "poszukuje"]}}, {"IS_TITLE": True, "OP": "+"}, {"IS_UPPER": True, "OP": "{1}"}]

]

company_pattern = [
    [{"TEXT": {"IN": ["Firma", "Jako", "Jesteśmy"]}}, {"POS": {"IN": ["PROPN", "NOUN", "ADJ"]}, "OP": "{1}"}]
]

location_pattern = [
    [{"LOWER": "w"}, {"POS": "ADJ", "OP": "+"}, {"POS": "PROPN", "OP": "+"}],
    [{"LOWER": "w"}, {"POS": "PROPN", "OP": "+", "LENGTH": {">": 4}}],
    [{"LOWER": "do"}, {"LOWER": "pracy"}, {"LOWER": "zdalnej"}],
    [{"TEXT": "Online"}]
]

salary_pattern = [
    [{"IS_DIGIT": True}, {"IS_PUNCT": True, "OP": "{1}"}, {"IS_DIGIT": True}, {"IS_UPPER": True, "TEXT": "PLN"}],
    [{"LOWER": {"IN": ["od", "przedziale", ":"]}}, {"IS_DIGIT": True}, {"IS_UPPER": True, "TEXT": "PLN"}],
    [{"IS_DIGIT": True}, {"IS_DIGIT": True, "OP": "+"}, {"IS_UPPER": True, "TEXT": "PLN"}]
]

skills_pattern = [
    [{"TEXT": {"IN": ["umiejętności", "Wymagania", "Wymagane"]}}, {"IS_PUNCT": True, "OP": "?"}, {"POS": {"IN": ["ADJ", "ADP", "ADV", "AUX", "CCONJ", "DET", "INTJ", "NOUN", "NUM", "PART", "PRON", "PROPN", "PUNCT", "SCONJ", "SYM", "VERB", "X"]}, "OP": "+"}],
    [{"TEXT": {"IN": ["posiadać", "mieć"]}}, {"POS": {"IN": ["ADJ", "ADP", "ADV", "AUX", "CCONJ", "DET", "INTJ", "NOUN", "NUM", "PART", "PRON", "PROPN", "PUNCT", "SCONJ", "SYM", "VERB", "X"]}, "OP": "+"}]
]

matcher.add("Stanowisko", job_title_pattern)
matcher.add("Firma", company_pattern)
matcher.add("Lokalizacja", location_pattern)
matcher.add("Wynagrodzenie", salary_pattern)
matcher.add("Wymagane Umiejętności", skills_pattern)

### Zadanie: Ekstrakcja Informacji z Ogłoszeń o Pracę za pomocą SpaCy Matcher

Twoim zadaniem jest wykorzystanie biblioteki SpaCy oraz jej modułu Matcher do automatycznej ekstrakcji kluczowych informacji z ogłoszeń o pracę. Celem jest stworzenie narzędzia, które potrafi zidentyfikować i wyodrębnić następujące elementy z nieustrukturyzowanego tekstu ogłoszeń:

**Stanowisko**: Tytuł oferowanego stanowiska pracy.

**Firma**: Nazwa firmy oferującej stanowisko.

**Lokalizacja**: Miejsce pracy (miasto, region).

**Wynagrodzenie**: Zakres płac oferowany na stanowisku.

**Wymagane Umiejętności**: Lista kluczowych umiejętności wymaganych do objęcia stanowiska.


Przeanalizuj strukturę ogłoszeń o pracę, aby zidentyfikować wzorce językowe odpowiadające powyższym kategoriom.
Konstrukcja Wzorców: Skonstruuj odpowiednie wzorce dla każdego elementu informacji, korzystając z możliwości oferowanych przez SpaCy Matcher (np. dopasowanie leksykalne, gramatyczne, części mowy).



Przydatny link: atrybuty lingwistyczne dostępne w Spacy: https://spacy.io/usage/linguistic-features#pos-tagging

In [None]:
jobs = [
    """Firma TechWave szuka doświadczonego Programisty C++ do pracy w Katowicach. Oferujemy wynagrodzenie w przedziale 9000-14000 PLN miesięcznie oraz 25 dni urlopu rocznie. Wymagane umiejętności: C++, STL, Git, znajomość algorytmów.""",

    """Jako InnovateX, oferujemy stanowisko Analityka Biznesowego w naszym biurze w Poznaniu. Proponujemy wynagrodzenie od 7500 PLN oraz możliwość uczestnictwa w projektach międzynarodowych. Kandydat powinien posiadać co najmniej 3 lata doświadczenia w analizie danych.""",

    """Poszukujemy Specjalisty ds. SEO do pracy zdalnej. Wynagrodzenie: 5000 PLN + premie. Wymagania: optymalizacja stron, Google Analytics, znajomość języka angielskiego na poziomie B2. Firma oferuje elastyczne godziny pracy i dostęp do szkoleń.""",

    """Firma GlobalTech rekrutuje Inżyniera Mechanika do działu R&D w Łodzi. Oferujemy wynagrodzenie od 8000 PLN, pakiet benefitów oraz możliwość rozwoju zawodowego. Wymagane: AutoCAD, doświadczenie w projektowaniu maszyn, znajomość norm ISO.""",

    """Jesteśmy EkoEnergia, liderem w sektorze odnawialnych źródeł energii, i szukamy Kierownika Produkcji do naszego zakładu w Gdyni. Proponujemy wynagrodzenie 10 000 PLN oraz premie za wyniki. Kandydat powinien mieć doświadczenie w zarządzaniu zespołem i optymalizacji procesów.""",

    """Poszukujemy Junior Front-End Developera do pracy w Krakowie. Wynagrodzenie: 4000-6000 PLN miesięcznie. Wymagania: HTML, CSS, JavaScript, znajomość frameworków React lub Vue.js. Firma oferuje szkolenia oraz możliwość pracy nad ciekawymi projektami.""",

    """Firma MedTech poszukuje Specjalisty ds. Marketingu Medycznego do pracy w Wrocławiu. Oferujemy wynagrodzenie w przedziale 7000-9000 PLN oraz pakiet benefitów. Wymagane: znajomość rynku medycznego, umiejętność tworzenia strategii marketingowej, dobra organizacja pracy.""",

    """Jako FinSecure, oferujemy stanowisko Audytora IT w naszym biurze w Warszawie. Wynagrodzenie: 8500 PLN + premie. Wymagania: doświadczenie w audycie systemów informatycznych, znajomość standardów ISO 27001, certyfikaty IT będą dodatkowym atutem.""",

    """Poszukujemy Projektanta UX do pracy w naszym studio w Szczecinie. Oferujemy wynagrodzenie od 6000 PLN, elastyczne godziny pracy oraz możliwość pracy zdalnej. Wymagane: znajomość narzędzi Figma, Adobe XD, doświadczenie w projektowaniu interfejsów użytkownika.""",

    """Firma BioLife szuka Biotechnologa do pracy w laboratorium w Bydgoszczy. Wynagrodzenie: 5000 PLN miesięcznie oraz pakiet szkoleń. Wymagania: wykształcenie wyższe w dziedzinie biotechnologii, doświadczenie w pracy laboratoryjnej, znajomość technik PCR.""",

    """Poszukujemy Administratora Systemów IT do pracy w Rzeszowie. Oferujemy wynagrodzenie w przedziale 7000-9000 PLN oraz możliwość rozwoju zawodowego. Wymagane: znajomość systemów Linux i Windows, doświadczenie w zarządzaniu siecią, umiejętność rozwiązywania problemów technicznych.""",

    """Jako GreenSolutions, oferujemy stanowisko Specjalisty ds. CSR w naszym biurze w Lublinie. Wynagrodzenie: 6500 PLN + benefity. Wymagania: doświadczenie w projektach z zakresu społecznej odpowiedzialności biznesu, umiejętność tworzenia raportów, znajomość języka angielskiego.""",

    """Firma AutoDrive poszukuje Inżyniera Elektronika do działu rozwoju produktów w Toruniu. Oferujemy wynagrodzenie od 8000 PLN, możliwość pracy nad innowacyjnymi projektami oraz pakiet benefitów. Wymagane: znajomość systemów embedded, doświadczenie w projektowaniu układów elektronicznych.""",

    """Poszukujemy Specjalisty ds. HR do pracy w naszym biurze w Gorzowie Wielkopolskim. Wynagrodzenie: 6000 PLN miesięcznie oraz pakiet benefitów. Wymagania: doświadczenie w rekrutacji, znajomość systemów HR, umiejętność prowadzenia rozmów kwalifikacyjnych.""",

    """Jako CreativeHub, oferujemy stanowisko Grafik UX/UI w naszym studio w Opolu. Wynagrodzenie: 5500-7500 PLN oraz elastyczne godziny pracy. Wymagane: portfolio projektów UX/UI, znajomość narzędzi Adobe Creative Suite, umiejętność pracy w zespole.""",

    """Firma HealthPlus szuka Dietetyka do pracy w naszej klinice w Zielonej Górze. Oferujemy wynagrodzenie od 4500 PLN oraz pakiet szkoleń. Wymagania: wykształcenie wyższe w dziedzinie dietetyki, doświadczenie w pracy z pacjentami, znajomość najnowszych trendów żywieniowych.""",

    """Poszukujemy Junior Data Scientist do pracy w naszym biurze w Kielcach. Wynagrodzenie: 5000 PLN + premie. Wymagania: znajomość Pythona, doświadczenie z bibliotekami NumPy i Pandas, podstawy machine learning.""",

    """Firma SecureNet rekrutuje Specjalistę ds. Cyberbezpieczeństwa do pracy w Warszawie. Oferujemy wynagrodzenie w przedziale 9000-13000 PLN oraz pakiet benefitów. Wymagane: doświadczenie w analizie zagrożeń, znajomość narzędzi do monitorowania bezpieczeństwa, certyfikaty CISSP lub CISM.""",

    """Jako EduTech, oferujemy stanowisko Instruktora Online w naszym programie edukacyjnym. Wynagrodzenie: 4000 PLN miesięcznie oraz elastyczne godziny pracy. Wymagania: doświadczenie w nauczaniu online, dobra znajomość platform e-learningowych, umiejętność tworzenia materiałów edukacyjnych.""",

    """Firma AgroFarm poszukuje Agronoma do pracy w naszym zakładzie w Olsztynie. Oferujemy wynagrodzenie od 7000 PLN, możliwość rozwoju zawodowego oraz pakiet benefitów. Wymagane: wykształcenie wyższe w dziedzinie agronomii, doświadczenie w pracy na polu, znajomość nowoczesnych technik rolniczych.""",

    """Poszukujemy Specjalisty ds. Logistyki do pracy w naszym centrum dystrybucji w Białymstoku. Wynagrodzenie: 6500 PLN + premie. Wymagania: doświadczenie w logistyce, umiejętność zarządzania łańcuchem dostaw, znajomość systemów ERP.""",

    """Firma UrbanDesign szuka Architekta Wnętrz do pracy w naszym biurze w Łodzi. Oferujemy wynagrodzenie w przedziale 8000-10000 PLN oraz możliwość pracy nad prestiżowymi projektami. Wymagane: portfolio projektów wnętrz, znajomość AutoCAD i SketchUp, umiejętność pracy z klientem.""",

    """Jako SmartTech, oferujemy stanowisko Specjalisty ds. IoT w naszym zespole w Rzeszowie. Wynagrodzenie: 8500 PLN + benefity. Wymagania: doświadczenie z urządzeniami IoT, znajomość protokołów komunikacyjnych, umiejętność programowania w C++ lub Python.""",

    """Firma FinancePro poszukuje Konsultanta ds. Finansów do pracy w naszym biurze w Toruniu. Oferujemy wynagrodzenie od 7000 PLN, pakiet benefitów oraz możliwość uczestnictwa w szkoleniach. Wymagane: wykształcenie wyższe w dziedzinie finansów, doświadczenie w konsultingu finansowym, dobra znajomość Excela.""",

    """Poszukujemy Specjalisty ds. E-commerce do pracy w naszym sklepie internetowym w Gdańsku. Wynagrodzenie: 6000 PLN + premie. Wymagania: doświadczenie w zarządzaniu sklepem online, znajomość platform Shopify lub Magento, umiejętność analizy danych sprzedażowych.""",

    """Firma HealthCare rekrutuje Fizjoterapeutę do pracy w naszej klinice w Kielcach. Oferujemy wynagrodzenie w przedziale 5000-7000 PLN oraz pakiet benefitów. Wymagane: wykształcenie wyższe w dziedzinie fizjoterapii, doświadczenie w pracy z pacjentami, znajomość nowoczesnych metod terapii.""",

    """Jako TechInnovators, oferujemy stanowisko DevOps Engineer w naszym zespole w Warszawie. Wynagrodzenie: 9500 PLN + premie. Wymagania: doświadczenie z Docker i Kubernetes, znajomość AWS lub Azure, umiejętność automatyzacji procesów CI/CD.""",

    """Firma MarketMasters szuka Specjalisty ds. Content Marketingu do pracy w naszym biurze w Lublinie. Oferujemy wynagrodzenie od 6000 PLN, pakiet benefitów oraz możliwość rozwoju zawodowego. Wymagane: doświadczenie w tworzeniu treści marketingowych, znajomość SEO, umiejętność pracy z narzędziami CMS.""",

    """Poszukujemy Specjalisty ds. Reklamacji do pracy w naszym dziale obsługi klienta w Bydgoszczy. Wynagrodzenie: 4500 PLN + premie. Wymagania: doświadczenie w obsłudze klienta, umiejętność rozwiązywania problemów, dobra znajomość języka angielskiego.""",

    """Firma BioHealth rekrutuje Specjalistę ds. Badań Klinicznych do pracy w naszym laboratorium w Olsztynie. Oferujemy wynagrodzenie w przedziale 8000-10000 PLN oraz pakiet benefitów. Wymagane: doświadczenie w badaniach klinicznych, znajomość standardów GCP, umiejętność pracy z dokumentacją medyczną.""",

    """Jako DigitalSolutions, oferujemy stanowisko Specjalisty ds. Social Media w naszym zespole w Szczecinie. Wynagrodzenie: 5500 PLN + premie. Wymagania: doświadczenie w zarządzaniu kontami social media, umiejętność tworzenia strategii komunikacji, znajomość narzędzi analitycznych.""",

    """Firma EduSmart poszukuje Nauczyciela Informatyki do pracy w naszej szkole w Białymstoku. Oferujemy wynagrodzenie od 5000 PLN, pakiet benefitów oraz możliwość rozwoju zawodowego. Wymagane: wykształcenie pedagogiczne, doświadczenie w nauczaniu informatyki, znajomość nowoczesnych metod nauczania.""",

    """Poszukujemy Specjalisty ds. Obsługi Klienta do pracy w naszym call center w Rzeszowie. Wynagrodzenie: 4000 PLN + premie. Wymagania: doświadczenie w obsłudze klienta, dobra znajomość języka angielskiego, umiejętność pracy w zespole.""",

    """Firma AgroTech rekrutuje Inżyniera Rolnictwa do pracy w naszym zakładzie w Zielonej Górze. Oferujemy wynagrodzenie od 7500 PLN, pakiet benefitów oraz możliwość pracy nad innowacyjnymi projektami. Wymagane: wykształcenie wyższe w dziedzinie rolnictwa, doświadczenie w zarządzaniu gospodarstwem, znajomość nowoczesnych technologii rolniczych.""",

    """Jako HealthInnovators, oferujemy stanowisko Specjalisty ds. Zarządzania Projektami w naszym biurze w Warszawie. Wynagrodzenie: 9000 PLN + premie. Wymagania: doświadczenie w zarządzaniu projektami, znajomość metodologii Agile, umiejętność pracy z narzędziami PM.""",

    """Firma CreativeLabs poszukuje Animatora 3D do pracy w naszym studiu w Gdańsku. Oferujemy wynagrodzenie w przedziale 7000-9000 PLN oraz pakiet benefitów. Wymagane: doświadczenie w animacji 3D, znajomość programów Blender lub Maya, portfolio projektów.""",

    """Poszukujemy Specjalisty ds. Public Relations do pracy w naszym dziale komunikacji w Lublinie. Wynagrodzenie: 6500 PLN + benefity. Wymagania: doświadczenie w PR, umiejętność tworzenia komunikatów prasowych, dobra znajomość języka angielskiego.""",

    """Firma GreenEnergy rekrutuje Inżyniera Energetyka do pracy w naszym zakładzie w Katowicach. Oferujemy wynagrodzenie od 8500 PLN, pakiet benefitów oraz możliwość pracy nad projektami z zakresu odnawialnych źródeł energii. Wymagane: wykształcenie wyższe w dziedzinie energetyki, doświadczenie w projektowaniu systemów energetycznych.""",

    """Jako TechMasters, oferujemy stanowisko Programista Java w naszym zespole w Poznaniu. Wynagrodzenie: 8000 PLN + premie. Wymagania: doświadczenie z Java SE i EE, znajomość Spring Framework, umiejętność pracy w zespole.""",

    """Firma HealthPlus szuka Specjalisty ds. Rekrutacji do pracy w naszym biurze w Wrocławiu. Oferujemy wynagrodzenie w przedziale 6000 PLN oraz pakiet benefitów. Wymagane: doświadczenie w rekrutacji, umiejętność prowadzenia rozmów kwalifikacyjnych, znajomość narzędzi rekrutacyjnych.""",

    """Poszukujemy Specjalisty ds. BHP do pracy w naszym zakładzie produkcyjnym w Bydgoszczy. Wynagrodzenie: 7000 PLN + premie. Wymagania: wykształcenie wyższe w dziedzinie BHP, doświadczenie w audytach BHP, znajomość przepisów prawa pracy.""",

    """Firma AutoTech rekrutuje Mechanika Samochodowego do pracy w naszym serwisie w Toruniu. Oferujemy wynagrodzenie od 5500 PLN, pakiet benefitów oraz możliwość rozwoju zawodowego. Wymagane: doświadczenie w naprawie samochodów, znajomość diagnostyki komputerowej, umiejętność pracy w zespole.""",

    """Jako DigitalMasters, oferujemy stanowisko Specjalisty ds. SEO/SEM w naszym biurze w Warszawie. Wynagrodzenie: 7500 PLN + premie. Wymagania: doświadczenie w SEO i SEM, znajomość narzędzi Google Ads i Google Analytics, umiejętność analizy danych.""",

    """Firma HealthCare poszukuje Farmaceuty do pracy w naszej aptece w Łodzi. Oferujemy wynagrodzenie w przedziale 5000-7000 PLN oraz pakiet benefitów. Wymagane: wykształcenie wyższe w dziedzinie farmacji, doświadczenie w aptece, znajomość aktualnych przepisów farmaceutycznych.""",

    """Poszukujemy Specjalisty ds. Zarządzania Zapasami do pracy w naszym magazynie w Zielonej Górze. Wynagrodzenie: 6000 PLN + premie. Wymagania: doświadczenie w zarządzaniu zapasami, znajomość systemów WMS, umiejętność analizy danych magazynowych.""",

    """Firma EduTech rekrutuje Specjalistę ds. E-learningu do pracy w naszym biurze w Krakowie. Oferujemy wynagrodzenie od 6500 PLN, pakiet benefitów oraz możliwość pracy zdalnej. Wymagane: doświadczenie w tworzeniu kursów online, znajomość narzędzi e-learningowych, umiejętność pracy w zespole.""",

    """Jako GreenSolutions, oferujemy stanowisko Specjalisty ds. Energooszczędności w naszym zespole w Gdyni. Wynagrodzenie: 8000 PLN + benefity. Wymagania: doświadczenie w projektach energooszczędnych, znajomość systemów zarządzania energią, umiejętność analizy zużycia energii.""",

    """Firma AgroLife szuka Technika Rolnika do pracy w naszym gospodarstwie w Olsztynie. Oferujemy wynagrodzenie od 4500 PLN, pakiet benefitów oraz możliwość pracy na nowoczesnym sprzęcie. Wymagane: doświadczenie w pracy na gospodarstwie, znajomość technik uprawy roślin, umiejętność obsługi maszyn rolniczych.""",

    """Poszukujemy Specjalisty ds. Zarządzania Relacjami z Klientami do pracy w naszym biurze w Lublinie. Wynagrodzenie: 7000 PLN + premie. Wymagania: doświadczenie w zarządzaniu relacjami z klientami, umiejętność negocjacji, dobra znajomość języka angielskiego.""",

    """Firma HealthPlus rekrutuje Fizjoterapeutę do pracy w naszej klinice w Rzeszowie. Oferujemy wynagrodzenie w przedziale 5500-7500 PLN oraz pakiet benefitów. Wymagane: wykształcenie wyższe w dziedzinie fizjoterapii, doświadczenie w pracy z pacjentami, znajomość nowoczesnych metod terapii.""",

    """Jako TechMasters, oferujemy stanowisko Backend Developera w naszym zespole w Poznaniu. Wynagrodzenie: 9000 PLN + premie. Wymagania: doświadczenie z Python i Django, znajomość baz danych SQL i NoSQL, umiejętność optymalizacji kodu.""",

    """Firma FinancePro poszukuje Specjalisty ds. Kontroli Finansowej do pracy w naszym biurze w Warszawie. Oferujemy wynagrodzenie od 8000 PLN, pakiet benefitów oraz możliwość uczestnictwa w szkoleniach. Wymagane: wykształcenie wyższe w dziedzinie finansów, doświadczenie w kontroli finansowej, znajomość systemów ERP.""",

    """Poszukujemy Specjalisty ds. IT Support do pracy w naszym dziale technicznym w Białymstoku. Wynagrodzenie: 6000 PLN + premie. Wymagania: doświadczenie w IT support, znajomość systemów operacyjnych Windows i Linux, umiejętność rozwiązywania problemów technicznych.""",

    """Firma UrbanDesign rekrutuje Architekta Krajobrazu do pracy w naszym biurze w Szczecinie. Oferujemy wynagrodzenie w przedziale 7500-9500 PLN oraz pakiet benefitów. Wymagane: wykształcenie wyższe w dziedzinie architektury krajobrazu, doświadczenie w projektowaniu terenów zielonych, znajomość AutoCAD.""",

    """Jako DigitalSolutions, oferujemy stanowisko Specjalisty ds. Email Marketingu w naszym zespole w Gdańsku. Wynagrodzenie: 6500 PLN + premie. Wymagania: doświadczenie w email marketingu, znajomość narzędzi MailChimp lub podobnych, umiejętność tworzenia kampanii marketingowych.""",

    """Firma BioTech poszukuje Specjalisty ds. Badań Rozwojowych do pracy w naszym laboratorium w Lublinie. Oferujemy wynagrodzenie od 8500 PLN, pakiet benefitów oraz możliwość pracy nad innowacyjnymi projektami. Wymagane: wykształcenie wyższe w dziedzinie biotechnologii, doświadczenie w badaniach R&D, znajomość technik molekularnych.""",

    """Poszukujemy Specjalisty ds. Sprzedaży do pracy w naszym biurze w Gorzowie Wielkopolskim. Wynagrodzenie: 5000 PLN + prowizje. Wymagania: doświadczenie w sprzedaży B2B, umiejętność negocjacji, dobra znajomość rynku.""",

    """Firma SecureNet rekrutuje Specjalistę ds. Zarządzania Ryzykiem IT do pracy w Warszawie. Oferujemy wynagrodzenie w przedziale 9000-12000 PLN oraz pakiet benefitów. Wymagane: doświadczenie w zarządzaniu ryzykiem IT, znajomość standardów ISO 31000, umiejętność analizy zagrożeń.""",

    """Jako EduSmart, oferujemy stanowisko Koordynatora Projektów E-learningowych w naszym zespole w Krakowie. Wynagrodzenie: 7000 PLN + benefity. Wymagania: doświadczenie w koordynacji projektów edukacyjnych, znajomość narzędzi e-learningowych, umiejętność zarządzania zespołem.""",

    """Firma AgroLife szuka Specjalisty ds. Agrotechniki do pracy w naszym gospodarstwie w Olsztynie. Oferujemy wynagrodzenie od 5000 PLN, pakiet benefitów oraz możliwość pracy na nowoczesnym sprzęcie. Wymagane: wykształcenie wyższe w dziedzinie agrotechniki, doświadczenie w zarządzaniu uprawami, znajomość nowoczesnych technologii rolniczych.""",

    """Poszukujemy Specjalisty ds. CRM do pracy w naszym dziale sprzedaży w Bydgoszczy. Wynagrodzenie: 7000 PLN + premie. Wymagania: doświadczenie w zarządzaniu systemami CRM, znajomość Salesforce lub podobnych narzędzi, umiejętność analizy danych sprzedażowych.""",

    """Firma HealthCare rekrutuje Specjalistę ds. Logistyki Medycznej do pracy w naszej klinice w Łodzi. Oferujemy wynagrodzenie w przedziale 8000 PLN oraz pakiet benefitów. Wymagane: doświadczenie w logistyce medycznej, umiejętność zarządzania łańcuchem dostaw, znajomość przepisów BHP.""",

    """Jako TechInnovators, oferujemy stanowisko Software Architect w naszym zespole w Poznaniu. Wynagrodzenie: 12000 PLN + premie. Wymagania: doświadczenie w projektowaniu architektury oprogramowania, znajomość mikroserwisów, umiejętność pracy z zespołem deweloperskim.""",

    """Firma MarketMasters szuka Specjalisty ds. Analizy Rynku do pracy w naszym biurze w Lublinie. Oferujemy wynagrodzenie od 7000 PLN, pakiet benefitów oraz możliwość rozwoju zawodowego. Wymagane: doświadczenie w analizie rynku, umiejętność tworzenia raportów, znajomość narzędzi analitycznych.""",

    """Poszukujemy Specjalisty ds. BHP do pracy w naszym zakładzie produkcyjnym w Zielonej Górze. Wynagrodzenie: 7500 PLN + premie. Wymagania: wykształcenie wyższe w dziedzinie BHP, doświadczenie w audytach BHP, znajomość przepisów prawa pracy.""",

    """Firma AutoDrive rekrutuje Specjalistę ds. Serwisu Samochodów elektrycznych do pracy w naszym serwisie w Toruniu. Oferujemy wynagrodzenie od 6000 PLN, pakiet benefitów oraz możliwość pracy nad nowoczesnymi pojazdami. Wymagane: doświadczenie w serwisie samochodów elektrycznych, znajomość diagnostyki pojazdów, umiejętność pracy w zespole.""",

    """Jako DigitalMasters, oferujemy stanowisko Specjalisty ds. PPC w naszym zespole w Warszawie. Wynagrodzenie: 8000 PLN + premie. Wymagania: doświadczenie w kampaniach PPC, znajomość Google Ads i Bing Ads, umiejętność optymalizacji budżetu reklamowego.""",

    """Firma BioHealth poszukuje Specjalisty ds. Kontroli Jakości do pracy w naszym laboratorium w Lublinie. Oferujemy wynagrodzenie od 8500 PLN, pakiet benefitów oraz możliwość pracy nad innowacyjnymi projektami. Wymagane: doświadczenie w kontroli jakości, znajomość standardów ISO, umiejętność pracy z dokumentacją laboratoryjną.""",

    """Poszukujemy Specjalisty ds. Zarządzania Treścią do pracy w naszym dziale marketingu w Gorzowie Wielkopolskim. Wynagrodzenie: 7000 PLN + premie. Wymagania: doświadczenie w zarządzaniu treścią, znajomość CMS, umiejętność tworzenia strategii contentowej.""",

    """Firma SecureNet rekrutuje Specjalistę ds. Testowania Oprogramowania do pracy w Warszawie. Oferujemy wynagrodzenie w przedziale 8000-10000 PLN oraz pakiet benefitów. Wymagane: doświadczenie w testowaniu oprogramowania, znajomość narzędzi do automatyzacji testów, umiejętność tworzenia scenariuszy testowych.""",

    """Jako EduSmart, oferujemy stanowisko Specjalisty ds. Edukacji Online w naszym zespole w Krakowie. Wynagrodzenie: 7500 PLN + benefity. Wymagania: doświadczenie w edukacji online, znajomość narzędzi e-learningowych, umiejętność tworzenia interaktywnych materiałów edukacyjnych.""",

    """Firma AgroLife szuka Specjalisty ds. Zarządzania Gospodarstwem do pracy w naszym gospodarstwie w Olsztynie. Oferujemy wynagrodzenie od 6000 PLN, pakiet benefitów oraz możliwość pracy na nowoczesnym sprzęcie. Wymagane: wykształcenie wyższe w dziedzinie zarządzania gospodarstwem, doświadczenie w pracy na gospodarstwie, znajomość nowoczesnych technologii rolniczych.""",

    """Poszukujemy Specjalisty ds. Zarządzania Projektem IT do pracy w naszym dziale technicznym w Bydgoszczy. Wynagrodzenie: 9000 PLN + premie. Wymagania: doświadczenie w zarządzaniu projektami IT, znajomość metodologii Agile, umiejętność pracy z narzędziami PM.""",

    """Firma HealthCare rekrutuje Specjalistę ds. Informatyki Medycznej do pracy w naszej klinice w Łodzi. Oferujemy wynagrodzenie w przedziale 8500 PLN oraz pakiet benefitów. Wymagane: wykształcenie wyższe w dziedzinie informatyki medycznej, doświadczenie w zarządzaniu systemami informatycznymi, znajomość standardów HL7.""",

    """Jako TechInnovators, oferujemy stanowisko Front-End Developer w naszym zespole w Poznaniu. Wynagrodzenie: 8000 PLN + premie. Wymagania: doświadczenie z HTML, CSS, JavaScript, znajomość frameworków React lub Angular, umiejętność tworzenia responsywnych stron.""",

    """Firma MarketMasters szuka Specjalisty ds. Badania Rynku do pracy w naszym biurze w Lublinie. Oferujemy wynagrodzenie od 7000 PLN, pakiet benefitów oraz możliwość rozwoju zawodowego. Wymagane: doświadczenie w badaniach rynku, umiejętność tworzenia ankiet i analiz, znajomość narzędzi analitycznych.""",

    """Poszukujemy Specjalisty ds. Zarządzania Relacjami z Partnerami do pracy w naszym biurze w Zielonej Górze. Wynagrodzenie: 7500 PLN + premie. Wymagania: doświadczenie w zarządzaniu relacjami biznesowymi, umiejętność negocjacji, dobra znajomość języka angielskiego.""",

    """Firma AutoTech rekrutuje Specjalistę ds. Diagnostyki Samochodowej do pracy w naszym serwisie w Toruniu. Oferujemy wynagrodzenie od 6000 PLN, pakiet benefitów oraz możliwość pracy z nowoczesnymi narzędziami diagnostycznymi. Wymagane: doświadczenie w diagnostyce samochodowej, znajomość systemów OBD, umiejętność pracy w zespole.""",

    """Jako DigitalMasters, oferujemy stanowisko Specjalisty ds. Analizy Danych w naszym zespole w Warszawie. Wynagrodzenie: 8500 PLN + premie. Wymagania: doświadczenie w analizie danych, znajomość narzędzi takich jak SQL, Python, umiejętność tworzenia wizualizacji danych.""",

    """Firma BioHealth poszukuje Specjalisty ds. Zarządzania Jakością do pracy w naszym laboratorium w Lublinie. Oferujemy wynagrodzenie w przedziale 9000 PLN oraz pakiet benefitów. Wymagane: doświadczenie w zarządzaniu jakością, znajomość standardów ISO 9001, umiejętność pracy z dokumentacją laboratoryjną.""",

    """Poszukujemy Specjalisty ds. Marketingu Cyfrowego do pracy w naszym dziale marketingu w Gorzowie Wielkopolskim. Wynagrodzenie: 7000 PLN + premie. Wymagania: doświadczenie w marketingu cyfrowym, znajomość narzędzi SEO/SEM, umiejętność analizy kampanii marketingowych.""",

    """Firma SecureNet rekrutuje Specjalistę ds. Compliance IT do pracy w Warszawie. Oferujemy wynagrodzenie w przedziale 9500-12000 PLN oraz pakiet benefitów. Wymagane: doświadczenie w compliance IT, znajomość regulacji prawnych, umiejętność tworzenia raportów zgodności.""",

    """Jako EduSmart, oferujemy stanowisko Specjalisty ds. Programów Edukacyjnych w naszym zespole w Krakowie. Wynagrodzenie: 7500 PLN + benefity. Wymagania: doświadczenie w tworzeniu programów edukacyjnych, znajomość narzędzi e-learningowych, umiejętność pracy z zespołem.""",

    """Firma AgroLife szuka Specjalisty ds. Sprzętu Rolniczego do pracy w naszym gospodarstwie w Olsztynie. Oferujemy wynagrodzenie od 5000 PLN, pakiet benefitów oraz możliwość pracy na nowoczesnym sprzęcie. Wymagane: doświadczenie w obsłudze sprzętu rolniczego, znajomość technik uprawy, umiejętność pracy w zespole.""",

    """Poszukujemy Specjalisty ds. Zarządzania Dokumentacją do pracy w naszym biurze w Bydgoszczy. Wynagrodzenie: 7000 PLN + premie. Wymagania: doświadczenie w zarządzaniu dokumentacją, znajomość systemów DMS, umiejętność organizacji pracy.""",

    """Firma HealthCare rekrutuje Specjalistę ds. Informatyki Medycznej do pracy w naszej klinice w Łodzi. Oferujemy wynagrodzenie w przedziale 9000 PLN oraz pakiet benefitów. Wymagane: wykształcenie wyższe w dziedzinie informatyki medycznej, doświadczenie w zarządzaniu systemami informatycznymi, znajomość standardów HL7.""",

    """Jako TechInnovators, oferujemy stanowisko Full-Stack Developera w naszym zespole w Poznaniu. Wynagrodzenie: 10000 PLN + premie. Wymagania: doświadczenie z JavaScript (React, Node.js), znajomość baz danych SQL i NoSQL, umiejętność tworzenia responsywnych aplikacji.""",

    """Firma MarketMasters szuka Specjalisty ds. Badania Rynku do pracy w naszym biurze w Lublinie. Oferujemy wynagrodzenie od 7500 PLN, pakiet benefitów oraz możliwość rozwoju zawodowego. Wymagane: doświadczenie w badaniach rynku, umiejętność tworzenia ankiet i analiz, znajomość narzędzi analitycznych.""",

    """Poszukujemy Specjalisty ds. Zarządzania Relacjami z Partnerami do pracy w naszym biurze w Zielonej Górze. Wynagrodzenie: 8000 PLN + premie. Wymagania: doświadczenie w zarządzaniu relacjami biznesowymi, umiejętność negocjacji, dobra znajomość języka angielskiego.""",

    """Firma AutoTech rekrutuje Specjalistę ds. Diagnostyki Samochodowej do pracy w naszym serwisie w Toruniu. Oferujemy wynagrodzenie od 6500 PLN, pakiet benefitów oraz możliwość pracy z nowoczesnymi narzędziami diagnostycznymi. Wymagane: doświadczenie w diagnostyce samochodowej, znajomość systemów OBD, umiejętność pracy w zespole.""",

    """Jako DigitalMasters, oferujemy stanowisko Specjalisty ds. Analizy Danych w naszym zespole w Warszawie. Wynagrodzenie: 9000 PLN + premie. Wymagania: doświadczenie w analizie danych, znajomość narzędzi takich jak SQL, Python, umiejętność tworzenia wizualizacji danych.""",

    """Firma BioHealth poszukuje Specjalisty ds. Zarządzania Jakością do pracy w naszym laboratorium w Lublinie. Oferujemy wynagrodzenie w przedziale 9500 PLN oraz pakiet benefitów. Wymagane: doświadczenie w zarządzaniu jakością, znajomość standardów ISO 9001, umiejętność pracy z dokumentacją laboratoryjną.""",

    """Poszukujemy Specjalisty ds. Marketingu Cyfrowego do pracy w naszym dziale marketingu w Gorzowie Wielkopolskim. Wynagrodzenie: 7500 PLN + premie. Wymagania: doświadczenie w marketingu cyfrowym, znajomość narzędzi SEO/SEM, umiejętność analizy kampanii marketingowych."""
]


In [None]:
for job_posting in jobs:
    doc = nlp(job_posting)

    matches = matcher(doc)

    job_title = []
    company = []
    location = []
    salary = []
    skills = []

    firma_index = job_posting.find("Firma oferuje")
    if firma_index != -1:
        job_posting = job_posting[:firma_index].strip()
    else:
        job_posting = job_posting

    doc = nlp(job_posting)

    for match_id, start, end in matches:
        span = doc[start:end]
        match_label = nlp.vocab.strings[match_id]

        if match_label == "Stanowisko":
            job_title_tokens = [token.text for token in span if token.text not in ["doświadczonego", "stanowisko", "Poszukujemy", "rekrutuje", "szukamy", "szuka", "poszukuje"]]
            job_title = " ".join(job_title_tokens)
            job_title = job_title.replace("ds .", "ds.")
            job_title = job_title.replace(" - ", "-")
            job_title = job_title.replace(" / ", "/")
        elif match_label == "Firma":
            company_tokens = [token.text for token in span if token.text.lower() not in ["firma", "jako", "jesteśmy"]]
            company = " ".join(company_tokens)
        elif match_label == "Lokalizacja":
            location = span.text
        elif match_label == "Wynagrodzenie":
            salary_tokens = [token.text for token in span if token.text.lower() not in [":", "przedziale"]]
            salary = " ".join(salary_tokens)
        elif match_label == "Wymagane Umiejętności":
            skills_tokens = [token.text for token in span if token.text not in ["umiejętności", "Wymagania", "Wymagane", ":", "."]]
            skills = " ".join(skills_tokens)
            skills = skills.replace(" , ", ", ")
            skills = skills.replace(" - ", "-")
            skills = skills.replace(" / ", "/")
            skills = skills.replace("( ", "(")
            skills = skills.replace(" )", ")")
            skills = skills.replace(" / ", "/")

    company = company if company else "brak"

    print(f"Stanowisko: {job_title}")
    print(f"Firma: {company}")
    print(f"Lokalizacja: {location}")
    print(f"Wynagrodzenie: {salary}")
    print(f"Wymagane Umiejętności: {skills}")
    print("\n")

Stanowisko: Programisty C++
Firma: TechWave
Lokalizacja: w Katowicach
Wynagrodzenie: 9000 - 14000 PLN
Wymagane Umiejętności: C++, STL, Git, znajomość algorytmów


Stanowisko: Analityka Biznesowego
Firma: InnovateX
Lokalizacja: w Poznaniu
Wynagrodzenie: od 7500 PLN
Wymagane Umiejętności: posiadać co najmniej 3 lata doświadczenia w analizie danych


Stanowisko: Specjalisty ds. SEO
Firma: brak
Lokalizacja: do pracy zdalnej
Wynagrodzenie: 5000 PLN
Wymagane Umiejętności: optymalizacja stron, Google Analytics, znajomość języka angielskiego na poziomie B2


Stanowisko: Inżyniera Mechanika
Firma: GlobalTech
Lokalizacja: w Łodzi
Wynagrodzenie: od 8000 PLN
Wymagane Umiejętności: AutoCAD, doświadczenie w projektowaniu maszyn, znajomość norm ISO


Stanowisko: Kierownika Produkcji
Firma: EkoEnergia
Lokalizacja: w Gdyni
Wynagrodzenie: 10 000 PLN
Wymagane Umiejętności: mieć doświadczenie w zarządzaniu zespołem i optymalizacji procesów


Stanowisko: Junior Front-End Developera
Firma: brak
Lokalizacja: