# Język naturalny w inżynierii

Przetwarzanie języka naturalnego (NLP) umożliwia komputerom rozumienie, interpretację i generowanie ludzkiego języka. Istnieją trzy fundamentalne powody, dla których komputery wykonują NLP: **po pierwsze**, aby komunikować się z ludźmi w naturalny, intuicyjny sposób; **po drugie**, aby uczyć się z ogromnych ilości informacji tekstowych; i **po trzecie**, aby rozwijać naukowe zrozumienie samego języka poprzez łączenie narzędzi AI z lingwistyką, psychologią poznawczą i neuronauk.

NLP to wcale nie nowa dziedzina. Jej korzenie sięgają 1949 roku, kiedy Claude Shannon i Warren Weaver opracowali pierwszy model N-gramów słów w języku angielskim, kładąc podwaliny pod statystyczne przetwarzanie języka. Podróż kontynuowała model Bag-of-Words (1954), Latent Semantic Indexing (LSI, 1990) i Latent Dirichlet Allocation (LDA, 2002). Ekstrakcja informacji nabrała rozpędu dzięki corocznym konferencjom Message Understanding Conferences (MUC) sponsorowanym przez rząd USA od 1997 roku. Rewolucja deep learningu przyniosła embeddingsy słów (Word2Vec, 2013), rekurencyjne sieci neuronowe, LSTM i jednostki GRU. Zmiana paradygmatu nastąpiła w 2017 roku wraz z przełomowym artykułem "Attention Is All You Need", wprowadzającym transformery. Najnowszym osiągnięciem, w 2024 roku, DeepSeek opublikował raporty techniczne o modelach rozumowania trenowanych przez uczenie ze wzmocnieniem, przesuwając granice jeszcze dalej.

```mermaid
timeline
    title Evolution of Natural Language Processing
    1949 : N-gram Models (Shannon & Weaver)
    1954 : Bag-of-Words
    1990 : Latent Semantic Indexing (LSI)
    1997 : Message Understanding Conferences (MUC)
    2002 : Latent Dirichlet Allocation (LDA)
    2013 : Word2Vec & Embeddings
    2014-2016 : RNNs, LSTMs, GRUs
    2017 : Transformers ("Attention Is All You Need")
    2024 : Reasoning Models (DeepSeek)
```

### 1.1 Dane tekstowe w inżynierii

Inżynierowie pracują w świecie nasyconym nieustrukturyzowanym tekstem. Codziennie technicy piszą dzienniki konserwacji opisujące zachowanie urządzeń, menedżerowie sporządzają raporty zmianowe, klienci zgłaszają reklamacje gwarancyjne i opinie, a zespoły projektowe tworzą dokumentację. Ale tekst nie tylko wypływa z inżynierii, a otacza inżynierów na każdym kroku.

Rozważmy typowe środowisko inżynierskie: **normy i specyfikacje** definiują, co należy zbudować; **Standardowe Procedury Operacyjne (SOP)** dyktują, jak wykonywać pracę; **transkrypcje spotkań** z klientami lub zarządem zawierają wymagania i ograniczenia. Inżynierowie analizują **raporty z testów prototypów**, analizują **reklamacje klientów** i studiują **dokumenty patentowe**, które służą jako plany rozwiązywania problemów w różnych branżach. Dokumentacja techniczna przechowuje dziesięciolecia wiedzy instytucjonalnej o trybach awarii, decyzjach projektowych i skutecznych rozwiązaniach.

To bogactwo informacji tekstowych stanowi zarówno szansę, jak i wyzwanie. NLP umożliwia inżynierom:

- Automatyczne przetwarzanie i kategoryzowanie dzienników konserwacji
- Wydobywanie spostrzeżeń z opinii klientów na dużą skalę
- Przeszukiwanie rozległych archiwów technicznych w poszukiwaniu odpowiednich precedensów
- Interfejsowanie z narzędziami inżynierskimi za pomocą języka naturalnego
- Konwersję mowy na tekst dla dokumentacji bez użycia rąk

```mermaid
graph TD
    A[Engineering Text Sources] --> B[Internal Sources]
    A --> C[External Sources]
    A --> D[Documentation]

    B --> B1[Maintenance Logs]
    B --> B2[Shift Reports]
    B --> B3[Meeting Transcripts]
    B --> B4[Test Reports]

    C --> C1[Customer Feedback]
    C --> C2[Warranty Claims]
    C --> C3[Complaint Forms]
    C --> C4[Patent Documents]

    D --> D1[Standards & Specs]
    D --> D2[SOPs]
    D --> D3[Design Documentation]
    D --> D4[Technical Manuals]
```

### 1.2 NLP w przepływie pracy inżynierskiej

NLP stał się istotnym komponentem nowoczesnych systemów wspomagania decyzji inżynierskich. Zamiast ręcznie przeszukiwać tysiące dzienników konserwacji lub recenzji klientów, inżynierowie mogą wykorzystać NLP do wyodrębniania wzorców, identyfikowania powtarzających się awarii i priorytetyzacji problemów według wagi i częstotliwości.

**Typowe zastosowania NLP w inżynierii obejmują:**

- **Wykrywanie i diagnostyka usterek**: Automatyczna analiza dzienników techników w celu identyfikacji problemów z urządzeniami zanim się nasilą
- **Analiza opinii klientów**: Przetwarzanie recenzji i reklamacji w celu odkrywania słabości projektowych lub próśb o nowe funkcje
- **Wyszukiwanie dokumentacji**: Przeszukiwanie instrukcji technicznych i historycznych zapisów za pomocą podobieństwa semantycznego zamiast dokładnego dopasowania słów kluczowych
- **Automatyczne raportowanie**: Generowanie podsumowań działań konserwacji prewencyjnej
- **Interfejsy głosowe**: Użycie mowy na tekst do dokumentowania ustaleń bez użycia rąk w terenie oraz tekstu na mowę dla dostępności

Tradycyjne wyszukiwanie oparte na słowach kluczowych zawodzi, gdy inżynierowie muszą znaleźć koncepcyjnie podobne awarie lub gdy terminologia różni się między zespołami. **Wyszukiwanie oparte na embeddingach** — które zgłębimy szczegółowo — umożliwia znajdowanie semantycznie powiązanych treści nawet gdy używane są różne słowa. Na przykład, wyszukiwanie "wibracji łożyska" może wydobyć dzienniki o "oscylacji wału" lub "wyważeniu wirnika", ponieważ te koncepcje są blisko powiązane znaczeniowo.

## 2. Dlaczego język naturalny jest trudny

Język naturalny jest fundamentalnie wyzwaniem dla komputerów, ponieważ ewoluował dla komunikacji międzyludzkiej, a nie przetwarzania maszynowego. W przeciwieństwie do języków programowania z ścisłą składnią i jednoznacznym znaczeniem, język ludzki jest nieuporządkowany, zależny od kontekstu i pełen ukrytej wiedzy. W zastosowaniach inżynierskich te wyzwania są wzmocnione przez żargon techniczny, skróconą notację i nieformalny styl dokumentacji terenowej.

**Niejednoznaczność i polisemia**: Słowa często mają wiele znaczeń w zależności od kontekstu. W inżynierii słowo "łożysko" może odnosić się do komponentu mechanicznego, pomiaru kierunkowego lub nośności obciążenia. "Uszczelnienie" może oznaczać uszczelkę lub powłokę. "Pęknięcie" może opisywać złamanie, dźwięk słyszalny lub akt rozwiązywania problemu. Bez kontekstu maszyny mają trudności z określeniem, które znaczenie ma zastosowanie.

**Pragmatyka i skróty techników**: Technicy terenu rzadko piszą w pełnych zdaniach. Dziennik konserwacji może brzmieć "pompa #3 głośna, sprawdz łożyska OK, mzl kawitacja" — skrótowo, nieformalnie i wymagająco wiedzy dziedzinowej do interpretacji. Znaczenie zależy nie tylko od słów, ale od wspólnego zrozumienia procedur konserwacji i zachowania urządzeń.

**Kwantyfikacja, czas i modalność**: Język inżynierski jest pełen niejasnych kwantyfikatorów i niepewności. Wyrażenia takie jak "nieco wyższa temperatura", "zauważalna wibracja" lub "może wkrótce zawieść" są subiektywne i zależne od kontekstu. Co liczy się jako "nieco wyższa" zależy od normalnych warunków pracy. "Może zawieść" wyraża niepewność co do przyszłych wydarzeń. Odniesienia czasowe jak "sprawdzono wczoraj" lub "działa gorąco od wtorku" wymagają śledzenia czasu i powiązania wydarzeń chronologicznie.

**Zależności długodystansowe**: W piśmie technicznym relacje przyczynowo-skutkowe często obejmują wiele zdań, a nawet akapitów. Technik może opisać objawy w jednym zdaniu, podjęte działania w innym, a wyniki w trzecim. Zrozumienie wymaga połączenia informacji w całej narracji: "Silnik przegrzewał się. Wyczyszczono filtry. Temperatura się znormalizowała." Ukryte połączenie — że czyszczenie filtrów rozwiązało przegrzewanie — nie jest wyrażone wprost.

**Żargon specyficzny dla dziedziny**: Każda dyscyplina inżynierska ma wyspecjalizowane słownictwo i skróty. "FFT", "RMS", "EOL", "MTBF", "SOP" — nie znaczą nic poza swoim kontekstem technicznym. Co gorsza, ten sam skrót może oznaczać różne rzeczy w różnych dziedzinach. "PSI" może być funtami na cal kwadratowy w jednej dziedzinie i inspekcją przed wysyłką w innej. Systemy NLP muszą być trenowane na korpusach specyficznych dla dziedziny, aby poprawnie obsługiwać tę terminologię.

## 3. Ewolucja algorytmów NLP

### 3.1 Klasyczne NLP: Bag of Words

Najwcześniejsze podejście obliczeniowe do tekstu było niezwykle proste: policzyć słowa. Model **Bag-of-Words (BoW)** traktuje dokument jako nieuporządkowany zbiór słów, całkowicie ignorując gramatykę i kolejność słów. Każdy dokument staje się wektorem liczników słów.

```mermaid
graph LR
    A["Motor vibration excessive"] --> B[Tokenize]
    B --> C["['motor', 'vibration', 'excessive']"]
    C --> D[Count]
    D --> E["{'motor': 1, 'vibration': 1, 'excessive': 1}"]
```

Udoskonaleniem zwanym **TF-IDF** (Term Frequency-Inverse Document Frequency) jest ważenie słów według ich wyróżnialności: typowe słowa jak "the" otrzymują niskie wagi, podczas gdy rzadkie terminy techniczne otrzymują wysokie wagi. To pomaga identyfikować dokumenty o określonych tematach.

### 3.2 Ograniczenia klasycznych podejść

Bag-of-Words katastrofalnie zawodzi na tekście inżynierskim:

- **Brak semantyki**: "łożysko uległo awarii" i "łożysko działa normalnie" zawierają te same słowa, ale przeciwne znaczenia
- **Brak kolejności słów**: "pompa uszkodziła silnik" vs "silnik uszkodził pompę" są traktowane identycznie
- **Brak kontekstu**: "uszczelnienie" jako komponent i "uszczelnienie" jako czasownik są nieodróżnialne
- **Rzadkie wektory**: Większość słów pojawia się w niewielu dokumentach, tworząc ogromne, głównie zerowe wektory
- **Brak podobieństwa**: "wibracja" i "oscylacja" są traktowane jako całkowicie niepowiązane słowa pomimo bycia blisko-synonimami

Te ograniczenia czynią BoW nieodpowiednim do wyszukiwania semantycznego. Znajdowanie podobnych awarii wymaga zrozumienia znaczenia, nie tylko dopasowania słów kluczowych.

### 3.3 Nowoczesne NLP: Embeddingsy

Przełom nastąpił wraz z **embeddingsami słów**: gęstymi, niskodymensjonalnymi wektorami, które uchwytują znaczenie semantyczne. Zamiast rzadkich wektorów liczników słów, każde słowo (lub fraza, lub zdanie) jest reprezentowane jako punkt w ciągłej przestrzeni wektorowej — zazwyczaj 300-768 wymiarów. Słowa o podobnych znaczeniach grupują się razem w tej przestrzeni.

**Embeddingsy słów** są uczone przez trenowanie sieci neuronowych na ogromnych korpusach tekstowych. Sieci uczą się przewidywać słowa z kontekstu, a w procesie odkrywają, że "wibracja" i "oscylacja" pojawiają się w podobnych kontekstach i powinny mieć podobne reprezentacje. Nowoczesne modele oparte na transformerach jak BERT i GPT idą dalej, tworząc **embeddingsy kontekstowe**, gdzie to samo słowo otrzymuje różne wektory w zależności od użycia.

**t-SNE (t-Distributed Stochastic Neighbor Embedding)** to technika redukcji wymiarowości, która projektuje wysokodymensjonalne embeddingsy do 2D lub 3D dla wizualizacji. Zachowuje strukturę lokalną: punkty, które są blisko w przestrzeni wysokodymensjonalnej, pozostają blisko w wizualizacji.

In [None]:
from sentence_transformers import SentenceTransformer
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity

# Load a pre-trained embedding model
model = SentenceTransformer("all-MiniLM-L6-v2")

# Engineering analogy: motor : electric :: pump : ?
words = [
    "motor",
    "electric motor",
    "pump",
    "electric pump",
    "hydraulic pump",
    "diesel engine",
    "electric generator",
]

# Generate embeddings
embeddings = model.encode(words, device='cpu')

# Calculate: "electric motor" - "motor" + "pump"
motor_vec = embeddings[0]
electric_motor_vec = embeddings[1]
pump_vec = embeddings[2]

# The "electric" concept vector
electric_concept = electric_motor_vec - motor_vec

# Add it to pump
result_vec = pump_vec + electric_concept

# Find closest match
similarities = cosine_similarity([result_vec], embeddings)[0]
most_similar_idx = np.argmax(similarities)

print(f"motor : electric motor :: pump : {words[most_similar_idx]}")

To demonstruje, że embeddingsy uchwytują relacje koncepcyjne. Arytmetyka wektorowa "przechwytuje" koncepcję "elektrycznego" i przenosi ją z silników na pompy.

### 3.4 Semantyka jako geometria

Embeddingsy przekształcają język w geometrię. Podobieństwo semantyczne staje się bliskością przestrzenną: podobne koncepcje grupują się razem, a odległość między punktami odzwierciedla ich różnicę koncepcyjną. Ten widok geometryczny umożliwia potężne możliwości wyszukiwania — możemy znaleźć elementy "bliskie" zapytaniu w przestrzeni znaczenia, nawet jeśli nie dzielą żadnych słów kluczowych.

Zwizualizujmy tę zasadę. Osadźmy zestaw terminów awarii inżynierskich, zredukujmy je do 2D za pomocą t-SNE i zobaczmy, gdzie ląduje zapytanie:

In [None]:
from sentence_transformers import SentenceTransformer
from sklearn.manifold import TSNE
import matplotlib.pyplot as plt
import numpy as np

# Load model
model = SentenceTransformer('all-MiniLM-L6-v2')

# Engineering failure modes (grouped by type)
terms = [
    # Vibration-related
    "bearing vibration", "shaft oscillation", "rotor imbalance", "resonance",
    # Thermal-related
    "overheating", "high temperature", "thermal expansion", "cooling failure",
    # Lubrication-related
    "oil contamination", "insufficient lubrication", "grease degradation",
    # Structural-related
    "crack propagation", "material fatigue", "corrosion", "deformation"
]

# Query
query = "vibration problem"

# Embed all terms + query
all_texts = terms + [query]
embeddings = model.encode(all_texts, device='cpu')

# Reduce to 2D with t-SNE
tsne = TSNE(n_components=2, random_state=42, perplexity=5)
coords_2d = tsne.fit_transform(embeddings)

# Separate query from terms
term_coords = coords_2d[:-1]
query_coord = coords_2d[-1]

# Plot
plt.figure(figsize=(6, 6))
plt.scatter(term_coords[:, 0], term_coords[:, 1], c='blue', label='Failure modes', alpha=0.6)
plt.scatter(query_coord[0], query_coord[1], c='red', s=200, marker='*', label='Query', edgecolors='black', linewidths=2)

# Annotate points
for i, term in enumerate(terms):
    plt.annotate(term, (term_coords[i, 0], term_coords[i, 1]), fontsize=8, alpha=0.7)
plt.annotate(query, (query_coord[0], query_coord[1]), fontsize=10, fontweight='bold', color='red')

plt.xlabel('t-SNE Dimension 1')
plt.ylabel('t-SNE Dimension 2')
plt.title('Semantic Space of Engineering Failure Modes')
plt.legend()
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

## 4. Typowe zadania NLP

Teraz, gdy rozumiemy embeddingsy, zbadajmy typowe zadania NLP, które inżynierowie mogą wykorzystać. Każde zadanie adresuje inny aspekt rozumienia tekstu. Zademonstrujemy je za pomocą prostych, praktycznych przykładów.

### 4.1 Klasyfikacja tekstu

**Czym to jest:** Przypisywanie predefiniowanych kategorii lub etykiet do tekstu. Na przykład, klasyfikacja opinii klientów jako pozytywnych/negatywnych, lub e-maili jako spam/nie spam.

**Zastosowanie inżynierskie:** Kategoryzacja raportów konserwacji według wagi (krytyczne, umiarkowane, pomniejsze) lub według systemu, którego dotyczą (elektryczny, mechaniczny, hydrauliczny).

In [None]:
from transformers import pipeline

# Zero-shot classifier
classifier = pipeline("zero-shot-classification", model="facebook/bart-large-mnli", device="cpu")

# A maintenance log entry
text = "Excessive vibration detected in gearbox housing, possible bearing wear"

# Candidate categories (we just make these up!)
candidate_labels = ["vibration issue", "thermal issue", "lubrication issue", "electrical issue"]

# Classify
result = classifier(text, candidate_labels)

print(f"Text: {text}\n")
for label, score in zip(result["labels"], result["scores"]):
    print(f"{label}: {score:.3f}")


### 4.2 Rozpoznawanie nazwanych encji (NER)

**Czym to jest:** Identyfikacja i wyodrębnianie specyficznych encji (nazw, dat, lokalizacji, organizacji) z tekstu.

**Zastosowanie inżynierskie:** Wyodrębnianie nazw komponentów, numerów części, dat i pomiarów z dzienników konserwacji lub dokumentacji technicznej.

In [None]:
from transformers import pipeline

# Load NER pipeline with a popular model (BERT-base)
ner = pipeline(
    "ner",
    model="dslim/bert-base-NER",
    aggregation_strategy="simple",
    device="cpu",
)

# Text with entities
text = "The pump manufactured by Siemens was installed in Building 7 on January 15, 2024."

# Extract entities
entities = ner(text)

print(f"Text: {text}\n")
for entity in entities:
    print(f"{entity['entity_group']}: {entity['word']} (confidence: {entity['score']:.3f})")


### 4.3 Analiza sentymentu

**Czym to jest:** Określanie emocjonalnego tonu tekstu (pozytywny, negatywny, neutralny).

**Zastosowanie inżynierskie:** Analizowanie reklamacji klientów w celu priorytetyzacji problemów, lub ocena pewności technika w rekomendacjach naprawczych ("prawdopodobnie w porządku" vs "zdecydowanie wymaga wymiany").

In [None]:
from transformers import pipeline

# Sentiment analyzer
sentiment_analyzer = pipeline("sentiment-analysis", device="cpu")

# Engineering-flavored feedback
feedback = [
    "The new cooling system works great, much quieter than before",
    "This design is terrible, constant failures every week",
    "The equipment meets specifications",
    "Extremely satisfied with the upgraded controls",
]

for text in feedback:
    result = sentiment_analyzer(text)[0]
    print(f"Feedback: {text}")
    print(f"Sentiment: {result['label']}, Score: {result['score']:.3f}\n")


## 5. RAG: Retrieval-Augmented Generation

**Wymagania wstępne:** Przed przystąpieniem do tej sekcji upewnij się, że masz:

- Zainstalowane i działające Ollama
- Pobrany model `gemma3:4b` (`ollama pull gemma3:4b`)

### 5.1 Podstawowa interakcja z LLM przy użyciu Pydantic AI

Zanim zbudujemy system RAG, najpierw zrozumijmy, jak komunikować się z LLM przy użyciu Pydantic AI. Ta biblioteka zapewnia czysty, pythoniczny interfejs do pracy z modelami językowymi.

In [None]:
import os
from dotenv import load_dotenv
from pydantic_ai import Agent
import nest_asyncio

# Allow nested event loops in Jupyter
nest_asyncio.apply()

load_dotenv()

os.environ["OLLAMA_BASE_URL"] = "http://127.0.0.1:11434/v1"
# Ollama doesn't require an API key, but pydantic_ai might need it set
os.environ["OLLAMA_API_KEY"] = "ollama"

# Create an agent connected to Ollama
agent = Agent(
    "ollama:qwen3:4b",
    instructions="Be concise, reply with one sentence.",
)

# Run a simple query
result = agent.run_sync('Where does "hello world" come from?')
print(result.output)

### 5.2 Koncepcja RAG

**Retrieval-Augmented Generation (RAG)** łączy moc wyszukiwania semantycznego z generacją LLM. Przepływ pracy to:

1. **Wyszukiwanie**: Dla zapytania użytkownika, znajdź najbardziej istotne dokumenty z bazy wiedzy używając podobieństwa embeddingów
2. **Wzbogacenie**: Dodaj pobrane dokumenty jako kontekst do promptu
3. **Generacja**: LLM generuje odpowiedź ugruntowaną w pobranych faktach

**Dlaczego RAG jest ważny dla inżynierów:** LLMy mają ogólną wiedzę, ale nie znają Twoich konkretnych urządzeń, awarii ani procedur. RAG pozwala przeszukiwać historię konserwacji Twojej organizacji, dokumenty techniczne lub decyzje projektowe tak, jakbyś rozmawiał z ekspertem, który przeczytał wszystko.

```mermaid
graph LR
    A[User Query] --> B[Embed Query]
    B --> C[Search Knowledge Base]
    C --> D[Retrieve Top-K Docs]
    D --> E[Construct Prompt with Context]
    E --> F[LLM Generate Answer]
    F --> G[Grounded Response]
```

### 5.3 Baza wiedzy: Syntetyczne dzienniki konserwacji

Do tej demonstracji użyjemy realistycznych dzienników konserwacji obejmujących typowe tryby awarii. W praktyce mogą one pochodzić z Twojego CMMS, raportów techników lub historycznych zapisów.

In [None]:
# Synthetic maintenance logs from a manufacturing facility
logs = [
    "Pump #3 shaft vibration excessive at 8mm/s, bearing replacement recommended",
    "Motor overheating, measured 95°C under normal load, cooling fan obstructed",
    "Gearbox oil contaminated with metal particles, suspect gear wear",
    "Conveyor belt slipping, tension adjustment needed",
    "Hydraulic cylinder leaking from rod seal, seal replacement required",
    "Compressor making loud knocking sound, possible valve failure",
    "Temperature sensor reading 20°C too high, calibration required",
    "Pump cavitation detected, suction line pressure too low",
    "Bearing noise increasing, vibration spectrum shows inner race defect",
    "Control panel display flickering, loose connection in power supply",
    "Lubrication system low pressure, filter clogged",
    "Shaft misalignment detected, coupling wear visible",
    "Cooling system flow reduced, heat exchanger tubes partially blocked",
    "Electrical motor drawing excess current, winding insulation degraded",
    "Pneumatic actuator slow response, air line restriction suspected",
]

print(f"Knowledge base: {len(logs)} maintenance logs")
for i, log in enumerate(logs[:3]):
    print(f"{i + 1}. {log}")
print("...")


### 5.4 Krok 1: Osadzanie bazy wiedzy

Użyjemy sentence-transformers do konwersji każdego dziennika na gęstą reprezentację wektorową. Te embeddingsy uchwytują znaczenie semantyczne, więc podobne awarie będą miały podobne wektory.

In [None]:
from sentence_transformers import SentenceTransformer
import numpy as np

# Load embedding model
model = SentenceTransformer("all-MiniLM-L6-v2")

# Embed all logs
log_embeddings = model.encode(logs, device='cpu')

print(f"Embedded {len(logs)} logs")
print(f"Each embedding is a vector of shape: {log_embeddings.shape}")
print(f"Example embedding (first 5 dimensions): {log_embeddings[0][:5]}")


### 5.5 Krok 2: Wyszukiwanie semantyczne (Retrieval)

Gdy użytkownik zadaje pytanie, osadzamy jego zapytanie i znajdujemy najbardziej podobne dzienniki używając podobieństwa cosinusowego.

In [None]:
from sklearn.metrics.pairwise import cosine_similarity

# User query
query = "Why is the pump vibrating?"

# Embed the query
query_embedding = model.encode([query])

# Calculate similarity between query and all logs
similarities = cosine_similarity(query_embedding, log_embeddings)[0]

# Get top 3 most relevant logs
top_k = 3
top_indices = np.argsort(similarities)[-top_k:][::-1]

print(f"Query: {query}\n")
print("Top 3 relevant logs:")
for i, idx in enumerate(top_indices, 1):
    print(f"{i}. [Score: {similarities[idx]:.3f}] {logs[idx]}")


### 5.6 Krok 3: Generowanie bez kontekstu (Baseline)

Najpierw zobaczmy, co się dzieje, gdy zadajemy pytanie bezpośrednio LLM, bez żadnego pobranego kontekstu. Odpowiedź będzie ogólna i potencjalnie niepoprawna.

In [None]:
from pydantic_ai import Agent

# Create agent
agent = Agent(
    "ollama:qwen3:4b",
    instructions="You are a maintenance engineer assistant. Answer questions about equipment failures.",
)

# Query without context
query = "Why is the pump vibrating?"
result = agent.run_sync(query)

print("=" * 60)
print("BASELINE (No RAG):")
print("=" * 60)
print(f"Query: {query}")
print(f"Answer: {result.output}")
print("=" * 60)

### 5.7 Krok 4: Generowanie z kontekstem (RAG)

Teraz dostarczamy pobrane dzienniki jako kontekst. LLM może ugruntować swoją odpowiedź w rzeczywistej historii konserwacji.

In [None]:
# Retrieve relevant logs (from step 5.5)
top_k = 3
top_indices = np.argsort(similarities)[-top_k:][::-1]
relevant_logs = [logs[idx] for idx in top_indices]

# Construct context
context = "\n".join([f"- {log}" for log in relevant_logs])

# Create RAG prompt
rag_prompt = f"""Based on the following maintenance logs, answer the question:

Maintenance Logs:
{context}

Question: {query}

Provide a specific answer based on the logs above."""

# Query with context
result_rag = agent.run_sync(rag_prompt)

print("\n" + "=" * 60)
print("WITH RAG:")
print("=" * 60)
print(f"Query: {query}")
print("\nRetrieved Context:")
for i, log in enumerate(relevant_logs, 1):
    print(f"  {i}. {log}")
print(f"\nAnswer: {result_rag.output}")
print("=" * 60)


### 5.8 Porównanie i dyskusja

**Kluczowe obserwacje:**

1. **Baseline (bez RAG):** Ogólna odpowiedź wspominająca typowe przyczyny takie jak niewspółosiowość, niewyważenie czy zużycie. Może być technicznie poprawna, ale nie specyficzna dla Twojego urządzenia.

2. **Z RAG:** Odpowiedź odnosi się do konkretnych dzienników, wspominając rekomendacje wymiany łożyska, pomiary wibracji wału (8mm/s) lub defekty łożysk wykryte w analizie wibracji. Odpowiedź jest ugruntowana w danych historycznych.

## 6. Podsumowanie i kolejne kroki

Omówiliśmy podstawowy zestaw narzędzi NLP dla inżynierów, przechodząc od podstawowych koncepcji do kompletnego systemu RAG:

1. **Embeddingsy** przekształcają tekst w przestrzeń geometryczną, gdzie podobieństwo semantyczne staje się mierzalną odległością
2. **Typowe zadania NLP** (klasyfikacja, NER, analiza sentymentu) dostarczają elementów składowych do rozumienia tekstu
3. **RAG** łączy wyszukiwanie i generację, pozwalając przeszukiwać wiedzę organizacyjną przy użyciu języka naturalnego

**Zasoby:**

- Sentence Transformers: <https://www.sbert.net/>
- Pydantic AI: <https://ai.pydantic.dev/>
- Hugging Face Transformers: <https://huggingface.co/docs/transformers/>

## 6. Summary & Next Steps

We've covered the essential NLP toolkit for engineers, progressing from basic concepts to a complete RAG system:

1. **Embeddings** transform text into geometric space where semantic similarity becomes measurable distance
2. **Common NLP tasks** (classification, NER, sentiment analysis) provide building blocks for text understanding
3. **RAG** combines retrieval and generation, letting you query organizational knowledge using natural language

**Next Steps for Your Projects:**

- **Start small**: Build a RAG system over your team's maintenance logs or design documents
- **Experiment with embeddings**: Try different models (all-MiniLM-L6-v2 is fast; all-mpnet-base-v2 is more accurate)
- **Refine retrieval**: Experiment with top-k values, hybrid search (combining keyword + semantic), or re-ranking
- **Evaluate quality**: Have domain experts review RAG outputs, iterate on prompt engineering
- **Scale up**: Move from toy datasets to production databases, add caching, implement feedback loops

**Resources:**
- Sentence Transformers: https://www.sbert.net/
- Pydantic AI: https://ai.pydantic.dev/
- Hugging Face Transformers: https://huggingface.co/docs/transformers/