## Zadania: LangChain Hello World i rodzaje zadań realizowanych z wykorzystaniem LLM

### Instalacja bibliotek

In [3]:
!pip install langchain-openai python-dotenv



Zadanie 1
Generowanie tekstu
1. Uruchom łańcuch (`chain`) dla 3 różnych zapytań i porównaj długość oraz strukturę odpowiedzi.
2. Dodaj prosty pomiar czasu wykonania (time.perf_counter) i wypisz wyniki.
3. Zaimplementuj funkcję pomocniczą `run_query(text: str) -> str`, która wywoła łańcuch i zwraca sam tekst odpowiedzi.

In [4]:
import os
from dotenv import load_dotenv
from langchain_openai import ChatOpenAI

load_dotenv()

# pobranie klucza OpenAI
api_key = os.getenv("OPENAI_API_KEY")
if not api_key:
    raise ValueError("Brak klucza API w pliku .env!")

# utworzenie klienta API OpenAI z wybranym modelem
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0, api_key=api_key)

# prosty prompt i request do API LLM
response = llm.invoke("Napisz krótkie pozdrowienie w języku polskim.")

print("Odpowiedź modelu:\n")
print(response.content)


Odpowiedź modelu:

Cześć! Mam nadzieję, że masz wspaniały dzień! Pozdrawiam serdecznie!


Zadanie 2
Generowanie tekstu
Uruchom łańcuch (`chain`) dla 2 różnych zapytań i porównaj długość oraz strukturę odpowiedzi.

In [5]:
response = llm.invoke("Wygeneruj przepis na słodki sernik z tuńczykiem, brokułem i cebulą.")

print("Odpowiedź modelu:\n")
print(response.content)

Odpowiedź modelu:

Oto przepis na nietypowy, słodki sernik z tuńczykiem, brokułem i cebulą. To połączenie smaków może być zaskakujące, ale spróbujmy!

### Słodki sernik z tuńczykiem, brokułem i cebulą

#### Składniki:

**Na spód:**
- 200 g herbatników (np. digestive)
- 100 g masła

**Na masę serową:**
- 500 g twarogu (najlepiej zmielonego)
- 200 g serka mascarpone
- 3 jajka
- 100 g cukru (można dostosować do smaku)
- 1 łyżeczka ekstraktu waniliowego
- 1 puszka tuńczyka w sosie własnym (odcedzonego)
- 200 g brokułów (ugotowanych na parze i drobno posiekanych)
- 1 mała cebula (drobno posiekana i podsmażona na złoto)
- Szczypta soli
- Szczypta pieprzu

**Na wierzch:**
- 100 g śmietany kremówki
- 2 łyżki cukru pudru
- Owoce do dekoracji (np. maliny, borówki)

#### Przygotowanie:

1. **Przygotowanie spodu:**
   - Rozgrzej piekarnik do 180°C.
   - Herbatniki pokrusz na drobno (możesz użyć blendera).
   - Roztop masło i wymieszaj z pokruszonymi herbatnikami.
   - Wyłóż dno tortownicy (o średn

Zadanie 3
Klasyfikacja
Zmodyfikuj teksty oraz prompt w poniższym kodzie tak aby klasyfikować sentyment tekstu (pozytywny, negatywny, neutralny). W przykładach umieść teksty o różnym sentymencie.
```
[
    "This product is amazing! I loved it.",
    "I am very disappointed. The product broke after one use.",
    "It's okay, does the job but nothing special."
]
```

In [11]:
articles = [
    "The government announced new tax reforms today.",
    "The local team won the championship in a thrilling match.",
    "New advancements in AI are reshaping the tech industry.",
    "The art exhibit showcased contemporary works by emerging artists.",
    "New guidelines for a healthy diet were published by the health department."
]
response = llm.invoke('Sklasyfikuj załączone teksty do grup "Polityka", "Sport", "Technologia", "Kultura", "Zdrowie".\n\n' + '\n'.join(articles))

print("Odpowiedź modelu:\n")
print(response.content)

Odpowiedź modelu:

Oto klasyfikacja załączonych tekstów:

1. **Polityka**: The government announced new tax reforms today.
2. **Sport**: The local team won the championship in a thrilling match.
3. **Technologia**: New advancements in AI are reshaping the tech industry.
4. **Kultura**: The art exhibit showcased contemporary works by emerging artists.
5. **Zdrowie**: New guidelines for a healthy diet were published by the health department.


Zadanie 4
Analiza dokumentu
Uruchom łańcuch dla 3 różnych promptów:
1. Dla jakich lat wartości są prezentowane w raporcie?
2. Jaka jest wartość "Netto-Cashflow" w 2019?
3. Znajdź informacje na temat rocznego przychodu firmy.

In [7]:
file = open("../../data/annual_report.html", "r")
document = file.read()
response = llm.invoke(f"Przeanalizuj załaczony dokument ____ \n\n {document}")
print("Odpowiedź modelu:\n")
print(response.content)

Odpowiedź modelu:

Dokument, które przesłałeś, to tabela przedstawiająca wyniki finansowe oraz dane operacyjne firmy za lata 2018 i 2019. Poniżej znajduje się analiza kluczowych informacji zawartych w tabeli:

### 1. **Produkcja**
- **Segment Automobile**: W 2019 roku wyprodukowano 1.802.073 samochodów, co oznacza spadek o 3,7% w porównaniu do 2018 roku (1.871.386).
- **Motoren**: Wzrost produkcji z 1.955.532 do 1.969.731, co daje wzrost o 0,7%.
- **Segment Motorräder**: Spadek produkcji z 53.320 do 51.723, co oznacza spadek o 3,0%.

### 2. **Auslieferungen an Kunden (Dostawy do klientów)**
- **Segment Automobile**: Spadek dostaw z 2.081.418 do 1.853.833, co daje spadek o 10,9%.
- **Marka Audi**: Wzrost dostaw z 1.812.485 do 1.845.573, co oznacza wzrost o 1,8%.
- **Marka Lamborghini**: Znaczący wzrost dostaw z 5.750 do 8.205, co daje wzrost o 42,7%.
- **Segment Motorräder (Marka Ducati)**: Niewielki wzrost z 53.004 do 53.183, co oznacza wzrost o 0,3%.

### 3. **Belegschaft (Zatrudnieni

Zadanie 5
Tłumaczenia maszynowe
Uruchom łańcuch (`chain`) dla 3 różnych zapytań tłumacząc teksty w różnych językach.
Czy wykorzystany model zna język Swahili?

In [12]:
response = llm.invoke("Przetłumacz poniższy tekst na język polski:\n I'm foreigner and I don't speak german fluently.")

print("Odpowiedź modelu:\n")
print(response.content)

Odpowiedź modelu:

Jina langu ni mgeni na siwezi kuzungumza Kijerumani kwa ufasaha.


Zadanie 6
Question answering
Wstaw pytanie dotyczace informacji w przekazanym promptcie

In [9]:
response = llm.invoke("Odpowiedz na poniżesze pytania w oparciu o załaczony tekst:\n"
"LangChain to framework do pracy z dużymi modelami językowymi.\n"
"Chains w LangChain to przepływy danych pomiędzy promptami, modelami i parserami.\n"
"Retriever pozwala wyszukiwać informacje w bazie wektorowej.\n"
"____") # <- Wstaw pytanie dotyczace informacji w przekazanym promptcie np. Czym jest LangChain?

print("Odpowiedź modelu:\n")
print(response.content)

Odpowiedź modelu:

Chains w LangChain służą do tworzenia przepływów danych pomiędzy promptami, modelami i parserami.


Zadanie 7
Sumaryzacja
1. Dodaj własny dokument z tekstem w folderze "../../data/" lub innej wybranej lokalizacji.
2. Podmień ścieżkę do pliku w ponizszym kodzie.
3. Dodaj limit słów w promptcie i wygeneruj podsumowanie załączonego pliku.

In [10]:
file = open("../../data/nad_niemnem.txt", "r") # <- tu podmień ścieżkę do pliku
document = file.read()
response = llm.invoke(f"Napisz krótkie podsumowanie (ok. 500 słów) załączonego tekstu.\n{document[:1800]}")

print("Odpowiedź modelu:\n")
print(response.content)

Odpowiedź modelu:

„Nad Niemnem” Elizy Orzeszkowej to powieść, która wprowadza czytelnika w malowniczy świat letniego krajobrazu nad rzeką Niemen. Opis dnia, w którym rozgrywa się akcja, jest pełen radości i harmonii z naturą. Orzeszkowa w mistrzowski sposób przedstawia piękno otaczającej przyrody, która tętni życiem i emanuje pozytywną energią. W powietrzu unosi się zapach kwiatów, a śpiew ptaków i owadów tworzy symfonię dźwięków, która podkreśla letnią atmosferę.

W opisie krajobrazu autorka zwraca uwagę na kontrasty między wzgórzami a doliną, gdzie wznoszą się gaje i borki, a także na brzeg rzeki, który majestatycznie wyrasta z zieleni. Obraz dworków i siedlisk ludzkich, które harmonijnie wpisują się w ten pejzaż, tworzy wrażenie spokoju i sielanki. Orzeszkowa maluje obraz życia wiejskiego, w którym ludzie żyją w zgodzie z naturą, a ich domy są otoczone ogrodami i polami.

W powieści pojawia się również motyw drogi, która przerzyna równinę, symbolizując nie tylko fizyczne połączenie