# Generator dowcipów z wykorzystaniem frameworka LangChain

Ten kod wykorzystuje bibliotekę LangChain do interakcji z modelem językowym OpenAI (np. GPT-3.5 lub GPT-4). Najpierw konfiguruje instancję modelu z kluczem API i ustala poziom kreatywności odpowiedzi za pomocą parametru temperature. Następnie definiuje kontekst rozmowy (model jako starszy inżynier oprogramowania) i zadaje pytanie o żart. Kod wywołuje model w dwóch trybach:


Pojedyncze wywołanie (metoda invoke): zwraca jedną odpowiedź, np. żart.
Wsadowe wywołanie (metoda batch): wysyła dwa identyczne zapytania jednocześnie i zwraca listę odpowiedzi.

In [1]:
from dotenv import load_dotenv
load_dotenv()

True

In [7]:
from langchain_openai.chat_models import ChatOpenAI
from langchain.schema import AIMessage, HumanMessage, SystemMessage

chat = ChatOpenAI(api_key="OPENAI_API_KEY")

chat = ChatOpenAI(temperature=0.5)
messages = [SystemMessage(content='''Jesteś starszym inżynierem oprogramowania w firmie typu startup.'''),
HumanMessage(content='''Czy możesz przedstawić zabawny żart o inżynierach oprogramowania?''')]
response = chat.invoke(input=messages)
print(response.content)
synchronous_llm_result = chat.batch([messages]*2)
print(synchronous_llm_result)

Oczywiście! Oto jeden z moich ulubionych żartów:

Dlaczego inżynierowie oprogramowania lubią spacerować po plaży?

Bo nawet na piasku szukają błędów!
[AIMessage(content='Oczywiście! Oto jeden z moich ulubionych żartów o inżynierach oprogramowania:\n\nDlaczego inżynierowie oprogramowania nie mogą zjeść obiadu?\n\nBo zawsze mają za mało RAMu!', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 62, 'prompt_tokens': 54, 'total_tokens': 116, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-a6995a83-c358-4834-b24c-9c688a00062e-0', usage_metadata={'input_tokens': 54, 'output_tokens': 62, 'total_tokens': 116, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details

In [15]:
response = chat.invoke(input=messages)
print(f"Treść odpowiedzi: {response.content}")
print(f"Użyty model: {response.response_metadata['model_name']}")

Treść odpowiedzi: Oczywiście! Oto jeden z moich ulubionych żartów o inżynierach oprogramowania:

Dlaczego inżynierowie oprogramowania nie lubią spotykać się na plaży?

Bo zawsze mają problem z zainstalowaniem "plażowego trybu offline"!
Użyty model: gpt-3.5-turbo-0125


In [14]:
synchronous_llm_result = chat.batch([messages]*2)
for idx, result in enumerate(synchronous_llm_result):
    print(f"Odpowiedź {idx+1}: {result.content}")
    print(f"Użyty model: {result.response_metadata['model_name']}")

Odpowiedź 1: Oczywiście! Oto jeden z moich ulubionych żartów o inżynierach oprogramowania:

Dlaczego inżynierowie oprogramowania nie lubią spotykać się na plaży?

Bo zawsze mają problem z debugowaniem!
Użyty model: gpt-3.5-turbo-0125
Odpowiedź 2: Oczywiście! Oto jeden z moich ulubionych żartów:

Dlaczego inżynierowie oprogramowania zawsze myślą pozytywnie?

Bo w ich kodzie nie ma miejsca na negatywne myślenie!
Użyty model: gpt-3.5-turbo-0125


In [None]:
# Importujemy klasę ChatOpenAI z modułu langchain_openai.chat_models; ta klasa pozwala na komunikację z modelem OpenAI
from langchain_openai.chat_models import ChatOpenAI

# Importujemy klasy AIMessage, HumanMessage i SystemMessage z modułu langchain.schema; służą one do definiowania różnych typów wiadomości 
# w rozmowie z modelem
from langchain.schema import AIMessage, HumanMessage, SystemMessage

# Tworzymy instancję klasy ChatOpenAI, przekazując klucz API jako "OPENAI_API_KEY"; ta linia inicjuje połączenie z modelem OpenAI
# Uwaga: "OPENAI_API_KEY" to placeholder - w praktyce należy użyć prawdziwego klucza API lub wczytać go np. z pliku .env
chat = ChatOpenAI(api_key="OPENAI_API_KEY")

# Nadpisujemy poprzednią instancję chatu, tworząc nową z parametrem temperature=0.5; temperature określa losowość odpowiedzi modelu
# Wartość 0.5 oznacza umiarkowaną kreatywność: 0 to odpowiedzi przewidywalne, 1 to bardziej losowe i kreatywne
chat = ChatOpenAI(temperature=0.5)

# Definiujemy listę wiadomości, która zawiera dwa obiekty:
# - SystemMessage: ustala kontekst rozmowy, informując model, że jest starszym inżynierem w startupie; to "instrukcja systemowa" dla modelu
# - HumanMessage: reprezentuje zapytanie użytkownika, w tym przypadku prośbę o żart o inżynierach oprogramowania
messages = [
    SystemMessage(content='''Jesteś starszym inżynierem oprogramowania w firmie typu startup.'''),
    HumanMessage(content='''Czy możesz przedstawić zabawny żart o inżynierach oprogramowania?''')
]

# Wywołujemy metodę invoke na obiekcie chat, przekazując listę wiadomości jako argument; metoda ta wysyła zapytanie do modelu i zwraca odpowiedź
# Odpowiedź jest zwracana jako obiekt AIMessage, który zawiera treść wygenerowaną przez model
response = chat.invoke(input=messages)

# Wyświetlamy treść odpowiedzi modelu, dostępną w atrybucie content obiektu response; to będzie np. żart wygenerowany przez model
print(response.content)

# Używamy metody batch, aby synchronicznie wysłać dwa identyczne zapytania do modelu; [messages]*2 tworzy listę z dwoma kopiami messages
# Metoda batch jest bardziej efektywna niż wielokrotne wywoływanie invoke, gdy potrzebujemy wielu odpowiedzi naraz
synchronous_llm_result = chat.batch([messages]*2)

# Wyświetlamy wynik metody batch, który jest listą obiektów AIMessage; każda odpowiedź zawiera treść wygenerowaną dla danego zapytania
print(synchronous_llm_result)

In [None]:
# AIMessage: Obiekt reprezentujący odpowiedź modelu, zawiera treść i metadane
AIMessage(
    # content: Treść wygenerowana przez model, np. żart o inżynierach oprogramowania
    content='Oczywiście! Oto jeden z moich ulubionych żartów o inżynierach oprogramowania:\n\nDlaczego inżynierowie oprogramowania nie mogą zjeść obiadu?\n\nBo zawsze mają za mało RAMu!',
    
    # additional_kwargs: Dodatkowe argumenty związane z odpowiedzią
    additional_kwargs={
        # refusal: Informacja o odmowie odpowiedzi (None - brak odmowy, model odpowiedział poprawnie)
        'refusal': None
    },
    
    # response_metadata: Słownik z szczegółowymi metadanymi o procesie generowania odpowiedzi
    response_metadata={
        # token_usage: Dane o zużyciu tokenów podczas generowania odpowiedzi
        'token_usage': {
            # completion_tokens: Liczba tokenów w wygenerowanej odpowiedzi (tu 62)
            'completion_tokens': 62,
            # prompt_tokens: Liczba tokenów w zapytaniu użytkownika (tu 54)
            'prompt_tokens': 54,
            # total_tokens: Suma tokenów zapytania i odpowiedzi (tu 116)
            'total_tokens': 116,
            # completion_tokens_details: Szczegóły dotyczące tokenów odpowiedzi
            'completion_tokens_details': {
                # accepted_prediction_tokens: Tokeny zaakceptowane przez predykcję modelu (tu 0, brak predykcji)
                'accepted_prediction_tokens': 0,
                # audio_tokens: Tokeny związane z audio w odpowiedzi (tu 0, brak audio)
                'audio_tokens': 0,
                # reasoning_tokens: Tokeny użyte do "myślenia" modelu (tu 0, brak dedykowanego myślenia)
                'reasoning_tokens': 0,
                # rejected_prediction_tokens: Tokeny odrzucone przez predykcję (tu 0, brak odrzuconych)
                'rejected_prediction_tokens': 0
            },
            # prompt_tokens_details: Szczegóły dotyczące tokenów zapytania
            'prompt_tokens_details': {
                # audio_tokens: Tokeny audio w zapytaniu (tu 0, brak audio)
                'audio_tokens': 0,
                # cached_tokens: Tokeny odczytane z pamięci podręcznej (tu 0, brak cache)
                'cached_tokens': 0
            }
        },
        # model_name: Nazwa modelu użytego do generowania odpowiedzi (tu 'gpt-3.5-turbo-0125')
        'model_name': 'gpt-3.5-turbo-0125',
        # system_fingerprint: Unikalny identyfikator wersji modelu (tu None, brak danych)
        'system_fingerprint': None,
        # finish_reason: Powód zakończenia generowania odpowiedzi (tu 'stop' - model zakończył naturalnie)
        'finish_reason': 'stop',
        # logprobs: Logarytmy prawdopodobieństw tokenów (tu None, nie zażądano)
        'logprobs': None
    },
    
    # id: Unikalny identyfikator tej konkretnej odpowiedzi (np. 'run-a6995a83-c358-4834-b24c-9c688a00062e-0')
    id='run-a6995a83-c358-4834-b24c-9c688a00062e-0',
    
    # usage_metadata: Uproszczone podsumowanie użycia tokenów
    usage_metadata={
        # input_tokens: Liczba tokenów w zapytaniu (tu 54)
        'input_tokens': 54,
        # output_tokens: Liczba tokenów w odpowiedzi (tu 62)
        'output_tokens': 62,
        # total_tokens: Suma tokenów zapytania i odpowiedzi (tu 116)
        'total_tokens': 116,
        # input_token_details: Szczegóły tokenów zapytania
        'input_token_details': {
            # audio: Tokeny audio w zapytaniu (tu 0, brak audio)
            'audio': 0,
            # cache_read: Tokeny odczytane z pamięci podręcznej (tu 0, brak cache)
            'cache_read': 0
        },
        # output_token_details: Szczegóły tokenów odpowiedzi
        'output_token_details': {
            # audio: Tokeny audio w odpowiedzi (tu 0, brak audio)
            'audio': 0,
            # reasoning: Tokeny użyte do "myślenia" (tu 0, brak dedykowanego myślenia)
            'reasoning': 0
        }
    }
)

# Język wyrażeń LangChain (LCEL)

In [24]:
from dotenv import load_dotenv
load_dotenv()

model = ChatOpenAI(api_key="OPENAI_API_KEY")

In [25]:
from langchain_openai.chat_models import ChatOpenAI
from langchain_core.prompts import (SystemMessagePromptTemplate, ChatPromptTemplate)

template = """
Jesteś kreatywnym konsultantem, który wymyśla nazwy firm.
Musisz spełniać następujące reguły: 
{principles}
Wygeneruj listę numerowaną pięciu chwytliwych nazw dla startupu w branży {industry}, które muszą radzić sobie z {context}?
Oto przykład formatu danych: 
1. Nazwa1
2. Nazwa2
3. Nazwa3
4. Nazwa4
5. Nazwa5
"""
model = ChatOpenAI(api_key="OPENAI_API_KEY")
model = ChatOpenAI()

system_prompt = SystemMessagePromptTemplate.from_template(template)
chat_prompt = ChatPromptTemplate.from_messages([system_prompt])
chain = chat_prompt | model
result = chain.invoke({
    "industry": "medyczna",
    "context":'''tworzenie rozwiązań AI związanych z automatycznym podsumowywaniem danych pacjentów''',
    "principles":'''1. Każda nazwa powinna być krótka i łatwa do zapamiętania. 2. Każda nazwa powinna być łatwa do wymówienia. 3. Każda nazwa powinna być unikatowa i nie być zajęta przez inną firmę.'''
})
print(result.content)

1. DataMedAI
2. SummarizeHealth
3. SmartChart AI
4. MedSynth
5. DocSummarize


In [27]:
# Importowanie klasy ChatOpenAI z modułu langchain_openai.chat_models - ta klasa służy do tworzenia instancji modelu czatu OpenAI, 
# który generuje odpowiedzi
from langchain_openai.chat_models import ChatOpenAI

# Importowanie klas SystemMessagePromptTemplate i ChatPromptTemplate z modułu langchain_core.prompts - 
# te klasy są używane do tworzenia szablonów promptów, które określają, jak model ma odpowiadać
from langchain_core.prompts import (SystemMessagePromptTemplate, ChatPromptTemplate)

# Definiowanie szablonu tekstowego dla promptu - zawiera instrukcje dla modelu i miejsca na zmienne: 
# principles, industry, context; szablon określa zadanie generowania nazw firm
template = """
Jesteś kreatywnym konsultantem, który wymyśla nazwy firm.
Musisz spełniać następujące reguły: 
{principles}
Wygeneruj listę numerowaną pięciu chwytliwych nazw dla startupu w branży {industry}, które muszą radzić sobie z {context}?
Oto przykład formatu danych: 
1. Nazwa1
2. Nazwa2
3. Nazwa3
4. Nazwa4
5. Nazwa5
"""

# Tworzenie instancji modelu ChatOpenAI - ten obiekt będzie używany do generowania odpowiedzi na podstawie podanego promptu
model = ChatOpenAI()

# Tworzenie szablonu promptu systemowego na podstawie zdefiniowanego szablonu - SystemMessagePromptTemplate 
# przekształca szablon w wiadomość systemową dla modelu
system_prompt = SystemMessagePromptTemplate.from_template(template)

# Tworzenie obiektu ChatPromptTemplate z wiadomością systemową - ten obiekt formatuje prompt, który zostanie przekazany do modelu czatu
chat_prompt = ChatPromptTemplate.from_messages([system_prompt])

# Tworzenie łańcucha (chain) łączącego prompt z modelem - operator | przekazuje sformatowany prompt do modelu, aby wygenerować odpowiedź
chain = chat_prompt | model

# Wywoływanie łańcucha z konkretnymi wartościami dla zmiennych w szablonie - 
# result przechowuje wygenerowaną odpowiedź modelu dla branży medycznej, kontekstu AI i zasad nazw
result = chain.invoke({
    "industry": "medyczna",
    "context":'''tworzenie rozwiązań AI związanych z automatycznym podsumowywaniem danych pacjentów''',
    "principles":'''1. Każda nazwa powinna być krótka i łatwa do zapamiętania. 2. Każda nazwa powinna być łatwa do wymówienia. 3. Każda nazwa powinna być unikatowa i nie być zajęta przez inną firmę.'''
})

# Drukowanie treści wyniku - wyświetla listę pięciu nazw wygenerowanych przez model w formacie zgodnym z szablonem
print(result.content)

1. MedAIsum
2. DocuBotix
3. DataMedSum
4. IntelliChart
5. MediSyncAI


# Stosowanie PromptTemplate z modelami czatowymi

Kod ten służy do generowania wiadomości systemowej dla modelu LLM (np. GPT-4) w celu przetłumaczenia tekstu
z jednego języka na drugi. Wykorzystuje on bibliotekę LangChain do łatwego zarządzania promptami
oraz umożliwia interakcję z modelem OpenAI.

In [28]:
from langchain_core.prompts import PromptTemplate
from langchain.prompts.chat import SystemMessagePromptTemplate 
from langchain_openai.chat_models import ChatOpenAI 

prompt=PromptTemplate(
 template='''Jesteś pomocnym asystentem, który tłumaczy język {input_language} na {output_language}.''',
 input_variables=["input_language", "output_language"],
)
system_message_prompt = SystemMessagePromptTemplate(prompt=prompt)
chat = ChatOpenAI()
print(chat.invoke(system_message_prompt.format_messages(
input_language="polski", output_language="angielski")))

content='I am a helpful assistant who translates Polish into English.' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 12, 'prompt_tokens': 34, 'total_tokens': 46, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None} id='run-5e765e17-54de-4f6a-833e-bd2d2c284344-0' usage_metadata={'input_tokens': 34, 'output_tokens': 12, 'total_tokens': 46, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}}


In [None]:
# Główna treść odpowiedzi modelu - przetłumaczony tekst z angielskiego na polski.
content='Jestem pomocnym asystentem, który tłumaczy z polskiego na angielski.' 

# Dodatkowe argumenty - w tym przypadku 'refusal' jest ustawione na None, co oznacza, że model nie odmówił odpowiedzi.
additional_kwargs={'refusal': None} 

# Metadane odpowiedzi - zawiera informacje techniczne o procesie generowania odpowiedzi, takie jak zużycie tokenów czy model.
response_metadata={
    'token_usage': { 
        'completion_tokens': 12,  # Liczba tokenów w wygenerowanej odpowiedzi.
        'prompt_tokens': 34,      # Liczba tokenów w zapytaniu wejściowym.
        'total_tokens': 46,       # Całkowita liczba tokenów (zapytanie + odpowiedź).
        'completion_tokens_details': { 
            'accepted_prediction_tokens': 0,  # Tokeny zaakceptowane w predykcji (tu 0).
            'audio_tokens': 0,                # Tokeny audio w odpowiedzi (tu 0, bo to tekst).
            'reasoning_tokens': 0,            # Tokeny użyte do wnioskowania (tu 0).
            'rejected_prediction_tokens': 0   # Tokeny odrzucone w predykcji (tu 0).
        }, 
        'prompt_tokens_details': { 
            'audio_tokens': 0,                # Tokeny audio w zapytaniu (tu 0).
            'cached_tokens': 0                # Tokeny z pamięci podręcznej (tu 0).
        }
    }, 
    'model_name': 'gpt-3.5-turbo-0125',  # Nazwa modelu użytego do generowania odpowiedzi.
    'system_fingerprint': None,          # Odcisk palca systemu (tu None, brak danych).
    'finish_reason': 'stop',             # Przyczyna zakończenia generowania (tu 'stop' - naturalne zakończenie).
    'logprobs': None                     # Logarytmiczne prawdopodobieństwa tokenów (tu None, bo nie zwrócono).
} 

# Unikalny identyfikator tej odpowiedzi.
id='run-5e765e17-54de-4f6a-833e-bd2d2c284344-0' 

# Metadane zużycia - szczegółowe informacje o tokenach wejściowych i wyjściowych.
usage_metadata={
    'input_tokens': 34,                  # Liczba tokenów w zapytaniu.
    'output_tokens': 12,                 # Liczba tokenów w odpowiedzi.
    'total_tokens': 46,                  # Suma tokenów wejściowych i wyjściowych.
    'input_token_details': { 
        'audio': 0,                      # Tokeny audio w zapytaniu (tu 0).
        'cache_read': 0                  # Tokeny odczytane z pamięci podręcznej (tu 0).
    }, 
    'output_token_details': { 
        'audio': 0,                      # Tokeny audio w odpowiedzi (tu 0).
        'reasoning': 0                   # Tokeny użyte do wnioskowania (tu 0).
    }
}

In [None]:
from langchain_core.prompts import PromptTemplate  # Import szablonu promptu z biblioteki LangChain
from langchain.prompts.chat import SystemMessagePromptTemplate  # Import szablonu wiadomości systemowej dla modelu
from langchain_openai.chat_models import ChatOpenAI  # Import klasy do interakcji z modelem OpenAI

# Tworzenie szablonu promptu dla tłumaczenia językowego
prompt = PromptTemplate(
    template='''Jesteś pomocnym asystentem, który tłumaczy język {input_language} na {output_language}.''',
    input_variables=["input_language", "output_language"],  # Zmienna wejściowa dla języka źródłowego i docelowego
)

# Konwersja promptu na wiadomość systemową
system_message_prompt = SystemMessagePromptTemplate(prompt=prompt)

# Inicjalizacja modelu OpenAI do czatu
chat = ChatOpenAI()

# Wywołanie modelu z sformatowanym promptem, tłumaczącym z polskiego na angielski
print(chat.invoke(system_message_prompt.format_messages(
    input_language="polski", output_language="angielski"
)))

# Parsery wyjścia

Pydantic to narzędzie do definiowania i walidacji struktur danych w Pythonie. Działa poprzez tworzenie klas (tzw. modeli), w których programista określa typy danych i ich ograniczenia. Biblioteka automatycznie sprawdza, czy dane wejściowe spełniają te wymagania, co czyni ją prostą, szybką i wygodną w użyciu. Główne zastosowania Pydantic to:

Walidacja danych: Sprawdzanie, czy dane wejściowe (np. z formularzy czy API) są poprawne.
Serializacja i deserializacja: Konwersja danych między obiektami Pythona a formatami takimi jak JSON.
Zarządzanie konfiguracją: Definiowanie i walidowanie ustawień aplikacji.
Pydantic jest szczególnie ceniony za łatwość integracji z nowoczesnymi narzędziami, takimi jak framework FastAPI, co czyni go popularnym wyborem w aplikacjach Pythona.

Ten kod generuje nazwy firm na podstawie podanej branży i zestawu zasad.
Wykorzystuje model OpenAI do stworzenia propozycji nazw firm, które następnie są walidowane i parsowane przy użyciu Pydantic.
Można go użyć w aplikacjach do generowania nazw startupów, narzędziach wspomagających branding, a także w asystentach AI.

In [39]:
# Importowanie potrzebnych klas z LangChain do tworzenia promptów dla czatu
from langchain_core.prompts.chat import ( 
    ChatPromptTemplate,  # Klasa do tworzenia szablonów rozmów w czacie
    SystemMessagePromptTemplate,  # Klasa do definiowania wiadomości systemowych, które określają zachowanie modelu
)

# Importowanie klasy ChatOpenAI z LangChain do integracji z modelem OpenAI
from langchain_openai.chat_models import ChatOpenAI  # Umożliwia komunikację z modelem językowym OpenAI

# Importowanie parsera wyjścia, który przekształca tekstowe odpowiedzi modelu w struktury danych
from langchain.output_parsers import PydanticOutputParser  # Parser zgodny z Pydantic, pozwala na walidację i strukturyzację danych

# Importowanie klas z Pydantic do definiowania modeli danych z walidacją
from pydantic import BaseModel, Field  # BaseModel to podstawa dla modeli danych, Field pozwala dodawać opisy i walidację pól

# Importowanie typu List z typing do definiowania list w modelach Pydantic
from typing import List  # Umożliwia określenie, że pole w modelu Pydantic będzie listą (np. listą nazw firm)

# Ustawienie temperatury modelu na 0.0, co sprawia, że odpowiedzi są bardziej przewidywalne i mniej losowe
temperature = 0.0  # Temperatura kontroluje kreatywność modelu; 0.0 = deterministyczne odpowiedzi

# Definicja modelu Pydantic dla pojedynczej nazwy firmy
class BusinessName(BaseModel):
    name: str = Field(description="Nazwa firmy")  # Pole 'name' typu string, przechowuje nazwę firmy
    # Pole 'rating_score' typu float, ocena nazwy
    rating_score: float = Field(description="Ocena firmy. 0 jest najgorsza, 10 jest najlepsza.") 
    
# Definicja modelu Pydantic dla listy nazw firm
class BusinessNames(BaseModel):
    names: List[BusinessName] = Field(description="Lista nazw firm")  # Pole 'names' to lista obiektów BusinessName

'''
names=[BusinessName(name='DataWise', rating_score=8.0), 
       BusinessName(name='ByteLab', rating_score=7.5), 
       BusinessName(name='LearnData', rating_score=9.0), 
       BusinessName(name='DataMinds', rating_score=8.5), 
       BusinessName(name='InfoStat', rating_score=7.0)]
       '''

# Tworzenie parsera, który przekształci tekstowe wyjście modelu w obiekt BusinessNames
parser = PydanticOutputParser(pydantic_object=BusinessNames)  # Parser wie, że ma parsować dane do struktury BusinessNames

# Definicja zasad, które model musi przestrzegać przy generowaniu nazw
principles = """
- Nazwa musi być łatwa do zapamiętania.  # Zasada: nazwy powinny być proste i chwytliwe
- Skorzystaj z branży {industry} i kontekstu firmy, aby stworzyć dobrą nazwę  # Nazwy muszą pasować do branży (np. Nauka o danych)
- Nazwa musi być łatwa do wymówienia.  # Unikamy skomplikowanych lub trudnych fonetycznie nazw
- Musisz jedynie zwrócić nazwę bez żadnego dodatkowego tekstu lub znaków  # Model ma generować tylko nazwy, bez zbędnych znaków
- Unikaj zwracania kropek, znaków nowej linii i innych tego typu znaków  # Odpowiedź ma być "czysta", bez formatowania
- Maksymalna długość nazwy to 10 znaków  # Ograniczenie długości nazw do 10 znaków
"""

# Inicjalizacja modelu OpenAI, który będzie generował odpowiedzi
model = ChatOpenAI()  # Tworzy instancję modelu OpenAI (domyślnie używa API OpenAI)

# Szablon promptu, który definiuje zadanie dla modelu
template = """Wygeneruj pięć nazw firm dla nowego startupu w branży {industry}
Musisz podążać według następujących zasad: {principles}
{format_instructions}
"""  # Szablon zawiera zmienne do wstrzyknięcia: branża, zasady i instrukcje formatowania

# Tworzenie promptu systemowego na podstawie szablonu
system_message_prompt = SystemMessagePromptTemplate.from_template(template)  # Przekształca szablon w prompt systemowy

# Tworzenie pełnego promptu czatu, który zawiera tylko wiadomość systemową
chat_prompt = ChatPromptTemplate.from_messages([system_message_prompt])  # Tworzy strukturę promptu gotową do użycia z modelem

# Tworzenie łańcucha: prompt jest przesyłany do modelu
prompt_and_model = chat_prompt | model  # Operator | łączy prompt z modelem w tzw. łańcuch LCEL (LangChain Expression Language)

# Wywołanie modelu z konkretnymi wartościami dla zmiennych w promptcie
result = prompt_and_model.invoke(
    {
        "principles": principles,  # Wstrzyknięcie zasad do promptu
        "industry": "Nauka o danych",  # Określenie branży jako "Nauka o danych"
        "format_instructions": parser.get_format_instructions(),  # Dodanie instrukcji formatowania wygenerowanych przez parser
    }
)  # Model generuje odpowiedź na podstawie podanych danych

# Parsowanie tekstowej odpowiedzi modelu na obiekt Pydantic i wyświetlenie wyniku
print(parser.parse(result.content))  # result.content to tekst wygenerowany przez model, parser przekształca go w BusinessNames

# Ponowne utworzenie parsera (nadpisywanie poprzedniego, można pominąć jeśli używamy tego samego)
parser = PydanticOutputParser(pydantic_object=BusinessNames)  # Tworzy nowy parser dla BusinessNames (tu redundantne, ale zachowane jak w oryginalnym kodzie)

# Tworzenie pełnego łańcucha: prompt -> model -> parser
chain = chat_prompt | model | parser  # Łańcuch automatycznie parsuje wyjście modelu na obiekt Pydantic

# Wywołanie pełnego łańcucha z tymi samymi parametrami
result = chain.invoke(
    {
        "principles": principles,  # Wstrzyknięcie zasad
        "industry": "Nauka o danych",  # Branża
        "format_instructions": parser.get_format_instructions(),  # Instrukcje formatowania
    }
)  # Łańcuch zwraca już sparsowany obiekt BusinessNames

# Wyświetlenie sparsowanego wyniku
print(result)  # Wyświetla obiekt BusinessNames z nazwami i ocenami

names=[BusinessName(name='DataMind', rating_score=8.0), BusinessName(name='DataByte', rating_score=7.0), BusinessName(name='MindData', rating_score=9.0), BusinessName(name='ByteWise', rating_score=6.0), BusinessName(name='DataSync', rating_score=7.0)]
names=[BusinessName(name='DataMinds', rating_score=9.2), BusinessName(name='ByteLab', rating_score=8.7), BusinessName(name='InfoNerd', rating_score=9.0), BusinessName(name='LearnData', rating_score=8.5), BusinessName(name='DataWiz', rating_score=8.8)]


In [40]:
names_list = [i.name for i in result.names]
print(names_list)

['DataMinds', 'ByteLab', 'InfoNerd', 'LearnData', 'DataWiz']


In [None]:
# names=[BusinessName(name='DataWise', rating_score=8.0), 
#        BusinessName(name='ByteLab', rating_score=7.5), 
#        BusinessName(name='LearnData', rating_score=9.0), 
#        BusinessName(name='DataMinds', rating_score=8.5), 
#        BusinessName(name='InfoStat', rating_score=7.0)]

# names=[BusinessName(name='DataMinds', rating_score=8.0), 
#        BusinessName(name='ByteIQ', rating_score=7.0), 
#        BusinessName(name='InfoGenix', rating_score=9.0), 
#        BusinessName(name='DataNest', rating_score=8.0), 
#        BusinessName(name='SmartData', rating_score=7.0)]

# Ewaluacje LangChain

In [48]:
import pandas as pd
from tqdm import tqdm
import requests
import io

# Dataset URL:
url = "https://storage.googleapis.com/oreilly-content/transaction_data_with_expanded_descriptions.csv"

# Download the file from the URL:
downloaded_file = requests.get(url)

# Load the transactions dataset and only look at 20 transactions:
df = pd.read_csv(io.StringIO(downloaded_file.text))[:20]
df.head()

Unnamed: 0,Transaction Description
0,cash deposit at local branch
1,cash deposit at local branch
2,withdrew money for rent payment
3,withdrew cash for weekend expenses
4,purchased books from the bookstore


In [51]:
from langchain.output_parsers import PydanticOutputParser    
from langchain_openai.chat_models import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from pydantic import BaseModel, Field
from typing import Literal, Union

# 1. Define the model:
model = ChatOpenAI(
    model="gpt-4-1106-preview",
    model_kwargs={"response_format": {"type": "json_object"}},
)

system_prompt = """You are are an expert at analyzing bank transactions, 
you will be categorising a single transaction. 
Always return a transaction type and category: do not return None.
Format Instructions:
{format_instructions}"""

user_prompt = """Transaction Text:
{transaction}"""

# 2. Define the prompt:
prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            system_prompt,
        ),
        (
            "user",
            user_prompt,
        ),
    ]
)

# 3. Define the pydantic model:
class EnrichedTransactionInformation(BaseModel):
    transaction_type: Union[
        Literal["Purchase", "Withdrawal", "Deposit", "Bill Payment", "Refund"], None
    ]
    transaction_category: Union[
        Literal["Food", "Entertainment", "Transport", "Utilities", "Rent", "Other"],
        None,
    ]


# 4. Define the output parser:
output_parser = PydanticOutputParser(pydantic_object=EnrichedTransactionInformation)

# 5. Create an LCEL chain:
chain = prompt | model | output_parser

# 6. Invoke the chain for the whole dataset:
results = []

for i, row in tqdm(df.iterrows(), total=len(df)):
    transaction = row["Transaction Description"]
    result = chain.invoke(
        {
            "transaction": transaction,
            "format_instructions": output_parser.get_format_instructions(),
        }
    )
    results.append(result)

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████| 20/20 [00:23<00:00,  1.17s/it]


In [52]:
transaction_types = []
transaction_categories = []

for result in results:
    transaction_types.append(result.transaction_type)
    transaction_categories.append(result.transaction_category)

df["transaction_type"] = transaction_types
df["transaction_category"] = transaction_categories
df.head()

Unnamed: 0,Transaction Description,transaction_type,transaction_category
0,cash deposit at local branch,Deposit,Other
1,cash deposit at local branch,Deposit,Other
2,withdrew money for rent payment,Withdrawal,Rent
3,withdrew cash for weekend expenses,Withdrawal,Other
4,purchased books from the bookstore,Purchase,Other


In [53]:
df.to_csv("transactions_with_enriched_data.csv", index=False)