<a href="https://colab.research.google.com/github/HalyshAnton/Python-AI/blob/AI_6_lesson/langchain.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Посібник для початківців з LangChain

LangChain - це надійний фреймворк, призначений для створення додатків на основі **великих мовних моделей (LLMs)**. Він спрощує робочі процеси, інтегруючи різні компоненти, такі як підказки, пам'ять і зовнішні інструменти, дозволяючи розробникам створювати інтелектуальні програми швидко і ефективно.

## **Як використовувати LLM в LangChain**

### Крок 1: Встановлення необхідних бібліотек


In [1]:
!pip install -q langchain langchain-community huggingface_hub langchain_huggingface

[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.4/2.4 MB[0m [31m10.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m3.1/3.1 MB[0m [31m20.6 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m49.5/49.5 kB[0m [31m2.3 MB/s[0m eta [36m0:00:00[0m
[?25h

### Крок 2: Отримайте токен API Hugging Face
Щоб використовувати моделі, розміщені на Hugging Face, вам потрібен токен API. Отримайте його з [Hugging Face](https://huggingface.co/settings/tokens).

In [2]:
import os

os.environ['HUGGINGFACEHUB_API_TOKEN'] = ''

### Крок 3: Ініціалізація моделі Mistral-7B-Instruct-v0.2
Використовуйте інтеграцію Hugging Face для завантаження моделі **mistralai/Mistral-7B-Instruct-v0.2**.

In [49]:
from langchain.llms import HuggingFaceHub

# Ініціалізуємо бібліотеку LLM
llm = HuggingFaceHub(
    repo_id='mistralai/Mistral-7B-Instruct-v0.2',
    model_kwargs={
        "temperature": 0.7, # Налаштуйте креативність
        "max_length": 256, # Обмежити довжину відповіді
        }
    )

# Протестуйте модель за допомогою простого запиту
prompt = 'What is LangChain?'
response = llm(prompt)
print(response)

What is LangChain?

LangChain is a decentralized, open-source, and blockchain-based AI language model. It is designed to provide high-quality and real-time language translation services, including text summarization, text generation, and question answering. LangChain utilizes the power of distributed computing and the security of the blockchain to create a decentralized language model that is more secure, transparent, and inclusive than traditional centralized models.

How does LangChain work?




## **Параметри моделі: Детальний опис**

При взаємодії з LLM параметри тонкої настройки можуть суттєво впливати на результати роботи моделі. Ось детальне пояснення:

### **1. Температура**
- **Що робить:** Керує випадковістю у вихідних даних.
- **Діапазон:** Від 0.0 до 1.0 (або вище).
- **Низькі значення (наприклад, 0.2):** Модель генерує детерміновані та цілеспрямовані відповіді.
- **Високі значення (наприклад, 0,8):** Модель дає різноманітні та творчі результати.

### **2. Max Tokens**
- **Що робить:** Обмежує максимальну кількість токенів (слів/частин слів) у виведенні.
- **Використання:** Запобігає отриманню надто довгих або урізаних відповідей.

### **3. Top-p (вибірка ядра)**.
- **Що робить:** Обмежує вибірку токенів до максимальної кумулятивної ймовірності `p`.
- Діапазон:** від 0.0 до 1.0.
- **Низькі значення (наприклад, 0.3):** Вихідні дані є більш детермінованими.
- **Високі значення (наприклад, 0.9):** Результат є більш творчим.

### **4. Frequency Penalty**
- **Що він робить:** Штрафує токени, які вже з'являлися, щоб заохотити різноманітні відповіді.
- **Діапазон:** від -2.0 до 2.0.
- **Вищі значення:** Перешкоджають повторенню.
- **Нижчі значення:** Дозволяють більше повторень.

### **5. Presence Penalty**
- **Що робить:** Штрафує токени на основі того, чи з'являються вони у вхідних даних.
- **Використання:** Заохочує вводити нові поняття у відповідях.
- **Діапазон:** від -2.0 до 2.0.

## **Приклад: Об'єднання параметрів**
Ось як ви можете комбінувати різні параметри для налаштування поведінки:

In [4]:
llm = HuggingFaceHub(
    repo_id="mistralai/Mistral-7B-Instruct-v0.2",
    model_kwargs={
        "temperature": 0.6,      # Збалансована креативність
        "max_length": 200,       # Відповіді середньої довжини
        "top_p": 0.85,           # Креативна вибірка
        "frequency_penalty": 0.5 # Заохочуємо різноманітність
    }
)

response = llm("Write short poem about moon")
print(response)

Write short poem about moon and stars

Title: Lunar Serenade

Beneath the twilight's gentle veil,
The moon ascends her throne,
A regal orb in tranquil sail,
In celestial dance, alone.

Her silver light, a tender glow,
Bestows upon the night,
A ballet of stars in tow,
In ethereal radiance, bright.

They twinkle, they dance, they


## **Що таке prompt і як його використовувати?**

Підказка - це вхідні дані або інструкції, які ви даєте LLM, щоб спрямувати його реакцію. Складання правильної підказки має важливе значення для отримання значущих і точних результатів.

### Як використовувати підказку в LangChain
Використовувати підказки в LangChain дуже просто. Ось базовий приклад:

In [93]:
from langchain.llms import HuggingFaceHub

# Initialize the model
llm = HuggingFaceHub(repo_id="mistralai/Mistral-7B-Instruct-v0.2",
                     model_kwargs={"temperature": 0.7})

# Define a prompt
prompt = "Explain the benefits of artificial intelligence in education."

# Get the model's response
response = llm(prompt)
print(response)

Explain the benefits of artificial intelligence in education.

Artificial Intelligence (AI) is transforming various industries, and education is no exception. AI technologies have the potential to revolutionize the way we learn and teach, bringing numerous benefits to students, teachers, and educational institutions. Here are some key advantages of using AI in education:

1. Personalized Learning: AI-powered education systems can analyze a student's learning patterns, strengths, weaknesses, and interests to provide personalized learning experiences. This approach can help students learn


## **Поради та приклади створення підказок**

Створення ефективних підказок вимагає уваги до чіткості, контексту і бажаного формату виводу. Нижче наведено кілька порад і прикладів:

### **Поради щодо створення підказок**
1. **Будьте конкретними:** Чітко сформулюйте, що ви хочете, щоб LLM зробив.
2. **Забезпечте контекст:** Надайте моделі відповідну довідкову інформацію, щоб покращити її реакцію.
3. **Визначте вихідний формат:** Вкажіть, чи потрібен вам список, таблиця або структурована відповідь.
4. **Експериментуйте:** Тестуйте та вдосконалюйте свої підказки для отримання кращих результатів.

### **Приклад 1: Проста інструкція**

In [94]:
prompt = "Describe the role of AI in healthcare in two sentences."
response = llm(prompt)
print(response)

Describe the role of AI in healthcare in two sentences. AI is revolutionizing healthcare by analyzing vast amounts of patient data and medical literature to identify patterns, make predictions, and suggest personalized treatment plans. It is also improving operational efficiency, reducing costs, and enhancing the patient experience through automated scheduling, triage, and virtual assistants.


### **Приклад 2: Структуроване виведення**

In [95]:
prompt = """
List three benefits of AI in education:
1.
2.
3.
"""
response = llm(prompt)
print(response)


List three benefits of AI in education:
1.
2.
3.
1. Personalized Learning: AI can analyze a student's learning patterns, strengths, and weaknesses, and provide customized lesson plans and resources to help them learn more effectively. This can lead to improved academic performance and better overall learning experiences.
2. Automated Administrative Tasks: AI can automate administrative tasks such as grading, scheduling, and record-keeping. This can save teachers time and allow them to focus more on teaching and interacting with students.
3


### **Приклад 3: Контекстно-керований запит**

In [96]:
prompt = """
You are a customer support chatbot.
Answer the following question in a friendly and concise tone:
What are the refund policies for your service?
"""
response = llm(prompt)
print(response)


You are a customer support chatbot.
Answer the following question in a friendly and concise tone:
What are the refund policies for your service?
Hello there! I'd be happy to help answer your question about our refund policies. We believe in providing the best possible service to our customers, but we also understand that sometimes things don't work out as planned. If you're not satisfied with our service within the first 30 days, we offer a full refund with no questions asked. After 30 days, we'll evaluate each refund request on a case-by-case basis and do our best to find a


### **Розширена обробка запитів за допомогою шаблонів запитів**
LangChain надає ``PromptTemplate`` для динамічної генерації підказок із заповнювачами:

In [97]:
from langchain.prompts import PromptTemplate

# Create a template with placeholders
template = PromptTemplate(
    input_variables=["topic", "length"],
    template="Write a {length} explanation about {topic}."
)

# Fill in the placeholders
filled_prompt = template.format(topic="machine learning", length="brief")
response = llm(filled_prompt)
print(response)

Write a brief explanation about machine learning.

Machine learning is a subset of artificial intelligence that provides systems the ability to automatically learn and improve from experience without being explicitly programmed. It focuses on the development of computer programs that can access data and use it to learn for themselves.

The process of learning begins with feeding the machine learning algorithm a large set of data. The algorithm then uses statistical analysis, pattern recognition, and other techniques to identify and learn the underlying structures and relationships within the data. Once the algorithm has learned these patterns


### **Допоміжні слова**

LangChain підтримує структуровані підказки зі спеціальними «допоміжними словами» або сигналами форматування для надання чітких інструкцій. Ось що означають деякі з них:

- **`<< FORMATTING >>`:** Вказує бажану структуру виводу, наприклад, списки, маркери або таблиці.
- **`<< CANDIDATE PROMPTS >>`:** Пропонує можливі варіанти підказки для експериментування або уточнення.
- **`<< INPUT >>`:** Вказує, де у підказку буде вставлено динамічне введення (наприклад, дані, надані користувачем).
- **`REMEMBER`:** Вказує моделі зберігати ключову інформацію для безперервності відповідей.

### **Приклади з допоміжними словами**

In [98]:
from langchain.llms import HuggingFaceHub

# Initialize the model
llm = HuggingFaceHub(repo_id="mistralai/Mistral-7B-Instruct-v0.2",
                     model_kwargs={"temperature": 0.7})

# Prompt with formatting instruction
prompt = """
Explain the advantages of renewable energy.
<< FORMATTING >>
- List three key points.
"""

response = llm(prompt)
print(response)


Explain the advantages of renewable energy.
<< FORMATTING >>
- List three key points.
1. **Reliance on Renewable Resources:** Renewable energy comes from naturally occurring sources like sunlight, wind, rain, geothermal heat, and tidal power. Unlike non-renewable energy sources like coal and natural gas, which are finite and will eventually run out, renewable energy sources are virtually inexhaustible.
2. **Environmental Sustainability:** Renewable energy is a clean source of energy that produces little to no greenhouse gas emissions


In [11]:
from langchain.prompts import PromptTemplate

# Create a dynamic prompt template
template = PromptTemplate(
    input_variables=["topic"],
    template="Describe the importance of {topic} in modern society. << INPUT >>"
)

# Generate a prompt
prompt = template.format(topic="artificial intelligence")
print(prompt)

Describe the importance of artificial intelligence in modern society. << INPUT >>


In [12]:
prompt = """
You are a helpful assistant.

REMEMBER: Be concise and avoid overly technical language.

Answer the question: What is blockchain technology?
"""
response = llm(prompt)
print(response)


You are a helpful assistant.

REMEMBER: Be concise and avoid overly technical language.

Answer the question: What is blockchain technology?

Blockchain technology is a type of digital ledger where transactions are recorded in a secure and unalterable way. It allows for the creation of a decentralized system where each participant has a copy of the entire transaction history. Once data has been recorded, it cannot be altered or deleted without the consensus of the network. This ensures transparency, security, and integrity of the data. It is most commonly known for being the technology behind cryptocurrencies like Bitcoin, but its applications extend


## **Ланцюги у LangChain**

Ланцюжки - це робочі процеси, у яких вихідні дані одного кроку надходять на наступний. LangChain надає інструменти для створення **простих ланцюжків** та більш складних **маршрутизаторів**.

### **Прості ланцюжки**

Простий ланцюжок складається з одного запиту і LLM, з додатковою пам'яттю.

In [13]:
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate

# Define a simple prompt template
template = PromptTemplate(
    input_variables=["name"],
    template="Write a friendly greeting for {name}."
)

# Create a simple chain
chain = LLMChain(llm=llm, prompt=template)

# Run the chain
response = chain.run(name="Alice")
print(response)

  chain = LLMChain(llm=llm, prompt=template)
  response = chain.run(name="Alice")


Write a friendly greeting for Alice.

Hello Alice, it's lovely to see you here today! I hope you're having a wonderful day so far. I'm here to help answer any questions you might have or just chat about anything that's on your mind. Don't hesitate to reach out and let me know how I can make your day even better. Welcome once again to our friendly community! :)


Для робити з ланцюгами потрібно використовувати **ChatModel**

In [106]:
from typing import Any, AsyncIterator, Dict, Iterator, List, Optional

from langchain_core.messages import (
    AIMessage,
    BaseMessage,
    FunctionMessage,
    HumanMessage,
    SystemMessage,
    ToolMessage,
)

from langchain_core.callbacks import (
    AsyncCallbackManagerForLLMRun,
    CallbackManagerForLLMRun,
)
from langchain_core.language_models import BaseChatModel, SimpleChatModel
from langchain_core.messages import AIMessageChunk, BaseMessage, HumanMessage
from langchain_core.outputs import ChatGeneration, ChatGenerationChunk, ChatResult
from langchain_core.runnables import run_in_executor


class CustomChatModelAdvanced(BaseChatModel):
    """A custom chat model that echoes the first `n` characters of the input.

    When contributing an implementation to LangChain, carefully document
    the model including the initialization parameters, include
    an example of how to initialize the model and include any relevant
    links to the underlying models documentation or API.

    Example:

        .. code-block:: python

            model = CustomChatModel(n=2)
            result = model.invoke([HumanMessage(content="hello")])
            result = model.batch([[HumanMessage(content="hello")],
                                 [HumanMessage(content="world")]])
    """

    model: HuggingFaceHub
    """The name of the model"""

    def _generate(
        self,
        messages: List[BaseMessage],
        stop: Optional[List[str]] = None,
        run_manager: Optional[CallbackManagerForLLMRun] = None,
        **kwargs: Any,
    ) -> ChatResult:
        """Override the _generate method to implement the chat model logic.

        This can be a call to an API, a call to a local model, or any other
        implementation that generates a response to the input prompt.

        Args:
            messages: the prompt composed of a list of messages.
            stop: a list of strings on which the model should stop generating.
                  If generation stops due to a stop token, the stop token itself
                  SHOULD BE INCLUDED as part of the output. This is not enforced
                  across models right now, but it's a good practice to follow since
                  it makes it much easier to parse the output of the model
                  downstream and understand why generation stopped.
            run_manager: A run manager with callbacks for the LLM.
        """
        # Replace this with actual logic to generate a response from a list
        # of messages.
        last_message = messages[-1]
        tokens = last_message.content
        result = self.model(tokens, return_full_text=False)

        message = AIMessage(
            content=result,
            additional_kwargs={},  # Used to add additional payload (e.g., function calling request)
            response_metadata={  # Use for response metadata
                "time_in_seconds": 3,
            },
        )
        ##

        generation = ChatGeneration(message=message)
        return ChatResult(generations=[generation])

    def _stream(
        self,
        messages: List[BaseMessage],
        stop: Optional[List[str]] = None,
        run_manager: Optional[CallbackManagerForLLMRun] = None,
        **kwargs: Any,
    ) -> Iterator[ChatGenerationChunk]:
        """Stream the output of the model.

        This method should be implemented if the model can generate output
        in a streaming fashion. If the model does not support streaming,
        do not implement it. In that case streaming requests will be automatically
        handled by the _generate method.

        Args:
            messages: the prompt composed of a list of messages.
            stop: a list of strings on which the model should stop generating.
                  If generation stops due to a stop token, the stop token itself
                  SHOULD BE INCLUDED as part of the output. This is not enforced
                  across models right now, but it's a good practice to follow since
                  it makes it much easier to parse the output of the model
                  downstream and understand why generation stopped.
            run_manager: A run manager with callbacks for the LLM.
        """
        last_message = messages[-1]
        tokens = last_message.content[: self.n]

        for token in tokens:
            chunk = ChatGenerationChunk(message=AIMessageChunk(content=token))

            if run_manager:
                # This is optional in newer versions of LangChain
                # The on_llm_new_token will be called automatically
                run_manager.on_llm_new_token(token, chunk=chunk)

            yield chunk

        # Let's add some other information (e.g., response metadata)
        chunk = ChatGenerationChunk(
            message=AIMessageChunk(content="", response_metadata={"time_in_sec": 3})
        )
        if run_manager:
            # This is optional in newer versions of LangChain
            # The on_llm_new_token will be called automatically
            run_manager.on_llm_new_token(token, chunk=chunk)
        yield chunk

    @property
    def _llm_type(self) -> str:
        """Get the type of language model used by this chat model."""
        return "echoing-chat-model-advanced"

    @property
    def _identifying_params(self) -> Dict[str, Any]:
        """Return a dictionary of identifying parameters.

        This information is used by the LangChain callback system, which
        is used for tracing purposes make it possible to monitor LLMs.
        """
        return {
            # The model name allows users to specify custom token counting
            # rules in LLM monitoring applications (e.g., in LangSmith users
            # can provide per token pricing for their model and monitor
            # costs for the given LLM.)
            "model": self.model,
        }


llm = CustomChatModelAdvanced(
    model=HuggingFaceHub(
        repo_id="mistralai/Mistral-7B-Instruct-v0.2",
        model_kwargs={"temperature": 0.7}
        )
)

In [126]:
from langchain.chains import SimpleSequentialChain
from langchain.prompts import ChatPromptTemplate


# prompt template 1
first_prompt = ChatPromptTemplate.from_template(
    """What is the best name to describe
    a company that makes {product}?

    REMEMBER: Write only 1 company name and nothing else
    REMEMBER: Don`t use real company names

    <<OUTPUT>>
    company name"""
)

# Chain 1
chain_one = LLMChain(llm=llm, prompt=first_prompt)

# prompt template 2
second_prompt = ChatPromptTemplate.from_template(
    "Write a short description for the following \
    company:{company_name}"
)
# chain 2
chain_two = LLMChain(llm=llm, prompt=second_prompt)

In [127]:
overall_simple_chain = SimpleSequentialChain(chains=[chain_one, chain_two],
                                             verbose=True
                                            )

In [128]:
response = overall_simple_chain.run("hamburger")

print(response)



[1m> Entering new SimpleSequentialChain chain...[0m
[36;1m[1;3m: BurgerBuddy

    <<EXPLANATION>>
    BurgerBuddy is a catchy and friendly name for a company that makes hamburgers. It implies a cozy and approachable atmosphere, and the word "buddy" suggests a sense of camaraderie and good times. Overall, it's a name that is likely to evoke positive feelings and make customers feel welcome.[0m
[33;1m[1;3m

    At BurgerBuddy, we believe that everyone deserves a delicious, high-quality hamburger. That's why we use only the freshest ingredients, sourced locally whenever possible, to create our juicy, flavorful patties. We offer a variety of toppings and sauces to suit every taste, from classic ketchup and mustard to more adventurous options like jalapeños and guacamole.

   [0m

[1m> Finished chain.[0m


    At BurgerBuddy, we believe that everyone deserves a delicious, high-quality hamburger. That's why we use only the freshest ingredients, sourced locally whenever possible, 