# Welcome to your first assignment!

Instructions are below. Please give this a try, and look in the solutions folder if you get stuck (or feel free to ask me!)

<table style="margin: 0; text-align: left;">
    <tr>
        <td style="width: 150px; height: 150px; vertical-align: middle;">
            <img src="../resources.jpg" width="150" height="150" style="display: block;" />
        </td>
        <td>
            <h2 style="color:#f71;">Just before we get to the assignment --</h2>
            <span style="color:#f71;">I thought I'd take a second to point you at this page of useful resources for the course. This includes links to all the slides.<br/>
            <a href="https://edwarddonner.com/2024/11/13/llm-engineering-resources/">https://edwarddonner.com/2024/11/13/llm-engineering-resources/</a><br/>
            Please keep this bookmarked, and I'll continue to add more useful links there over time.
            </span>
        </td>
    </tr>
</table>

# HOMEWORK EXERCISE ASSIGNMENT

Upgrade the day 1 project to summarize a webpage to use an Open Source model running locally via Ollama rather than OpenAI

You'll be able to use this technique for all subsequent projects if you'd prefer not to use paid APIs.

**Benefits:**
1. No API charges - open-source
2. Data doesn't leave your box

**Disadvantages:**
1. Significantly less power than Frontier Model

## Recap on installation of Ollama

Simply visit [ollama.com](https://ollama.com) and install!

Once complete, the ollama server should already be running locally.  
If you visit:  
[http://localhost:11434/](http://localhost:11434/)

You should see the message `Ollama is running`.  

If not, bring up a new Terminal (Mac) or Powershell (Windows) and enter `ollama serve`  
And in another Terminal (Mac) or Powershell (Windows), enter `ollama pull llama3.2`  
Then try [http://localhost:11434/](http://localhost:11434/) again.

If Ollama is slow on your machine, try using `llama3.2:1b` as an alternative. Run `ollama pull llama3.2:1b` from a Terminal or Powershell, and change the code below from `MODEL = "llama3.2"` to `MODEL = "llama3.2:1b"`

# **📌 Zadanie domowe – Użycie modelu Open Source zamiast OpenAI**

## **📖 Opis zadania**  
Twoim celem jest rozbudowa projektu z pierwszego dnia, który podsumowuje zawartość strony internetowej.  
Tym razem zamiast korzystać z API OpenAI, uruchomimy **model Open Source lokalnie** przy użyciu **Ollama**.  

### **✅ Korzyści:**
- **Brak opłat za API** – model działa lokalnie.  
- **Twoje dane pozostają na komputerze** – nie są wysyłane do chmury.  

### **⚠️ Ograniczenia:**  
- Modele Open Source działające lokalnie są **mniej wydajne** niż zaawansowane modele w chmurze (np. GPT-4).  

## **1️⃣ Instalacja Ollama**  

📌 **Aby zainstalować Ollama, odwiedź:**  
🔗 [ollama.com](https://ollama.com) i pobierz instalator odpowiedni dla Twojego systemu operacyjnego.  

Po instalacji **serwer Ollama powinien działać automatycznie**.  
Możesz to sprawdzić, otwierając przeglądarkę i wchodząc na:  
👉 [http://localhost:11434/](http://localhost:11434/)  

Jeśli zobaczysz komunikat:  

to znaczy, że wszystko działa poprawnie.  

---


In [2]:
# 📌 Importowanie wymaganych bibliotek

import requests  # Biblioteka do wykonywania żądań HTTP (np. pobierania stron internetowych)
from bs4 import BeautifulSoup  # Biblioteka do parsowania i ekstrakcji danych z HTML
from IPython.display import Markdown, display  # Moduły do wyświetlania sformatowanego tekstu w Jupyter Notebook

In [3]:
# 📌 Definicja stałych używanych w aplikacji

OLLAMA_API = "http://localhost:11434/api/chat"  # adres endpointu API lokalnie uruchomionego serwera Ollama, który pozwala na interakcję z modelem LLM.
HEADERS = {"Content-Type": "application/json"}  # nagłówek HTTP, który mówi, że wysyłane dane mają format JSON (wymagane przez API).
MODEL = "llama3.2"  # Nazwa modelu LLM, który będzie używany do przetwarzania zapytań

# MODEL = "llama3.2:1b"  # Mniejsza wersja modelu, która działa szybciej na słabszym sprzęcie

In [4]:
# Create a messages list using the same format that we used for OpenAI

messages = [
    {"role": "user", "content": "Describe some of the business applications of Generative AI"}
]

In [11]:
messages2 = [
    {"role": "system", "content": "Jesteś pomocnym asystentem od AI i komunikujesz się w języku polskim."},
    {"role": "user", "content": "Opisz niektóre zastosowania biznesowe generatywnej sztucznej inteligencji"}
]

In [6]:
# 📌 Tworzenie obiektu payload, który zostanie wysłany do API Ollama

payload = {
    "model": MODEL,  # Określenie, który model LLM ma być używany (np. "llama3.2")
    "messages": messages,  # Lista wiadomości w formacie zgodnym z API (historia rozmowy)
    "stream": False  # Ustawienie False oznacza, że odpowiedź zostanie zwrócona w całości (bez strumieniowania)
}

In [12]:
# 📌 Tworzenie obiektu payload, który zostanie wysłany do API Ollama

payload2 = {
    "model": MODEL,  # Określenie, który model LLM ma być używany (np. "llama3.2")
    "messages": messages2,  # Lista wiadomości w formacie zgodnym z API (historia rozmowy)
    "stream": False  # Ustawienie False oznacza, że odpowiedź zostanie zwrócona w całości (bez strumieniowania)
}

In [None]:
# 📌 Upewnienie się, że model LLM jest pobrany i gotowy do użycia

!ollama pull llama3.2  # Pobiera model "llama3.2" na lokalny serwer Ollama

In [14]:
!ollama list # To wyświetli wszystkie modele dostępne w Twoim systemie.

NAME               ID              SIZE      MODIFIED       
llama3.2:latest    a80c4f17acd5    2.0 GB    24 minutes ago    


In [15]:
# 📌 Wysyłanie zapytania do lokalnego API Ollama

response = requests.post(OLLAMA_API, json=payload, headers=HEADERS)  # Wysyłamy zapytanie POST do API
print(response.json()['message']['content'])  # Wyświetlamy odpowiedź modelu

Generative AI has numerous business applications across various industries. Here are some examples:

1. **Content Generation**: Generative AI can create high-quality content, such as articles, social media posts, product descriptions, and more. This can help businesses save time and resources on content creation.
2. **Chatbots and Virtual Assistants**: Generative AI can power chatbots and virtual assistants that provide customer support, answer frequently asked questions, and offer personalized recommendations.
3. **Image and Video Generation**: Generative AI can create realistic images and videos for use in advertising, marketing, and social media campaigns. This can help businesses create engaging visuals without requiring extensive design or production expertise.
4. **Music and Audio Generation**: Generative AI can create original music, sound effects, and audio tracks for use in film, television, and video games.
5. **Language Translation**: Generative AI can translate text from on

In [13]:
# 📌 Wysyłanie zapytania do lokalnego API Ollama

response = requests.post(OLLAMA_API, json=payload2, headers=HEADERS)  # Wysyłamy zapytanie POST do API
print(response.json()['message']['content'])  # Wyświetlamy odpowiedź modelu

Generatywna sztuczna inteligencja (GSI) jest dziedziną AI, która pozwala systemom informatycznym na tworzenie nowych, oryginalnych wyników lub rozwiązań. Oto kilka zastosowań biznesowych GSI:

1. **Kreatywność i projektowanie**: GSIA może być wykorzystana w projektowaniu produktów, usług i rozwiązywaniu problemów biznesowych. Można ją wykorzystać do stworzenia nowych pomysłów na produkty lub usługi, lub do udoskonalenia istniejących rozwiązań.
2. **Generowanie treści**: GSIA może być wykorzystana w generowaniu treści marketingowej, takiej jak artykuły, opisy produktów czy evenewska. Można ją wykorzystać do automatyzacji procesu generowania treści, co może zmniejszyć koszty i zwiększyć efektywność.
3. **Analityka danych**: GSIA może być wykorzystana w analizie dużych ilości danych, takiej jak dane rynkowe czy dane o behaviorskim zachowaniu konsumentów. Można ją wykorzystać do identyfikacji nowych tendencji i rozwiązań.
4. **Procesy automatyczne**: GSIA może być wykorzystana w automatyza

# Introducing the ollama package

And now we'll do the same thing, but using the elegant ollama python package instead of a direct HTTP call.

Under the hood, it's making the same call as above to the ollama server running at localhost:11434

In [None]:
# 📌 Wysyłanie zapytania do lokalnego API Ollama

response = requests.post(OLLAMA_API, json=payload, headers=HEADERS)  # Wysyłamy zapytanie POST do API
print(response.json()['message']['content'])  # Wyświetlamy odpowiedź modelu

In [17]:
# 📌 Wysyłanie zapytania do lokalnego modelu Ollama za pomocą biblioteki `ollama`
# Zalety korzystania z ollama zamiast requests:

# ✅ Łatwiejsza obsługa – Nie trzeba ręcznie wysyłać zapytań HTTP.
# ✅ Lepsza integracja – Biblioteka ollama jest zoptymalizowana dla lokalnych modeli.
# ✅ Prostszy kod – Mniej konfiguracji i obsługi błędów.

import ollama # Importuje natywną bibliotekę Ollama, która pozwala komunikować się z lokalnym modelem bez użycia requests.

# Wysłanie zapytania do modelu
response = ollama.chat(model=MODEL, messages=messages)

# Wyświetlenie wygenerowanej odpowiedzi
print(response['message']['content'])  

Generative AI has numerous business applications across various industries. Here are some examples:

1. **Content Generation**: Generative AI can be used to generate high-quality content, such as articles, social media posts, and product descriptions, at scale and speed. This can help businesses save time and resources while maintaining consistency in their branding.
2. **Product Design and Development**: Generative AI can assist in the design and development of new products by generating 3D models, prototypes, and even entire product lines. This can accelerate the product development process and reduce costs.
3. **Marketing and Advertising**: Generative AI can be used to create personalized advertisements, generate social media content, and even predict consumer behavior. This can help businesses optimize their marketing campaigns for better engagement and conversion rates.
4. **Customer Service Chatbots**: Generative AI-powered chatbots can be used to provide 24/7 customer support, a

## Alternative approach - using OpenAI python library to connect to Ollama

In [18]:
# 📌 Importujemy klienta OpenAI – standardowa biblioteka do obsługi modeli językowych
from openai import OpenAI  

# 📌 Inicjalizujemy klienta OpenAI, ale zamiast standardowego API OpenAI
# używamy lokalnego serwera Ollama, który działa na http://localhost:11434/v1
# API key nie jest wymagany, ale OpenAI client go wymaga, więc podajemy dowolną wartość ('ollama').
ollama_via_openai = OpenAI(base_url='http://localhost:11434/v1', api_key='ollama')

# 📌 Wysyłamy zapytanie do lokalnego serwera Ollama za pomocą metody `chat.completions.create()`
# - `model=MODEL` → określamy, jakiego modelu chcemy użyć (np. "llama3.2")
# - `messages=messages` → przekazujemy historię rozmowy w formacie OpenAI API
response = ollama_via_openai.chat.completions.create(
    model=MODEL,
    messages=messages
)

# 📌 Wyciągamy i drukujemy treść wygenerowanej odpowiedzi.
# - `response.choices[0].message.content` → dostęp do pierwszej (i jedynej) wygenerowanej odpowiedzi
print(response.choices[0].message.content)

Generative AI has numerous business applications across various industries. Here are some examples:

1. **Content Creation**: Generative AI can be used to create high-quality content such as articles, social media posts, product descriptions, and more. This can help businesses save time and resources spent on manual content creation.
2. **Graphic Design**: Generative AI-powered design tools can create graphics, logos, and infographics with ease, reducing the need for expensive hiring a professional designer.
3. **Image Generation**: Generative AI can be used to generate realistic images, videos, and 3D models, which can be applied in various fields like marketing, advertising, and entertainment.
4. **Chatbots and Virtual Assistants**: Generative AI-powered chatbots can help businesses provide customer support, answer frequently asked questions, and engage with customers in a more personalized manner.
5. **Product Recommendations**: Generative AI can analyze customer data and preference

## Also trying the amazing reasoning model DeepSeek

Here we use the version of DeepSeek-reasoner that's been distilled to 1.5B.  
This is actually a 1.5B variant of Qwen that has been fine-tuned using synethic data generated by Deepseek R1.

Other sizes of DeepSeek are [here](https://ollama.com/library/deepseek-r1) all the way up to the full 671B parameter version, which would use up 404GB of your drive and is far too large for most!

In [None]:
!ollama pull deepseek-r1:1.5b

In [20]:
# Importujemy klienta OpenAI, który pozwala na interakcję z modelem Ollama
response = ollama_via_openai.chat.completions.create(
    model="deepseek-r1:1.5b",  # Wybieramy model językowy "DeepSeek R1" w wersji 1.5B parametrów
    messages=[  # Tworzymy listę wiadomości, które będą przekazane do modelu
        {
            "role": "user",  # Określamy, że to użytkownik (user) wysyła wiadomość
            "content": "Please give definitions of some core concepts behind LLMs: "
                       "a neural network, attention and the transformer"  
            # Treść zapytania – prosimy model o definicje kluczowych pojęć związanych z LLM:
            # sieć neuronowa, mechanizm uwagi (attention) i architektura transformera.
        }
    ]
)

# Wydobywamy i drukujemy odpowiedź modelu, znajdującą się w pierwszym wyborze (choices[0])
# Struktura odpowiedzi OpenAI pozwala na wielokrotne odpowiedzi, ale tutaj pobieramy tylko pierwszą
print(response.choices[0].message.content)

<think>
Okay, so I need to figure out how to define the core concepts behind LLMs—neural networks, attention, and transformers. Let me start by recalling what I know about these topics.

First off, Large Language Models (LLMs) are systems that can generate human-level text based on a limited set of training data. So they're pretty big in AI and natural language processing. But the core concepts that define their architecture must be more specific than just "large" or "ai."

I remember hearing about neural networks being crucial for LLMs because they process information using layers and nodes, which can handle complex patterns. Maybe it's something to do with how these models learn from data through layer by layer processing.

Then there are attention mechanisms and transformers. I think attention is a way the model focuses on specific parts of the input when making decisions. Transformers, on the other hand, have blocks called "modules" that process inputs sequentially. The key thing I

# NOW the exercise for you

Take the code from day1 and incorporate it here, to build a website summarizer that uses Llama 3.2 running locally instead of OpenAI; use either of the above approaches.

In [40]:
import os
import ollama
import requests
from bs4 import BeautifulSoup
from IPython.display import Markdown, display

In [41]:
system_prompt = "Jesteś asystentem, który analizuje zawartość witryny \
i dostarcza krótkie podsumowanie, ignorując tekst, który może być związany z nawigacją. \
Odpowiedz w Markdownie."

In [42]:
headers = {
 "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Safari/537.36"
}

class Website:

    def __init__(self, url):
        self.url = url
        response = requests.get(url, headers=headers)
        soup = BeautifulSoup(response.content, 'html.parser')
        self.title = soup.title.string if soup.title else "No title found"
        for irrelevant in soup.body(["script", "style", "img", "input"]):
            irrelevant.decompose()
        self.text = soup.body.get_text(separator="\n", strip=True)

cnn = Website("https://cnn.com")

In [43]:
print(cnn.title)

Breaking News, Latest News and Videos | CNN


In [None]:
print(cnn.text)

In [49]:
def user_prompt_for(website):
    user_prompt = f"You are looking at a website titled {website.title}"
    user_prompt += "\nThe contents of this website is as follows; \
please provide a short summary of this website in markdown. \
If it includes news or announcements, then summarize these too.\n\n"
    user_prompt += website.text
    return user_prompt

print(user_prompt_for(cnn))

You are looking at a website titled Breaking News, Latest News and Videos | CNN
The contents of this website is as follows; please provide a short summary of this website in markdown. If it includes news or announcements, then summarize these too.

CNN values your feedback
1. How relevant is this ad to you?
2. Did you encounter any technical issues?
Video player was slow to load content
Video content never loaded
Ad froze or did not finish loading
Video content did not start after ad
Audio on ad was too loud
Other issues
Ad never loaded
Ad prevented/slowed the page from loading
Content moved around while ad loaded
Ad was repetitive to ads I've seen previously
Other issues
Cancel
Submit
Thank You!
Your effort and contribution in providing this feedback is much
                                        appreciated.
Close
Ad Feedback
Close icon
US
World
Politics
Business
Health
Entertainment
Style
Travel
Sports
Science
Climate
Weather
Ukraine-Russia War
Israel-Hamas War
More
US
World
Politi

In [54]:
def messages_for(website):
    return [
        {"role": "system", "content": system_prompt},
        {"role": "user", "content": user_prompt_for(website)}
    ]

messages_for(cnn)

[{'role': 'system',
  'content': 'Jesteś asystentem, który analizuje zawartość witryny i dostarcza krótkie podsumowanie, ignorując tekst, który może być związany z nawigacją. Odpowiedz w Markdownie.'},
 {'role': 'user',
  'content': "You are looking at a website titled Breaking News, Latest News and Videos | CNN\nThe contents of this website is as follows; please provide a short summary of this website in markdown. If it includes news or announcements, then summarize these too.\n\nCNN values your feedback\n1. How relevant is this ad to you?\n2. Did you encounter any technical issues?\nVideo player was slow to load content\nVideo content never loaded\nAd froze or did not finish loading\nVideo content did not start after ad\nAudio on ad was too loud\nOther issues\nAd never loaded\nAd prevented/slowed the page from loading\nContent moved around while ad loaded\nAd was repetitive to ads I've seen previously\nOther issues\nCancel\nSubmit\nThank You!\nYour effort and contribution in providin

In [55]:
def summarize(url):
    website = Website(url)
    response = ollama.chat(
        model = MODEL,
        messages = messages_for(website)
    )
    return response['message']['content']

summarize("https://cnn.com")

"This appears to be a CNN website, with various sections and articles on different topics. However, I can't provide a specific answer or recommendation without knowing what you're looking for.\n\nIf you could provide more context or clarify what you'd like to know or discuss, I'll do my best to assist you."

In [56]:
def display_summary(url):
    summary = summarize(url)
    display(Markdown(summary))

display_summary("https://cnn.com")

This is the CNN homepage, and it appears to be a news aggregator page that provides summaries of various news articles from around the world. The page includes a mix of headlines, images, and videos from different sections such as:

* World: News from Africa, Americas, Asia, Australia, China, Europe, India, Middle East, and United Kingdom.
* US Politics: News from Congress, SCOTUS, and US elections.
* Business: News on markets, investing, and technology.
* Health: News on fitness, food, sleep, mindfulness, relationships, entertainment, and more.
* Science: News on space, climate, weather, and solutions.

The page also includes a section called "In Case You Missed It" which provides summaries of important news articles that may have been missed by users.

Overall, this is a comprehensive news aggregator page that aims to provide users with a broad range of news from around the world.