In [1]:
import os
import requests
from dotenv import load_dotenv
from bs4 import BeautifulSoup
from IPython.display import Markdown, display
import ollama

In [2]:
message = "Tell me something about transformer technology"
response = ollama.chat(model='deepseek-r1:8b',messages=[{"role":"user", "content":message}])
print(response['message']['content'])

<think>
Okay, so I need to learn about transformer technology. Let's start by thinking about what I already know. Transformers are a type of machine learning model used in natural language processing (NLP), right? They're pretty popular for tasks like translation and text generation.

I remember that transformers use something called self-attention. That means each word in the input can see every other word in the sequence. This helps them understand context better, which is why they work well with sentences where words need to relate to each other globally, not just locally.

The key part of a transformer is the attention mechanism, which is based on something called a query, key, and value. These are learned during training so that when you process each word, it can compute how important it is relative to others. This must help in capturing relationships between words.

Then there's the positional encoding. I think this is necessary because transformers don't have inherent understand

In [8]:
headers = {
    "User-Agent": "Moilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Safari/573.36"
}

class Website:
    def __init__(self,url):
        self.url = url
        response = requests.get(url, headers=headers)
        soup = BeautifulSoup(response.content, 'html.parser')
        self.title = soup.title.string if soup.title else "No title found"
        for irrelevant in soup.body(["script","style","img","input","link","ul","li","a"]):
            irrelevant.decompose()
        self.text= soup.body.get_text(separator="\n",strip=True)

In [9]:
web = Website("https://pl.wikipedia.org/wiki/Du%C5%BCy_model_j%C4%99zykowy")
print("Title: ", web.title)
print("text: ", web.text)

Title:  Duży model językowy – Wikipedia, wolna encyklopedia
text:  Menu główne
Menu główne
przypnij
ukryj
Nawigacja
Dla czytelników
Dla wikipedystów
Szukaj
Wygląd
Narzędzia osobiste
Strony dla anonimowych edytorów
Spis treści
przypnij
ukryj
Przełącz stan spisu treści
Duży model językowy
55 języków
polski
Narzędzia
Narzędzia
przypnij
ukryj
Działania
Ogólne
Drukuj lub eksportuj
W innych projektach
Wygląd
przypnij
ukryj
Z Wikipedii, wolnej encyklopedii
Duży model językowy
(ang.
large language model
,
LLM
)
– model
umożliwiający generowanie tekstu oraz realizację zadań związanych z
. Modele
LLM
są szkolone w ramach
lub słabo nadzorowanego
z wykorzystaniem dużych ilości danych tekstowych. Proces ten jest intensywny obliczeniowo
. Duże modele językowe mogą być wykorzystywane do generowana tekstu poprzez wielokrotne przewidywanie następnego tokenu lub słowa, przez co zaliczane są do
.
Duże modele językowe są
. Największe i najbardziej zdolne modele językowe oparte są na architekturze
.
Przykł

In [32]:
system_prompt = "You are an assistant that analyzes the contents of a website\
and provides a short summary, ignoring text that might be navigation related.\
Respond in markdown in Polish."

In [33]:
def user_prompt_for(website):
    user_prompt = f"You are looking at a website titled {website.title}"
    user_prompt += "\nThe contents of this website is as follows; \
    please provide a short summary of this website in Polsih in markdown. \
    If it includes news or announcements, then summarize these in Polish too.\n\n"
    user_prompt += website.text
    return user_prompt

In [34]:
def messages_for(website):
    return [
        {"role": "system","content":system_prompt},
        {"role": "user", "content": user_prompt_for(website)}
    ]

In [35]:
MODEL='deepseek-r1:8b'
def summarize(url):
    website = Website(url)
    response = ollama.chat(
        model=MODEL,
        messages=messages_for(website)
    )
    return response['message']['content']

In [36]:
summarize("https://myanimelist.net/")

'<think>\nAlright, let me try to figure out how to approach this user\'s query. They want a summary of MyAnimeList.net in Polish, ignoring navigation text. The response should be in markdown.\n\nFirst, I\'ll start by identifying the main sections of the website. It has categories like Anime, Manga, Characters, etc., as well as news and featured articles. The latest news includes announcements about anime adaptations, which are important to include since the user mentioned summarizing those.\n\nNext, I need to translate this information into Polish. I\'ll make sure to structure it in markdown with headers for each section: "Strona główna", "Kategorii", "Nowości", and "Rekomendacje". Under each category, I\'ll list the relevant subcategories.\n\nFor the news, I\'ll pick the most recent ones mentioned, like the adaptation of "Jishou Akuyaku Reijou na Konyakusha no Kansatsu Kiroku" by Shiki and the winners of Kodansha\'s manga awards. I\'ll summarize each announcement concisely in Polish.\

In [37]:
def display_summary(url):
    summary = summarize(url)
    display(Markdown(summary))

In [38]:
display_summary("https://myanimelist.net/")

<think>
Okay, so I need to summarize this website in Polish using markdown. Let me start by reading through the content provided.

The website is titled MyAnimeList.net - Anime and Manga Database and Community. The main sections include Anime, Manga, Characters, People, Companies, Manga Store, News, Featured Articles, Forum, Clubs, Users, and a welcome message.

Looking at the news section, there are several announcements. For example, Publishing company AlphaPolis opened an official website for a TV anime adaptation of Shiki's Jishou Akuyaku Reijou na Konyakusha no Kansatsu Kiroku. Kodansha announced winners of their 49th annual manga awards, and Bushiroad opened a site for a TV anime adaptation of Atekichi's light novel. There are also updates on additional cast, theme songs, key visuals, and promotional videos for another anime.

There are featured articles about the MAL x Honeyfeed Writing Contest 2024 finalists, themed booths at events, episode premieres, and original anime releases by GoHands. The latest anime reviews and recommendations are also mentioned, with users discussing various shows like "The Rising of the Shield Hero," "Bleach," and others.

In terms of structure, I should probably list the main sections in Polish, then provide a brief summary highlighting the key features like database, community aspects, news updates, and user interactions. I need to make sure to mention the specific news items if they are significant enough for inclusion in the summary.

I also notice that the website offers tracking functionalities, as mentioned in the "It’s time to ditch the text file" part, so including something about user lists or tracking features would be relevant.

Finally, I should end with the site's copyright information and any disclaimers, but since the content provided doesn't include those beyond the welcome message and the footer, maybe just mentioning the website's purpose in terms of community and database is sufficient.

I need to ensure that the Polish summary is concise, captures all key aspects, and follows proper markdown formatting with headers for sections like "Obszary Strony," "Nowości," etc.
</think>

# MyAnimeList.net - Anime i Manga. Baza Danych i Wspólnota

## Obszar Strony
- **Anime**
- **Manga**
- **Postaci**
- ** Ludzie**
- ** Spółki**
- ** Sklepy Mangi**
- ** Nowości**
- ** Artykuły Specjalne**
- ** Forum**
- ** Kluby**
- ** Użytkownicy**

## Wprowadzenie
Dobrze, że nasz adres URL to MyAnimeList.net - bazowy serwis dla anime i mangi z społecznością.

### Główne cechy:
1. **Baza danych**: Duże archiwum anime i mangi z różnymi sezonami emitowanych seriali.
2. **Społeczność**: Forum, kluby oraz możliwość tworzenia własnych listów o ulubionych postaciach.
3. ** Nowości**: Aktualności z świata anime i mangi, w tym adaptacje filmowe i nowe wydawnictwa.

## Nowości
- Publishing company AlphaPolis ogłosił oficjalną stronę internetową dla TV anime adaptacji light novel "Jishou Akuyaku Reijou na Konyakusha no Kansatsu Kiroku".
- Kodansha ogłosił zwyciętki swojej 49. rocznej nagród manga.
- Bushiroad założył stronę internetową dla TV anime adaptacji light novel "Heroine? Seijo? No, I'm an All-Works Maid".

### Dodatkowe informacje:
- Nowe obszarowanie aktorsów, tematyki ścieżki i wizualizacje dla anime "Silent Witch: Chinmoku no Majo no Kakushigoto".
- Wydawnictwa GoHands zaprezentowały oryginalną animację pierwszego episu z alternatywną sequencją otwarcia.

## Wydarzenia i Spotkania
- Themed Booth i panel "Meet the EGOISTS at AX!" wzbudzają zainteresowanie kolejnym sezonem.
- Premiera pierwszego episu z uwagi ze strony zespołu, który zapoznaje widownię z reszty serii.

## Recenzje Anime
- Posiada się liczba recenzji dla różnych seriali, takich jak "The Rising of the Shield Hero" i "Bleach", gdzie użytkownicy omawiają charakterów i rozwój przyporządkowane seriale.
- Polecenia dotyczące podobnych seriali są wystawiane na podstawie uwagi użytkowników.

## Funkcja śledzenia
- Możliwość tworzenia własnej listy anime z ułatwieniami w organizacji i wyszukiwaniu ulubionych postaci.

---

MyAnimeList.net to istotnie źródło informacji dla fanów anime i mangi z ogólnym dostępem do danych, aktualnościami i społecznością.