# Connecting to OpenAI 


In [1]:
import os
import requests
from dotenv import load_dotenv
from bs4 import BeautifulSoup
from IPython.display import Markdown, display
from openai import OpenAI


In [5]:
load_dotenv(override=True)
api_key = os.getenv('OPENAI_API_KEY')

# Check the key

if not api_key:
    print("No API key was found!")

In [13]:
openai = OpenAI()

# Frontier model

In [7]:
message = "Hello, GPT! This is my first ever message to you! Hi!"
response = openai.chat.completions.create(model="gpt-4o-mini", messages=[{"role":"user", "content":message}])
print(response.choices[0].message.content)

Hello! Welcome! I'm glad to have you here. How can I assist you today?


In [8]:
# A class to represent a Webpage
# If you're not familiar with Classes, check out the "Intermediate Python" notebook

# Some websites need you to use proper headers when fetching them:
headers = {
 "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/117.0.0.0 Safari/537.36"
}

class Website:

    def __init__(self, url):
        """
        Create this Website object from the given url using the BeautifulSoup library
        """
        self.url = url
        response = requests.get(url, headers=headers)
        soup = BeautifulSoup(response.content, 'html.parser')
        self.title = soup.title.string if soup.title else "No title found"
        for irrelevant in soup.body(["script", "style", "img", "input"]):
            irrelevant.decompose()
        self.text = soup.body.get_text(separator="\n", strip=True)

In [27]:
# Let's try one out. Change the website and add print statements to follow along.

person = Website("https://fa.wikipedia.org/wiki/%D8%AD%D8%A7%D9%81%D8%B8")
print(person.title)
print(person.text)

حافظ - ویکی‌پدیا، دانشنامهٔ آزاد
پرش به محتوا
منوی اصلی
منوی اصلی
انتقال به نوار کناری
نهفتن
بازدید محتوا
صفحهٔ اصلی
رویدادهای کنونی
مقالهٔ تصادفی
همکاری
تغییرات اخیر
ویکی‌نویس شوید!
راهنما
تماس با ویکی‌پدیا
جستجو
جستجو
ظاهر
کمک مالی
ساخت حساب
ورود
ابزارهای شخصی
کمک مالی
ساخت حساب
ورود
فهرست
انتقال به نوار کناری
نهفتن
بخش آغازین
۱
زمینهٔ تاریخی
تغییر وضعیت زیربخش‌های زمینهٔ تاریخی
۱.۱
زبان و ادب فارسی در روزگار حافظ
۲
داستان‌های زندگی
تغییر وضعیت زیربخش‌های داستان‌های زندگی
۲.۱
در روزگار نو
۲.۱.۱
تولد
۲.۱.۲
نام و نشان
۲.۱.۳
پرورش و بالندگی
۲.۱.۴
تحصیل و تدریس
۲.۱.۵
خانواده
۲.۱.۶
سفرها
۳
دیوان حافظ
۴
ممدوحان و معاصران حافظ
۵
درگذشت و آرامگاه
۶
جهان‌بینی حافظ
تغییر وضعیت زیربخش‌های جهان‌بینی حافظ
۶.۱
مذهب
۶.۲
تصوف و عرفان
۶.۳
انتقاد از شرایط زمانه
۶.۴
مکتب رندی
۷
موسیقی در شعر حافظ
تغییر وضعیت زیربخش‌های موسیقی در شعر حافظ
۷.۱
موسیقی بیرونی
۷.۱.۱
وزن در شعر حافظ
۷.۲
موسیقی درونی
۷.۲.۱
واژگان موسیقایی
۷.۳
موسیقی کناری
۸
سبک و هنر شعری
تغییر وضعیت زیربخش‌های سبک و هنر شعری
۸.۱
مدح در غزل
۸

## Types of prompts

Models like GPT4o have been trained to receive instructions in a particular way.

They expect to receive:

**A system prompt** that tells them what task they are performing and what tone they should use

**A user prompt** -- the conversation starter that they should reply to

In [30]:
# Define our system prompt - you can experiment with this later, changing the last sentence to 'Respond in markdown in Spanish."

system_prompt = "You are an assistant that analyzes the contents of a website \
and provides a short summary, ignoring text that might be navigation related. \
Respond in markdown."

In [31]:
# A function that writes a User Prompt that asks for summaries of websites:

def user_prompt_for(website):
    user_prompt = f"You are looking at a website titled {website.title}"
    user_prompt += "\nThe contents of this website is as follows; \
please provide a short summary of this website in markdown. \
If it includes news or announcements, then summarize these too.\n\n"
    user_prompt += website.text
    return user_prompt

In [32]:
print(user_prompt_for(person))

You are looking at a website titled حافظ - ویکی‌پدیا، دانشنامهٔ آزاد
The contents of this website is as follows; please provide a short summary of this website in markdown. If it includes news or announcements, then summarize these too.

پرش به محتوا
منوی اصلی
منوی اصلی
انتقال به نوار کناری
نهفتن
بازدید محتوا
صفحهٔ اصلی
رویدادهای کنونی
مقالهٔ تصادفی
همکاری
تغییرات اخیر
ویکی‌نویس شوید!
راهنما
تماس با ویکی‌پدیا
جستجو
جستجو
ظاهر
کمک مالی
ساخت حساب
ورود
ابزارهای شخصی
کمک مالی
ساخت حساب
ورود
فهرست
انتقال به نوار کناری
نهفتن
بخش آغازین
۱
زمینهٔ تاریخی
تغییر وضعیت زیربخش‌های زمینهٔ تاریخی
۱.۱
زبان و ادب فارسی در روزگار حافظ
۲
داستان‌های زندگی
تغییر وضعیت زیربخش‌های داستان‌های زندگی
۲.۱
در روزگار نو
۲.۱.۱
تولد
۲.۱.۲
نام و نشان
۲.۱.۳
پرورش و بالندگی
۲.۱.۴
تحصیل و تدریس
۲.۱.۵
خانواده
۲.۱.۶
سفرها
۳
دیوان حافظ
۴
ممدوحان و معاصران حافظ
۵
درگذشت و آرامگاه
۶
جهان‌بینی حافظ
تغییر وضعیت زیربخش‌های جهان‌بینی حافظ
۶.۱
مذهب
۶.۲
تصوف و عرفان
۶.۳
انتقاد از شرایط زمانه
۶.۴
مکتب رندی
۷
موسیقی در شعر حافظ
تغیی

## Messages

The API from OpenAI expects to receive messages in a particular structure.
Many of the other APIs share this structure:

```python
[
    {"role": "system", "content": "system message goes here"},
    {"role": "user", "content": "user message goes here"}
]
```
To give you a preview, the next 2 cells make a rather simple call - we won't stretch the mighty GPT (yet!)

In [25]:
messages = [
    {"role": "system", "content": "شما یک دستیار شوخ طبع هستید"},
    {"role": "user", "content": "۲ + ۲ چند میشه؟"}
]

In [26]:
# To give you a preview -- calling OpenAI with system and user messages:

response = openai.chat.completions.create(model="gpt-4o-mini", messages=messages)
print(response.choices[0].message.content)

یعنی تو رو به چالش کشیدم! باید با جملات فلسفی پاسخ بدم: آیا دو تا دو، دو تا دو است یا دو تا چهار! ولی اگر بخوام جواب ساده بدم، ۲ + ۲ میشه ۴! بله، ریاضیات همیشه منطقی است، مگر اینکه در یک برنامه تلویزیونی کمدی باشید! 😄


In [33]:
# See how this function creates exactly the format above

def messages_for(website):
    return [
        {"role": "system", "content": system_prompt},
        {"role": "user", "content": user_prompt_for(website)}
    ]

In [34]:
messages_for(person)

[{'role': 'system',
  'content': 'You are an assistant that analyzes the contents of a website and provides a short summary, ignoring text that might be navigation related. Respond in markdown.'},
 {'role': 'user',
  'content': 'You are looking at a website titled حافظ - ویکی\u200cپدیا، دانشنامهٔ آزاد\nThe contents of this website is as follows; please provide a short summary of this website in markdown. If it includes news or announcements, then summarize these too.\n\nپرش به محتوا\nمنوی اصلی\nمنوی اصلی\nانتقال به نوار کناری\nنهفتن\nبازدید محتوا\nصفحهٔ اصلی\nرویدادهای کنونی\nمقالهٔ تصادفی\nهمکاری\nتغییرات اخیر\nویکی\u200cنویس شوید!\nراهنما\nتماس با ویکی\u200cپدیا\nجستجو\nجستجو\nظاهر\nکمک مالی\nساخت حساب\nورود\nابزارهای شخصی\nکمک مالی\nساخت حساب\nورود\nفهرست\nانتقال به نوار کناری\nنهفتن\nبخش آغازین\n۱\nزمینهٔ تاریخی\nتغییر وضعیت زیربخش\u200cهای زمینهٔ تاریخی\n۱.۱\nزبان و ادب فارسی در روزگار حافظ\n۲\nداستان\u200cهای زندگی\nتغییر وضعیت زیربخش\u200cهای داستان\u200cهای زندگی\n۲.۱\nدر روزگا

In [36]:
# And now: call the OpenAI API. You will get very familiar with this!

def summarize(url):
    website = Website(url)
    response = openai.chat.completions.create(
        model = "gpt-4o-mini",
        messages = messages_for(website)
    )
    return response.choices[0].message.content

In [37]:
summarize("https://fa.wikipedia.org/wiki/%D8%AD%D8%A7%D9%81%D8%B8")

RateLimitError: Error code: 429 - {'error': {'message': 'Request too large for gpt-4o-mini in organization org-Z3YbGRBhRiyUXwPifpqkWoaP on tokens per min (TPM): Limit 60000, Requested 72960. The input or output tokens must be reduced in order to run successfully. Visit https://platform.openai.com/account/rate-limits to learn more. You can increase your rate limit by adding a payment method to your account at https://platform.openai.com/account/billing.', 'type': 'tokens', 'param': None, 'code': 'rate_limit_exceeded'}}

In [None]:
# A function to display this nicely in the Jupyter output, using markdown

def display_summary(url):
    summary = summarize(url)
    display(Markdown(summary))

In [None]:
display_summary("https://fa.wikipedia.org/wiki/%D8%AD%D8%A7%D9%81%D8%B8")

# Open Source model
**Benefits:**
1. No API charges - open-source
2. Data doesn't leave your box

**Disadvantages:**
1. Significantly less power than Frontier Model

## Recap on installation of Ollama

Simply visit [ollama.com](https://ollama.com) and install!

Once complete, the ollama server should already be running locally.  
If you visit:  
[http://localhost:11434/](http://localhost:11434/)

You should see the message `Ollama is running`. 

In [38]:
# imports

import requests
from bs4 import BeautifulSoup
from IPython.display import Markdown, display

In [39]:
# Constants

OLLAMA_API = "http://localhost:11434/api/chat"
HEADERS = {"Content-Type": "application/json"}
MODEL = "llama3.2"

In [40]:
# Create a messages list using the same format that we used for OpenAI

messages = [
    {"role": "user", "content": "Describe some of the business applications of Generative AI"}
]

In [41]:
payload = {
        "model": MODEL,
        "messages": messages,
        "stream": False
    }

In [42]:
# Let's just make sure the model is loaded

!ollama pull llama3.2

Error: could not connect to ollama app, is it running?


In [43]:
# If this doesn't work for any reason, try the 2 versions in the following cells
# And double check the instructions in the 'Recap on installation of Ollama' at the top of this lab
# And if none of that works - contact me!

response = requests.post(OLLAMA_API, json=payload, headers=HEADERS)
print(response.json()['message']['content'])

ConnectionError: HTTPConnectionPool(host='localhost', port=11434): Max retries exceeded with url: /api/chat (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x787d403bcd70>: Failed to establish a new connection: [Errno 111] Connection refused'))

# Avalai