<a href="https://colab.research.google.com/github/Jakub-Ner/NoteScribe/blob/main/OdlotowiAgenci.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [91]:
#@title Initial configuration
!pip install langchain openai elevenlabs > /dev/null 2>&1
!pip install pytesseract > /dev/null 2>&1
!pip install pdf2image > /dev/null 2>&1
!pip install fpdf > /dev/null 2>&1

!pip install unstructured tiktoken chromadb chroma pypdf > /dev/null 2>&1
!apt-get install tesseract-ocr > /dev/null 2>&1
!apt-get install libtesseract-dev > /dev/null 2>&1
!apt-get install poppler-utils > /dev/null 2>&1

# Download Polish language data file
!wget https://github.com/tesseract-ocr/tessdata/raw/main/pol.traineddata > /dev/null 2>&1

# Specify the Tesseract data directory
tessdata_dir = '/usr/share/tesseract-ocr/4.00/tessdata/'

# Move the downloaded language data file to the Tesseract data directory
!mv pol.traineddata $tessdata_dir

# Set TESSDATA_PREFIX environment variable
import os
import elevenlabs
from getpass import getpass

OPENAI_API_KEY = getpass("OPENAI_API_KEY: ")
elevenlabs.set_api_key(getpass("11_LABS_API_KEY: ")) 

os.environ['TESSDATA_PREFIX'] = tessdata_dir
os.environ["OPENAI_API_KEY"] = OPENAI_API_KEY


OPENAI_API_KEY: ··········
11_LABS_API_KEY: ··········


## **Utils**

In [76]:
# @title Convert .md -> .pdf { display-mode: "form" }
!sudo apt-get install pandoc texlive-latex-base texlive-fonts-recommended texlive-extra-utils texlive-latex-extra > /dev/null 2>&1

def md_to_pdf():
  """Converts md file into pdf."""
  !pandoc /content/sample_data/conversation.md -o /content/sample_data/conversation.pdf


In [77]:
# @title Downloader { display-mode: "form" }
from google.colab import files

def download_conversation(text, file_path="/content/sample_data/conversation"):
  with open(f"{file_path}.md", "w+") as f:
    f.write(text)

  md_to_pdf()
  files.download(f"{file_path}.pdf")


In [78]:
#@title Print Markdown { display-mode: "form" }
from IPython.display import Markdown

def print_md(text=r'#**Hello** *World:* $\frac{1}{2} \times \pi \times r^2$'):
    display(Markdown(text))


In [79]:
#@title 11Labs { display-mode: "form" }
from elevenlabs import generate, play

def generate_and_play(text="Some very long text to be read by the voice"):
  audio = generate(
      text=text, 
      model='eleven_multilingual_v1'
      )

  play(audio, notebook=True)


## **Agent Tools**

In [80]:
#@title Menu View
MENU_VIEW = \
"""# Welcome!
## Settings:
 - audio (**on**/off)
 - text formatting (**.md**/.txt)
 - language

## Avaliable programs:
 - compendium - university courses content scraper and personal tutor
 - img2pdf - converter for images to pdfd
"""

MENU_VIEW_PL = \
"""# Witaj
## Ustawienia:
 - audio (**wł** / wył)
 - formatowanie tekstu (**.md** / .txt)
 - język

## Dostępne narzędzia:
 - Compendium -  Wyszukiwarka wiedzy uniwersyteckiej i osobisty tutor
 - im2pdf - Konwerter zdjęć do pdf
"""

In [92]:
#@title ChatConfiguration { display-mode: "form" }
from pydantic import BaseModel, Field
from typing import Literal

from langchain.callbacks import get_openai_callback
from langchain.tools import tool

USE_CASE_LITERAL = Literal["menu", "compendium"]
STATE_AUDIO_LITERAL = Literal["on", "off"]
STATE_TEXT_LITERAL = Literal["md", "txt"]

class ChatConfigurationSingleton:
  __instance = None

  use_case: USE_CASE_LITERAL = "menu"
  audio_state: STATE_AUDIO_LITERAL = "on"
  text_state: STATE_TEXT_LITERAL = "md"

  used_tokens = 0
  total_cost = 0

  def __new__(cls, *args, **kwargs):
    if not cls.__instance:
        cls.__instance = super().__new__(cls, *args, **kwargs)
    return cls.__instance

  def _extract_inf(self, openai_cb):
    self.used_tokens += openai_cb.total_tokens
    self.total_cost += openai_cb.total_cost

  def show(self, text):
    if self.text_state == "md":
      print_md(text)
    else:
      print(text)

    if self.audio_state == "on":
      generate_and_play(text)
      

  def run(self, run_func, text):
    with get_openai_callback() as cb:
      response = run_func(text)
      self._extract_inf(cb)

    self.show(response)

chat_config = ChatConfigurationSingleton()


@tool(return_direct=True)
def set_use_case_toool(state: USE_CASE_LITERAL) -> str:
  """"Useful at the beginning, when user knows what he want
    @param use_case: The use case to be processed.
      "menu" - back to menu
      "compendium" - university courses content scraper and personal tutor
      img2pdf
  """
  chat_config.use_case = state
  return f"Switched to {state}"

@tool(return_direct=True)
def set_audio_tool(state: STATE_AUDIO_LITERAL) -> str:
  """Useful when user want or don't want speaking responses"""
  chat_config.audio_state = state
  return f"From now audio responses are turned {state}"

@tool(return_direct=True)
def set_markdown_tool(state: STATE_TEXT_LITERAL) -> str:
  """Turn off or on markdown formatted responses"""
  chat_config.text_state = state
  return f"From now messages are displayed using {state}"


## **Compendium**

In [82]:
courses_recources = {
    "Fizyka I" : [
      ("pl", "/content/GFG-15.pdf")   
    ],
    "analiza matematyczna": {
        
    }
} 

In [83]:
#@title Resource fetcher
from langchain.document_loaders import UnstructuredPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.llms import OpenAI
from langchain import PromptTemplate, LLMChain
import json

def getLanguage(text):
  llm = OpenAI(temperature = 0)

  prompt = PromptTemplate(
          input_variables=["text"],
          template="What is a language of that text: {text}? Answer in one word",
      )

  llm_chain = LLMChain(prompt=prompt, llm=OpenAI())
  return llm_chain.run(text).replace("\n", "").replace(":", "")


def addDataSource(name_of_course: str, pdf_path: str):

  loader = UnstructuredPDFLoader(pdf_path)

  data = loader.load()

  text_splitter = RecursiveCharacterTextSplitter(chunk_size=4000, chunk_overlap=0)
  texts = text_splitter.split_documents(data)

  data_source = (getLanguage(texts[0]), pdf_path)

  try:
    with open("/content/embeddings.json", "r") as file:
      data = json.load(file)
  except FileNotFoundError:
    data = {}

  if name_of_course in data:
      data[name_of_course].append(data_source)
  else:
      data[name_of_course] = [data_source]


  with open("/content/embeddings.json", "w") as outfile:
    json.dump(data, outfile)
    


In [84]:
#@title helpers { display-mode: "form" }
from langchain import PromptTemplate, LLMChain
from langchain.document_loaders import PyPDFLoader
from langchain.chat_models import ChatOpenAI
from langchain.text_splitter import RecursiveCharacterTextSplitter

def get_questions(zakres, lang):
  match lang:
    case "pl" : template_questions = "Zadaj pytania dotyczace badz zwiazane z tym zagadnieniem: {zakres}, wylistuj je i zakoncz dzialanie. Pytania:"
    case "eng" : template_questions = "Ask question about or related to topic {topic}. List them and end task. Questions:"

  llm_questions = ChatOpenAI(temperature=0.8, max_tokens=1000)
  prompt_questions = PromptTemplate(input_variables=["zakres"], template=template_questions)
  chain_questions = LLMChain(llm=llm_questions,prompt=prompt_questions)
  return chain_questions({"zakres":zakres}, return_only_outputs=True)['text'].split("\n")[:2] # -2 JOŁ ZMIEN TO PRZED DEMO


def get_resources(nazwa_kursu):
  lang, url = courses_recources[nazwa_kursu][0]

  match lang:
    case "pl": print_md(f"Użyję {url}")
    case "eng": print_md(f"I will use {url}")

  return lang, url


def get_documents(url):
  loader = PyPDFLoader(url)
  pages = loader.load_and_split()

  text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=10)
  return text_splitter.split_documents(pages)

def get_QA(summary, questions_list):
  llm = ChatOpenAI(temperature=0.8,max_tokens=1000, model_name="gpt-3.5-turbo")
  promptTester = PromptTemplate(
      input_variables = ["summary", "QA"],
      template = """Create a test to help memorize and practice the material from {summary} and {QA}. There should be multiple questions
      The format should be:
      [QUESTION]?
      a) answer
      b) answer
      c) answer
      d) answer

      Odpowiedź:
      """,
  )

  testerChain = LLMChain(llm=llm, prompt=promptTester, output_key="test")
  return testerChain({"summary":summary,"QA":questions_list})["test"]


def get_notes(summary, QA):
  llm = OpenAI(temperature=0.8,max_tokens=1000, model_name="gpt-3.5-turbo")
  promptNote = PromptTemplate(
      input_variables = ["sumText","QA" ],
      template = """Connect the information from {sumText} and {QA} into a big note from which students can learn and remove breaklines.""",
  )

  noteChain = LLMChain(llm=llm,prompt=promptNote, output_key="summary")
  return noteChain({"sumText": summary,"QA": QA})["summary"]

In [85]:
#@title Run Compendium
from langchain.llms import OpenAI
from langchain.vectorstores import Chroma
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain import VectorDBQA
from langchain.chains import RetrievalQA

def ask(msg, content):
  option = input(msg)
  content += f"{msg}:{option}"
  return option == "yes" or "tak" or "pewnie" or "sure"
    
def run_compendium(nazwa_kursu, zakres, url, lang):
  if not (url and lang):
    lang, url = get_resources(nazwa_kursu)
  questions_list = get_questions(zakres, lang)

  for question in questions_list:
    chat_config.show(question)

  document = get_documents(url)
  # print(f'Now you have {len(document)} documents')

  embeddings = OpenAIEmbeddings(openai_api_key=OPENAI_API_KEY)
  docsearch = Chroma.from_documents(document, embeddings)
  chain = RetrievalQA.from_chain_type(llm=ChatOpenAI(temperature=0.7,max_tokens=1000) ,chain_type='map_reduce', retriever=docsearch.as_retriever(), return_source_documents=True)

  summary = ""
  for question in questions_list:
    summary += chain({'query':f'{question} Rozwin swoja wypowiedz o jak najwiecej szczegolow'},return_only_outputs=True)['result']
  
  content = f"## Podsumowanie:\n{summary}\n" 
  chat_config.show(summary)
  
  # QA Maker
  if ask("Chcesz sprawdzić swoją wiedzę?:", content):
    QA = get_QA(summary, questions_list)
    content += f"## Test wiedzy:\n{QA}\n"
    chat_config.show(QA)

  # Notes Maker
  if ask("Chcesz notatki?:", content):
    notes = get_notes(summary, QA)
    content += f"## Notatki:\n{notes}\n"
    chat_config.show(notes)

  # Downloader
  if ask("Chcesz pobrać:", content):
    download_conversation(content)
  


## **Imgs2PDF**

In [87]:
import pytesseract
from fpdf import FPDF
from pdf2image import convert_from_path

def delete_special_characters(word):
  for character in word:
    if ord(character) > 127:
      return False
  return True
    
    
def convert_images_to_searchable_pdf(pdf_path: str, return_path: str) -> None:
    """Extracts text from an image and saves it as pdf file to user device"""
    images = convert_from_path(pdf_path)
    # save FPDF() class into a variable pdf
    pdf = FPDF()
    for i, image in enumerate(images):
        # Extract text from image
        text = pytesseract.image_to_string(image, lang="pol")
        # Add a page
        pdf.add_page()
        
        # set style and size of font
        # that you want in the pdf
        pdf.set_font("Arial", size=15)
        
        for line in text.split('\n'):
            if delete_special_characters(line):
                pdf.cell(200, 10, txt=line, ln=1, align='C')
        
        # save the pdf with name .pdf
    pdf.output(return_path) 
       

pdf_path = '/content/530_Krotki_wyk_ad_z_fizyki_ogolnej.pdf' #@param {type:"string"}
return_path = '/content/GFG.pdf' #@param {type:"string"}
# convert_images_to_searchable_pdf(pdf_path)

# **Demo**

In [95]:
#@title Initialize Agent
from langchain.agents import AgentType, initialize_agent
from langchain.chat_models import ChatOpenAI
from langchain.memory import ConversationBufferMemory

memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

chat_llm = ChatOpenAI(temperature=0)
tools = [set_use_case_toool, set_audio_tool, set_markdown_tool]
agent = initialize_agent(tools, chat_llm, agent=AgentType.CHAT_CONVERSATIONAL_REACT_DESCRIPTION, memory=memory)

print_md(MENU_VIEW_PL)
memory.chat_memory.add_ai_message(MENU_VIEW_PL)


# Witaj
## Ustawienia:
 - audio (**wł** / wył)
 - formatowanie tekstu (**.md** / .txt)
 - język

## Dostępne narzędzia:
 - Compendium -  Wyszukiwarka wiedzy uniwersyteckiej i osobisty tutor
 - im2pdf - Konwerter zdjęć do pdf


In [97]:
#@title Conversation

match chat_config.use_case:
  case "menu":
    #@markdown **Menu**
    User_input = "Pomoz ogarnac laby" #@param {type:"string"}
    chat_config.run(agent.run, User_input)

  case "compendium":
    #@markdown **Compendium:**
    nazwa_kursu = "Fizyka I" #@param ["Fizyka I", "Analiza matematyczna"]
    zakres = "Czym jest dynamika?" #@param {type:"string"}
    literatura = "" #@param {type:"string"}
    jezyk_literatury = "" #@param {type:"string"}

    run_compendium(nazwa_kursu, zakres, literatura, jezyk_literatury)
    chat_config.use_case = "menu" # powrot do menu

  case "img2pdf":
    #@markdown **ImgPDF:**
    pdf_path = '' #@param {type:"string"}
    return_path = '' #@param {type:"string"}

    convert_images_to_searchable_pdf(pdf_path, return_path)
    chat_config.use_case = "menu" # powrot do menu



Użyję /content/GFG-15.pdf

1. Jaką definicję można przypisać pojęciu dynamika?

2. Jakie są podstawowe elementy dynamiki?



Nie ma bezpośredniej odpowiedzi na to pytanie w dostępnej treści.Podstawowymi elementami dynamiki są siły i momenty. Siła to wektorowa wielkość fizyczna, która opisuje oddziaływanie jednego ciała na drugie. W dynamice siła jest związana z ruchem ciała i zmiennością jego prędkości. Siła jest mierzona w jednostkach newtonów (N).

Moment to również wektorowa wielkość fizyczna, która opisuje siłę działającą na ciało w kontekście jego rotacji. Moment jest mierzony w jednostkach niutonometrów (Nm).

W sekcji 1.2. pt. "Zasady dynamiki" omawiane są trzy prawa opracowane przez Isaaca Newtona, które określają związek między siłami działającymi na ciało, jego masą i przyspieszeniem. Pierwsza zasada dynamiki mówi o tym, że ciało pozostaje w spoczynku lub porusza się ruchem jednostajnym prostoliniowym, jeśli nie działa na nie żadna siła lub siły działające na ciało są w równoważeniu. Druga zasada dynamiki mówi o tym, że przyspieszenie ciała jest wprost proporcjonalne do siły działającej na nie, a odwrotnie proporcjonalne do masy ciała. Trzecia zasada dynamiki mówi o tym, że każdej sile działającej na ciało towarzyszy siła przeciwna i równie wielka, działająca na inne ciało.

W sekcji 1.5. pt. "Prawa zachowania dla układu punktów materialnych" omawiane są zasady zachowania, które dotyczą zachowania pewnych wielkości fizycznych w czasie. Prawo zachowania pędu mówi o tym, że pęd całego układu izolowanego punktów materialnych pozostaje stały, jeśli na układ nie działa żadna siła zewnętrzna. Prawo zachowania energii mówi o tym, że energia całkowita układu izolowanego punktów materialnych pozostaje stała. Prawo zachowania momentu pędu mówi o tym, że moment pędu całego układu izolowanego punktów materialnych pozostaje stały.

W sekcji 1.6. pt. "Elementy dynamiki bryły sztywnej" omawiane są zasady dynamiki dla brył sztywnych, czyli obiektów, które są sztywne i nie zmieniają swojego kształtu pod wpływem sił zewnętrznych. Obejmują one m.in. równania ruchu dla brył sztywnych i zasady zachowania momentu pędu dla brył sztywnych.

W podsumowaniu, podstawowe elementy dynamiki to siły i momenty, które są ściśle związane z ruchem ciała i jego rotacją. W dynamice istnieje wiele zasad i praw, które opisują związki między tymi elementami, a także zachowanie pewnych wielkości fizycznych w czasie. Aby uzyskać bardziej szczegółowe informacje na temat podstawowych elementów dynamiki, należałoby poszukać innych źródeł lub pytać o to specjalisty z dziedziny mechaniki lub fizyki.

Chcesz sprawdzić swoją wiedzę?:tak


1. Jaką definicję można przypisać pojęciu dynamika?
      a) Dynamika to nauka zajmująca się ruchem ciał i siłami, które na nie działają.
      b) Dynamika to nauka zajmująca się statycznym zachowaniem ciał.
      c) Dynamika to nauka zajmująca się tylko rotacją ciał.
      d) Dynamika to nauka zajmująca się tylko siłami działającymi na ciała.

Odpowiedź: a) Dynamika to nauka zajmująca się ruchem ciał i siłami, które na nie działają.

2. Jakie są podstawowe elementy dynamiki?
      a) Siła i moment bezwładności.
      b) Prędkość i przyspieszenie.
      c) Siła i momenty.
      d) Moment i przyspieszenie.

Odpowiedź: c) Siła i momenty.

Chcesz notatki?:pewnie




Note: The basic elements of dynamics are forces and moments. Force is a vector physical quantity that describes the interaction of one body on another. In dynamics, force is related to the motion of the body and its change in velocity. Force is measured in units of newtons (N). Moment is also a vector physical quantity that describes the force acting on a body in the context of its rotation. Moment is measured in units of newton-meters (Nm). Dynamics involves many principles and laws that describe the relationships between these elements, as well as the behavior of certain physical quantities over time. To learn more about the basic elements of dynamics, students can consult other sources or consult a specialist in the field of mechanics or physics.

Chcesz pobrać:tak


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [94]:
# @title OpenAI api usage
f"Used {chat_config.used_tokens} tokens, what cost: ${chat_config.total_cost}"

'Used 778 tokens, what cost: $0.0015559999999999999'