In [3]:
!pip install faiss-cpu sentence-transformers ollama

Collecting faiss-cpu
  Downloading faiss_cpu-1.11.0-cp311-cp311-manylinux_2_28_x86_64.whl.metadata (4.8 kB)
Collecting sentence-transformers
  Downloading sentence_transformers-5.0.0-py3-none-any.whl.metadata (16 kB)
Collecting ollama
  Downloading ollama-0.5.1-py3-none-any.whl.metadata (4.3 kB)
Collecting transformers<5.0.0,>=4.41.0 (from sentence-transformers)
  Downloading transformers-4.53.1-py3-none-any.whl.metadata (40 kB)
Collecting safetensors>=0.4.3 (from transformers<5.0.0,>=4.41.0->sentence-transformers)
  Downloading safetensors-0.5.3-cp38-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (3.8 kB)
Downloading faiss_cpu-1.11.0-cp311-cp311-manylinux_2_28_x86_64.whl (31.3 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m31.3/31.3 MB[0m [31m2.4 MB/s[0m eta [36m0:00:00[0m00:01[0m00:01[0m
[?25hDownloading sentence_transformers-5.0.0-py3-none-any.whl (470 kB)
Downloading transformers-4.53.1-py3-none-any.whl (10.8 MB)
[2K   [90m━━━━━━━━━━━━━━━━

In [12]:
import faiss
import numpy as np
from sentence_transformers import SentenceTransformer
import pickle
import ollama

# Load model
model = SentenceTransformer('all-MiniLM-L6-v2')

# Load and chunk documents
with open('./data/curated.txt', 'r') as file:
    text = file.read()

documents = [d.strip() for d in text.split('\n\n') if d.strip()]

# Encode embeddings
doc_embeddings = model.encode(documents, convert_to_numpy=True)

# Save raw docs and embeddings
with open('documents.pkl', 'wb') as f:
    pickle.dump(documents, f)
np.save('doc_embeddings.npy', doc_embeddings)

# Create and save FAISS index
index = faiss.IndexFlatL2(doc_embeddings.shape[1])
index.add(doc_embeddings)
faiss.write_index(index, 'knowledge_index.faiss')

In [3]:
import faiss
import numpy as np
from sentence_transformers import SentenceTransformer
import pickle
import ollama

model = SentenceTransformer('all-MiniLM-L6-v2')

def retrieve_similar_documents(query, top_k=5):
    # Load index and data
    index = faiss.read_index('knowledge_index.faiss')
    documents = pickle.load(open('documents.pkl', 'rb'))

    # Encode query
    query_embedding = model.encode([query], convert_to_numpy=True)
    
    # Search
    distances, indices = index.search(query_embedding, k=top_k)
    return [documents[i] for i in indices[0]]


In [4]:
retrieve_similar_documents('Mongolian. How tuition fee is MSc in Ireland?', top_k=1)

['Applicants must have studied Maths at second level or QQI FET or demonstrate involvement with Maths related areas. Further information on applying as a mature student is available on theMature ApplicantsandMature Student Entrysupport pages. Non-EU applicants are expected to have educational qualifications of a standard equivalent to the Irish Leaving Certificate. In addition, where such applicants are non-native speakers of the English language they must satisfy the university of their competency in the English language. To verify if you meet the minimum academic and language requirements visit ourqualification comparison pageand refer to ourInternational Office pagefor more information. ## Fees and Costs - Whether you are an EU or Non-EU student will affect the course fees applicable to you. See more information onEU Fees, Non-EU Fees, or Free Fees Status. - The State will pay the tuition fees for EU students who are eligible under the Free Fees Scheme.']

In [1]:
import re
import requests

def translate_rag_response(text):
    translated_parts = []

    # Match code blocks: ```...```, non-greedy
    blocks = re.split(r"(```.*?```)", text, flags=re.DOTALL)

    for block in blocks:
        if block.startswith("```"):
            # Code block: do not translate
            translated_parts.append(block)
        else:
            # Non-code block: split by period
            sentences = [s.strip() for s in block.split('.') if s.strip()]
            translated_sentences = []

            for sentence in sentences:
                try:
                    response = requests.post(
                        "http://localhost:5000/en2mon",
                        json={"text": sentence}
                    )
                    if response.status_code == 200:
                        translated = response.json()["translation"]
                        translated_sentences.append(translated)
                    else:
                        print(f"Translation failed: {response.text}")
                        translated_sentences.append(sentence)
                except Exception as e:
                    print(f"Error translating: {e}")
                    translated_sentences.append(sentence)

            # Rejoin translated sentences (adding period back)
            translated_block = ". ".join(translated_sentences) + "."
            translated_parts.append(translated_block)

    # Return full translated text
    return "\n".join(translated_parts)


In [20]:
def rag_pipeline(query):
    docs = retrieve_similar_documents(query, top_k=20)
    context = "\n".join(docs)
    
    prompt = f"""The following are relevant documents:\n{context}\n\nQuery: {query}\nAnswer within 500 words.\nAnswer:"""
    
    response = ollama.chat(model='llama3.2', messages=[
        {'role': 'user', 'content': prompt}
    ])
    
    return response['message']['content']


In [21]:
query = 'Mongolian: Language courses how to apply and how expensive they are in Ireland'
rag_pipeline(query)

"Mongolians can study English language courses in Ireland through various institutions, including IBAT College Dublin. To apply for an English language course, you will need to submit your application online or in-person at the institution.\n\nThe cost of English language courses in Ireland varies depending on the institution and program. Here are some approximate costs:\n\n* General English courses:\n\t+ 1 week: €250-€350\n\t+ 1 month: €800-€1,200\n* Intensive English courses (15 hours/week):\n\t+ 1 week: €220-€320\n\t+ 1 month: €600-€900\n\nIt's recommended to check the specific costs and requirements for each institution and program on their website or by contacting them directly.\n\nAs a non-EU citizen, you may also need to apply for a Study Visa to study in Ireland. The visa application process and cost will vary depending on your individual circumstances.\n\nTo get started, I recommend visiting the IBAT College Dublin website or contacting them directly to inquire about their Eng

In [5]:
def rag_pipeline(query):
    docs = retrieve_similar_documents(query, top_k=20)
    context = "\n".join(docs)
    
    prompt = f"""The following are relevant documents:\n{context}\n\nQuery: {query}\nAnswer within 500 words.\nAnswer:"""
    
    response = ollama.chat(model='llama3.2', messages=[
        {'role': 'user', 'content': prompt}
    ])
    
    english_answer = response['message']['content']
    mongolian_answer = translate_rag_response(english_answer)
    return mongolian_answer

query = 'Mongolian: Language courses how to apply and how expensive they are in Ireland'
rag_pipeline(query)

'Ирланд дахь монголчуудын хэлний сургалтын талаарх мэдээллийг олохын тулд би янз бүрийн эх сурвалжуудаас хайсан.. Энд юу олсон бэ: ** Ирландын хэлний сургалт** Дублинд олон улсын оюутнуудад зориулсан, тэр дундаа Монголын оюутнуудад зориулсан англи хэлний сургалт явуулдаг хэд хэдэн сургууль байдаг. Хамгийн түгээмэл сонголт нь: 1. **IBAT College Dublin**: Насанд хүрэгчид болон хүүхдүүдэд зориулсан англи хэлний сургалтын өргөн хүрээг санал болгож байна.. 2 .. **Гриффит коллеж**: Англи хэлний сургалт, бизнесийн англи хэлний сургалт, шалгалтын бэлтгэл сургалт зэрэг сургалт явуулдаг. 3 .. ** Дублины хотын их сургуулийн хэлний төв**: Англи хэлний сургалт, сертификатын хөтөлбөр, англи хэлний сургалтын зэрэг олгодог. Ирланд улсад хэлний сургалтанд хамрагдахын тулд дараахь алхамуудыг дагах хэрэгтэй: 1. ** Сургуулийн цахим хуудсыг шалгаарай**: Таны сонирхож буй хэлний сургууль, коллежийн цахим хуудсыг очиж, одоогийн сургалт, үнэ, хүсэлт гаргах шаардлагыг мэдээрэй.. 2 .. ** Шаардлагатай баримт бич

In [6]:
query = 'Mongolian: Language courses tuitions are in Ireland?'
rag_pipeline(query)

'Монгол Улс нь ихэвчлэн мандарин болон монгол хэлээр ярьдаг улс тул Англи хэлний сургалт явуулдаг улс биш юм.. Хэрэв та монголд англи хэл сурах эсвэл хэлний сургалтын боломжуудыг судлах сонирхолтой бол дараахь сонголттой болно: 1. **Улаанбаатар хотын хэлний сургууль**: Монгол Улсын нийслэл Улаанбаатар хотын зарим хэлний сургуулиуд гадаадын иргэдэд англи хэлний сургалт явуулдаг. Эдгээр сургалтуудыг бизнес эрхлэгчид, жуулчид, эсвэл англи хэлний ур чадвараа сайжруулахыг хүссэн иргэдэд зориулж зохион байгуулж болно.. 2 .. **Монголын салбартай олон улсын хэлний сургууль**: Зарим олон улсын хэлний сургууль, жишээ нь British Council эсвэл Cambridge Assessment International Education нь Улаанбаатар хотод салбартай бөгөөд англи хэлний сургалт явуулдаг.. Гэсэн хэдий ч эдгээр хөтөлбөрүүд нь монгол оюутнуудад зориулагдсан биш байж болно.. 3 .. ** Онлайнаар хэл сурах платформ**: Онлайнаар суралцах нь нэмэгдэж байгаатай холбогдуулан та Монгол Улс тэргүүтэй дэлхийн хаанаас ч англи хэлний сургалтанд х

In [7]:
query = 'Whats the living expense like in Ireland?'
rag_pipeline(query)

'Ирланд нь амьдрах зардлын хувьд Европын хамгийн өндөр орнуудын нэг гэдгээрээ алдартай. Гэсэн хэдий ч анхааралтай төлөвлөж, төсөвлөж чадвал оюутнууд санхүүгийн асуудлыг үр дүнтэй удирдаж, сайхан амьдрах боломжтой. Ирландын оюутнуудын сар бүрийн амьдрах зардлын тооцоо: 1. ** Орон сууц:** * Орон сууцны хүрээлэн: долоо хоногт 209-300 евро (хоёр сард ойролцоогоор 1100-1600 евро) * Орон сууцны хүрээлэн: сарын 600-1200 евро 2. ** хоол:** * гадаа хооллодог: хоолны нэг удаагийн 10-15 евро * хүнсний бүтээгдэхүүн: 50-75 евро долоо хоногт 3. ** Тээврийн хэрэгсэл:** * Тээврийн сарын зардал: 120-150 евро (Студентын лип картыг ашиглах) 4. **Нийтийн үйлчилгээ:** * Цахилгаан эрчим хүч, ус, интернет: 100-150 евро сард 5. ** Бусад зардал:** * Амралт: 200-300 евро сар бүр * Бусад: 50-100 евро сар бүр Нийтдээ оюутнууд Ирландын амьдрах зардлаар сар бүр 2000-3000 евро зарцуулах боломжтой.. Таны тооцоолсон орлого, зардлын талаар илүү сайн ойлголттой байхын тулд энд жишээ авч үзье: ** Орлого:** * Сургалтын тө

In [8]:
query = 'How to find student accomidation in Ireland?'
rag_pipeline(query)

'Ирланд дахь оюутны орон сууцыг олохын тулд дараахь алхамуудыг дагах хэрэгтэй: 1. ** Их сургуулийн орон сууцны газартай холбоо бариарай**: Оюутны орон сууц олох талаар зөвлөгөө авахын тулд University College Cork (UCC) -ийн орон сууц, нийгмийн амьдралын газартай холбоо бариарай.. Тэд ашиглах боломжтой сонголтууд, үнэ, хүсэлт гаргах үйл явцын талаар мэдээлэл өгөх боломжтой. 2 .. ** Их сургуулийн цахим хуудсыг үзээрэй**: UCC-ийн цахим хуудсыг зочилж, Орон сууцны хэсгийг судалж, одоогоор зөвшөөрөгдсөн үйлчилгээ үзүүлэгчдийн жагсаалт, тэдгээрийн холбооны мэдээллийг багтаасан оюутны байрны талаар дэлгэрэнгүй мэдээлэл олж болно.. 3 .. **Онлайн нөөцийг ашиглах**: * **Оюутны орон сууц. com**: Энэ вэбсайт нь Ирландын оюутны орон сууцны сонголтуудын бүрэн жагсаалтыг үзүүлдэг.. * **Нэг байр. com**: Uniplaces нь Ирландын тэргүүтэй Европын орон сууцны үйлчилгээ үзүүлэгчидтэй оюутнуудыг холбодог алдартай платформ юм.. Сурагчдын өрөө. ie**: StudentRoom бол Ирландын оюутны орон сууцны сонголтуудыг жаг

In [9]:
query = 'Can you reccomend me a university in Ireland for Data Science'
rag_pipeline(query)

'Ирланд нь сүүлийн жилүүдэд мэдээллийн шинжлэх ухааны оюутнууд, мэргэжилтнүүдийн хувьд олны анхаарлыг татсан газар болж байгаа нь технологийн салбар, эрдэм шинжилгээний байгууллага, дэлхийн түвшний их дээд сургуулиудын хөгжил дэвшилийн ачаар юм.. Ирландын шилдэг мэдээллийн шинжлэх ухааны хөтөлбөрүүдийг санал болгодог дээд сургуулиуд: 1. **University College Dublin (UCD)**: UCD-ийн Компьютерийн сургууль нь Ирландын хамгийн том, хамгийн нэр хүндтэй компьютерийн шинжлэх ухааны сургуулиудын нэг юм.. Энэ нь өгөгдлийн шинжлэх ухааны болон шинжилгээний магистр зэрэг хамруулж, өгөгдлийн шинжлэх ухааны болон шинжилгээний чиглэлээр бакалаврын болон магистрын зэрэг олгодог.. 2 .. **Trinity College Dublin (TCD)**: TCD-ийн Компьютерийн шинжлэх ухаан, инженерчлэлийн сургууль нь Мэдээллийн шинжлэх ухааны чиглэлээр мэргэшсэн Компьютерийн бакалавр, Мэдээллийн шинжлэх ухааны чиглэлээр MPhil / PhD-ийг санал болгодог. Тус их сургууль нь судалгааны боломж, хамтын ажиллагааг олгодог "Insight Centre for Data