# RAG application built on gemini 

In [1]:
from langchain_community.document_loaders import UnstructuredURLLoader
urls = ['https://copyrichacademy.com/p/20weeksforexbootcamp-coursepage/?affcode=947714_tnrscmsq']
loader = UnstructuredURLLoader(urls=urls)
data = loader.load()  # entire PDF is loaded as a single Document
#data

In [2]:
len(data)

1

In [3]:
from langchain.text_splitter import RecursiveCharacterTextSplitter

# split data
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000)
docs = text_splitter.split_documents(data)


print("Total number of documents: ",len(docs))

Total number of documents:  8


In [4]:
docs[7]

Document(metadata={'source': 'https://copyrichacademy.com/p/20weeksforexbootcamp-coursepage/?affcode=947714_tnrscmsq'}, page_content='5. 我的朋友听得懂中文，但是看不太明白中文，他可以参加吗？\n\nLucy的课程必须要看得懂中文也听得懂中文哦，所以如果他只能听得懂中文，但是看不太明白中文，付费参加课程前请三思哟。\n\n6. 参加完这个20周外汇训练营的课程之后，是否还需要其他的费用呢？\n\n参加20周外汇训练营的课程，只需要缴费一次，没有其他的费用。而交易用的入金部分由自己个人决定。如果需要Lucy公司其他的服务可以直接付费购买即可。\n\n7. 付费一次可以上课多久呢？\n\n付费参加20周外汇训练营，可以学习一年期，如果您是尊享级421俱乐部会员，公司会赠送给您本人3个单位的20周外汇训练营，可以自己使用，也可以拿来销售，也可以拿来赠送。\n\n8. 参加20周外汇训练营所使用的交易平台商有限定吗？\n\n没有限定，但是如果您想成为国际交易平台商的代理，透过代理能够自己交易得到奖金回馈可以跟公司联络：[email protected]\n\n9. 完全不懂外汇交易或是不懂金融工具的人可以参加吗？\n\n可以的，20周外汇训练营针对三种不同级别的人都非常的适合。\n\nA. 完全不懂外汇交易的外汇小白。\n\nB. 曾经学习过外汇交易的交易者。\n\nC. 已经交易许多年的成熟交易者。\n\n10. 如果我报名了这个课程，我可以转让给他人吗？\n\n20周外汇训练营没有办法做转让哦，所以如果你报名了，就只能给自己本人使用和学习。\n\n11. 之前有参加过K线8堂课的朋友，需要参加20周外汇训练营吗？\n\n20周外汇训练营是K线8堂课的升级版，换句话说，有更延伸的内容，有更多的广度跟深度，还有许多Lucy老师提供的策略教学说明。\n\nK线8堂课是以前公司的服务内容，现在20周外汇训练营是CopyRich Academy 有钱人复制学院的服务内容，因此两者完全没有关联。')

In [5]:
from langchain_chroma import Chroma
from langchain_google_genai import GoogleGenerativeAIEmbeddings

from dotenv import load_dotenv
load_dotenv() 

#Get an API key: 
# Head to https://ai.google.dev/gemini-api/docs/api-key to generate a Google AI API key. Paste in .env file

# Embedding models: https://python.langchain.com/v0.1/docs/integrations/text_embedding/

embeddings = GoogleGenerativeAIEmbeddings(model="models/embedding-001")
vector = embeddings.embed_query("hello, world!")
vector[:5]
#vector

GoogleGenerativeAIError: Error embedding content: 504 Deadline Exceeded

In [6]:
vectorstore = Chroma.from_documents(documents=docs, embedding=GoogleGenerativeAIEmbeddings(model="models/embedding-001"))

In [8]:
retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 2})

retrieved_docs = retriever.invoke("这个课程适合什么样的人群？")


In [9]:
len(retrieved_docs)

2

In [11]:
print(retrieved_docs[1].page_content)

这些问题是否正困扰着你？

你拥有一份朝九晚五的工作，领着固定的薪资，但是固定薪资完全没有办法满足生活中各种增加的财务需求。

就算手上有好几份兼职工作，心力交瘁却还是无济于事。﻿

你尝试开店面，做传统生意，但是需要不断的进货囤货，出售货物速度太慢，现金流不足，无法周转自己的日常生活开销。

加上疫情时代的来临，许多需要面对面的生意，渐渐进入不好经营的状态。

你把钱都存在了银行里，时间在跑，但是你却什么也都没有做，钱的价值渐渐贬低。

赚钱的速度赶不上物价涨幅的速度，只能看着三餐价格涨了一倍，你口袋里的钱却没有翻一倍。

你常常看到身边的人在做许多不同的投资，自己也想要进行，却苦于不知从何开始？

随着年纪越来越大，身体体力越来越不好，吸收知识的速度变慢，怕自己赚钱的能力越来越下降，又跟不上时代。

你到处去上课，看了一大堆关于交易，理财的书，但是没有人可以手把手教到如何获利，学到的都是零散的投资知识，很难实踐。

你成为了给别人投资建议的巨人，但是自己在市场里实践时却一直无法获利。

许多理财方式都需要有大资金作为起始资金，对于小资族是一种障碍，不容易轻松起步。

理财投资似乎离自己好遥远，诈骗新闻又层出不穷，不知道怎么扎实的学一套方法。

我们有解决方法！

课程结构

无论你是完全不懂外汇交易的外汇小白，

或者你是曾经学习过外汇交易的交易者，

又或者是你是已经交易许多年的成熟交易者，

Lucy以超过22,000小时的交易经验，透过地毯式、系统性的教学，20周循序渐进，一周五天，每天两课，每课12分钟到20分钟。

不影响你的生活作息，也不会打乱你的工作进度，带你用两招《日内单》交易策略，让你从基础入门直达实战获利！

就算拥有朝九晚五的工作，或者许多兼职工作，但是只要在下班之后，每天晚上用三十分钟学习，就可以帮自己每个月加薪至少1200-1500美金！

透过线上交易创造现金流，可以让你补强自己进货囤货售货所导致的现金流停滞，亦可以让你完全不需要再经营实体/线上店面，轻松用交易的收入为自己增加现金流。

你可以将银行里的现金取用一小部分来学习，以及做交易创造自己的现金流。不再让钱的价值停滞在银行里，利用自己的真功夫，让闲置的钱为你带来更多财富。

通过二十周的外汇训练营，你不用买一堆的书，也不用看一堆的书。


In [12]:
from langchain_google_genai import ChatGoogleGenerativeAI

llm = ChatGoogleGenerativeAI(model="gemini-1.5-pro",temperature=0.3, max_tokens=500)

In [13]:
from langchain.chains import create_retrieval_chain
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain_core.prompts import ChatPromptTemplate

system_prompt = (
    "You are an assistant for question-answering tasks. "
    "Use the following pieces of retrieved context to answer "
    "the question. If you don't know the answer, say that you "
    "don't know. Use three sentences maximum and keep the "
    "answer concise."
    "\n\n"
    "{context}"
)

prompt = ChatPromptTemplate.from_messages(
    [
        ("system", system_prompt),
        ("human", "{input}"),
    ]
)

In [14]:
question_answer_chain = create_stuff_documents_chain(llm, prompt)
rag_chain = create_retrieval_chain(retriever, question_answer_chain)

In [None]:
response = rag_chain.invoke({"input": "这个课程适合什么样的人群？"})
print(response["answer"])