In [1]:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.embeddings.ollama import OllamaEmbedding
from llama_index.llms.ollama import Ollama

In [2]:
documents = SimpleDirectoryReader("data").load_data()

# nomic embedding model
Settings.embed_model = OllamaEmbedding(model_name="nomic-embed-text")

# ollama
Settings.llm = Ollama(model="llama3.1", request_timeout=360.0)

index = VectorStoreIndex.from_documents(
    documents,
)

In [3]:
# 查询数据
query_engine = index.as_query_engine().
response = query_engine.query("Datawhale是什么?")
print(response)

Datawhale是一个专注于数据科学与 AI 领域的开源组织。


In [4]:
# 检索上下文进行对话
from llama_index.core.memory import ChatMemoryBuffer
memory = ChatMemoryBuffer.from_defaults(token_limit=1500)

chat_engine = index.as_chat_engine(
    chat_mode="context",
    memory=memory,
    system_prompt=(
        "You are a chatbot, able to have normal interactions."
    ),
)

response = chat_engine.chat("Datawhale是什么？")
print(response)

Datawhale是一个开源组织，成立于2018年。它是一个聚集了众多领域院校和知名企业优秀学习者的团队，致力于构建AI领域的开源学习社区。


In [5]:
response = chat_engine.chat("Datawhale是哪一年成立的？")
print(response)

Datawhale成立于2018年。


In [10]:
response = chat_engine.chat("Datawhale目标是什么？")
print(response)

Datawhale的目标是为学习者提供一个平台，让他们能与人一起成长、真实地展现自我、开放包容、互信互助、敢于试错和勇于担当，促进AI领域的开源学习和人才培养。
