Skip to content

使用FastAPI + MemFire Cloud + LangChain开发个人知识库应用

License

Notifications You must be signed in to change notification settings

MemFire-Cloud/memfirecloud-qa

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

项目介绍

  • 使用FastAPI作为Web服务端框架
  • 使用MemFire Cloud作为向量数据和个人文档数据存储
  • 使用LangChain进行AI应用开发
  • 使用Next.js开发了一个简陋的UI界面用于问答演示

完整的教程文档请参考:FastAPI+MemFire Cloud+LangChain开发ChatGPT应用

准备工作

  • MemFire Cloud上创建应用,后面需要用到应用的API URL和Service Role Key。 可以在应用的应用设置->API页面找到响应的配置

  • 创建应用后,在应用的SQL执行器页面执行如下脚本

-- Enable the pgvector extension to work with embedding vectors
create extension vector;

-- Create a table to store your documents
create table documents (
    id uuid primary key,
    content text, -- corresponds to Document.pageContent
    metadata jsonb, -- corresponds to Document.metadata
    embedding vector(1536) -- 1536 works for OpenAI embeddings, change if needed
);

CREATE FUNCTION match_documents(query_embedding vector(1536), match_count int)
   RETURNS TABLE(
       id uuid,
       content text,
       metadata jsonb,
       -- we return matched vectors to enable maximal marginal relevance searches
       embedding vector(1536),
       similarity float)
   LANGUAGE plpgsql
   AS $$
   # variable_conflict use_column
BEGIN
   RETURN query
   SELECT
       id,
       content,
       metadata,
       embedding,
       1 -(documents.embedding <=> query_embedding) AS similarity
   FROM
       documents
   ORDER BY
       documents.embedding <=> query_embedding
   LIMIT match_count;
END;
$$;
  • 准备好用来测试的文档目录

默认需要将文档放到 app/docs下,可以通过环境变量指定其他目录

  • 准备好openai的账号

请参考网上教程申请一个openai账号,后面代码运行需要用到openai的API KEY

如何运行

linux 下运行

  1. 安装依赖
pip install -r app/requirements.txt
  1. 设置参数
export DOCS_PATH=./docs
export SUPABASE_URL="your-api-url"
export SUPABASE_KEY="your-service-role-key"
export OPENAI_API_KEY="your-openai-api-key"
  1. 运行
uvicorn main:app --reload --host 0.0.0.0

docker运行

docker build -t memfirecloud-qa:v1 .

docker run -p 8000:80 \
    -e SUPABASE_URL="your-api-url" \
    -e SUPABASE_KEY="your-service-role-key" \
    -e OPENAI_API_KEY="your-openai-api-key" \
    -v ./docs:/docs \
    memfirecloud-qa:v1

windows下运行(没测试)

与linux类似,设置相关环境变量,然后运行:

uvicorn main:app --reload --host 0.0.0.0

如何访问

用浏览器访问: http://ip:8000/ 可以显示一个简陋的问答页面

支持的参数配置

# 本地文档路径
export DOCS_PATH=./docs

# memfire cloud 应用的API URL和Service role key
export SUPABASE_URL="your-api-url"
export SUPABASE_KEY="your-service-role-key"

# 使用openai / baidu 的大模型
export QA_BACKEND="openai" # 默认值

# openai 相关配置(QA_BACKEND=openai是需要)
export OPENAI_ORGANIZATION="your-openai-organization"
export OPENAI_API_KEY="your-openai-api-key"
export OPENAI_MODEL="gpt-3.5-turbo"  # 默认值

# 百度相关配置(QA_BACKEND=baidu时需要)
export BAIDU_API_KEY="your-baidu-api-key"
export BAIDU_API_SECRET="your-baidu-api-secret"
export BAIDU_MODEL="ERNIE-Bot-turbo" # 默认值

TODOS

  • 不重复处理文档
  • 程序运行中增量添加新文档
  • 支持对话(目前只是QA)
  • 支持文心一言