Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

publish 0.2.10 #2797

Merged
merged 73 commits into from
Jan 25, 2024
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
Show all changes
73 commits
Select commit Hold shift + click to select a range
aeb7a7e
增加 PDF_OCR_THRESHOLD 配置项,只对宽高超过页面一定比例(图片宽/页面宽,图片高/页面高)的图片进行 OCR。 (#2525)
liunux4odoo Jan 2, 2024
6703466
Merge branch 'panda-master' into panda-dev
liunux4odoo Jan 5, 2024
03eb5e9
Gemini api (#2630)
yhfgyyf Jan 12, 2024
29ef5dd
Update pgvector connection method following updates in langchain_comm…
HALIndex Jan 12, 2024
a5b52e1
elasticsearch更新https连接 (#2390)
xldistance Jan 12, 2024
e615932
Merge branch 'master' into dev
zRzRzRzRzRzRzR Jan 12, 2024
75ff268
【功能新增】增强对PPT、DOC知识库文件的OCR识别 (#2013)
596192804 Jan 12, 2024
269090e
更新0.2.x Agent,之后的Agent在0.3.x更新
zRzRzRzRzRzRzR Jan 12, 2024
4ac510f
版本更新
zRzRzRzRzRzRzR Jan 12, 2024
ff91508
每次创建对象时从连接池获取连接,避免每次执行方法时都新建连接 (#2480)
Lijia0 Jan 12, 2024
3333007
Merge branch 'chatchat-space:dev' into dev
zRzRzRzRzRzRzR Jan 12, 2024
c5985ae
Merge pull request #2638 from zRzRzRzRzRzRzR/dev
zRzRzRzRzRzRzR Jan 12, 2024
6df4554
更新即将废弃的启动内容
zRzRzRzRzRzRzR Jan 13, 2024
0a37fe9
Merge pull request #2647 from zRzRzRzRzRzRzR/dev
zRzRzRzRzRzRzR Jan 13, 2024
ebda105
Fix two bugs in Minimax's model worker that affect usage, namely do_ …
xyhshen Jan 13, 2024
f031ebc
ChatOpenAI为了判断token有没有超过模型的context上下文长度,每个模型的token算法不一样 ,所以这里应该自己实现to…
glide-the Jan 13, 2024
991e824
Merge pull request #2649 from glide-the/dev
glide-the Jan 13, 2024
f28cd59
Merge pull request #2648 from xyhshen/patch-1
zRzRzRzRzRzRzR Jan 13, 2024
241690d
更新运行数据库报错和项目里程碑
zRzRzRzRzRzRzR Jan 14, 2024
cb38226
Merge pull request #2659 from zRzRzRzRzRzRzR/dev
zRzRzRzRzRzRzR Jan 14, 2024
67ae61d
langchain新版本PGVector传入connection,插入、删除操作会回滚
Lijia0 Jan 16, 2024
2c92cd0
langchain新版本PGVector传入connection,插入、删除操作会回滚
Lijia0 Jan 16, 2024
b2ea386
fix:修复ES库无法使用向量检索.添加mappings创建向量索引
Jan 17, 2024
1b5efec
Merge pull request #2681 from Lijia0/adapter_pgvector
zRzRzRzRzRzRzR Jan 17, 2024
e5acf3d
Merge pull request #2688 from MSZheng20/dev
zRzRzRzRzRzRzR Jan 17, 2024
2ab9449
fix:1、index_name获取兼容windows和linux系统 2、补充mappings,创建向量索引结构保持一致 3、添加ES向…
Jan 18, 2024
b058e19
Merge pull request #2704 from MSZheng20/dev
zRzRzRzRzRzRzR Jan 18, 2024
dc07cba
更新依赖
zRzRzRzRzRzRzR Jan 20, 2024
4a77880
Merge branch 'dev' of https://github.com/zRzRzRzRzRzRzR/Langchain-Cha…
zRzRzRzRzRzRzR Jan 20, 2024
8c2019f
pr 2775 maybe need?
zRzRzRzRzRzRzR Jan 20, 2024
0cf65d5
更新模型配置文件和支持列表
zRzRzRzRzRzRzR Jan 20, 2024
e5b4bb4
更新GLM 临时解决方案,支持GLM4,版本不兼容,会有bug
zRzRzRzRzRzRzR Jan 21, 2024
554d6b4
依赖文件删除,智谱AI 0.2.x 不兼容
zRzRzRzRzRzRzR Jan 21, 2024
3057c29
perf typing
showmecodett Jan 21, 2024
71deed9
perf typing
showmecodett Jan 21, 2024
56c2a70
Merge pull request #2740 from showmecodett/perf-typing
zRzRzRzRzRzRzR Jan 22, 2024
8ac255f
Merge branch 'chatchat-space:dev' into dev
zRzRzRzRzRzRzR Jan 22, 2024
6b61d91
支持GLM4
zRzRzRzRzRzRzR Jan 22, 2024
8483c0b
Merge branch 'dev' of https://github.com/zRzRzRzRzRzRzR/Langchain-Cha…
zRzRzRzRzRzRzR Jan 22, 2024
c0968fb
Merge pull request #2746 from zRzRzRzRzRzRzR/dev
zRzRzRzRzRzRzR Jan 22, 2024
09bcec5
Merge pull request #2748 from chatchat-space/dev
zRzRzRzRzRzRzR Jan 22, 2024
eeba2e2
配置文件修改
zRzRzRzRzRzRzR Jan 22, 2024
80c26e4
Merge branch 'dev' of https://github.com/zRzRzRzRzRzRzR/Langchain-Cha…
zRzRzRzRzRzRzR Jan 22, 2024
fb6c84b
Merge pull request #2749 from zRzRzRzRzRzRzR/dev
zRzRzRzRzRzRzR Jan 22, 2024
d4ff6be
Merge pull request #2750 from chatchat-space/dev
zRzRzRzRzRzRzR Jan 22, 2024
b6d2bc7
恢复 删除知识库选项
zRzRzRzRzRzRzR Jan 22, 2024
6437883
Merge pull request #2751 from zRzRzRzRzRzRzR/dev
zRzRzRzRzRzRzR Jan 22, 2024
17803cb
gemini api 修复调用
zRzRzRzRzRzRzR Jan 22, 2024
54e5b41
Merge pull request #2752 from zRzRzRzRzRzRzR/dev
zRzRzRzRzRzRzR Jan 22, 2024
8577182
更新readme
zRzRzRzRzRzRzR Jan 22, 2024
c50e988
readme更新
zRzRzRzRzRzRzR Jan 22, 2024
1adff31
更新了最新的整理好的依赖
zRzRzRzRzRzRzR Jan 22, 2024
56d32a9
删除掉一些没用的注释,已经不需要todo了
zRzRzRzRzRzRzR Jan 22, 2024
31631e5
Merge pull request #2753 from zRzRzRzRzRzRzR/dev
zRzRzRzRzRzRzR Jan 22, 2024
2c92f42
Merge pull request #2754 from chatchat-space/dev
zRzRzRzRzRzRzR Jan 22, 2024
bb5e0e1
fix: set default score_threshold to 1; add weather api key to kb_config
liunux4odoo Jan 22, 2024
57c73b1
更新错误的依赖
zRzRzRzRzRzRzR Jan 22, 2024
6df6ed2
修复错误依赖
zRzRzRzRzRzRzR Jan 22, 2024
481d1c4
Merge branch 'chatchat-space:dev' into dev
zRzRzRzRzRzRzR Jan 22, 2024
088a27d
Merge pull request #2759 from zRzRzRzRzRzRzR/dev
zRzRzRzRzRzRzR Jan 22, 2024
60d5f7d
update req
imClumsyPanda Jan 22, 2024
7248163
调整依赖;优化webui模型列表;更新wiki版本
liunux4odoo Jan 23, 2024
f9a5ae9
更新了部分依赖
zRzRzRzRzRzRzR Jan 24, 2024
852ca5f
更新两行注释
zRzRzRzRzRzRzR Jan 24, 2024
f50400a
Merge pull request #2782 from zRzRzRzRzRzRzR/dev
zRzRzRzRzRzRzR Jan 24, 2024
d4ab1a6
Merge pull request #2783 from chatchat-space/dev
zRzRzRzRzRzRzR Jan 24, 2024
454d82b
Add files via upload
imClumsyPanda Jan 17, 2024
1c3b928
Update README.md
imClumsyPanda Jan 22, 2024
370dbfe
Add README_ja.md (#2787)
eltociear Jan 25, 2024
a5e758b
fix: set default score_threshold to 1; add weather api key to kb_config
liunux4odoo Jan 22, 2024
488c13a
Merge branch 'panda-dev' into panda-pre
liunux4odoo Jan 25, 2024
dcff542
merge master to dev
liunux4odoo Jan 25, 2024
7c163b9
Merge branch 'panda-dev' into panda-pre
liunux4odoo Jan 25, 2024
File filter

Filter by extension

Filter by extension


Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
83 changes: 61 additions & 22 deletions README.md
Original file line number Diff line number Diff line change
@@ -1,37 +1,46 @@
![](img/logo-long-chatchat-trans-v2.png)


🌍 [READ THIS IN ENGLISH](README_en.md)
🌍 [日本語で読む](README_ja.md)

📃 **LangChain-Chatchat** (原 Langchain-ChatGLM)

基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现,开源、可离线部署的检索增强生成(RAG)大模型知识库项目。

⚠️`0.2.10`将会是`0.2.x`系列的最后一个版本,`0.2.x`系列版本将会停止更新和技术支持,全力研发具有更强应用性的 `Langchain-Chatchat 0.3.x`。

---

## 目录

* [介绍](README.md#介绍)
* [解决的痛点](README.md#解决的痛点)
* [快速上手](README.md#快速上手)
* [1. 环境配置](README.md#1-环境配置)
* [2. 模型下载](README.md#2-模型下载)
* [3. 初始化知识库和配置文件](README.md#3-初始化知识库和配置文件)
* [4. 一键启动](README.md#4-一键启动)
* [5. 启动界面示例](README.md#5-启动界面示例)
* [1. 环境配置](README.md#1-环境配置)
* [2. 模型下载](README.md#2-模型下载)
* [3. 初始化知识库和配置文件](README.md#3-初始化知识库和配置文件)
* [4. 一键启动](README.md#4-一键启动)
* [5. 启动界面示例](README.md#5-启动界面示例)
* [联系我们](README.md#联系我们)


## 介绍

🤖️ 一种利用 [langchain](https://github.com/hwchase17/langchain) 思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。
🤖️ 一种利用 [langchain](https://github.com/langchain-ai/langchain)
思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。

💡 受 [GanymedeNil](https://github.com/GanymedeNil) 的项目 [document.ai](https://github.com/GanymedeNil/document.ai) 和 [AlexZhangji](https://github.com/AlexZhangji) 创建的 [ChatGLM-6B Pull Request](https://github.com/THUDM/ChatGLM-6B/pull/216) 启发,建立了全流程可使用开源模型实现的本地知识库问答应用。本项目的最新版本中通过使用 [FastChat](https://github.com/lm-sys/FastChat) 接入 Vicuna, Alpaca, LLaMA, Koala, RWKV 等模型,依托于 [langchain](https://github.com/langchain-ai/langchain) 框架支持通过基于 [FastAPI](https://github.com/tiangolo/fastapi) 提供的 API 调用服务,或使用基于 [Streamlit](https://github.com/streamlit/streamlit) 的 WebUI 进行操作。
💡 受 [GanymedeNil](https://github.com/GanymedeNil) 的项目 [document.ai](https://github.com/GanymedeNil/document.ai)
和 [AlexZhangji](https://github.com/AlexZhangji)
创建的 [ChatGLM-6B Pull Request](https://github.com/THUDM/ChatGLM-6B/pull/216)
启发,建立了全流程可使用开源模型实现的本地知识库问答应用。本项目的最新版本中通过使用 [FastChat](https://github.com/lm-sys/FastChat)
接入 Vicuna, Alpaca, LLaMA, Koala, RWKV 等模型,依托于 [langchain](https://github.com/langchain-ai/langchain)
框架支持通过基于 [FastAPI](https://github.com/tiangolo/fastapi) 提供的 API
调用服务,或使用基于 [Streamlit](https://github.com/streamlit/streamlit) 的 WebUI 进行操作。

✅ 依托于本项目支持的开源 LLM 与 Embedding 模型,本项目可实现全部使用**开源**模型**离线私有部署**。与此同时,本项目也支持 OpenAI GPT API 的调用,并将在后续持续扩充对各类模型及模型 API 的接入。
✅ 依托于本项目支持的开源 LLM 与 Embedding 模型,本项目可实现全部使用**开源**模型**离线私有部署**。与此同时,本项目也支持
OpenAI GPT API 的调用,并将在后续持续扩充对各类模型及模型 API 的接入。

⛓️ 本项目实现原理如下图所示,过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的 `top k`个 -> 匹配出的文本作为上下文和问题一起添加到 `prompt`中 -> 提交给 `LLM`生成回答。
⛓️ 本项目实现原理如下图所示,过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 ->
在文本向量中匹配出与问句向量最相似的 `top k`个 -> 匹配出的文本作为上下文和问题一起添加到 `prompt`中 -> 提交给 `LLM`生成回答。

📺 [原理介绍视频](https://www.bilibili.com/video/BV13M4y1e7cN/?share_source=copy_web&vd_source=e6c5aafe684f30fbe41925d61ca6d514)

Expand All @@ -43,7 +52,8 @@

🚩 本项目未涉及微调、训练过程,但可利用微调或训练对本项目效果进行优化。

🌐 [AutoDL 镜像](https://www.codewithgpu.com/i/chatchat-space/Langchain-Chatchat/Langchain-Chatchat) 中 `v13` 版本所使用代码已更新至本项目 `v0.2.9` 版本。
🌐 [AutoDL 镜像](https://www.codewithgpu.com/i/chatchat-space/Langchain-Chatchat/Langchain-Chatchat) 中 `v13`
版本所使用代码已更新至本项目 `v0.2.9` 版本。

🐳 [Docker 镜像](registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.6) 已经更新到 ```0.2.7``` 版本。

Expand All @@ -53,7 +63,10 @@
docker run -d --gpus all -p 80:8501 registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.7
```

🧩 本项目有一个非常完整的[Wiki](https://github.com/chatchat-space/Langchain-Chatchat/wiki/) , README只是一个简单的介绍,__仅仅是入门教程,能够基础运行__。 如果你想要更深入的了解本项目,或者想对本项目做出贡献。请移步 [Wiki](https://github.com/chatchat-space/Langchain-Chatchat/wiki/) 界面
🧩 本项目有一个非常完整的[Wiki](https://github.com/chatchat-space/Langchain-Chatchat/wiki/) , README只是一个简单的介绍,_
_仅仅是入门教程,能够基础运行__。
如果你想要更深入的了解本项目,或者想对本项目做出贡献。请移步 [Wiki](https://github.com/chatchat-space/Langchain-Chatchat/wiki/)
界面

## 解决的痛点

Expand All @@ -63,17 +76,19 @@ docker run -d --gpus all -p 80:8501 registry.cn-beijing.aliyuncs.com/chatchat/ch
我们支持市面上主流的本地大语言模型和Embedding模型,支持开源的本地向量数据库。
支持列表详见[Wiki](https://github.com/chatchat-space/Langchain-Chatchat/wiki/)


## 快速上手

### 1. 环境配置

+ 首先,确保你的机器安装了 Python 3.8 - 3.11
+ 首先,确保你的机器安装了 Python 3.8 - 3.11 (我们强烈推荐使用 Python3.11)。

```
$ python --version
Python 3.11.7
```

接着,创建一个虚拟环境,并在虚拟环境内安装项目的依赖

```shell

# 拉取仓库
Expand All @@ -89,33 +104,44 @@ $ pip install -r requirements_webui.txt

# 默认依赖包括基本运行环境(FAISS向量库)。如果要使用 milvus/pg_vector 等向量库,请将 requirements.txt 中相应依赖取消注释再安装。
```
请注意,LangChain-Chatchat `0.2.x` 系列是针对 Langchain `0.0.x` 系列版本的,如果你使用的是 Langchain `0.1.x` 系列版本,需要降级。

请注意,LangChain-Chatchat `0.2.x` 系列是针对 Langchain `0.0.x` 系列版本的,如果你使用的是 Langchain `0.1.x`
系列版本,需要降级您的`Langchain`版本。

### 2, 模型下载

如需在本地或离线环境下运行本项目,需要首先将项目所需的模型下载至本地,通常开源 LLM 与 Embedding 模型可以从 [HuggingFace](https://huggingface.co/models) 下载。
如需在本地或离线环境下运行本项目,需要首先将项目所需的模型下载至本地,通常开源 LLM 与 Embedding
模型可以从 [HuggingFace](https://huggingface.co/models) 下载。

以本项目中默认使用的 LLM 模型 [THUDM/ChatGLM3-6B](https://huggingface.co/THUDM/chatglm3-6b) 与 Embedding 模型 [BAAI/bge-large-zh](https://huggingface.co/BAAI/bge-large-zh) 为例:
以本项目中默认使用的 LLM 模型 [THUDM/ChatGLM3-6B](https://huggingface.co/THUDM/chatglm3-6b) 与 Embedding
模型 [BAAI/bge-large-zh](https://huggingface.co/BAAI/bge-large-zh) 为例:

下载模型需要先[安装 Git LFS](https://docs.github.com/zh/repositories/working-with-files/managing-large-files/installing-git-large-file-storage),然后运行
下载模型需要先[安装 Git LFS](https://docs.github.com/zh/repositories/working-with-files/managing-large-files/installing-git-large-file-storage)
,然后运行

```Shell
$ git lfs install
$ git clone https://huggingface.co/THUDM/chatglm3-6b
$ git clone https://huggingface.co/BAAI/bge-large-zh
```

### 3. 初始化知识库和配置文件

按照下列方式初始化自己的知识库和简单的复制配置文件

```shell
$ python copy_config_example.py
$ python init_database.py --recreate-vs
```

### 4. 一键启动

按照以下命令启动项目

```shell
$ python startup.py -a
```

### 5. 启动界面示例

如果正常启动,你将能看到以下界面
Expand All @@ -134,19 +160,32 @@ $ python startup.py -a

![](img/init_knowledge_base.jpg)


### 注意

以上方式只是为了快速上手,如果需要更多的功能和自定义启动方式 ,请参考[Wiki](https://github.com/chatchat-space/Langchain-Chatchat/wiki/)
以上方式只是为了快速上手,如果需要更多的功能和自定义启动方式
,请参考[Wiki](https://github.com/chatchat-space/Langchain-Chatchat/wiki/)


---

## 项目里程碑

+ `2023年4月`: `Langchain-ChatGLM 0.1.0` 发布,支持基于 ChatGLM-6B 模型的本地知识库问答。
+ `2023年8月`: `Langchain-ChatGLM` 改名为 `Langchain-Chatchat`,`0.2.0` 发布,使用 `fastchat` 作为模型加载方案,支持更多的模型和数据库。
+ `2023年10月`: `Langchain-Chatchat 0.2.5` 发布,推出 Agent 内容,开源项目在`Founder Park & Zhipu AI & Zilliz`
举办的黑客马拉松获得三等奖。
+ `2023年12月`: `Langchain-Chatchat` 开源项目获得超过 **20K** stars.
+ `2024年1月`: `LangChain 0.1.x` 推出,`Langchain-Chatchat 0.2.x` 发布稳定版本`0.2.10`
后将停止更新和技术支持,全力研发具有更强应用性的 `Langchain-Chatchat 0.3.x`。

+ 🔥 让我们一起期待未来 Chatchat 的故事 ···

---

## 联系我们

### Telegram

[![Telegram](https://img.shields.io/badge/Telegram-2CA5E0?style=for-the-badge&logo=telegram&logoColor=white "langchain-chatglm")](https://t.me/+RjliQ3jnJ1YyN2E9)

### 项目交流群
Expand All @@ -158,4 +197,4 @@ $ python startup.py -a

<img src="img/official_wechat_mp_account.png" alt="二维码" width="300" />

🎉 Langchain-Chatchat 项目官方公众号,欢迎扫码关注。
🎉 Langchain-Chatchat 项目官方公众号,欢迎扫码关注。
38 changes: 31 additions & 7 deletions README_en.md
Original file line number Diff line number Diff line change
Expand Up @@ -8,6 +8,10 @@
A LLM application aims to implement knowledge and search engine based QA based on Langchain and open-source or remote
LLM API.

⚠️`0.2.10` will be the last version of the `0.2.x` series. The `0.2.x` series will stop updating and technical support,
and strive to develop `Langchain-Chachat 0.3.x with stronger applicability. `.


---

## Table of Contents
Expand All @@ -25,7 +29,8 @@ LLM API.
## Introduction

🤖️ A Q&A application based on local knowledge base implemented using the idea
of [langchain](https://github.com/hwchase17/langchain). The goal is to build a KBQA(Knowledge based Q&A) solution that
of [langchain](https://github.com/langchain-ai/langchain). The goal is to build a KBQA(Knowledge based Q&A) solution
that
is friendly to Chinese scenarios and open source models and can run both offline and online.

💡 Inspired by [document.ai](https://github.com/GanymedeNil/document.ai)
Expand Down Expand Up @@ -56,10 +61,9 @@ The main process analysis from the aspect of document process:
🚩 The training or fine-tuning are not involved in the project, but still, one always can improve performance by do
these.

🌐 [AutoDL image](registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.5) is supported, and in v13 the codes are update
to v0.2.9.
🌐 [AutoDL image](https://www.codewithgpu.com/i/chatchat-space/Langchain-Chatchat/Langchain-Chatchat) is supported, and in v13 the codes are update to v0.2.9.

🐳 [Docker image](registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.7)
🐳 [Docker image](registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.7) is supported to 0.2.7

## Pain Points Addressed

Expand Down Expand Up @@ -99,7 +103,9 @@ $ pip install -r requirements_webui.txt

# 默认依赖包括基本运行环境(FAISS向量库)。如果要使用 milvus/pg_vector 等向量库,请将 requirements.txt 中相应依赖取消注释再安装。
```
Please note that the LangChain-Chachat `0.2.x` series is for the Langchain `0.0.x` series version. If you are using the Langchain `0.1.x` series version, you need to downgrade.

Please note that the LangChain-Chachat `0.2.x` series is for the Langchain `0.0.x` series version. If you are using the
Langchain `0.1.x` series version, you need to downgrade.

### Model Download

Expand Down Expand Up @@ -159,15 +165,33 @@ please refer to the [Wiki](https://github.com/chatchat-space/Langchain-Chatchat/

---

## Project Milestones

+ `April 2023`: `Langchain-ChatGLM 0.1.0` released, supporting local knowledge base question and answer based on the
ChatGLM-6B model.
+ `August 2023`: `Langchain-ChatGLM` was renamed to `Langchain-Chatchat`, `0.2.0` was released, using `fastchat` as the
model loading solution, supporting more models and databases.
+ `October 2023`: `Langchain-Chachat 0.2.5` was released, Agent content was launched, and the open source project won
the third prize in the hackathon held by `Founder Park & Zhipu AI & Zilliz`.
+ `December 2023`: `Langchain-Chachat` open source project received more than **20K** stars.
+ `January 2024`: `LangChain 0.1.x` is launched, `Langchain-Chachat 0.2.x` is released. After the stable
version `0.2.10` is released, updates and technical support will be stopped, and all efforts will be made to
develop `Langchain with stronger applicability -Chat 0.3.x`.


+ 🔥 Let’s look forward to the future Chatchat stories together···

---

## Contact Us

### Telegram

[![Telegram](https://img.shields.io/badge/Telegram-2CA5E0?style=for-the-badge&logo=telegram&logoColor=white "langchain-chatglm")](https://t.me/+RjliQ3jnJ1YyN2E9)

### WeChat Group
### WeChat Group

<img src="img/qr_code_67.jpg" alt="二维码" width="300" height="300" />
<img src="img/qr_code_87.jpg" alt="二维码" width="300" height="300" />

### WeChat Official Account

Expand Down
2 changes: 1 addition & 1 deletion configs/__init__.py
Original file line number Diff line number Diff line change
Expand Up @@ -5,4 +5,4 @@
from .prompt_config import *


VERSION = "v0.2.9"
VERSION = "v0.2.10"
12 changes: 8 additions & 4 deletions configs/kb_config.py.example
Original file line number Diff line number Diff line change
Expand Up @@ -21,10 +21,9 @@ OVERLAP_SIZE = 50
# 知识库匹配向量数量
VECTOR_SEARCH_TOP_K = 3

# 知识库匹配的距离阈值,取值范围在0-1之间,SCORE越小,距离越小从而相关度越高,
# 取到1相当于不筛选,实测bge-large的距离得分大部分在0.01-0.7之间,
# 相似文本的得分最高在0.55左右,因此建议针对bge设置得分为0.6
SCORE_THRESHOLD = 0.6
# 知识库匹配的距离阈值,一般取值范围在0-1之间,SCORE越小,距离越小从而相关度越高。
# 但有用户报告遇到过匹配分值超过1的情况,为了兼容性默认设为1,在WEBUI中调整范围为0-2
SCORE_THRESHOLD = 1.0

# 默认搜索引擎。可选:bing, duckduckgo, metaphor
DEFAULT_SEARCH_ENGINE = "duckduckgo"
Expand All @@ -49,12 +48,17 @@ BING_SUBSCRIPTION_KEY = ""
# metaphor搜索需要KEY
METAPHOR_API_KEY = ""

# 心知天气 API KEY,用于天气Agent。申请:https://www.seniverse.com/
SENIVERSE_API_KEY = ""

# 是否开启中文标题加强,以及标题增强的相关配置
# 通过增加标题判断,判断哪些文本为标题,并在metadata中进行标记;
# 然后将文本与往上一级的标题进行拼合,实现文本信息的增强。
ZH_TITLE_ENHANCE = False

# PDF OCR 控制:只对宽高超过页面一定比例(图片宽/页面宽,图片高/页面高)的图片进行 OCR。
# 这样可以避免 PDF 中一些小图片的干扰,提高非扫描版 PDF 处理速度
PDF_OCR_THRESHOLD = (0.6, 0.6)

# 每个知识库的初始化介绍,用于在初始化知识库时显示和Agent调用,没写则没有介绍,不会被Agent调用。
KB_INFO = {
Expand Down
Loading