-docker-compose.yml # docker-compose文件
-acs-web #前端挂载配置文件
-acs-api #后端挂载上传文件目录
-milvus #milvus向量数据库挂载目录
-mysql #mysq挂载目录
-mysql/init #mysql初始化目录,里面有一个初始化sql文件de_customer_service.sql,首次启动mysql会自动初始化,容器启动初始化完成后可以删除
-redis #redis挂载目录
-textgen #textgen挂载目录
-textgen/models #模型数据目录,需要单独下载,默认使用Atom-7B-Chat模型,只需要下载Atom-7B-Chat目录和 config.yaml文件即可
apt install docker -y
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
apt install -y nvidia-container-toolkit
systemctl start docker
docker run --gpus all nvidia/cuda:11.2.2-base-ubuntu18.04 nvidia-smi
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 515.105.01 Driver Version: 515.105.01 CUDA Version: 11.7 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA GeForce ... Off | 00000000:02:00.0 On | N/A |
| 0% 26C P8 34W / 370W | 14652MiB / 24576MiB | 35% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| 0 N/A N/A 1076 G /usr/lib/xorg/Xorg 26MiB |
| 0 N/A N/A 1142 G /usr/bin/gnome-shell 93MiB |
| 0 N/A N/A 1987 G /usr/lib/xorg/Xorg 335MiB |
| 0 N/A N/A 2129 G /usr/bin/gnome-shell 54MiB |
| 0 N/A N/A 14985 C python3.9 14045MiB |
| 0 N/A N/A 16622 G ...nlogin/bin/sunloginclient 8MiB |
| 0 N/A N/A 17532 G ...token=5412487339909047007 13MiB |
| 0 N/A N/A 29148 G ...AAAAAAAA== --shared-files 8MiB |
| 0 N/A N/A 30904 G ...145939687547819517,262144 29MiB |
| 0 N/A N/A 31862 G /usr/lib/firefox/firefox 27MiB |
+-----------------------------------------------------------------------------+
代表安装nvidia-container-toolkit成功
git clone https://github.com/aicyber2023/acs-docker.git
-
说明: text-generation-webui 容器需要部署在 GPU 的机器上,并且机器需要安装支持 GPU 的 docker 引擎,所以需要安装 nvidia-container-toolkit。
-
模型数据下载,默认使用Atom-7B-Chat模型,只需要下载Atom-7B-Chat目录和 config.yaml文件即可,放到acs-docker/dockercompose/textgen/models/目录
-
网盘地址:
链接: https://pan.baidu.com/s/1KajsPgjy59nc4PKTrDQ8Bw?pwd=khm4 提取码: khm4
-
进行到acs-docker/dockercompose/目录, dockercompose目录内所有目录不要进行修改和删除,以免影响正常启动。
-
运行
docker-compose up -d
命令 (docker-compose版本为1.29.2)-
首先会自动下载镜像,下载完镜像会自动启动,过程可能会等几分钟,根据当前网络环境决定。
-
当看到所有项目都标记done后代表启动成功,可以通过命令
docker ps -a
进行查看容器状态查看是否启动成功。
-
-
容器启动成功后,进行模型选择,这里默认选用
Atom-7B-Chat
模型。- 访问
textgen
管理页面http://127.0.0.1:27860
进行模型 load,点击model
标签在下拉菜单选择Atom-7B-Chat
,点右侧load
,直到右侧显示Successfully loaded Atom-7B-Chat
,代表模型设置成功,之后点击save setting 保存。
- 访问
-
登录到奥图大模型客服机器人管理后台
-
奥图大模型客服机器人管理后台访问地址: http://127.0.0.1:28002
登录权限: 账号:admin 密码:admin123
-
奥图大模型客服机器人对话端访问地址:http://127.0.0.1:28001
-
前端页面如果出现502,需要重启acs-api,是由于mysql初始化需要时间导致acs-api连不上mysql
- 执行重启命令
docker restart acs-api
- 执行重启命令
-
-
至此部署完成
账号:admin
密码:admin123