# Docker pgvector

pgvector 是 postgres 的 向量化扩展，扩展了类型 vector，支持 相似度查询。

+ 下载镜像 docker pull ankane/pgvector
+ 启动容器 docker run -p 5432:5432 --name my-postgres -e POSTGRES_PASSWORD=123456 -d ankane/pgvector
    - windows下，host: localhost
    - 端口 5432
    - 数据库名 my-postgres
    - 密码 123456

In [2]:
# python 库

!pip3 install --upgrade openai pgvector sqlalchemy psycopg2-binary




# 1. Python 代码 测试 向量

In [4]:
import openai
from pgvector.sqlalchemy import Vector
from sqlalchemy import create_engine, insert, select, text, Integer, Text
from sqlalchemy.orm import declarative_base, mapped_column, Session

engine = create_engine('postgresql://postgres:123456@localhost:5432/postgres')

with engine.connect() as conn:
    conn.execute(text('CREATE EXTENSION IF NOT EXISTS vector'))
    conn.commit()

Base = declarative_base()


class Document(Base):
    """定义 document 表"""
    __tablename__ = 'document'

    id = mapped_column(Integer, primary_key=True)
    content = mapped_column(Text)
    embedding = mapped_column(Vector(1536))


# 删除 并 创建 document 表
Base.metadata.drop_all(engine)
Base.metadata.create_all(engine)

input = [
    'The dog is barking',
    'The cat is purring',
    'The bear is growling'
]

# openai 生成 嵌入向量
embeddings = [v['embedding'] for v in openai.Embedding.create(input=input, model='text-embedding-ada-002')['data']]

documents = [dict(content=input[i], embedding=embedding) for i, embedding in enumerate(embeddings)]

session = Session(engine)
# 插入数据
session.execute(insert(Document), documents)
# 提交事务,使其生效
session.commit()

# 查询 id 为 1 的 document数据
doc = session.get(Document, 1)

# 查询与 id 为 1 的 document 最相似的 5 条数据
neighbors = session.scalars(select(Document).filter(Document.id != doc.id).order_by(Document.embedding.max_inner_product(doc.embedding)).limit(5))

for neighbor in neighbors:
    print(neighbor.content)

# 2. [pgAdmin](https://ftp.postgresql.org/pub/pgadmin/pgadmin4/v7.4/windows/pgadmin4-7.4-x64.exe) 数据库图形管理工具

点 [pgAdmin](https://ftp.postgresql.org/pub/pgadmin/pgadmin4/v7.4/windows/pgadmin4-7.4-x64.exe) 安装 EXE

## 2.1. 链接 数据库

![](../../../images/20230629185144.png)

## 2.2. 查看 所有 Table

左边树状: Servers/my-postgres/Databases/postgres/Schemas/public/Tables

每次 程序改变数据, 记得刷新 右键--Refresh

![](../../../images/20230629191243.png)

## 2.3. 查看 对应 Table 的 数据

对应的 Table, 右键 View / Edit Data / All Rows

每次 程序改变数据, 记得刷新 右键--Refresh

![](../../../images/20230629191507.png)