# 07-03 Embeddings 与 RAG

学习向量嵌入和检索增强生成（RAG），这是构建知识库问答系统的核心技术。

## 1. 什么是 Embeddings？

In [None]:
// Embeddings 将文本转换为数值向量
// 语义相似的文本，向量距离也相近

import OpenAI from 'openai';
const openai = new OpenAI();

async function getEmbedding(text) {
  const response = await openai.embeddings.create({
    model: 'text-embedding-3-small',
    input: text
  });
  return response.data[0].embedding;  // 1536 维向量
}

// 获取两个文本的向量
const vec1 = await getEmbedding('猫是一种可爱的宠物');
const vec2 = await getEmbedding('狗是人类的好朋友');
const vec3 = await getEmbedding('今天股市上涨了');

console.log('vec1 维度:', vec1.length);  // 1536

// 计算余弦相似度
function cosineSimilarity(a, b) {
  let dotProduct = 0;
  let normA = 0;
  let normB = 0;
  for (let i = 0; i < a.length; i++) {
    dotProduct += a[i] * b[i];
    normA += a[i] * a[i];
    normB += b[i] * b[i];
  }
  return dotProduct / (Math.sqrt(normA) * Math.sqrt(normB));
}

console.log('猫 vs 狗:', cosineSimilarity(vec1, vec2));  // 相似度高
console.log('猫 vs 股市:', cosineSimilarity(vec1, vec3));  // 相似度低

## 2. 简单向量数据库

In [None]:
// 内存中的向量存储
class SimpleVectorDB {
  constructor() {
    this.documents = [];  // { id, text, embedding }
  }
  
  async add(id, text, embeddingFn) {
    const embedding = await embeddingFn(text);
    this.documents.push({ id, text, embedding });
  }
  
  async search(query, embeddingFn, topK = 3) {
    const queryEmbedding = await embeddingFn(query);
    
    const scored = this.documents.map(doc => ({
      ...doc,
      score: cosineSimilarity(queryEmbedding, doc.embedding)
    }));
    
    return scored
      .sort((a, b) => b.score - a.score)
      .slice(0, topK);
  }
}

// 使用示例
const db = new SimpleVectorDB();

const docs = [
  { id: '1', text: 'OpenClaw 支持 Telegram、Discord、Slack 等消息平台' },
  { id: '2', text: 'OpenClaw 可以连接 OpenAI、Anthropic 等 AI 模型' },
  { id: '3', text: 'OpenClaw 支持语音通话和语音合成' },
  { id: '4', text: 'Redis 是一个内存数据库，支持多种数据结构' }
];

for (const doc of docs) {
  await db.add(doc.id, doc.text, getEmbedding);
}

// 搜索
const results = await db.search('哪些平台可以用？', getEmbedding);
console.log(results);

## 3. RAG 完整流程

In [None]:
// RAG: Retrieval Augmented Generation
async function ragQuery(userQuestion, vectorDB) {
  // 1. 检索相关文档
  const relevantDocs = await vectorDB.search(userQuestion, getEmbedding, 3);
  
  // 2. 构建提示词
  const context = relevantDocs
    .map(d => `[${d.id}] ${d.text}`)
    .join('\n');
  
  const prompt = `根据以下参考资料回答问题：

${context}

问题：${userQuestion}

请基于以上资料回答，如果资料不足请说明。`;
  
  // 3. 生成回答
  const completion = await openai.chat.completions.create({
    model: 'gpt-4o-mini',
    messages: [{ role: 'user', content: prompt }]
  });
  
  return {
    answer: completion.choices[0].message.content,
    sources: relevantDocs.map(d => d.id)
  };
}

// 使用
const result = await ragQuery('OpenClaw 支持语音吗？', db);
console.log('回答:', result.answer);
console.log('来源:', result.sources);

## 4. 文档分块策略

In [None]:
// 长文档需要分块处理
function chunkText(text, maxChunkSize = 500, overlap = 50) {
  const chunks = [];
  let start = 0;
  
  while (start < text.length) {
    let end = start + maxChunkSize;
    
    // 尽量在句子边界分割
    if (end < text.length) {
      const lastPeriod = text.lastIndexOf('.', end);
      if (lastPeriod > start) {
        end = lastPeriod + 1;
      }
    }
    
    chunks.push(text.slice(start, end).trim());
    start = end - overlap;  // 重叠部分保持上下文
  }
  
  return chunks;
}

// 处理 Markdown 文档
function chunkMarkdown(markdown) {
  // 按标题分割
  const sections = markdown.split(/(?=^#{1,3} )/m);
  return sections
    .filter(s => s.trim())
    .map(s => ({
      header: s.match(/^#{1,3} (.+)$/m)?.[1] || '',
      content: s.slice(0, 1000)  // 限制长度
    }));
}

## 练习

1. 为自己的笔记构建一个问答系统
2. 对比不同 embedding 模型的效果
3. 实现一个带引用的 Chatbot