# 🧬 RAG智能问答系统 - Google Colab版

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/novenazgarfield/research-workstation/blob/main/RAG_System_Colab.ipynb)

这是一个基于检索增强生成(RAG)技术的智能问答系统，专为科研工作者设计。

## 🚀 快速开始
1. 运行下面的代码块安装依赖
2. 运行RAG系统代码
3. 启动Web界面
4. 通过公共URL访问系统

---

## 📦 步骤1: 安装依赖

In [None]:
# 安装必要的依赖包
!pip install streamlit pyngrok -q

print("✅ 依赖安装完成！")

## 🧬 步骤2: 创建RAG系统应用

In [None]:
%%writefile rag_app.py
#!/usr/bin/env python3
"""
RAG智能问答系统 - Google Colab版
基于检索增强生成技术的智能问答系统
"""

import streamlit as st
import json
import datetime
import random
import time

# 页面配置
st.set_page_config(
    page_title="🧬 RAG智能问答系统",
    page_icon="🧬",
    layout="wide",
    initial_sidebar_state="expanded"
)

# 模拟知识库
KNOWLEDGE_BASE = {
    "AI": "人工智能(AI)是计算机科学的一个分支，致力于创建能够执行通常需要人类智能的任务的系统。",
    "RAG": "检索增强生成(RAG)是一种结合信息检索和文本生成的AI技术，能够基于外部知识库生成更准确的回答。",
    "机器学习": "机器学习是AI的一个子领域，使计算机能够在没有明确编程的情况下学习和改进。",
    "深度学习": "深度学习是机器学习的一个分支，使用多层神经网络来模拟人脑的学习过程。",
    "自然语言处理": "自然语言处理(NLP)是AI的一个分支，专注于计算机与人类语言之间的交互。"
}

DEMO_RESPONSES = [
    "根据文档分析，这是一个关于人工智能的重要问题。AI技术正在快速发展，特别是在自然语言处理领域。",
    "基于检索到的相关文档，我可以为您提供以下信息：这个问题涉及到机器学习的核心概念。",
    "通过文档检索，我发现了相关的研究资料。深度学习在这个领域有着广泛的应用前景。",
    "根据知识库中的信息，这个问题可以从多个角度来分析。让我为您详细解答。",
    "文档显示，这是一个值得深入研究的技术问题。相关的解决方案包括多种方法。"
]

def simulate_rag_response(question):
    """模拟RAG系统响应"""
    # 简单的关键词匹配
    question_lower = question.lower()
    
    for key, value in KNOWLEDGE_BASE.items():
        if key.lower() in question_lower or any(word in question_lower for word in key.lower().split()):
            return f"**智能回答**: {value}\n\n**检索来源**: 知识库匹配 - {key}\n\n**置信度**: 92%"
    
    # 如果没有匹配，使用随机回答
    response = random.choice(DEMO_RESPONSES)
    return f"**智能回答**: {response}\n\n**检索来源**: 模拟文档库 (演示模式)\n\n**置信度**: 85%"

def main():
    # 标题和介绍
    st.title("🧬 RAG智能问答系统")
    st.markdown("### 🌟 基于检索增强生成技术的智能问答系统")
    
    # 运行环境提示
    st.info("🚀 当前运行在 Google Colab 环境中 | 📱 支持移动端访问")
    
    # 侧边栏
    with st.sidebar:
        st.header("🔧 系统控制")
        
        st.success("✅ Colab模式运行中")
        st.success("🤖 模拟API已就绪")
        st.info("📚 演示知识库已加载")
        
        st.markdown("---")
        
        # 系统统计
        if 'chat_history' in st.session_state:
            st.metric("💬 对话次数", len(st.session_state.chat_history))
        else:
            st.metric("💬 对话次数", 0)
        
        st.metric("📖 知识条目", len(KNOWLEDGE_BASE))
        
        st.markdown("---")
        
        if st.button("🔄 刷新页面", use_container_width=True):
            st.rerun()
            
        if st.button("🗑️ 清除历史", use_container_width=True):
            if 'chat_history' in st.session_state:
                st.session_state.chat_history = []
            st.success("历史记录已清除")
        
        st.markdown("---")
        st.markdown("### 🔗 相关链接")
        st.markdown("- [GitHub仓库](https://github.com/novenazgarfield/research-workstation)")
        st.markdown("- [完整版部署](https://github.com/novenazgarfield/research-workstation/blob/main/systems/rag-system/README.md)")
        st.markdown("- [技术文档](https://github.com/novenazgarfield/research-workstation/blob/main/systems/rag-system/DEPLOYMENT.md)")
    
    # 主要内容区域
    tab1, tab2, tab3, tab4 = st.tabs(["💬 智能问答", "📜 聊天历史", "📖 系统介绍", "🎯 使用指南"])
    
    with tab1:
        st.header("💬 智能问答")
        
        # 状态指示器
        col1, col2, col3 = st.columns(3)
        with col1:
            st.success("📚 知识库: 已加载")
        with col2:
            st.success("🤖 AI模型: 就绪")
        with col3:
            st.success("🔍 检索系统: 运行中")
        
        st.markdown("---")
        
        # 问答界面
        st.subheader("🤔 请输入您的问题")
        
        # 示例问题
        st.markdown("**💡 示例问题:**")
        example_questions = [
            "什么是人工智能？",
            "RAG技术的原理是什么？",
            "机器学习和深度学习的区别？",
            "自然语言处理有哪些应用？"
        ]
        
        cols = st.columns(2)
        for i, example in enumerate(example_questions):
            with cols[i % 2]:
                if st.button(f"📝 {example}", key=f"example_{i}", use_container_width=True):
                    st.session_state.current_question = example
        
        # 问题输入
        question = st.text_area(
            "输入问题:",
            value=st.session_state.get('current_question', ''),
            height=100,
            placeholder="例如：什么是RAG技术？它有什么优势？",
            key="question_input"
        )
        
        # 提交按钮
        col1, col2 = st.columns([1, 4])
        with col1:
            submit_button = st.button("🚀 获取答案", type="primary", use_container_width=True)
        
        if submit_button and question.strip():
            # 初始化聊天历史
            if 'chat_history' not in st.session_state:
                st.session_state.chat_history = []
            
            # 显示处理过程
            with st.spinner("🔍 正在检索相关文档..."):
                time.sleep(1)
            
            with st.spinner("🤖 AI正在生成回答..."):
                response = simulate_rag_response(question)
                time.sleep(1)
            
            # 保存到历史
            st.session_state.chat_history.append({
                'timestamp': datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
                'question': question,
                'response': response
            })
            
            st.success("✅ 回答生成完成！")
            
            # 清除当前问题
            if 'current_question' in st.session_state:
                del st.session_state.current_question
        
        # 显示最新回答
        if 'chat_history' in st.session_state and st.session_state.chat_history:
            st.markdown("---")
            st.subheader("💡 最新回答")
            latest = st.session_state.chat_history[-1]
            
            with st.container():
                st.markdown(f"**❓ 问题**: {latest['question']}")
                st.markdown(latest['response'])
                st.caption(f"⏰ 回答时间: {latest['timestamp']}")
    
    with tab2:
        st.header("📜 聊天历史")
        
        if 'chat_history' in st.session_state and st.session_state.chat_history:
            st.info(f"📊 共有 {len(st.session_state.chat_history)} 条对话记录")
            
            # 搜索功能
            search_term = st.text_input("🔍 搜索历史记录", placeholder="输入关键词搜索...")
            
            filtered_history = st.session_state.chat_history
            if search_term:
                filtered_history = [
                    chat for chat in st.session_state.chat_history
                    if search_term.lower() in chat['question'].lower() or search_term.lower() in chat['response'].lower()
                ]
                st.info(f"🔍 找到 {len(filtered_history)} 条匹配记录")
            
            # 显示历史记录
            for i, chat in enumerate(reversed(filtered_history)):
                with st.expander(f"💬 对话 {len(filtered_history)-i} - {chat['timestamp']}", expanded=(i==0)):
                    st.markdown(f"**❓ 问题**: {chat['question']}")
                    st.markdown("**🤖 回答**:")
                    st.markdown(chat['response'])
        else:
            st.info("📝 暂无聊天记录，请先在智能问答中提问")
            st.markdown("### 🎯 开始使用")
            st.markdown("1. 切换到 **智能问答** 标签页")
            st.markdown("2. 输入您的问题")
            st.markdown("3. 点击 **获取答案** 按钮")
            st.markdown("4. 查看AI生成的智能回答")
    
    with tab3:
        st.header("📖 系统介绍")
        
        st.markdown("""
        ## 🎯 关于RAG智能问答系统
        
        这是一个基于**检索增强生成(RAG)**技术的智能问答系统，专为科研工作者和知识工作者设计。
        
        ### ✨ 核心特性
        
        **🤖 多API支持**
        - 本地模型：DeepSeek、Llama等
        - 在线API：魔搭、OpenAI、智谱等
        - 自动故障转移和负载均衡
        
        **🔧 分布式计算**
        - RTX 3090：专门负责LLM推理
        - RTX 4060：负责嵌入计算和向量搜索
        - 智能任务调度和资源优化
        
        **📚 智能文档处理**
        - 支持PDF、DOCX、PPTX、Excel等格式
        - 自动文本提取和分块
        - 向量化存储和检索
        
        **🧠 记忆管理系统**
        - 永久记忆：长期知识存储
        - 临时记忆：会话上下文管理
        - 任务分类：多项目并行管理
        
        ### 🚀 技术架构
        """)
        
        st.code("""
用户界面 (Streamlit)
        ↓
    RAG核心系统
        ↓
┌─────────────┬─────────────┐
│   RTX 3090  │   RTX 4060  │
│  LLM推理    │  嵌入计算    │
└─────────────┴─────────────┘
        ↓
向量数据库 + 记忆系统
        """, language="text")
        
        st.markdown("""
        ### 💡 技术栈
        
        - **前端**: Streamlit
        - **后端**: Python + FastAPI
        - **向量数据库**: FAISS
        - **嵌入模型**: sentence-transformers
        - **LLM**: llama-cpp-python + API调用
        - **数据库**: SQLite
        - **部署**: Docker + GPU支持
        
        ### 📋 使用场景
        
        - **🔬 科研文献问答**: 快速查找和理解论文内容
        - **📖 技术文档查询**: 从大量技术文档中获取答案
        - **🧠 知识管理**: 构建个人或团队知识库
        - **🎓 学习辅助**: 智能答疑和知识总结
        """)
    
    with tab4:
        st.header("🎯 使用指南")
        
        st.markdown("""
        ## 🚀 快速开始
        
        ### 1️⃣ 基本使用
        1. 在 **智能问答** 标签页输入问题
        2. 点击 **获取答案** 按钮
        3. 查看AI生成的智能回答
        4. 在 **聊天历史** 中查看所有对话记录
        
        ### 2️⃣ 高级功能
        - **示例问题**: 点击预设问题快速开始
        - **历史搜索**: 在聊天历史中搜索特定内容
        - **记录管理**: 清除历史记录或刷新页面
        
        ### 3️⃣ 最佳实践
        - **明确问题**: 提出具体、明确的问题
        - **关键词**: 使用相关的技术关键词
        - **上下文**: 提供必要的背景信息
        
        ## 🔧 完整版部署
        
        当前是演示版本，完整功能需要本地部署：
        
        ### 📥 获取源码
        """)
        
        st.code("""
# 克隆仓库
git clone https://github.com/novenazgarfield/research-workstation.git

# 进入项目目录
cd research-workstation/systems/rag-system

# 安装依赖
pip install -r requirements.txt

# 配置系统
python config_manager.py

# 启动系统
python run_enhanced.py --mode web
        """, language="bash")
        
        st.markdown("""
        ### 🌟 完整版特性
        - 真实的文档处理和向量检索
        - 多种LLM API集成
        - GPU加速计算
        - 分布式架构支持
        - 完整的记忆管理系统
        
        ## 📞 技术支持
        
        如有问题或建议，欢迎通过以下方式联系：
        - GitHub Issues: [提交问题](https://github.com/novenazgarfield/research-workstation/issues)
        - 项目文档: [查看文档](https://github.com/novenazgarfield/research-workstation/blob/main/systems/rag-system/README.md)
        """)
    
    # 页脚
    st.markdown("---")
    st.markdown(
        "<div style='text-align: center; color: #666;'>" +
        "🧬 RAG智能问答系统 - Google Colab版 | " +
        "完整版支持多API + 分布式计算 + 智能记忆管理 | " +
        "<a href='https://github.com/novenazgarfield/research-workstation' target='_blank'>GitHub仓库</a>" +
        "</div>",
        unsafe_allow_html=True
    )

if __name__ == "__main__":
    main()

print("✅ RAG系统应用文件创建完成！")

## 🌐 步骤3: 设置公共访问 (ngrok)

⚠️ **重要**: 您需要一个免费的 ngrok 账号来获取公共URL

1. 访问 [ngrok.com](https://ngrok.com/) 注册免费账号
2. 获取您的 authtoken
3. 在下面的代码中替换 `YOUR_NGROK_TOKEN`

In [None]:
# 设置 ngrok authtoken (替换为您的token)
# 获取token: https://dashboard.ngrok.com/get-started/your-authtoken

NGROK_TOKEN = "YOUR_NGROK_TOKEN"  # 替换为您的实际token

if NGROK_TOKEN != "YOUR_NGROK_TOKEN":
    !ngrok config add-authtoken {NGROK_TOKEN}
    print("✅ ngrok token 配置完成！")
else:
    print("⚠️ 请先设置您的 ngrok token")
    print("1. 访问 https://ngrok.com/ 注册账号")
    print("2. 获取 authtoken: https://dashboard.ngrok.com/get-started/your-authtoken")
    print("3. 替换上面代码中的 YOUR_NGROK_TOKEN")

## 🚀 步骤4: 启动RAG系统

运行下面的代码启动系统并获取公共访问URL

In [None]:
import subprocess
import threading
import time
from pyngrok import ngrok

# 启动 Streamlit 应用
def run_streamlit():
    subprocess.run([
        "streamlit", "run", "rag_app.py",
        "--server.port", "8501",
        "--server.address", "0.0.0.0",
        "--server.enableCORS", "true",
        "--server.enableXsrfProtection", "false",
        "--server.headless", "true"
    ])

# 在后台启动 Streamlit
print("🚀 正在启动 RAG智能问答系统...")
thread = threading.Thread(target=run_streamlit)
thread.daemon = True
thread.start()

# 等待服务启动
print("⏳ 等待服务启动...")
time.sleep(15)

try:
    # 创建公共 URL
    print("🌐 创建公共访问URL...")
    public_url = ngrok.connect(8501)
    
    print("\n" + "="*60)
    print("🎉 RAG智能问答系统启动成功！")
    print("="*60)
    print(f"🌐 公共访问地址: {public_url}")
    print("📱 支持手机和电脑访问")
    print("🔗 点击上面的链接即可使用系统")
    print("="*60)
    print("\n💡 使用提示:")
    print("1. 点击上面的URL打开系统")
    print("2. 在智能问答页面输入问题")
    print("3. 点击'获取答案'按钮")
    print("4. 查看AI生成的智能回答")
    print("\n⚠️ 注意: 保持此代码块运行，关闭后URL将失效")
    
    # 保持运行
    try:
        while True:
            time.sleep(60)
            print(f"✅ 系统运行中... {time.strftime('%H:%M:%S')}")
    except KeyboardInterrupt:
        print("\n🛑 系统已停止")
        
except Exception as e:
    print(f"❌ 启动失败: {e}")
    print("\n🔧 解决方案:")
    print("1. 确保已设置正确的 ngrok token")
    print("2. 检查网络连接")
    print("3. 重新运行代码块")

## 🔄 备用方案: 无需ngrok的本地访问

如果ngrok设置有问题，可以使用Colab的内置端口转发功能：

In [None]:
# 备用方案：使用Colab内置端口转发
import subprocess
import threading
import time

def run_streamlit_local():
    subprocess.run([
        "streamlit", "run", "rag_app.py",
        "--server.port", "8501",
        "--server.address", "localhost",
        "--server.headless", "true"
    ])

print("🚀 启动本地访问模式...")
thread = threading.Thread(target=run_streamlit_local)
thread.daemon = True
thread.start()

time.sleep(10)

print("\n" + "="*50)
print("🎉 RAG系统启动成功 (本地模式)")
print("="*50)
print("📍 本地地址: http://localhost:8501")
print("\n💡 访问方法:")
print("1. 在Colab中，系统会自动显示链接")
print("2. 或者查看Colab的'端口'标签页")
print("3. 点击8501端口对应的链接")
print("="*50)

# 保持运行
try:
    while True:
        time.sleep(30)
        print(f"✅ 系统运行中... {time.strftime('%H:%M:%S')}")
except KeyboardInterrupt:
    print("\n🛑 系统已停止")

## 📖 使用说明

### 🎯 功能特色
- **💬 智能问答**: 基于RAG技术的智能问答系统
- **📜 聊天历史**: 完整的对话记录管理
- **🔍 历史搜索**: 快速查找历史对话
- **📱 移动友好**: 支持手机和平板访问

### 🚀 快速开始
1. 运行上面的代码获取访问链接
2. 点击链接打开RAG系统
3. 在"智能问答"页面输入问题
4. 点击"获取答案"查看AI回答

### 💡 示例问题
- 什么是人工智能？
- RAG技术的原理是什么？
- 机器学习和深度学习的区别？
- 自然语言处理有哪些应用？

### 🔧 技术支持
如有问题，请访问 [GitHub仓库](https://github.com/novenazgarfield/research-workstation) 获取帮助。

---
**🧬 RAG智能问答系统 - Google Colab版**  
基于检索增强生成技术 | 专为科研工作者设计