本仓库包含HIAS高级人工智能系统课程的各种实验和示例代码,旨在帮助学习者深入理解现代人工智能技术,特别是大型语言模型和注意力机制等核心概念。
本仓库包含以下主要模块:
GRPO实验,包含:
GRPO_reward.xlsx
: GRPO奖励数据Qwen2.5_3B_GRPO_modelscope.ipynb
: 使用Qwen2.5 3B模型进行GRPO实验的Jupyter笔记本
大语言模型空间表示实验,研究LLM如何理解和表示空间信息。
自注意力机制示例代码:
multihead_self_attention_demo.py
: 多头自注意力机制的Python实现self_attention.ipynb
: 自注意力机制的详细教学笔记本
基于nanoGPT的中文古诗生成项目:
- 包含完整的模型训练代码、配置文件和示例数据
- 实现了基于Transformer架构的诗歌生成系统
- 提供了多个Jupyter笔记本用于模型缩放研究和Transformer参数配置
Reference Agent:用于学术论文引用核查与文献下载的智能体。
- 主要文件结构:
reference_agent/agent.py
:核心代理逻辑reference_agent/utils.py
:工具函数reference_agent/app.py
:应用入口(预留Web界面)reference_agent/prompts/
:提示词模板examples/
:示例目录
LoRA微调实验,包含:
- Qwen1_5_0_5B_Chat_Lora.ipynb :基于Qwen1.5-0.5B-Chat模型的LoRA微调Jupyter笔记本
- train-weather.jsonl :天气工具调用对话数据集
RAG实验,包含:
- 11_feedback_loop_rag.ipynb :通过用户反馈持续优化RAG系统(自我学习能力)
- 12_adaptive_rag.ipynb :根据查询类型动态选择最佳检索策略(智能决策)
- 18_hierarchy_rag.ipynb :构建多层次索引实现高效检索(上下文保留)
PPT智能更新助手,基于AI的PowerPoint演示文稿智能更新系统:
- 使用大语言模型自动识别PPT中可能过时的内容
- 通过MCP框架集成多种搜索工具获取最新信息
- 生成适合PPT展示的更新建议
- 主要文件:
PPT_update_agent/streamlit_app.py
:Streamlit Web界面PPT_update_agent/ppt_update_agent_full.py
:核心更新AgentPPT_update_agent/ppt_parser.py
:PPT文件解析器PPT_update_agent/browser_mcp.json
:MCP服务器配置
每个实验目录包含独立的代码和数据,可以按照以下步骤运行:
- 进入相应的实验目录
- 对于Jupyter笔记本(.ipynb文件),使用Jupyter Lab或Notebook打开
- 对于Python脚本,直接使用Python解释器运行
- Python 3.8+
- PyTorch 1.12+
- Jupyter
- 其他依赖项(请参考各实验目录中的说明)
本仓库的实验和示例是高级人工智能课程的实践部分,建议结合课程讲义和相关理论学习材料一起使用,以获得最佳学习效果。
欢迎通过Issue或Pull Request提出改进建议或贡献代码。