Skip to content

MILK-BIT/AutoLatex

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

104 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

项目简介

本项目是一个可以将word、txt、markdown格式的论文一键转化为制定模板的Latex论文的Agent,使用crewai框架制作。

项目使用指南

1. 📋项目结构

整体结构

autolatex/
├── .gitignore
├── knowledge/
├── pyproject.toml
├── README.md
├── .env -- 到这里之前都是一些Crewai的文件
├── data/ -- 这是白同学以前存放论文模版的文件夹(似乎要改)
├── docs/ -- markdown格式的说明(包括帮助我配置的guideline和已完成的任务报告)
├── knowledge/ -- crewai自己建的关于用户的一些信息
├── Agent输出/ -- 我们的Agent的输出
├── 模板/ -- 目前存放的是一些BIT毕业论文模版
├── test_data/ -- hbk同学创建的用来测试的word、txt、markdown文件
├── vendor/ --有个deepseek-OCR的文件
├── checkpoints/mixtex_lora_10k_final_tuned --微调模型
├── scripts/ --模型训练和评估的代码
└── src/
    └── autolatex/
        ├── __init__.py
        ├── main.py
        ├── crew.py
        ├── tools/
        │   ├── custom_tool.py
        │   └── __init__.py
        └── config/
            ├── agents.yaml
            └── tasks.yaml

2. 🛠️配置环境

  1. 在项目根目录下创建.env文件,输入您的LLMapi的url和key 以deepseek api为例
MODEL=openai/deepseek-chat
OPENAI_API_KEY = <填入你的key>
OPENAI_API_BASE=https://api.deepseek.com
AUTOTEX_LATEX_USE_DOCKER=True
AUTOTEX_LATEX_IMAGE=autotex-compiler
  1. 将终端切换到项目根目录,安装Python环境,我们建议使用Python3.11版本
uv venv --python 3.11 myenv
  1. 安装所有依赖 在终端输入
uv pip install -r requirements.txt

3. 📝启动OCR工具(需要开启VPN)

在终端输入

uvicorn ocr_api:app --host 0.0.0.0 --port 8001

4. 🚀启动crewai并使用

4.1 在终端启动

首先将需要转化的论文放入data\uploads中,将需要上传的公式图片放入data\uploads\equation

src\autolatex\main.py中修改"file_path": r'data\uploads\你的文件名'

在项目根目录的终端输入

crewai run  

即可运行

得到的pdf与tex文件均在output文件夹下

4.2 在前端启动

  1. 首先使用 conda 创建一个 Python 3.11 环境
conda create -n autolatex python=3.11
conda activate autolatex
  1. 安装 uv 包管理器
pip install uv
  1. 同步项目依赖
uv sync
  1. 启动前端服务

    • 在第一个终端运行 API 服务(用于运行前端):
    uv run python run_api.py
    • 在第二个终端运行应用服务:
    uv run python app.py

About

能够识别word/txt/markdown格式的论文并将其转化为Latex格式的Agent

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors