环境pre-install

实战Transformers

环境pre-install

# https://www.runpod.io/  Cloud GPUs environment runpod/pytorch:2.1.1-py3.10-cuda12.1.1-devel-ubuntu22.04

## pre-instsall.sh
# 安装 miniconda, PyTorch/CUDA 的 conda 环境
mkdir -p ~/miniconda3
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O ~/miniconda3/miniconda.sh
bash ~/miniconda3/miniconda.sh -b -u -p ~/miniconda3
rm -rf ~/miniconda3/miniconda.sh
~/miniconda3/bin/conda init bash && source ~/miniconda3/bin/activate
conda config --set auto_activate_base false
conda create -n transformers python=3.10 -y
conda activate transformers
# conda environments:
conda env list
nvidia-smi
pip install transformers datasets evaluate peft accelerate gradio optimum sentencepiece bitsandbytes trl
pip install jupyterlab scikit-learn pandas matplotlib tensorboard nitk rouge optuna wandb
pip install torch torchvision 
pip install jupyter ipykernel huggingface_hub
python -m ipykernel install --user --name transformers --display-name "conda & pytorch(transformers)"

### clone code

apt update
apt install git-lfs
cd /workspace
git lfs install
git clone https://github.com/zwong91/transformers.git

课程规划

基础入门篇：Transformers入门，从环境安装到各个基础组件的介绍，包括Pipeline、Tokenizer、Model、Datasets、Evaluate、Trainer，并通过一个最基本的文本分类实例将各个模块进行串讲
实战演练篇：Transformers实战，通过丰富的实战案例对Transformers在NLP任务中的解决方案进行介绍，包括命名实体识别、机器阅读理解、多项选择、文本相似度、检索式对话机器人、掩码语言模型、因果语言模型、摘要生成、生成式对话机器人
高效微调篇：Transformers模型高效微调，以PEFT库为核心，介绍各种常用的参数高效微调方法的原理与实战，包括BitFit、Prompt-tuning、P-tuning、Prefix-Tuning、Lora和IA3
低精度训练篇：Transformers模型低精度训练，基于bitsandbytes库，进行模型的低精度训练，包括LlaMA2-7B和ChatGLM2-6B两个模型的多个不同精度训练的实战演练，包括半精度训练、8bit训练、4bit训练（QLoRA）
分布式训练篇：Transformers模型分布式训练，基于accelerate库讲解transformers模型的分布式训练解决方案，介绍分布式训练的基本原理以及accelerate库的基本使用方式，包括与Deepspeed框架的集成
对齐训练篇: ...
性能优化篇: ...
系统演示篇: ...

课程地址

课程视频发布在B站与YouTube，代码与视频会逐步进行更新，目前课程主要更新在B站，YouTube后续会持续更新

Transformers 基础入门篇 (已更新完成)

01- 基础知识与环境安装
- 视频地址：Bilibili | YouTube
02 基础组件之 Pipeline |
- 视频地址：Bilibili | YouTube
03 基础组件之 Tokenizer
- 视频地址：Bilibili | YouTube
04 基础组件之 Model(上) 基本使用
- 视频地址：Bilibili | YouTube
04 基础组件之 Model(下) BERT文本分类代码实例
- 视频地址：Bilibili | YouTube
05 基础组件之 Datasets
- 视频地址：Bilibili | YouTube
06 基础组件之 Evaluate
- 视频地址：Bilibili | YouTube
07 基础组件之 Trainer
- 视频地址：Bilibili | YouTube

Transformers 实战演练篇 (已更新完成)

08 基于 Transformers的 NLP解决方案
- 视频地址：Bilibili | YouTube
09 实战演练之命名实体识别
- 视频地址：Bilibili | YouTube
10 实战演练之机器阅读理解（上，过长截断策略）
- 视频地址：Bilibili | YouTube
10 实战演练之机器阅读理解（下，滑动窗口策略）
- 视频地址：Bilibili | YouTube
11 实战演练之多项选择
- 视频地址：Bilibili | YouTube
12 实战演练之文本相似度（上，基于交互策略）
- 视频地址：Bilibili | YouTube
12 实战演练之文本相似度（下，基于匹配策略）
- 视频地址：Bilibili | YouTube
13 实战演练之检索式对话机器人
- 视频地址：Bilibili | YouTube
14 实战演练之预训练模型
- 视频地址：Bilibili | YouTube
15 实战演练篇之文本摘要（上，基于T5模型）
- 视频地址：Bilibili | YouTube
15 实战演练篇之文本摘要（下，基于GLM模型）
- 视频地址：Bilibili | YouTube
16 实战演练篇之生成式对话机器人（基于Bloom）
- 视频地址：Bilibili | YouTube

Transformers 参数高效微调篇 (已更新完成)

17 参数高效微调与BitFit实战
- 视频地址：Bilibili | YouTube
18 Prompt-Tuning 原理与实战
- 视频地址：Bilibili | YouTube
19 P-Tuning 原理与实战
- 视频地址：Bilibili | YouTube
20 Prefix-Tuning 原理与实战
- 视频地址：Bilibili | YouTube
21 LoRA 原理与实战
- 视频地址：Bilibili | YouTube
22 IA3 原理与实战
- 视频地址：Bilibili | YouTube
23 PEFT 进阶操作
- 视频地址：Bilibili | YouTube

Transformers 低精度训练篇（已更新完成）

24 低精度训练与模型下载
- 视频地址：Bilibili | YouTube
25 半精度模型训练（上，基于LLaMA2的半精度模型训练）
- 视频地址：Bilibili | YouTube
25 半精度模型训练（下，基于ChatGLM3的半精度模型训练）
- 视频地址：Bilibili | YouTube
26 量化与8bit模型训练
- 视频地址：Bilibili | YouTube
27 4bit量化与QLoRA模型训练
- 视频地址：Bilibili | YouTube

Transformers 分布式训练篇

28 分布式训练基础与环境配置
- 视频地址：Bilibili | YouTube
29 Data Parallel原理与应用
- 视频地址：Bilibili | YouTube
30 Distributed Data Parallel原理与应用
- 视频地址：Bilibili | YouTube
31 Accelerate 分布式训练入门
- 视频地址：Bilibili | YouTube
32 Accelerate 使用进阶（上）
- 视频地址：Bilibili | YouTube
32 Accelerate 使用进阶（下）
- 视频地址：Bilibili | YouTube

Transformers 番外技能篇

基于Optuna的Transformers模型自动调参
- 视频地址：Bilibili | YouTube

Name		Name	Last commit message	Last commit date
Latest commit History 32 Commits
01-Getting Started		01-Getting Started
02-NLP Tasks		02-NLP Tasks
03-PEFT		03-PEFT
04-Kbit Training		04-Kbit Training
05-Distributed Training		05-Distributed Training
Others		Others
imgs		imgs
pptx		pptx
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

环境pre-install

课程规划

课程地址

Transformers 基础入门篇 (已更新完成)

Transformers 实战演练篇 (已更新完成)

Transformers 参数高效微调篇 (已更新完成)

Transformers 低精度训练篇（已更新完成）

Transformers 分布式训练篇

Transformers 番外技能篇

About

Releases

Packages

Contributors 2

Languages

zwong91/transformers

Folders and files

Latest commit

History

Repository files navigation

环境pre-install

课程规划

课程地址

Transformers 基础入门篇 (已更新完成)

Transformers 实战演练篇 (已更新完成)

Transformers 参数高效微调篇 (已更新完成)

Transformers 低精度训练篇（已更新完成）

Transformers 分布式训练篇

Transformers 番外技能篇

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages