NLP/LLM入门推荐

1. 对于初学者

请尽量按顺序阅读 如果已经有一定的NLP基础，可以自行决定跳过部分内容

网课Stanford CS224N: Natural Language Processing with Deep Learning
- 网站：CS224N
- 视频：Winter 2021 - Youtube Winter 2021 - B站
- 课程网站上有最近一次开课的Slides，但是还没有对应的视频，建议先看视频和2021冬季的Slides，再自行决定是否看最新的Slides
网课Stanford CS230: Deep Learning
- Video
- 可以优先看Lecture 1-3, 5-7, 8
阅读：
- What is Word Embedding?
- What is Tokenization?
- 选读：Word2Vec [论文] [Wiki]
- 回答：
  - 如何用向量表征一个词、甚至一个短语、一个句子？
  - 我们也可以用一个系数的、很高维的向量来表示一个句子。例如中文有2万个常用词，那么我们可以使用2万维的向量表示一个句子，2万维的每个位置都对应一个具体的词。例如句子“我爱北京天安门”，我们可以将我、爱、北京、天安门这四个词对应的维度设置为1，其余维度设置为0来表示整个句子。这种表示方式，相比于embedding，有哪些缺点？
论文：Attention Is All You Need [arxiv]
- 大语言模型的基石：attention机制与Transformer结构
- 看完后希望你能回答：
  - self-attention的K、Q、V是什么？
  - 多头注意力机制的计算是如何实现的，以hidden state为4096维、有32个attention head为例？
  - 为什么要过Softmax
论文：BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
- [论文]
- 回答：从Encoder和Decoder的角度，BERT和最原始的Transformer（Attention Is All You Need中的）有什么区别？

2. 快速上手Python编程

尝试在自己的机器上部署Python3（不要安装Python2）
了解主函数、输入输出函数的使用
尝试Python的两种执行方式：交互式执行、提交式执行
了解基本数据结构：
- 掌握list、dict、set、tuple的特性和使用方法
- 掌握函数的定义
- 掌握class的定义、init、初步掌握class的继承
掌握json文件的读写，json格式字符串与list、dict对象之间的互相转化（尤其注意dict对象的KEY为数字或KEY为字符串时，该对象与json格式的字符串互相转换之间的不一致性）
测试：用Python编写程序，实现BFS走迷宫(链接)

3. 可以去哪里看论文？

大部分文章质量较高：
- NLP：ACL/NAACL/EMNLP
- CV：CVPR/ICCV/ECCV/等等
- 与AI、DL、ML相关的：NeurIPS/ICML/ICLR
- ACL系列论文集：https://aclanthology.org
其他值得参考但需要鉴别的：
- EACL/COLING/等等
- arXiv

4. 尝试部署一个LLM

示例（Microsoft Phi-2）：
- 参考链接：HuggingFace、ModelScope
- 可以将代码和模型参数都下载至本地"/path/to/save/phi2"，然后通过本地路径调用
- 参考代码：GitHub(改编自HuggingFace)
关于各种超参数的介绍：HuggingFace（不用急着一次性看完，）
延伸阅读：
- 了解能通过transformers加载的模型都需要哪些文件？config.json、tokenizer.json、*.bin/*.safetensors、……
- 了解加载模型时可选的参数编码模式：float32、bfloat16、int8、int4、……

5. 用LLM完成某个特定任务：

阅读：
- 思维链推理（arXiv）
- 上下文学习（ai.stanford.edu）
- 初步了解（略读）开源LLM的鼻祖——LLaMA（arXiv）
- 关于设计prompt的介绍：promptingguide.ai、learnprompting.org
动手尝试：部署LLM完成特定任务（例如情感分类）
- 对于英文任务，你可以尝试：LLaMA2-7B、Mistral-7B
- 对于中文任务，你可以尝试：Baichuan2-7B、Qwen-7B、Deepseek-7B

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
chap2		chap2
chap4		chap4
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NLP/LLM入门推荐

1. 对于初学者

2. 快速上手Python编程

3. 可以去哪里看论文？

4. 尝试部署一个LLM

5. 用LLM完成某个特定任务：

About

Releases

Packages

Languages

License

kobayashikanna01/directions4nlpfresher

Folders and files

Latest commit

History

Repository files navigation

NLP/LLM入门推荐

1. 对于初学者

2. 快速上手Python编程

3. 可以去哪里看论文？

4. 尝试部署一个LLM

5. 用LLM完成某个特定任务：

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages