Skip to content

kobayashikanna01/directions4nlpfresher

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 

Repository files navigation

NLP/LLM入门推荐

1. 对于初学者

请尽量按顺序阅读 如果已经有一定的NLP基础,可以自行决定跳过部分内容

  • 网课Stanford CS224N: Natural Language Processing with Deep Learning
    • 网站:CS224N
    • 视频:Winter 2021 - Youtube Winter 2021 - B站
    • 课程网站上有最近一次开课的Slides,但是还没有对应的视频,建议先看视频和2021冬季的Slides,再自行决定是否看最新的Slides
  • 网课Stanford CS230: Deep Learning
    • Video
    • 可以优先看Lecture 1-3, 5-7, 8
  • 阅读:
    • What is Word Embedding?
    • What is Tokenization?
    • 选读:Word2Vec [论文] [Wiki]
    • 回答:
      • 如何用向量表征一个词、甚至一个短语、一个句子?
      • 我们也可以用一个系数的、很高维的向量来表示一个句子。例如中文有2万个常用词,那么我们可以使用2万维的向量表示一个句子,2万维的每个位置都对应一个具体的词。例如句子“我爱北京天安门”,我们可以将 我、爱、北京、天安门 这四个词对应的维度设置为1,其余维度设置为0来表示整个句子。这种表示方式,相比于embedding,有哪些缺点?
  • 论文:Attention Is All You Need [arxiv]
    • 大语言模型的基石:attention机制与Transformer结构
    • 看完后希望你能回答:
      • self-attention的K、Q、V是什么?
      • 多头注意力机制的计算是如何实现的,以hidden state为4096维、有32个attention head为例?
      • 为什么要过Softmax
  • 论文:BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
    • [论文]
    • 回答:从Encoder和Decoder的角度,BERT和最原始的Transformer(Attention Is All You Need中的)有什么区别?

2. 快速上手Python编程

  • 尝试在自己的机器上部署Python3(不要安装Python2)
  • 了解主函数、输入输出函数的使用
  • 尝试Python的两种执行方式:交互式执行、提交式执行
  • 了解基本数据结构:
    • 掌握list、dict、set、tuple的特性和使用方法
    • 掌握函数的定义
    • 掌握class的定义、init、初步掌握class的继承
  • 掌握json文件的读写,json格式字符串与list、dict对象之间的互相转化(尤其注意dict对象的KEY为数字或KEY为字符串时,该对象与json格式的字符串互相转换之间的不一致性)
  • 测试:用Python编写程序,实现BFS走迷宫(链接)

3. 可以去哪里看论文?

  • 大部分文章质量较高:

    • NLP:ACL/NAACL/EMNLP
    • CV:CVPR/ICCV/ECCV/等等
    • 与AI、DL、ML相关的:NeurIPS/ICML/ICLR
    • ACL系列论文集:https://aclanthology.org
  • 其他值得参考但需要鉴别的:

    • EACL/COLING/等等
    • arXiv

4. 尝试部署一个LLM

  • 示例(Microsoft Phi-2):
  • 关于各种超参数的介绍:HuggingFace(不用急着一次性看完,)
  • 延伸阅读:
    • 了解能通过transformers加载的模型都需要哪些文件?config.json、tokenizer.json、*.bin/*.safetensors、……
    • 了解加载模型时可选的参数编码模式:float32、bfloat16、int8、int4、……

5. 用LLM完成某个特定任务:

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages