Skip to content

FromZeroToFanatic/LLM_Practical_Implementation_Demo1

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

25 Commits
 
 
 
 
 
 
 
 

Repository files navigation

大模型技术总览

学习资料

【原理】大模型原理


【脉络】ChatGPT的前世今生


【手撕】图解系列Transformer/BERT/GPT


【实战】大模型实战


实战---✅

任务描述

本次实战要求完成一个基于Google T5-Base的生成式问答模型。模型需要能够根据输入的"context"和"question"生成对应的“answer”。

模型要求

数据格式

  • 每一行为一个数据样本,json 格式。
  • 其中,"context" 代表参考文章,question 代表问题,"answer" 代表问题答案。
{
  "context": "违规分为:一般违规扣分、严重违规扣分、出售假冒商品违规扣分...",
  "answer": "12月31日24:00",
  "question": "淘宝扣分什么时候清零", 
  "id": 203
}

评价指标

  • 模型的评价指标采用BLEU-1,BLEU-2,BLEU-3,BLEU-4。

要求:

  • 完成模型训练的代码,并画出模型收敛曲线图。
  • 完成模型的预测代码,给定任意context和query,可以生成对应答案。

附加

如有侵权,联系必删,仅用于学习用途,不做任何商业用途。

About

大模型实战学习路线阶段1:大模型技术总览(必备基础)+ 实战

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published