Skip to content

arch-simulator-sig/micro-arch-learning

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

50 Commits
 
 

Repository files navigation

micro-arch-learning

高级体系结构研讨会传送门

进入门槛

6个月完成一生一芯6期A线(rv64imac+boot linux + pa4 finished) 并通过流片考核(附学习记录+git repo)

今年要做的事情

  1. 超标量体系结构入门 ,超标量处理器设计,量化,现代处理器设计,高性能超标量cpu
  2. 完成quard-star-tutorial (4week) [确定,高阶软件基础入门]
  3. 6.175/6.375 一致性入门
  4. cva6完全剖析

长期项目任务 (截止24年6月)

  1. sim-godson riscv cva6 boot linux
  2. nop-processor/rocketchip 文档
  3. perf model + chisel3

处理器设计示例

  1. MIPS R10K
  2. Intel P6
  3. Alpha 21264
  4. PowerPC 620
  5. BOOM
  6. XiangShan
  7. XuanTie

后续项目任务

  1. 在给定的模拟器开发框架下,实现香山mini模拟器迭代
  2. 根据项目需求学习多核、乱序相关知识,完成包括但不限于普林斯顿体系结构,MIT6.175,MIT6.375,CS152computer architecture等相关课程,boom,玄铁,整理一生一芯S线讲义

我的理解:

  1. 先做一个正确的顺序处理器,模块不重要,语言不重要,sky的课作用是让你知道自己写的verilog和自己所想的是否一致,如果自己不能确保,需要刷,做两个,对fpga资源有理解。

  2. 接着开始乱序踩坑,姚永斌的书只写了单列的模块,没有涉及模块耦合的trick,这里都是比较多的坑,写乱序先保证正确性这就已经非常难了,接着coremark性能调优,积累大量经验,可能会持续很多年,会有挫折,贪生怕死,勿入此门。

  3. 不存在所谓的正确学习道路,需要踩8年以上的坑才有极小可能成为一名架构师,如果顺序设计占用5%,那么一个正确的乱序占用80%,还有无穷大的空间是用于性能调优,然而要达到黄老师的水平,架构师做到了尽头,还需要后端,模拟等全部精通,天人境界,然而即便这样,经常学到每天只睡5h。

  4. chisel:缺乏形式化验证,如果chisel4加上将是绝杀,chisel3加上suggestname勉强能用,但是目前工业界不用,风险太大。

  5. 后端:非常多的Magic,一个优秀或者天才的架构师需要能够全局掌控。

  6. 模拟器:cpp模型正确的概率远大于rtl,需要对自己模拟器的每一个细节做到完全掌握,虽然k210没有模拟器,但是有黄老师人脑模拟,如果觉得自己更强可以不写。

ref 志锐乱序踩坑之旅

ref 超标量处理器设计书合集 x4Pa提取

ref IA&C Lab@Fudan - 知乎 (zhihu.com)

ref 已经做完的micro-arch-learning,禁止参考答案

ref 量化研究方法第六版

跨时钟域:文档1 文档2

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published