## 2022/03/24

## Stall cycle count 모니터링 방법

- MSR(Model-Specific Register) 중 IA32\_THREAD\_STALL MSR을 참조
- IA32\_THREAD\_STALL MSR 구조 및 정보 (Combined Volume Set of Intel® 64 and IA-32 Architectures Software Developer's Manuals vol.4 참조)



Figure 14-18. IA32\_THREAD\_STALL MSR

| Register<br>Address |         | Architectural MSR Name / Bit Fields<br>(Former MSR Name) | MSR/Bit Description                                                                    | Comment                   |
|---------------------|---------|----------------------------------------------------------|----------------------------------------------------------------------------------------|---------------------------|
| Hex                 | Decimal |                                                          |                                                                                        |                           |
|                     |         |                                                          |                                                                                        |                           |
| DB2H                | 3506    | IA32_THREAD_STALL                                        | Per-Logical_Processor HDC Idle Residency (R/0)                                         | If CPUID.06H:EAX.[13] = 1 |
|                     |         | 63:0                                                     | Stall_Cycle_Cnt (R/W)                                                                  | If CPUID.06H:EAX.[13] = 1 |
|                     |         |                                                          | Stalled cycles due to HDC forced idle on this logical processor. See Section 14.5.4.1. |                           |

- Stall\_Cycle\_Cnt (bit 63:0, R)
  - 해당 processor core의 마지막 RESET 이후의 HDC forced-idle cycle count 값
    을 저장
    - HDC란 Hard Drive Controller를 의미
  - 。 Counter는 TSC(Timer Stamp Counter)와 동일한 rate로 증가함
    - TSC란 Timer Stamp Counter의 약자로, CPU Cycle Counter라고 생각하면 됨
  - Stall\_Cycle\_Cnt의 counter는 logical processor가 forced idled C-state에서 빠져나오면 update됨
    - 각 update마다 counter에 forced-idle 동안 logical processor가 stall된 cycle 수가 더해짐

2022/03/24

- 이 counter는 CPUID.06H: EAX[bit 13] = 1 일 때만 사용할 수 있으며, 기본값은 0 임
- IA32\_THREAD\_STALL MSR 값
  - 。 값이 0 : HDC가 지원되지 않거나 logical processor가 forced HDC idle을 한 번도 수행하지 않은 경우
  - 값이 non-zero : 이 register에 저장된 값은 logical processor의 HDC forced-idle residency(상주) 시간을 나타냄
    - 이 값은 기존 OS accounting mechanism의 C0 time으로 나타내어지는 forced-idle cycle 값을 나타내기도 함
- msr-tools : MSR을 읽고 쓰기 위한 tool로, MSR을 읽는 rdmsr, MSR에 쓰는 wrmsr 기능을 제공

https://guix.gnu.org/packages/msr-tools-1.3/

- MSR read instruction (rdmsr) in msr-tools
  - rdmsr -p (process #) (Register Address in Hex or Decimal)
    - rdmsr -p 2 0xdb2 → 2번 processor의 IA32\_THREAD\_STALL MSR 값을 읽는다
    - rdmsr -p 2 3506 → 2번 processor의 IA32\_THREAD\_STALL MSR 값을 읽는다
  - 단, modprobe msr를 통해 msr 모듈을 insert 해줘야 함
- MSR write instruction (wrmsr) in msr-tools
  - wrmsr -p (process #) (Register Address in Hex or Decimal)
    - wrmsr -p 2 0xdb2 0 → 2번 processor의 IA32\_THREAD\_STALL MSR 값을 0으로 세팅한다
    - wrmsr -p 2 3506 0 → 2번 processor의 IA32\_THREAD\_STALL MSR 값을 0으로 세팅한다
  - 단, modprobe msr를 통해 msr 모듈을 insert 해줘야 함
- 해결 해야할 문제

2022/03/24 2

- Xeon processor에서는 rdmsr이 수행되지 않는 문제가 존재
  - 참고: https://github.com/erpalma/throttled/issues/252
  - → 단순히 Xeon HW support가 안되는건지, 아니면 kernel version 때문인건지 알 아봐야함
- Intel i7-10700 processor에서는 rdmsr이 수행은 되나, rdmsr -p 2 0xdb2가 계속
  0 값을 반환함
  - 참고: https://www.felixcloutier.com/x86/cpuid
  - $\rightarrow$  초기 EAX 값의 13번째 bit가 세팅되어 있지 않아서 IA32\_THREAD\_STALL MSR 값이 안바뀌는건지, 그리고 실제로 그렇다면 어떻게 이를 해결할지를 알아봐 야함

2022/03/24 3