New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
간헐적 서비스 중단 발생 (2021-04-23 -) #249
Comments
|
|
장애가 있던 시간 말고도 이전에도 메모리 사용량이 높아진 때가 있었던 것 같습니다. atop 설치가 누락되어서 (#248) 당시 기록이 없습니다. 새로 설치했으니 비슷한 상황이 다시 생기면 확인해보겠습니다. |
새 장애 발생 중
|
fastcgi 잡의 메모리(119.8MiB)가 소프트 리밋(110MiB)을 넘어가 있길래 150MiB으로 늘렸더니 괜찮아졌는데, 늘리면서 alloc도 새로 만들어진지라 괜찮아진게 재시작의 영향인지 리밋의 영향인지 확실하지가 않습니다 |
시간대별 정리입니다
|
EBS에 대해서 unlimited 모드에 상응하는 그런 게 없어 보여서, 꺼놨던 t3a 인스턴스를 살려서 MySQL을 제외한 서비스를 옮겼습니다 MySQL을 제외한건 data-dir가 아키텍처에 독립적인 내용이라는 보장이 없어서(옮길 때 한번 실패했으므로[1])입니다 |
메모리 부족으로 php-fpm이 패닉에 빠지는 것일 수 있을 것 같아 메모리 제한에 여유를 둬서 다시 시도해보려고 합니다 |
php-fpm의
|
8시 30분부터 문제가 생겨 아예 복구되지 않은 채로 있었는데 emergency_restart 설정이 원인일 수 있을 것 같아 revert했습니다 |
|
25일 12:37 경 php-fpm 프로세스가 종료되지 않고 수만 증가하여 최대치(20개)를 채우고 멈춰 복구되는 것 같지 않아
|
request-terminate-timeout 설정을 추가했습니다 → femiwiki/nomad@7b8911f Reference: |
이런 로그가 가끔 뜹니다
|
캐디 로그가 너무 많이 나와서 지나가면 금방 지워져서 |
지금 문제 생겼었는데 프로세서가 30초 후에 죽기는 죽는데 그래도 20개 꽉 채운데다 여전히 5xx만 내고 있어서 2021-04-25T10:06:00Z에 alloc stop 했더니 괜찮아졌습니다 |
리퀘스트가 많아 문제를 생겼을 때 journalctl에 다음과 같이 표시됩니다
|
April 26th 2021, 12:29:24 am femiwiki/nomad@76cd3de applied |
|
루아 바이너리에 뭐 문제가 있을 수도 있을 것 같구요... php-fpm.log에는 별 내용 없습니다 |
4월 28일 13:42 (아래 남긴 건 초입니다.)
|
|
사이트가 느려지다가 2021-05-16T07:05:38Z에 php-fpm alloc이 "Docker container exited with non-zero exit code: 143"라면서 저절로 재시작하고 회복되었습니다. 06:47-07:05 동안 yum-cron과 함께 디스크 입출력이 늘었던 기록이 있습니다. |
femiwiki/nomad#29 를 제외한 다른 문제는 거의 해결되어 닫습니다. |
Local time:
UTC:
The text was updated successfully, but these errors were encountered: