Sujet de votre conférence
War story : comment les pauses du GC ont pété la prod
Le(s) speaker(s)
Sylvain Wallez
Description de votre conférence
Nous avons eu un incident récent sur Elastic Cloud dont une des causes est des pauses longues du garbage collector de ZooKeeper.
Le talk présentera les grands principes de ZooKeeper et comment il est utilisé sur Elastic Cloud. On verra comment du code apparemment juste sous-optimal dans la librairie Apache Curator a en fait contribué à une réaction en chaîne qui a mis par terre une partie des services, et comment nous y avons remédié pour que ce type d'incident ne se produise plus.
Informations diverses
- Thème, label : JVM, garbage collector, systèmes distribués
- Niveau de difficulté (débutant|confirmé) : débutant
- Durée : 45 min
- Format (slides, live-coding, les deux): slides
- Dispo ou indispo (après mars, dès que possible, pas entre X et Y): à partir de mi-mai 2019
Sujet de votre conférence
War story : comment les pauses du GC ont pété la prod
Le(s) speaker(s)
Sylvain Wallez
Description de votre conférence
Nous avons eu un incident récent sur Elastic Cloud dont une des causes est des pauses longues du garbage collector de ZooKeeper.
Le talk présentera les grands principes de ZooKeeper et comment il est utilisé sur Elastic Cloud. On verra comment du code apparemment juste sous-optimal dans la librairie Apache Curator a en fait contribué à une réaction en chaîne qui a mis par terre une partie des services, et comment nous y avons remédié pour que ce type d'incident ne se produise plus.
Informations diverses