Skip to content

War story : comment les pauses du GC ont pété la prod #28

@swallez

Description

@swallez

Sujet de votre conférence

War story : comment les pauses du GC ont pété la prod

Le(s) speaker(s)

Sylvain Wallez

Description de votre conférence

Nous avons eu un incident récent sur Elastic Cloud dont une des causes est des pauses longues du garbage collector de ZooKeeper.

Le talk présentera les grands principes de ZooKeeper et comment il est utilisé sur Elastic Cloud. On verra comment du code apparemment juste sous-optimal dans la librairie Apache Curator a en fait contribué à une réaction en chaîne qui a mis par terre une partie des services, et comment nous y avons remédié pour que ce type d'incident ne se produise plus.

Informations diverses

  • Thème, label : JVM, garbage collector, systèmes distribués
  • Niveau de difficulté (débutant|confirmé) : débutant
  • Durée : 45 min
  • Format (slides, live-coding, les deux): slides
  • Dispo ou indispo (après mars, dès que possible, pas entre X et Y): à partir de mi-mai 2019

Metadata

Metadata

Assignees

No one assigned

    Labels

    Distributed SystemsKafka, etcd and the rest of the zoo(keeper!) but with a focus on dist sys problems

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions