lib/membase/performance/stats.py

import json
import re
from threading import Thread
import time
import gzip
from collections import defaultdict
import logging
import logging.config

from lib.membase.api.rest_client import RestConnection
from lib.memcached.helper.data_helper import MemcachedClientHelper
from lib.remote.remote_util import RemoteMachineShellConnection, RemoteMachineHelper
from lib.mc_bin_client import MemcachedError


RETRIES = 10

logging.config.fileConfig('mcsoda.logging.conf')
logging.getLogger("paramiko").setLevel(logging.WARNING)
log = logging.getLogger()


def histo_percentile(histo, percentiles):
    """The histo dict is returned by add_timing_sample(). The percentiles must
    be sorted, ascending, like [0.90, 0.99]."""
    v_sum = 0
    bins = histo.keys()
    bins.sort()
    for bin in bins:
        v_sum += histo[bin]
    v_sum = float(v_sum)
    v_cur = 0  # Running total.
    rv = []
    for bin in bins:
        if not percentiles:
            return rv
        v_cur += histo[bin]
        while percentiles and (v_cur / v_sum) >= percentiles[0]:
            rv.append((percentiles[0], bin))
            percentiles.pop(0)
    return rv


class StatsCollector(object):
    _task = {}
    _verbosity = True
    _mb_stats = {"snapshots": []}  # manually captured memcached stats
    _reb_stats = {}

    def __init__(self, verbosity):
        self._verbosity = verbosity
        self.is_leader = False
        self.active_mergers = 0

    def start(self, nodes, bucket, pnames, name, frequency, client_id='',
              collect_server_stats=True, ddoc=None):
        """This function starts collecting stats from all nodes with the given
        frequency"""
        self._task = {"state": "running", "threads": [], "name": name,
                      "time": time.time(), "ops": [], "totalops": [],
                      "ops-temp": [], "latency": {}, "data_size_stats": []}
        rest = RestConnection(nodes[0])
        info = rest.get_nodes_self()
        self.data_path = info.storage[0].get_data_path()
        self.client_id = str(client_id)
        self.nodes = nodes

        if collect_server_stats:
            mbstats_thread = Thread(target=self.membase_stats,
                                    args=(nodes, bucket, 60, self._verbosity))
            mbstats_thread.start()
            sysstats_thread = Thread(target=self.system_stats,
                                     args=(nodes, pnames, frequency, self._verbosity))
            sysstats_thread.start()
            iostats_thread = Thread(target=self.iostats,
                                    args=(nodes, 10, self._verbosity))
            iostats_thread.start()
            ns_server_stats_thread = Thread(target=self.ns_server_stats,
                                            args=(nodes, bucket, 60))
            ns_server_stats_thread.start()
            bucket_size_thead = Thread(target=self.get_bucket_size,
                                       args=(bucket, nodes, frequency))
            bucket_size_thead.start()

            self._task["threads"] = [sysstats_thread, ns_server_stats_thread,
                                     bucket_size_thead, mbstats_thread]
            if ddoc is not None:
                view_stats_thread = Thread(target=self.collect_indexing_stats,
                                           args=(nodes, bucket, ddoc, frequency))
                indexing_stats_thread = Thread(target=self.measure_indexing_throughput,
                                               args=(nodes, ))
                view_stats_thread.start()
                indexing_stats_thread.start()
                self._task["threads"].append(view_stats_thread)
                self._task["threads"].append(indexing_stats_thread)

            # Getting build/machine stats from only one node in the cluster
            self.build_stats(nodes)
            self.machine_stats(nodes)

            # Start atop
            self.start_atop()

    def stop(self):
        self.stop_atop()
        self._task["state"] = "stopped"
        for t in self._task["threads"]:
            t.join(120)
            if t.is_alive():
                print "Failed to join {0} thread".format(t.name)

        self._task["time"] = time.time() - self._task["time"]

    def sample(self, cur):
        pass

    def export(self, name, test_params):
        for latency in self._task["latency"].keys():
            # save the last histogram snapshot
            histos = self._task["latency"].get(latency, [])
            if histos:
                key = latency + "-histogram"
                self._task["latency"][key] = histos[-1].copy()
                del self._task["latency"][key]["delta"]
                self._task["latency"][key]["client_id"] = self.client_id

            # calculate percentiles
            key = 'percentile-' + latency
            self._task["latency"][key] = []
            for histo in histos:
                # for every sample histogram, produce a temp summary:
                # temp = [90 per, 95 per, 99 per, client_id, delta]
                temp = []
                time = histo['time']
                delta = histo['delta']
                del histo['delta'], histo['time']
                p = histo_percentile(histo, [0.80, 0.90, 0.95, 0.99, 0.999])
                # p is list of tuples
                for val in p:
                    temp.append(val[-1])
                temp.append(self.client_id)
                temp.append(time)
                temp.append(delta)
                self._task["latency"][key].append(temp)

        test_params.update(self._reb_stats)

        obj = {
            "buildinfo": self._task.get("buildstats", {}),
            "machineinfo": self._task.get("machinestats", {}),
            "membasestats": self._task.get("membasestats", []),
            "systemstats": self._task.get("systemstats", []),
            "iostats": self._task.get("iostats", []),
            "name": name,
            "totalops": self._task["totalops"],
            "ops": self._task["ops"],
            "time": self._task["time"],
            "info": test_params,
            "ns_server_data": self._task.get("ns_server_stats", []),
            "ns_server_data_system": self._task.get("ns_server_stats_system", []),
            "view_info": self._task.get("view_info", []),
            "indexer_info": self._task.get("indexer_info", []),
            "timings": self._task.get("timings", []),
            "dispatcher": self._task.get("dispatcher", []),
            "bucket-size": self._task.get("bucket_size", []),
            "data-size": self._task.get("data_size_stats", []),
            "latency-set-histogram": self._task["latency"].get("latency-set-histogram", []),
            "latency-set": self._task["latency"].get('percentile-latency-set', []),
            "latency-set-recent": self._task["latency"].get('percentile-latency-set-recent', []),
            "latency-get-histogram": self._task["latency"].get("latency-get-histogram", []),
            "latency-get": self._task["latency"].get('percentile-latency-get', []),
            "latency-get-recent": self._task["latency"].get('percentile-latency-get-recent', []),
            "latency-delete": self._task["latency"].get('percentile-latency-delete', []),
            "latency-delete-recent": self._task["latency"].get('percentile-latency-delete-recent', []),
            "latency-query-histogram": self._task["latency"].get("latency-query-histogram", []),
            "latency-query": self._task["latency"].get('percentile-latency-query', []),
            "latency-query-recent": self._task["latency"].get('percentile-latency-query-recent', []),
            "latency-obs-persist-server-histogram": self._task["latency"].get("latency-obs-persist-server-histogram", []),
            "latency-obs-persist-server": self._task["latency"].get('percentile-latency-obs-persist-server-server', []),
            "latency-obs-persist-server-recent": self._task["latency"].get('percentile-latency-obs-persist-server-recent', []),
            "latency-obs-persist-client-histogram": self._task["latency"].get("latency-obs-persist-client-histogram", []),
            "latency-obs-persist-client": self._task["latency"].get('percentile-latency-obs-persist-client', []),
            "latency-obs-persist-client-recent": self._task["latency"].get('percentile-latency-obs-persist-client-recent', []),
            "latency-obs-repl-client-histogram": self._task["latency"].get("latency-obs-repl-client-histogram", []),
            "latency-obs-repl-client": self._task["latency"].get('percentile-latency-obs-repl-client', []),
            "latency-obs-repl-client-recent": self._task["latency"].get('percentile-latency-obs-repl-client-recent', []),
            "latency-woq-obs-histogram": self._task["latency"].get("latency-woq-obs-histogram", []),
            "latency-woq-obs": self._task["latency"].get('percentile-latency-woq-obs', []),
            "latency-woq-obs-recent": self._task["latency"].get('percentile-latency-woq-obs-recent', []),
            "latency-woq-query-histogram": self._task["latency"].get("latency-woq-query-histogram", []),
            "latency-woq-query": self._task["latency"].get('percentile-latency-woq-query', []),
            "latency-woq-query-recent": self._task["latency"].get('percentile-latency-woq-query-recent', []),
            "latency-woq-histogram": self._task["latency"].get("latency-woq-histogram", []),
            "latency-woq": self._task["latency"].get('percentile-latency-woq', []),
            "latency-woq-recent": self._task["latency"].get('percentile-latency-woq-recent', []),
            "latency-cor-histogram": self._task["latency"].get("latency-cor-histogram", []),
            "latency-cor": self._task["latency"].get('percentile-latency-cor', []),
            "latency-cor-recent": self._task["latency"].get('percentile-latency-cor-recent', [])}

        if self.client_id:
            patterns = ('reload$', 'load$', 'warmup$', 'index$')
            phases = ('.reload', '.load', '.warmup', '.index')
            name_picker = lambda (pattern, phase): re.search(pattern, self._task["name"])
            try:
                phase = filter(name_picker, zip(patterns, phases))[0][1]
            except IndexError:
                phase = '.loop'
            name = str(self.client_id) + phase

        file = gzip.open("{0}.json.gz".format(name), 'wb')
        file.write(json.dumps(obj))
        file.close()

    def get_bucket_size(self, bucket, nodes, frequency):
        self._task["bucket_size"] = []
        retries = 0
        nodes_iterator = (node for node in nodes)
        node = nodes_iterator.next()
        rest = RestConnection(node)
        while not self._aborted():
            time.sleep(frequency)
            log.info("Collecting bucket size stats")
            try:
                status, db_size = rest.get_database_disk_size(bucket)
                if status:
                    self._task["bucket_size"].append(db_size)
            except IndexError, e:
                retries += 1
                log.error("Unable to get bucket size {0}: {1}".format(bucket, e))
                log.warning("Retries: {0} of {1}".format(retries, RETRIES))
                if retries == RETRIES:
                    try:
                        node = nodes_iterator.next()
                        rest = RestConnection(node)
                        retries = 0
                    except StopIteration:
                        log.error("No nodes available: stop collecting bucket_size")
                        return

        log.info("Finished bucket size stats")

    def get_data_file_size(self, nodes, frequency, bucket):
        shells = []
        for node in nodes:
            try:
                shells.append(RemoteMachineShellConnection(node))
            except:
                pass
        paths = []
        if shells[0].is_couchbase_installed():
            bucket_path = self.data_path + '/{0}'.format(bucket)
            paths.append(bucket_path)
            view_path = bucket_path + '/set_view_{0}_design'.format(bucket)
            paths.append(view_path)
        else:
            paths.append(self.data_path + '/{0}-data'.format(bucket))

        d = {"snapshots": []}
        start_time = str(self._task["time"])

        while not self._aborted():
            time.sleep(frequency)
            current_time = time.time()
            i = 0
            for shell in shells:
                node = nodes[i]
                unique_id = node.ip + '-' + start_time
                value = {}
                for path in paths:
                    size = shell.get_data_file_size(path)
                    value["file"] = path.split('/')[-1]
                    value["size"] = size
                    value["unique_id"] = unique_id
                    value["time"] = current_time
                    value["ip"] = node.ip
                    d["snapshots"].append(value.copy())
                i += 1
        self._task["data_size_stats"] = d["snapshots"]
        log.info("Finished data_size_stats")

    #ops stats
    #{'tot-sets': 899999, 'tot-gets': 1, 'tot-items': 899999, 'tot-creates': 899999}
    def ops_stats(self, ops_stat):
        ops_stat["time"] = time.time()
        self._task["ops-temp"].append(ops_stat)
        if len(self._task["ops-temp"]) >= 500 * (1 + self.active_mergers):
            # Prevent concurrent merge
            while self.active_mergers:
                time.sleep(0.1)

            # Semaphore: +1 active
            self.active_mergers += 1

            # Merge
            merged = self._merge()
            self._task["ops"].append(merged)
            self._task["ops-temp"] = self._task["ops-temp"][500:]

            # Semaphore: -1 active
            self.active_mergers -= 1

        #if self._task["ops"] has more than 1000 elements try to aggregate them ?

    def latency_stats(self, latency_cmd, latency_stat, cur_time=0):
        if self._task["latency"].get(latency_cmd) is None:
            self._task["latency"][latency_cmd] = []
        temp_latency_stat = latency_stat.copy()
        if not cur_time:
            cur_time = time.time()
        temp_latency_stat['time'] = int(cur_time)
        temp_latency_stat['delta'] = cur_time - self._task['time']
        self._task["latency"][latency_cmd].append(temp_latency_stat)

    def _merge(self):
        first = self._task["ops-temp"][0]
        merged = {"startTime": first["start-time"]}
        totalgets = 0
        totalsets = 0
        totalqueries = 0
        delta = 0
        for i in range(499):
            current = self._task["ops-temp"][i]
            next = self._task["ops-temp"][i + 1]
            totalgets += current["tot-gets"]
            totalsets += current["tot-sets"]
            totalqueries += current["tot-queries"]
            delta += (next["start-time"] - current["start-time"])
        merged["endTime"] = merged["startTime"] + delta
        merged["totalSets"] = totalsets
        merged["totalGets"] = totalgets
        merged["totalQueries"] = totalqueries
        qps = totalqueries / float(delta)
        merged["queriesPerSec"] = qps
        return merged

    def total_stats(self, ops_stat):
        ops_stat["time"] = time.time()
        self._task["totalops"].append(ops_stat)

    def build_stats(self, nodes):
        json_response = StatUtil.build_info(nodes[0])
        self._task["buildstats"] = json_response

    def machine_stats(self, nodes):
        machine_stats = StatUtil.machine_info(nodes[0])
        self._task["machinestats"] = machine_stats

    def reb_stats(self, start, dur):
        log.info("Recording reb start = {0}, reb duration = {1}".format(start, dur))
        self._reb_stats["reb_start"] = start
        self._reb_stats["reb_dur"] = dur

    def _extract_proc_info(self, shell, pid):
        o, r = shell.execute_command("cat /proc/{0}/stat".format(pid))
        fields = ('pid comm state ppid pgrp session tty_nr tpgid flags minflt '
                  'cminflt majflt cmajflt utime stime cutime cstime priority '
                  'nice num_threads itrealvalue starttime vsize rss rsslim '
                  'startcode endcode startstack kstkesp kstkeip signal blocked '
                  'sigignore sigcatch wchan nswap cnswap exit_signal '
                  'processor rt_priority policy delayacct_blkio_ticks '
                  'guest_time cguest_time ').split(' ')

        d = dict(zip(fields, o[0].split(' ')))
        return d

    def _extract_io_info(self, shell):
        """
        Extract info from iostat

        Output:

        [kB_read, kB_wrtn, %util, %iowait, %idle]

        Rough Benchmarks:
        My local box (WIFI LAN - VM), took ~1.2 sec for this routine
        """
        CMD = "iostat -dk | grep 'sd. ' | " \
              "awk '{read+=$5; write+=$6} END { print read, write }'"
        out, err = shell.execute_command(CMD)
        results = out[0]

        CMD = "iostat -dkx | grep 'sd. ' | "\
              "awk '{util+=$12} END { print util/NR }'"
        out, err = shell.execute_command(CMD)
        results = "%s %s" % (results, out[0])

        CMD = "iostat 1 2 -c | awk 'NR == 7 { print $4, $6 }'"
        out, err = shell.execute_command(CMD)
        results = "%s %s" % (results, out[0])

        return results.split(' ')

    def system_stats(self, nodes, pnames, frequency, verbosity=False):
        shells = []
        for node in nodes:
            try:
                bucket = RestConnection(node).get_buckets()[0].name
                MemcachedClientHelper.direct_client(node, bucket)
                shells.append(RemoteMachineShellConnection(node))
            except:
                pass
        d = {"snapshots": []}
        #        "pname":"x","pid":"y","snapshots":[{"time":time,"value":value}]

        start_time = str(self._task["time"])
        while not self._aborted():
            time.sleep(frequency)
            current_time = time.time()
            i = 0
            for shell in shells:
                node = nodes[i]
                unique_id = node.ip + '-' + start_time
                for pname in pnames:
                    obj = RemoteMachineHelper(shell).is_process_running(pname)
                    if obj and obj.pid:
                        value = self._extract_proc_info(shell, obj.pid)
                        value["name"] = pname
                        value["id"] = obj.pid
                        value["unique_id"] = unique_id
                        value["time"] = current_time
                        value["ip"] = node.ip
                        d["snapshots"].append(value)
                i += 1
        self._task["systemstats"] = d["snapshots"]
        log.info("Finished system_stats")

    def iostats(self, nodes, frequency, verbosity=False):

        shells = []
        for node in nodes:
            try:
                bucket = RestConnection(node).get_buckets()[0].name
                MemcachedClientHelper.direct_client(node, bucket)
                shells.append(RemoteMachineShellConnection(node))
            except:
                pass

        self._task["iostats"] = []

        log.info("Started capturing io stats")

        while not self._aborted():
            time.sleep(frequency)
            log.info("Collecting io_stats")
            for shell in shells:
                try:
                    kB_read, kB_wrtn, util, iowait, idle = \
                        self._extract_io_info(shell)
                except (ValueError, TypeError, IndexError):
                    continue
                if kB_read and kB_wrtn:
                    self._task["iostats"].append({"time": time.time(),
                                                 "ip": shell.ip,
                                                 "read": kB_read,
                                                 "write": kB_wrtn,
                                                 "util": util,
                                                 "iowait": iowait,
                                                 "idle": idle})
        log.info("Finished capturing io stats")

    def couchdb_stats(nodes):
        pass

    def capture_mb_snapshot(self, node):
        """Capture membase stats snapshot manually"""
        log.info("Capturing memcache stats snapshot for {0}".format(node.ip))
        stats = {}

        try:
            bucket = RestConnection(node).get_buckets()[0].name
            mc = MemcachedClientHelper.direct_client(node, bucket)
            stats = mc.stats()
            stats.update(mc.stats("warmup"))
        except Exception as e:
            log.error("Exception: {0}".format(str(e)))
            return False
        finally:
            stats["time"] = time.time()
            stats["ip"] = node.ip
            self._mb_stats["snapshots"].append(stats)
            print stats

        log.info("Memcache stats snapshot captured")
        return True

    def membase_stats(self, nodes, bucket, frequency, verbose=False):
        mcs = []
        for node in nodes:
            try:
                bucket = RestConnection(node).get_buckets()[0].name
                mcs.append(MemcachedClientHelper.direct_client(node, bucket))
            except:
                pass
        self._task["membasestats"] = []
        self._task["timings"] = []
        self._task["dispatcher"] = []
        d = {}
        # "pname": "x", "pid": "y","snapshots": [{"time": time,"value": value}]
        for mc in mcs:
            d[mc.host] = {"snapshots": [], "timings": [], "dispatcher": []}

        while not self._aborted():
            time_left = frequency
            log.info("Collecting membase stats")
            timings = None
            # at minimum we want to check for aborted every minute
            while not self._aborted() and time_left > 0:
                time.sleep(min(time_left, 60))
                time_left -= 60
            for mc in mcs:
                retries = 0
                stats = {}
                while not stats and retries < RETRIES:
                    try:
                        stats = mc.stats()
                        try:
                            mem_stats = mc.stats('raw memory')
                        except MemcachedError:
                            mem_stats = mc.stats('memory')
                        stats.update(mem_stats)
                    except Exception as e:
                        log.error("{0}, retries = {1}".format(str(e), retries))
                        time.sleep(2)
                        mc.reconnect()
                        retries += 1
                        continue
                stats["time"] = time.time()
                stats["ip"] = mc.host
                d[mc.host]["snapshots"].append(stats)
                try:
                    timings = mc.stats('timings')
                    d[mc.host]["timings"].append(timings)
                    dispatcher = mc.stats('dispatcher')
                    d[mc.host]["dispatcher"].append(dispatcher)
                except EOFError, e:
                    log.error("Unable to get timings/dispatcher stats {0}: {1}"\
                              .format(mc.host, e))

        start_time = str(self._task["time"])
        for mc in mcs:
            ip = mc.host
            unique_id = ip + '-' + start_time
            current_time = time.time()
            if self._mb_stats["snapshots"]:
                # use manually captured stats
                self._task["membasestats"] = self._mb_stats["snapshots"]
            else:
                # use periodically captured stats
                for snapshot in d[mc.host]["snapshots"]:
                    snapshot['unique_id'] = unique_id
                    snapshot['time'] = current_time
                    snapshot['ip'] = ip
                    self._task["membasestats"].append(snapshot)
            for timing in d[mc.host]["timings"]:
                timing['unique_id'] = unique_id
                timing['time'] = current_time
                timing['ip'] = ip
                self._task["timings"].append(timing)
            for dispatcher in d[mc.host]["dispatcher"]:
                dispatcher['unique_id'] = unique_id
                dispatcher['time'] = current_time
                dispatcher['ip'] = ip
                self._task["dispatcher"].append(dispatcher)

        if timings:  # TODO: dump timings for all servers
            timestamp = time.strftime('%X %x %Z')
            log.info("Dumping disk timing stats: {0}".format(timestamp))
            for key, value in sorted(timings.iteritems()):
                if key.startswith("disk"):
                    print "{0:50s}:     {1}".format(key, value)

        log.info("Finished membase_stats")

    def ns_server_stats(self, nodes, bucket, frequency):
        self._task["ns_server_stats"] = []
        self._task["ns_server_stats_system"] = []
        nodes_iterator = (node for node in nodes)
        node = nodes_iterator.next()
        retries = 0
        not_null = lambda v: v if v is not None else 0

        rest = RestConnection(node)
        while not self._aborted():
            time.sleep(frequency)
            log.info("Collecting ns_server_stats")
            try:
                # Bucket stats
                ns_server_stats = rest.fetch_bucket_stats(bucket=bucket)
                for key, value in ns_server_stats["op"]["samples"].iteritems():
                    ns_server_stats["op"]["samples"][key] = not_null(value)
                self._task["ns_server_stats"].append(ns_server_stats)
                # System stats
                ns_server_stats_system = rest.fetch_system_stats()
                self._task["ns_server_stats_system"].append(ns_server_stats_system)
            except ValueError, e:
                retries += 1
                log.error("Unable to parse json object {0}: {1}".format(node, e))
                log.warning("Retries: {0} of {1}".format(retries, RETRIES))
                if retries == RETRIES:
                    try:
                        node = nodes_iterator.next()
                        rest = RestConnection(node)
                        retries = 0
                    except StopIteration:
                        log.error("No nodes available: stop collecting ns_server_stats")
                        return

        log.info("Finished ns_server_stats")

    def collect_indexing_stats(self, nodes, bucket, ddoc, frequency):
        """Collect view indexing stats"""
        self._task['view_info'] = list()

        while not self._aborted():
            time.sleep(frequency)
            log.info("Collecting view indexing stats")
            for node in nodes:
                rest = RestConnection(node)
                data = rest.set_view_info(bucket, ddoc)
                update_history = data[1]['stats']['update_history']
                try:
                    indexing_time = \
                        [event['indexing_time'] for event in update_history]
                    avg_time = sum(indexing_time) / len(indexing_time)
                except (IndexError, KeyError):
                    avg_time = 0
                finally:
                    self._task['view_info'].append({'node': node.ip,
                                                    'indexing_time': avg_time,
                                                    'timestamp': time.time()})

        log.info("Finished collecting view indexing stats")

    def measure_indexing_throughput(self, nodes):
        self._task['indexer_info'] = list()
        indexers = defaultdict(dict)
        while not self._aborted():
            time.sleep(15)  # 15 seconds by default

            # Grab indexer tasks from all nodes
            tasks = list()
            for node in nodes:
                rest = RestConnection(node)
                tasks.extend(filter(lambda t: t['type'] == 'indexer',
                                    rest.active_tasks()))

            # Calculate throughput for every unique PID
            thr = 0
            for task in tasks:
                uiid = task['pid'] + str(task['started_on'])

                changes_delta = \
                    task['changes_done'] - indexers[uiid].get('changes_done', 0)
                time_delta = \
                    task['updated_on'] - indexers[uiid].get('updated_on',
                                                            task['started_on'])
                if time_delta:
                    thr += changes_delta / time_delta
                indexers[uiid]['changes_done'] = task['changes_done']
                indexers[uiid]['updated_on'] = task['updated_on']

            # Average throughput
            self._task['indexer_info'].append({
                'indexing_throughput': thr,
                'timestamp': time.time()
            })

    def _aborted(self):
        return self._task["state"] == "stopped"

    def start_atop(self):
        """Start atop collector"""
        for node in self.nodes:
            shell = RemoteMachineShellConnection(node)
            cmd = "killall atop; rm -fr /tmp/*.atop;" + \
                "atop -w /tmp/{0}.atop -a 15".format(node.ip) + \
                " > /dev/null 2> /dev.null < /dev/null &"
            shell.execute_command(cmd)

    def stop_atop(self,):
        """Stop atop collector"""
        for node in self.nodes:
            shell = RemoteMachineShellConnection(node)
            shell.execute_command("killall atop")


class CallbackStatsCollector(StatsCollector):

    """Invokes optional callback when registered levels have been reached
    during stats sample()'ing."""

    def __init__(self, verbosity):
        # Tuples of level_name, level, callback.
        self.level_callbacks = []
        super(CallbackStatsCollector, self).__init__(verbosity)

    def sample(self, cur):
        for level_name, level, callback in self.level_callbacks:
            if level < cur.get(level_name, -1):
                callback(cur)

        return super(CallbackStatsCollector, self).sample(cur)


class StatUtil(object):

    @staticmethod
    def build_info(node):
        rest = RestConnection(node)
        api = rest.baseUrl + 'nodes/self'
        status, content, header = rest._http_request(api)
        json_parsed = json.loads(content)
        return json_parsed

    @staticmethod
    def machine_info(node):
        shell = RemoteMachineShellConnection(node)
        info = shell.extract_remote_info()
        return {"type": info.type, "distribution": info.distribution_type,
                "version": info.distribution_version, "ram": info.ram,
                "cpu": info.cpu, "disk": info.disk, "hostname": info.hostname}