In [6]:
import numpy as np
import pandas as pd
import copy
from random import randint
import matplotlib.pyplot as plt

class DataArray:

  def init(self, input_address = 'none', 
               inDf = pd.DataFrame(), inLabel = ''):
    """
    Конструктор класса 
    часть реализации класса, не используется снаружи в явном виде
    Первый параметр не указывается при вызове функции
    Второй параметр это адрес csv файла, опционально. По умолчанию 'none' 
    (строка)
    Третий параметр это готовый датафрейм будет использоваться, если не указан 
    адрес, опционально. По умолчанию пустой датафрейм (dataframe)
    Четвертый параметр это метка, опционально. По умолчанию пустая строка
    (строка)
    Создает объект класса DataArray по входному адресу или готовому датафрейму
    """
    if (input_address == 'none'):
      self.df = inDf
      self.__label = inLabel
    else:
      self.__create_data_frame(input_address)
      self.__set_label()
      self.__columns_moderating()
    self.__selected_groups = {}

  def get_data_frame(self):
    """Возвращает копию датафрейма, используемого в объекте класса"""
    return self.__df.copy(deep=True)

  def get_columns_name(self):
    """
    Возвращает названия колонок датафрейма, это копия, поэтому редактировать
    их через этот метод не получится
    """
    return self.__df.columns.copy(deep=True)

  def get_columns(self, name):
    """
    Возвращает копию указаного столбца из датафрейма, параметр - имя столбца
    (строка)
    """
    return self.__df[name].copy(deep=True)

  def get_label(self):
    """
    Возвращает копию метки объекта
    """
    return copy.deepcopy(self.__label)

  def get_selected_groups(self):
    """
    Возвращает список выбранных групп столбцов
    Не трогай - это на новый год
    """
    return self.__selected_groups.items()

  def get_time_columns(self):
    """
    Возвращает копию столбца времени
    """
    return self.__df[self.__df.columns[0]].copy(deep=True)

  def __set_label(self):
    """
    Устанавливает метку объекта исходя из датафрейма
    часть реализации класса, не используется снаружи
    """
    if 'Label' not in self.__df.columns.tolist():
      self.__label = ''
    else:
      self.__label = self.__df.iloc[0]['Label']

  def __add(self, other):
    """
    Перегрузка оператора + 
    При сложении возвращается новый объект класс DataArray 
    за основу берется левый операнд и к нему прибавляются не повторяющиеся
    столбцы из правого операнда
    """
    newDataArray = self.df.copy(deep=True)
    listSelf = self.get_columns_name().tolist()
    listInput = other.get_columns_name().tolist()
    for i in listInput:
      if i not in listSelf:
        newDataArray[i] = other.get_columns(i)
    return DataArray( inDf = newDataArray, inLabel = self.__label)


  def __iadd(self, other):
    """
    Перегрузка оператора +=
    При сложении результат записывается в левый операнд
    за основу берется левый операнд и к нему прибавляются не повторяющиеся
    столбцы из правого операнда
    """
    newDataArray = self.df.copy(deep=True)
    listSelf = self.get_columns_name().tolist()
    listInput = other.get_columns_name().tolist()
    for i in listInput:
      if i not in listSelf:
        newDataArray[i] = other.get_columns(i)
        self.__df[i] = other.get_columns(i)
    return DataArray( inDf = newDataArray, inLabel = self.__label)

  def __sub(self, other):
    """
    Перегрузка оператора - 
    При вычитании возвращается новый объект класс DataArray 
    за основу берется левый операнд и от него отнимаются повторяющиеся
    столбцы из правого операнда
    """
    newDataArray = DataArray( inDf = self.df.copy(deep=True), 
                             inLabel = self.__label)
    listSelf = self.get_columns_name().tolist()
    listInput = other.get_columns_name().tolist()
    for i in listSelf:
      if i in listInput:
        newDataArray.__delete_columns(i)
    return newDataArray

  def __isub(self, other):
    """
    Перегрузка оператора -=
    При вычитании результат записывается в левый операнд
    за основу берется левый операнд и от него отнимаются повторяющиеся
    столбцы из правого операнда
    """
    newDataArray = DataArray( inDf = self.__df.copy(deep=True), 
                             inLabel = self.__label)
    listSelf = self.get_columns_name().tolist()
    listInput = other.get_columns_name().tolist()
    for i in listSelf:
      if i in listInput:
        self.__delete_columns(i)
        newDataArray.__delete_columns(i)
    return newDataArray

  def __columns_moderating(self):
    """
    Приводит датафрейм в рабочий вид, для удобства использования, чистит 
    навания колонок и удаляет колонку с меткой
    часть реализации класса, не используется снаружи
    """
    if('Label' in self.__df.columns.tolist()):
      self.__delete_columns('Label') 
    listValues = self.__df.columns.tolist()
    for i in range(len(listValues)):
      listValues[i] = listValues[i][5:-1]
    self.__df.columns = listValues

  def __delete_columns(self, name):
    """
    Удаляет указанную колонку, параметр - название колонки
    из безопасности остается частью реализации и не используется снаружи
    """
    self.__df = self.__df.drop(name, axis=1)

  def __create_data_frame(self, address):
    """
    Создает датафрейм по адресу csv файла
    часть реализации класса и не используется снаружи
    """
    self.__df = pd.read_csv(address, delimiter=',')

  def change_all_number_values(self, value):
    """
    Прибавляет или отнимает (в зависимости от знака входящего параметра)
    числовое значение входящего параметра от всех числовых значений 
    в датафрейме, кроме колонки времени
    параметр - числовое значение (-x : отнять x; x : прибавить x) (int)
    """
    listValues = self.__df.columns.tolist()
    del listValues[0]
    self.__df[listValues] += value

  def mean_average_value(self, name, interval, delete_flag = True):
    """
    Создает колонку усредненных значений из колонок в интервале, опционально
    удаляет использованные колонки из интервала
    Первый параметр - название новой колонки (строка)
    Второй параметр - какие столбцы усреднять (список строк)
    Третий параметр - флаг удаления (true - удалить / false - не удалять) 
    (булевое значение)
    """
    self.__df.insert( int(self.__df.columns.get_loc(interval[0])), name, 
                     self.__df[interval].mean(axis=1), allow_duplicates = False)
    if(delete_flag):
      self.__delete_columns(interval) 

  def select_groups(self, group, name = 'none'):
    """
    Группировка столбцов, для дальнейшего использования
    первый параметр - список названий столбцов (список строк)
    второй параметр имя группы (позже будет использовано,
    как имя получившегося столбца), опционально, по умолчанию называется 
    именем предыдущей группы + 1 или при повторении именем повторившейся группы 
    + 1
    """
    if (name == 'none'):
      listKeys = self.__selected_groups.keys()
      name = listKeys[len(listKeys) - 1] + '1'
    if (self.__selected_groups.get(name, []) != []):
      name = name + '1'
    self.__selected_groups[name] = group

  def mean_selected_groups(self, delet_flag = True):
    """
    Усреднить значение в выбранных группах и создать новый объект DataAray
    с получившимися значениями, опционально удалить использованные столбцы 
    параметр флаг удаления (true - удалить/ false не удалять)
    """
    listItems = self.__selected_groups.items()
    newDataArray = DataArray( inDf = self.__df.copy(deep=True),
                             inLabel = self.__label)
    for item in listItems:
      newDataArray.mean_average_value(item[0], item[1], delet_flag)
    newDataArray -= self
    newDataArray.__df.insert(0, '', self.get_time_columns().tolist(), False)
    return newDataArray

  def clear_selected_groups(self):
    """
    очистить выбранные группы столбцов
    """
    self.__selected_groups.clear()

  def std_average_value(self, name, interval, delete_flag = True):
    """
    Создает колонку стандартных отклонений значений из колонок в интервале, 
    опционально удаляет использованные колонки из интервала
    Первый параметр - название новой колонки (строка)
    Второй параметр - какие столбцы использовать (список строк)
    Третий параметр - флаг удаления (true - удалить / false - не удалять) 
    (булевое значение)
    """
    self.__df.insert( int(self.__df.columns.get_loc(interval[0])), name, 
                     self.__df[interval].std(axis=1), allow_duplicates = False)
    if(delete_flag):
      self.__delete_columns(interval) 

  def std_selected_groups(self, delet_flag = True):
    """
    Получить стандартное отклонение в выбранных группах и создать новый объект 
    DataAray с получившимися значениями, опционально удалить использованные
    столбцы 
    параметр флаг удаления (true - удалить/ false не удалять)
    """
    listItems = self.__selected_groups.items()
    newDataArray = DataArray( inDf = self.__df.copy(deep=True),
                             inLabel = self.__label)
    for item in listItems:
      newDataArray.std_average_value(item[0],item[1], delet_flag)
    newDataArray -= self
    newDataArray.__df.insert(0, '', self.get_time_columns().tolist(), False)
    return newDataArray

  def check_time_columns(self, other):
    """
    проверка на равенство колонок времени, входной параметр второй объект 
    DataArray
    """
    listSelf = self.get_time_columns().tolist()
    listInput = other.get_time_columns().tolist()
    for i in range(len(listSelf if len(listSelf) <= len(listInput) else listInput)):
      if (listSelf[i] != listInput[i]):
        return False
    return True

  def __create_color_list(rang):
    colors = []

    for i in range(rang):
      colors.append('#%06X' % randint(0, 0xFFFFFF))
    return colors

  def errorfill(x, y, yerr, color=None, alpha_fill=0.3, ax=None):
    ax = ax if ax is not None else plt.gca()
    if color is None:
        color = ax._get_lines.color_cycle.next()
    if np.isscalar(yerr) or len(yerr) == len(y):
        ymin = y - yerr
        ymax = y + yerr
    elif len(yerr) == 2:
        ymin, ymax = yerr
    ax.plot(x, y, color=color)
    ax.fill_between(x, ymax, ymin, color=color, alpha=alpha_fill)

  def __create_list_of_labels(groups):
    labels = []
    if(type(groups[1]) is list):
      for group in groups:
        if(group[0] == None):
          labels += result_mean.get_columns_name().tolist()[:group[1]]
        elif(group[1] == None):
          labels += result_mean.get_columns_name().tolist()[group[0]:]
        else:
          labels += result_mean.get_columns_name().tolist()[group[0]:group[1]]
    else:
      if(groups[0] == None):
        labels += result_mean.get_columns_name().tolist()[:groups[1]]
      elif(groups[1] == None):
        labels += result_mean.get_columns_name().tolist()[groups[0]:]
      else:
        labels += result_mean.get_columns_name().tolist()[groups[0]:groups[1]]
    return labels
    
  def create_graph(self, other, groups, rang, str_xlabel, 
                    str_ylabel, str_title, str_savefig):
    """
    рисует график на основании датафрейма, первый параметр это result_mean, 
    то есть вызывается это result_mean.create_graph(...) второй параметр это result_std, 
    третий параметр это лист с отрезками должен иметь вид в зависимости от использования:
    [x:y] - [x,y]; [x:] - [x, None]; [:y] - [None, y]; [x:y]...[z:c] - [[x,y],...,[z,c]]
    четвертый параметр это количество цветов
    """
    labels = self.__create_list_of_labels(groups)
    colors = self.__create_color_list(rang)
    fig = plt.figure(figsize = (15, 11))
    for index, label in enumerate(labels):
      errorfill(self.get_time_columns(), self.get_columns(label), 
                other.get_columns(label), color =colors[index])
      plt.plot(self.get_time_columns(), self.get_columns(label), 
                color =colors[index], label = label, linewidth = 3)
    plt.legend(loc = 1, fontsize = 16)
    plt.xlabel(str_xlabel, fontsize = 15)
    plt.ylabel(str_ylabel, fontsize = 15)
    plt.ylim(ymin = 0) #Масштаб графика по y
    plt.xlim(xmin = 0) #Масштаб графика по x
    plt.yticks(size=15) #Размер нумерации по оси y
    plt.xticks(size=15) #Размер нумерации по оси x
    plt.title(str_title, size=17)
    plt.savefig(str_savefig, dpi=300, bbox_inches='tight')