In [19]:
from sklearn.preprocessing import  LabelEncoder, LabelBinarizer, OneHotEncoder
from sklearn.pipeline import make_union, make_pipeline
from sklearn.preprocessing import FunctionTransformer, StandardScaler, Imputer
from sklearn.preprocessing import CategoricalEncoder
from sklearn.base import BaseEstimator, TransformerMixin
import datetime 
from datetime import timedelta
from dateutil import parser
import json
import pandas as pd

class Person_data:
    '''
    Класс создает новый датафрейм по заявке клиента на расчет инсулина
    Передает датафрейм который потом будет конкатенироватся с продуктовой таблицей!
    
    '''
    
    def __init__(self, count_product:int,shugar_now:int, place_injection = 'Живот', human_param_json = 'param_dict.json',
                time_injection = None, time_meal = None, active = False, insulin_typ = True,
                temperatur_norm = True):
        
        '''
        Передадим все атрибуты которые потребуются для создания DataFrame
        
        
        '''
        
        '''
        
        Инициализатор принимает имя таблицы и подрубает DataFrame
        При создание класса мы передаем параметры которые человек должен сам указать,
        Это динмаичные параметры
        
    
        
        Принимает time_injection = str '10:15' - Время когда сделанн укол
        Принимает time_meal = str '10:30' - Время когда пища начинает поступать в организм
        Принимает булевое active - Планируется ли тренировка после приема пищи или нет?
        Принимает place_injection - Строка указывающая место инъекции
        Принимает insulin_typ - Тип инсулина Если True значит короткий под еду если нет Значит длинный
        Кто с посмпой у них всегда короткий! 
        Принимает temperatur_norm - Бинарный признак Температура тела внорме или повышенная(Болезнь)
        По умлочанию температура в норме
        count_product- Кол-во продуктов которое будем потреблять
        shugar_now- Текущий сахар - передается человеком
        '''
        
        self.count_product = count_product
        
        self.time_injection = time_injection
        self.time_meal = time_meal
        self.active = active
        self.place_injection = place_injection
        self.insulin_typ = insulin_typ
        self.temperatur_norm = temperatur_norm
        self.shugar_now = shugar_now
        
        
        self.human_param_json = human_param_json
        
        # Считываем словарик
        with open(human_param_json,'r') as f:

            self.param_dict = json.load(f)
            
        # Создаем датафрейм размерностью соответсвующий кол-во поступающих продуктов
        self.df = pd.DataFrame(index = range(self.count_product))
            
        
        
        

    
    def time_future(self,df):
        
        '''
        Функция преобразует признак время на несколько других признаков!
        Время это больше статистика
        
        --------------------------------------------------- 
        Это к разряду что нужно будет подавать модели для
        обучения! А что идет просто для отображения статистики и визуализации
        
        А вот время приема пищи вполне может влиять на усвоение сахара!
        '''
       
        # Ставим текущее время    
        df['Время'] = datetime.datetime.now()
        
        
        df['Год'] = df['Время'].apply(lambda x: x.year)
        df['Месяц'] = df['Время'].apply(lambda x: x.month)
        df['День'] = df['Время'].apply(lambda x: x.day)
        df['День_недели'] = df['Время'].dt.weekday_name
        
        # Добавим время приема пищи
        df['Прием пищи'] = df['Время'].dt.time.astype('str').apply(lambda x: 'Завтрак' if x < '10:00' else 
                                                                       'Обед' if x < '14:00' else 
                                                                       'Полдник' if x < '17:00' else 'Ужин')
    
        # Добавим Сезоны! времена года! Это может влиять на усваиваемось инсулина из за повышенной активности летом!
        # И частотой простуды зимой!
        df['Сезон'] = df['Месяц'].apply(lambda x: 'Весна' if 3 <= x < 6 else 
                                                      'Лето' if 6 <= x < 9 else 
                                                      'Осень' if 9 <= x <= 11 else 'Зима')
        
        return df[['Время','Год','Месяц','День','День_недели','Прием пищи','Сезон']]
    
    ###################################################################
    
    # Здесь идут статичные данные которые мы подгружаем из словарика! Они редко меняются!
    
    def get_human_param(self,df):
        
        '''
        Функция устанавливает все статичные параметры из словарика!
        Возвращает признаки в DataFrame
        '''
        
        # Создадим словарь с теми ключами которые достаточно просто записать! 
        #Остальные требуют отдельной обработки
        
        iter_dict = dict((x,self.param_dict[x]) for x in self.param_dict.keys() if x !='Инсулин под еду' 
                                                                                if x !='Инсулин для организма'
                                                                                if x != 'День рождения'
                                                                                if x != 'Дата диагноза')
        # Делаем сортировку и записываем в df
        for key,value in sorted(iter_dict.items()):
            
            df[key] = value
            
        return  df[sorted(iter_dict.keys())]  
    
    def age_diagnos_and_age(self, df):
        '''
        Функция принимает DataFrame

        Отсчитывает разницу со дня определения диагноза и по сегодняшний день!
        
        Берем Даты рождения и Дату диагноза из словарика!

        ''' 
        # Достаем строки из словаря и преобразуем их в datetime
        dt_diagnos = parser.parse(self.param_dict['Дата диагноза'],dayfirst=True)
        dt_birhtday = parser.parse(self.param_dict['День рождения'],dayfirst=True)
        
                                        # подсчитаем дельту  31536000 число секунд в году!         
        df['Стаж заболевания(лет)'] = df['Время'].apply(lambda x: (x -  dt_diagnos).total_seconds() // 31536000)

        df['Возраст'] = df['Время'].apply(lambda x: (x - dt_birhtday).total_seconds() // 31536000)

        # Проставим стаж заболевания и возраст в каждой строке в зависимости от времени
        return df[['Стаж заболевания(лет)','Возраст']]
    
    
    def time_injection_and_time_meal(self, df):
        '''
        Функция принимает DataFrame
        Принимает данные по времени введения инсулина и времени обеда

        Если передаются параметры time_injection str(10:00) и параметр time_meal str(10:15)
        то устанавливаем их! 
        Если нет то время инъекции берем текущее а время обеда + 10 мин

        '''

        # Преобразуем присланное время в datetime строку! Это нужно чтобы правельно прибавить 10минутный отступ за едой

        if self.time_injection is not None:

            df['Время инъекции'] = self.time_injection

        else:
            # Если время инъекции не переданно то считаем что инъекция делается в момент запроса!

            df['Время инъекции'] = df['Время'].apply(lambda x: x.strftime('%H:%M'))

        if self.time_meal is not None:

            df['Время приема пищи'] = self.time_meal

        else:
            # Если время приема пищи не переданные  то ставим + 10 минут от начала инъекции!
            df['Время приема пищи'] = df['Время'].apply(lambda x: (x + timedelta(minutes = 10)).strftime('%H:%M'))
        
        return  df[['Время приема пищи','Время инъекции']]
    
    
    def active_mod(self, df):
    
        '''
        Функция принимает DataFrame
        Если у человека планируется физическая нагрузка в течениее 1 часа после еды! То лучше это отобразить
        Так как актиный режим понижает уровень сахара в крови! Отсюда нужна корректировка дозировки!

        '''

        df['Тренировка'] = 1 if self.active else 0
        
        return df['Тренировка'].values.reshape(-1,1)
    
    def injection_place(self, df):
        '''
        Функция принимает DataFrame
        str(place) - Отображающий место укола Живот, Нога, Рука, Ягодицы
        Эта информация больше нужна для статитсики! Но есть научное подтверждение тому что с утра рекомендуется 
        делать укол в живот вечером же наоборот нельзя из за скорости усвоения инсулина человеком 
        в зависимости от времени суток! Это все касается при использование инсулиновых ручек или шприцов!
        С помпами этот параметр не так важен!
        '''

        df['Место инъекции'] = self.place_injection
        
        return df['Место инъекции'].values.reshape(-1,1)
    
    def type_insulin(self, df):
        '''
        Функция принимает DataFrame
        Указывает тип инсулина -Короткий под еду Длинный для поддержания организма

        '''
        # Если True значит Укол под еду
        if self.insulin_typ:
            
            df['Тип инсулина'] = self.param_dict['Инсулин под еду']
        # Если нет значит делаем инъекцию длинного инслуина для организма    
        else:
            
            df['Тип инсулина'] = self.param_dict['Инсулин для организма']
            
        return df['Тип инсулина'].values.reshape(-1,1)  
    
    def temperature_body(self, df):
        '''
        Функция принимает DataFrame 
        Булевое значение norm = True по умолчанию! Значит температуры нет
        Если ставим False то температура!(Человек болеет)
        '''

        df['Болезнь'] = 0 if self.temperatur_norm else 1
        
        return df['Болезнь'].values.reshape(-1,1)
    
    def set_shugar_now(self, df):
        '''
        Функция просто устанавливает сахар в данный момент времени
        
        '''
        
        df['История глюкозы (mg/dL)'] = self.shugar_now
        
        return df['История глюкозы (mg/dL)'].values.reshape(-1,1)
        
    
    def set_id_meal(self, df):
        '''
        Функция устанавливает в DataFrame id_meal
        Добавляет +1 и перезаписывает в файл
        
        '''
        id_meal = self.get_id_meal()
        
        df['ID_meal'] = id_meal
        
        with open('id_meal.txt','w') as f:
            
            json.dump({"Id_meal": id_meal + 1},f)
            
        return df['ID_meal'].values.reshape(-1,1)   
            
            
    
    def get_id_meal(self):
        
        '''
        Функция считывает id_meal и прибавляет 1 + перезаписывает
        
        '''
        with open('id_meal.txt', 'r') as f:
            
            id_meal = json.load(f)["Id_meal"]
            
            return id_meal
    
   


    ######################################################################################    
    def get_pipline(self):
        '''
        Функция запускает пайплайн для преобразования данных из программы Freestyle_libre
        Дергает все методы постепенно
            
        '''  
        pipeline = make_union(*[
            
            
            make_pipeline(FunctionTransformer(self.time_future, validate=False)),
            
            make_pipeline(FunctionTransformer(self.get_human_param, validate=False)),
            
            make_pipeline(FunctionTransformer(self.type_insulin, validate=False)),
            
            make_pipeline(FunctionTransformer(self.age_diagnos_and_age, validate=False)),
            
            make_pipeline(FunctionTransformer(self.time_injection_and_time_meal, validate = False)),
            
            make_pipeline(FunctionTransformer(self.active_mod, validate = False)),
            
            make_pipeline(FunctionTransformer(self.injection_place, validate = False)),
           
            make_pipeline(FunctionTransformer(self.set_id_meal, validate = False)),
            
            make_pipeline(FunctionTransformer(self.temperature_body, validate = False)),
            
            make_pipeline(FunctionTransformer(self.set_shugar_now, validate = False))
                            
                                  ])          
            
        
        pipeline.fit_transform(self.df)
        
        # Пока буду возвращать готовый DataFrame Потом посмотрю!
        return self.df

In [31]:
data_person = Person_data(count_product=1,shugar_now=180).get_pipline()

In [32]:
data_person

Unnamed: 0,Время,Год,Месяц,День,День_недели,Прием пищи,Сезон,ID,Вес(кг.),Интсрумент инъекции,...,Тип инсулина,Стаж заболевания(лет),Возраст,Время инъекции,Время приема пищи,Тренировка,Место инъекции,ID_meal,Болезнь,История глюкозы (mg/dL)
0,2018-09-07 22:28:12.109633,2018,9,7,Friday,Ужин,Осень,1,17,Инсулиновая ручка,...,Короткий(Новорапид),1.0,4.0,22:28,22:38,0,Живот,3,0,180


In [None]:
# Порядок запуска такой из за метода id_meal
# 1. data_row
# 2. data_person

In [28]:
product_table = Product_Table(name_table='data_table.csv')

In [29]:
data_row = product_table.get_product(name_product='Банан', new_mass=150)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy


In [None]:
data_person = Person_data(count_product=1,shugar_now=180).get_pipline()

In [None]:
data_person

In [33]:
data_for_ml = data_person.join(data_row.set_index('ID_meal'), on='ID_meal')

In [34]:
# Все по сути Осталоьс сделать обучающую выборку она будет иметь такой вид
# Первый алгоритм построю на предсказание дозировки инсулина исходя из этих данных
# До 31 октября я доделю обучающую выборку! и обучу модель!


# Вот такие Датафреймы пойдут в Класс по обработки данных для машинного обучения
data_for_ml

Unnamed: 0,Время,Год,Месяц,День,День_недели,Прием пищи,Сезон,ID,Вес(кг.),Интсрумент инъекции,...,Наименование продукта,Гликемический индекс,Ккал,Белки,Жиры,Углеводы,Оценка продукта,Категория продукта,Глюкоза,Масса(гр.)
0,2018-09-07 22:28:12.109633,2018,9,7,Friday,Ужин,Осень,1,17,Инсулиновая ручка,...,Банан,60.0,136.5,2.25,0.15,31.5,2,Фрукты и ягоды,18.9,150


In [35]:
data_for_ml.columns

Index(['Время', 'Год', 'Месяц', 'День', 'День_недели', 'Прием пищи', 'Сезон',
       'ID', 'Вес(кг.)', 'Интсрумент инъекции', 'Источник данных(сахар)',
       'Место Обитания', 'Модель инструмента', 'Рост(см.)', 'Тип инсулина',
       'Стаж заболевания(лет)', 'Возраст', 'Время инъекции',
       'Время приема пищи', 'Тренировка', 'Место инъекции', 'ID_meal',
       'Болезнь', 'История глюкозы (mg/dL)', 'Наименование продукта',
       'Гликемический индекс', 'Ккал', 'Белки', 'Жиры', 'Углеводы',
       'Оценка продукта', 'Категория продукта', 'Глюкоза', 'Масса(гр.)'],
      dtype='object')

In [None]:
class Machine_learning_algoritm:
    '''
    Класс по обработки данных для модели машинного обучения
    
    
    '''
    
    pass

In [None]:
# Также я создам класс по созданию визуализаций на основе данных
class Vizualization:
    '''
    Класс будет предоставлять отчеты по контролю сахара
    Какие продукты удачнее всего какие скачки сахара 
    Средние показатели и тд!
    
    '''
    pass

In [17]:
import functools
from difflib import get_close_matches

class Product_Table():
    
    '''
    Этот класс работает с табличкей с продуктами!
    
    Он может изменять значения в таблице!
    Добавлять новые продукты в таблицу!
    Выводит информацию о конкретных продуктах или целых категориях
    
    '''
    
    def __init__(self,name_table):
        
        '''
        Инициализируем при создание объекта класса DataFrame
        '''
        # Имя таблицы
        self.name_table = name_table
#         Откроем Табличку в DataFrame
        self.data_table = pd.read_csv(self.name_table)
    
    # Запилим декоратор сохранения в csv таблицу
    
    def to_save_csv(func):
        '''
        Декоратор! Записывает DattaFrame в csv
        
        '''
        @functools.wraps(func)
        def wrapper(self, *args, **kwargs):
            
            result = func(self,*args, **kwargs)
            
            result.to_csv(self.name_table,index=False)
            
        return wrapper   
    
    @to_save_csv
    def add_new_product(self,dict_new_row):
        '''
        Функция принимает параметры и создает новый датафрейм который можно конкатенировать с 
        текущей таблицей! Соединяет новый продукт с общей таблицей и пересохраняет таблицу
        Принимает: 
        1. Словарь введеных параметров(Последний параметр это категория продукта)
        2. Категория к которой относится продукт
        '''


        # Сначало проверим есть ли продукт в базе?

        name = dict_new_row['Наименование продукта']

        if self.search_product_in_table(name):
            print('Продукт с таким именем уже есть в базе!')
            return 

        else:    # продукта нет, можно создавать
            columns = self.data_table.columns
            data_row = pd.DataFrame(columns = columns,data = [dict_new_row])
            
            # Сделаем список по которому будем пробегатся и вставлять значения из расчета общей таблицы
            # В этом списке будут значения которые человек не ввел при добавление продукта
            none_columns = columns.difference(dict_new_row.keys())
            
            # уберем единственный интовый показатель который нужно расчитать отдельно 
            for col in none_columns.drop('Оценка продукта'):

                # Сгрупируй по категории по считай средние значения для пропущенного параметра
                data_row[col] = round(self.data_table[self.data_table['Категория продукта'] == dict_new_row['Категория продукта']][col].mean(),1)

        # Посчитаем медианную оценку по категории продукта и получим оценку           
        data_row['Оценка продукта'] = int(self.data_table[self.data_table['Категория продукта'] == dict_new_row['Категория продукта']]['Оценка продукта'].median())  

        # Обновляем продуктовую таблицу и перезаписываем ее
        self.data_table = self.data_table.append(data_row,ignore_index=True)

       
        print('Продукт добавленн!Таблица перезаписанна!')

        print(data_row.to_string()) 
        
        return self.data_table
        
    def search_product_in_table(self, name_product, return_index_prod = False):
        '''
        Функция открывает таблицу и ищит продукт по названию если он есть то выводит, если нет то пишит что продукта нет
        Можно добавлять

        '''
        for name in self.data_table['Наименование продукта'].values:

            if name_product.lower() == name.lower():

                print('Продукт есть в базе!')

                print(self.data_table[self.data_table['Наименование продукта'] == name].to_string())

                # Если стоит задача вернуть и индекс продукта то она будет выполнена!
                if return_index_prod:

                    return self.data_table[self.data_table['Наименование продукта'] == name].index[0]

                return True


        print('Продукта с таким именим нет в базе!')
        return False    
    
    def find_product_data(self,name_product):
        '''
        Функция выведит данные по продукту
        Если продукта нет то напишит что нет

        '''
        if self.search_product_in_table(name_product):

            print('Удачного дня!')


        else: # продукта нет, можно создавать! Или есть продукт с входящими словами! Возможно нужен он!

            print('Пробую найти похожие названия!')
            # Применим стороннею библиотеку которая поможет найти похожие слова и фразы!
            
            list_name = self.data_table['Наименование продукта'].values
            
            list_close = get_close_matches(word = name_product,possibilities=list_name, n=3,cutoff=0.6)
            

            for name in list_close:

#                 # Беру слово без окончаний и понижаю во избежание ошибок
#                 if name_product[:-1].lower() in name.lower():

                display(self.data_table[self.data_table['Наименование продукта'] == name])
    
    @to_save_csv
    def delete_product(self,name_product):
        '''
        Функция принимает имя продукта! И удаляет его из таблицы
        после обновляет таблицу!
        
        '''
        
        self.data_table.drop(self.data_table[self.data_table['Наименование продукта'] == name_product].index[0],
                                                                                         inplace = True)
        
        print('Продукт удаленн!')
        
        return self.data_table
        
      
        
        
    def find_index_product(self, name_product):
        '''
        Функция ищет объект по имени и выводит его индекс!

        '''

        # Если продукт есть напичатает что есть и вернет индекс этого продукта
        
        index = self.search_product_in_table(name_product, return_index_prod = True) 
        
        print('Индекс данного продукта {}.'.format(index))

        return index  
    
    def print_category(self):
        '''
        Функция выводит на экран все доступные категории продуктов
        
        '''

        display(self.data_table.groupby('Категория продукта').size().sort_values(ascending= False))
        
    def print_product_on_category(self,category):
        '''
        Функция выводит все продукты по конкретной категории
        
        '''
        display(self.data_table[self.data_table['Категория продукта'] == category]) 
       
    @to_save_csv
    def update_product_table(self, identificator, dict_change):
        '''
        Функция изменяет любой параметр в объекте!
        Принимает Идентификатор - это либо индекс либо имя продукта
        dict_change - словарь с значениями которые мы перезаписываем
        
        '''

        # Если Если старший класс инт Нам передали индекс
        if isinstance(identificator,int):
            
            for name_future in dict_change:
                
                self.data_table.at[identificator, name_future] = dict_change[name_future]
                
            print('Данные обновленны! Записываю в таблицу')
                
            display(self.data_table.loc[identificator])
            
        else:
            
            # Если попали сюда значит нам передали название продукта
            
            index = self.find_index_product(identificator)
            
            # Дальше код просто копируется
            
            for name_future in dict_change:
                
                self.data_table.at[index, name_future] = dict_change[name_future]
                
            print('Данные обновленны! Записываю в таблицу')
                
            display(self.data_table.loc[index])
            
        return self.data_table
            
            
    def  get_product(self, name_product: str, new_mass: int):
        '''
        Функция принимает имя продукта и его массу
        Возвращает DataFrame 1ой строкой(Посмотрю может проще словарем)
        '''
        new_data = self.data_table[self.data_table['Наименование продукта'] == name_product]
            
            
        for col in ['Ккал','Белки','Жиры','Углеводы','Глюкоза']:
    
            new_data[col] = new_data[col] * new_mass / new_data['Масса(гр.)']
        
        new_data['Масса(гр.)'] = new_mass
        
        # Установим id_meal по нему будем joinить
        new_data["ID_meal"] = self.get_id_meal()
        
        # Все здесь мы вернули данные По продукту в зависимости от массы!
        return new_data
    
    def get_id_meal(self):
        
        '''
        Функция считывает id_meal и прибавляет 1 + перезаписывает
        
        '''
        with open('id_meal.txt', 'r') as f:
            
            id_meal = json.load(f)["Id_meal"]
            
            return id_meal
        