# Функция optimize_memory_usage оптимизации типов в dataframe.
Код взят из источника https://github.com/ellavs/python-pandas-optimize-dataframe-memory-usage

In [2]:
# Передаваемые в функцию optimize_memory_usage:
# df - наш df, который нужно оптимизировать - понизить размерность
# print_size=False  и print_info=False - печать информации не производится

def optimize_memory_usage(df, print_size=True, print_info_befor=True, print_info_after=True): 

    # Типы, которые будем проверять на оптимизацию.
    numerics = ['int16', 'int32', 'int64', 'float16', 'float32', 'float64']
    
    if print_info_befor == True:  # Показать информацию о таблице до оптимизации.
        print('-' * 80)
        print(df.info())
        print('-' * 80)
  
    # Размер занимаемой памяти до оптимизации (в Мб).
    before_size = df.memory_usage().sum() / 1024**2    
    for column in df.columns:
        column_type = df[column].dtypes
        if column_type in numerics:
            column_min = df[column].min()
            column_max = df[column].max()
            if str(column_type).startswith('int'):
                if column_min > np.iinfo(np.int32).min and column_max < np.iinfo(np.int32).max:
                    df[column] = df[column].astype(np.int32)
                elif column_min > np.iinfo(np.int64).min and column_max < np.iinfo(np.int64).max:
                    df[column] = df[column].astype(np.int64)  
            else:
                if column_min > np.finfo(np.float32).min and column_max < np.finfo(np.float32).max:
                    df[column] = df[column].astype(np.float32)
                else:
                    df[column] = df[column].astype(np.float64)    
    # Размер занимаемой памяти после оптимизации (в Мб).
    after_size = df.memory_usage().sum() / 1024**2
    if print_size: 
        print('Memory usage size: before {:5.4f} Mb - after {:5.4f} Mb ({:.1f}%).'.format(before_size, after_size, 100 * (before_size - after_size) / before_size))
    if print_info_after == True: #  Показать информацию о таблице после оптимизации.
        print('-' * 80)
        print(df.info())
        print('-' * 80)
       
    return df