# Подключение библиотек

In [None]:
import warnings
warnings.filterwarnings('ignore')

import pandas as pd
import numpy as np

# DataFrame

Чтение из файла

In [None]:
df = pd.read_excel(r'file_name.xlsx', sheet_name='sheet_name', header=0)

Чтение из БД

In [None]:
from sqlalchemy import create_engine

POSTGRES_ADDRESS = '10.248.23.152'
POSTGRES_PORT = '5432'
POSTGRES_USERNAME = 'isu'
POSTGRES_PASSWORD = 'isupass'
POSTGRES_DBNAME = 'isu_db'

postgres_str = ('postgresql://{username}:{password}@{ipaddress}:{port}/{dbname}'.format(username=POSTGRES_USERNAME, password=POSTGRES_PASSWORD, ipaddress=POSTGRES_ADDRESS, port=POSTGRES_PORT, dbname=POSTGRES_DBNAME))

cnx = create_engine(postgres_str)

df = pd.read_sql_table('table_name', cnx)

Запись в файл

In [None]:
with pd.ExcelWriter(r'file_name.xlsx', engine='openpyxl') as writer:
    df.to_excel(writer, sheet_name='sheet_name', header=True, index=False, encoding = '1251')

Запись в БД

In [None]:
df.to_sql('table_name', cnx, if_exists='append', index_label='id')

Получение списка листов

In [None]:
sheets_list = pd.ExcelFile(r'file_name.xlsx').sheet_names

Создание датафрейма

In [None]:
df = pd.DataFrame(columns=['column_1', 'column_2', 'column_3'])

Переименование колонок

In [None]:
df.rename(columns={'column_1': 'column_4', 'column_2': 'column_5'}, inplace=True)

Изменение типа полей

In [None]:
df.column = df.column.apply(pd.to_datetime)
df.column = df.column.astype(int)

df.column = df.column.apply(str.lower)
df.column = df.column.apply(lambda x: func(x))

Добавление записи

In [None]:
new_line = {'column_1': 'text', 'column_2': 'text', 'column_3': 'text'}
df = df.append(new_line, ignore_index=True)

Склейка датафреймов

In [None]:
pd.concat([df_1, df_2], ignore_index=True)

Объединение датафреймов по полю

In [None]:
df = df_1.merge(df_2, on=['column'])

Сортировка

In [None]:
df.sort_values(by=['column'], ascending=False)

Кастомная сортировка

In [None]:
custom_dict = {
    'Липецкая область': 0,
    'Белгородская область': 1,
    'Брянская область': 2,
    'Владимирская область': 3,
    'Воронежская область': 4,
    'Ивановская область': 5,
    'Калужская область': 6,
    'Костромская область': 7,
    'Курская область': 8,    
    'Московская область': 9,
    'Орловская область': 10,
    'Рязанская область': 11,
    'Смоленская область': 12,
    'Тамбовская область': 13,
    'Тверская область': 14,
    'Тульская область': 15,
    'Ярославская область': 16,
    'г. Москва': 17
}

df.sort_values(by=['column'], key=lambda x: x.map(custom_dict))

Построение диаграммы рассеяния

In [None]:
import matplotlib.pyplot as plt
plt.style.use('ggplot')

pd.plotting.scatter_matrix(df, figsize=(25, 25))

# Функции

MAPE

In [None]:
def mape(actual_values, forecast_values):
    if len(actual_values) != len(forecast_values):
        raise ValueError("Arrays must have the same size")
    else:
        n = len(actual_values)
        M = 0.0
        for actual_value, forecast_value in zip(actual_values, forecast_values):
            M += abs((actual_value - forecast_value) / actual_value)
        M /= n
        return M * 100

Преобразование чисел к удобному виду

In [None]:
def pretty_number(num):    
    num = round(num, 0)
    num = str(num)
    num = num[:-2]
    num = num[::-1]    
    temp = ''
    for i in range(len(num)):
        if (i == 3) | (i==6) | (i==9)  | (i==12):
            temp += ' ' + num[i]
        else:
            temp += num[i]
    return temp[::-1]

Звуковое оповещение

In [None]:
import winsound

def finish_sound():
    frequency = 1500   # Set Frequency To 2500 Hertz
    duration = 100   # Set Duration To 1000 ms == 1 second
    for i in range(3):
        winsound.Beep(frequency, duration)

Время выполнения

In [None]:
from datetime import date, datetime

start_time = datetime.now()
print('\033[1m\033[94mВремя работы: %s' %(datetime.now() - start_time) + '\033[0m')

Стиль текста

In [None]:
class PrintStyle:
    purple = '\033[95m'
    cyan = '\033[96m'
    darkcyan = '\033[36m'
    blue = '\033[94m'
    green = '\033[92m'
    yellow = '\033[93m'
    red = '\033[91m'
    bold = '\033[1m'
    underline = '\033[4m'
    end = '\033[0m'

print(PrintStyle.bold + 'Hello World!' + PrintStyle.end)

Статус процесса

In [None]:
import ipywidgets as widgets

def create_progress(max_value):
    return widgets.IntProgress(value=0, min=0, max=max_value, step=1, description='0%', bar_style='', orientation='horizontal')

def increase_progress(progress):
    progress.value += 1
    progress.description = str(int(round(100 / progress.max * (progress.value), 0))) + '%'
    
progress = create_progress(df.shape[0])
display(progress)

Словарь возрастных групп

In [None]:
age_dict = {'0': '0-4', '1': '0-4', '2': '0-4', '3': '0-4', '4': '0-4',
            '5': '5-9', '6': '5-9', '7': '5-9', '8': '5-9', '9': '5-9',
            '10': '10-14', '11': '10-14', '12': '10-14', '13': '10-14', '14': '10-14',
            '15': '15-19', '16': '15-19', '17': '15-19', '18': '15-19', '19': '15-19',
            '20': '20-24', '21': '20-24', '22': '20-24', '23': '20-24', '24': '20-24',
            '25': '25-29', '26': '25-29', '27': '25-29', '28': '25-29', '29': '25-29',
            '30': '30-34', '31': '30-34', '32': '30-34', '33': '30-34', '34': '30-34',
            '35': '35-39', '36': '35-39', '37': '35-39', '38': '35-39', '39': '35-39',
            '40': '40-44', '41': '40-44', '42': '40-44', '43': '40-44', '44': '40-44',
            '45': '45-49', '46': '45-49', '47': '45-49', '48': '45-49', '49': '45-49',
            '50': '50-54', '51': '50-54', '52': '50-54', '53': '50-54', '54': '50-54',
            '55': '55-59', '56': '55-59', '57': '55-59', '58': '55-59', '59': '55-59',
            '60': '60-64', '61': '60-64', '62': '60-64', '63': '60-64', '64': '60-64',
            '65': '65-69', '66': '65-69', '67': '65-69', '68': '65-69', '69': '65-69',
            '70': '70-74', '71': '70-74', '72': '70-74', '73': '70-74', '74': '70-74',
            '75': '75-79', '76': '75-79', '77': '75-79', '78': '75-79', '79': '75-79',
            '80': '80-84', '81': '80-84', '82': '80-84', '83': '80-84', '84': '80-84',
            '85': '85-89', '86': '85-89', '87': '85-89', '88': '85-89', '89': '85-89',
            '90': '90-94', '91': '90-94', '92': '90-94', '93': '90-94', '94': '90-94',
            '95': '95-99', '96': '95-99', '97': '95-99', '98': '95-99', '99': '95-99',
            '100 и более': '100 и более'}

Кратчайщий путь в графе

In [None]:
nx.shortest_path(G, source='A', target='B')

Boxplot (ящик с усами)

In [None]:
def boxplot(data):
    k = 1.5
    q1 = np.quantile(data, 0.25)
    q3 = np.quantile(data, 0.75)
    IQR = q3 - q1
    return q1 - k * IQR, q3 + k * IQR

# Plotly

Plotly Express

In [None]:
import plotly.express as px

px.scatter(x=[0, 1, 2, 3, 4], y=[0, 1, 4, 9, 16]).show()

px.line(x=t, y=np.cos(t), labels={'x':'t', 'y':'cos(t)'}).show()

График с двумя осями

In [None]:
import plotly.graph_objects as go
from plotly.subplots import make_subplots

fig = make_subplots(specs=[[{'secondary_y': True}]])

fig.add_trace(go.Scatter(x=df.date, y=df.column_1, name='column_1'), secondary_y=False)
fig.add_trace(go.Scatter(x=df.date, y=df.column_2, name='column_2'), secondary_y=True)

fig.update_yaxes(title_text='column_1', secondary_y=False)
fig.update_yaxes(title_text='column_2', secondary_y=True)

fig.show()