<a id='head'></a>


### [Строки](#string)
- [Массовый вызов методов строк для переименования заголовков DF](#string_01)

### [Циклы](#cycle)
- [Обратный цикл перебора словаря](#cycle_01)
- [Замена дубликатов в DF (простая)](#cycle_02)
- [Замена дубликатов в DF (улучшенная)](#cycle_03)
- [Перебор комбинации значений из двух списков](#cycle_04)
- [Пример цикла While](#cycle_05)

### [Условия](#if_else)
- [try... except](#if_else_01)
- [Короткая запись условия](#if_else_02)

### [Функции](#function)
- [Перебор вхождения строки в элемент из списка значений](#function_01)
- [Поиск значений усов коробки с усами](#function_02)

### [Lambda функции](#lambda_function)
- [Пример](#lambda_function_01)

### [Генераторы списков](#list_comprehension)

### [Распаковка списков](#unpack_list)

### OS

### [Диаграммы и Графики](#plt)
- [Heatmap для матрицы корреляции](#plt_01)
- [Seaborn Pairplot](#plt_02)


<a id='string'></a>
<div style="border:solid orange 2px; padding: 40px">
    <h1><p style="text-align: center;">Строки</p></h1>
</div>

<a id='string_01'></a>
<div class="alert alert-info">
<h3> Массовый вызов методов строк для переименования заголовков DF</h3>
</div>

In [16]:
import pandas as pd
df = pd.read_csv('datasets/yandex_music_project.csv')
print(df.columns)

# __________Начало___________
df.columns = df.columns.str.strip().str.lower().str.replace('с_значение_1', 'на_значение_2')
# __________Конец___________

print(df.columns)

Index(['  userID', 'Track', 'artist', 'genre', '  City  ', 'time', 'Day'], dtype='object')
Index(['userid', 'track', 'artist', 'genre', 'city', 'time', 'day'], dtype='object')


# [▴](#head)

<a id='cycle'></a>
<div style="border:solid orange 2px; padding: 40px">
    <h1><p style="text-align: center;">Циклы</p></h1>
</div>

<a id='cycle_01'></a>
<div class="alert alert-info">
    <h3>Обратный цикл перебора словаря</h3>
</div>

In [17]:
test_dict = {"Слово": ['Славо', "Слуво", "Сливо"], "Огонь": ["Кинь", "Конь"]}
for item in test_dict.items():
    for val in item[1]:
        print(val, "->", item[0])

Славо -> Слово
Слуво -> Слово
Сливо -> Слово
Кинь -> Огонь
Конь -> Огонь


# [▴](#head)

<a id='cycle_02'></a>
<div class="alert alert-info">
    <h3>Замена дубликатов в DF (простая)</h3>
</div>

In [18]:
import pandas as pd
df = pd.read_csv('datasets/yandex_music_project.csv')
df.fillna('Нету', inplace=True)
print(list(filter(lambda x: 'hip' in x or 'hop' in x, df['genre'].sort_values().unique())))

# __________Начало___________
def replace_wrong_genres(wrong_genres, correct_genre):
    for wrong_genre in wrong_genres:
        df['genre'] = df['genre'].replace(wrong_genre, correct_genre)

replace_wrong_genres(['hip-hop', 'hip', 'hop'], 'hiphop')
# __________Конец___________

print(list(filter(lambda x: 'hip' in x or 'hop' in x, df['genre'].sort_values().unique())))

['hip', 'hip-hop', 'hiphop', 'hop', 'triphop']
['hiphop', 'triphop']


# [▴](#head)

<a id='cycle_03'></a>
<div class="alert alert-info">
    <h3>Замена дубликатов в DF (улучшеная)</h3>
</div>

In [19]:
import pandas as pd
df = pd.read_csv('datasets/yandex_music_project.csv')
df.fillna('Нету', inplace=True)
print(list(filter(lambda x: 'hip' in x or 'hop' in x or 'эл' in x or 'electronic' in x, df['genre'].sort_values().unique())))

# __________Начало___________
def replace_wrong_genres_upgrade(genres_duplicates): # принимаем на вход словарь с данными о дубликатах
    for item in genres_duplicates.items(): # обходим каждый элемент словаря, распаковывая их в кортеж
        for val in item[1]: # в кортеже создаем цикл на обход списка (по сути это значение ключа словаря со списком дубликатов)
            df['genre'] = df['genre'].replace(val, item[0]) # заменяем каждый дубликат на верное значение (ключ словаря)

duplicates_dict = {'hiphop': ['hip-hop', 'hip', 'hop'], 'electronic': ['электроника']} # наборов может быть сколько угодно
replace_wrong_genres_upgrade(duplicates_dict)
# __________Конец___________

print(list(filter(lambda x: 'hip' in x or 'hop' in x or 'эл' in x or 'electronic' in x, df['genre'].sort_values().unique())))

['electronic', 'hip', 'hip-hop', 'hiphop', 'hop', 'loungeelectronic', 'popelectronic', 'triphop', 'электроника']
['electronic', 'hiphop', 'loungeelectronic', 'popelectronic', 'triphop']


# [▴](#head)

<a id='cycle_04'></a>
<div class="alert alert-info">
    <h3>Перебор комбинации значений из двух списков</h3>
</div>

In [20]:
import itertools
first_list = ['A', 'B']
second_list = ['c', 'd', 'e']
print(list(itertools.product(first_list, second_list)))

[('A', 'c'), ('A', 'd'), ('A', 'e'), ('B', 'c'), ('B', 'd'), ('B', 'e')]


# [▴](#head)

In [21]:
first_list = ['A', 'B']
second_list = ['c', 'd', 'e']
new_list = []
for i in first_list:
    for j in second_list:
        new_list.append([i, j])
print(new_list)

[['A', 'c'], ['A', 'd'], ['A', 'e'], ['B', 'c'], ['B', 'd'], ['B', 'e']]


# [▴](#head)

<a id='cycle_05'></a>
<div class="alert alert-info">
    <h3>Пример цикла While</h3>
</div>

In [22]:
import random

total_weight = 0
capacity = 300

while total_weight < capacity: # пока суммарный вес меньше грузоподъёмности лифта
    person_weight = random.randint(30, 120) # генерируется случайное целое число от 30 до 120
    total_weight += person_weight # сгенерированный вес добавляется к суммарному весу

# [▴](#head)

In [23]:
import numpy as np

spots = np.array([[2,3,4,5,6,7], # имя переменной spots по-английски значит «пятна»
    [3,4,5,6,7,8], 
    [4,5,6,7,8,9], 
    [5,6,7,8,9,10], 
    [6,7,8,9,10,11],
    [7,8,9,10,11,12]])

spot_counts = {}

for i in range(0, 6):
        for j in range(0, 6):
                if spots[i][j] not in spot_counts.keys():
                        spot_counts[spots[i][j]] = 1
                else:
                        spot_counts[spots[i][j]] += 1

print(spot_counts)

spot_probs={k:spot_counts[k]/36 for k in spot_counts} #dictionary comprehension
print(spot_probs)

{2: 1, 3: 2, 4: 3, 5: 4, 6: 5, 7: 6, 8: 5, 9: 4, 10: 3, 11: 2, 12: 1}
{2: 0.027777777777777776, 3: 0.05555555555555555, 4: 0.08333333333333333, 5: 0.1111111111111111, 6: 0.1388888888888889, 7: 0.16666666666666666, 8: 0.1388888888888889, 9: 0.1111111111111111, 10: 0.08333333333333333, 11: 0.05555555555555555, 12: 0.027777777777777776}


# [▴](#head)

<a id='if_else'></a>
<div style="border:solid orange 2px; padding: 40px">
    <h1><p style="text-align: center;">Условия</p></h1>
</div>

<a id='if_else_01'></a>
<div class="alert alert-info">
    <h3>try ... except</h3>
</div>

In [24]:
try:
    print(1 / 0)
except:
    print('Проверьте значения параметров a и b')
print('Кстати, хорошего дня') 

Проверьте значения параметров a и b
Кстати, хорошего дня


# [▴](#head)

<a id='if_else_02'></a>
<div class="alert alert-info">
    <h3>Короткая запись условия</h3>
</div>

In [25]:
p = 1
x = ("Yes" if p == 1 else "Нет или не уверен")
print(x)

Yes


# [▴](#head)

<a id='function'></a>
<div style="border:solid orange 2px; padding: 40px">
    <h1><p style="text-align: center;">Функции</p></h1>
</div>

<a id='function_01'></a>
<div class="alert alert-info">
    <h3>Перебор вхождения строки в элемент из списка значений</h3>
</div>

In [None]:
# создадим 4 списка, для каждой из категорий и впишем туда необходимые корни слов

auto_list = ['авто'] # автомобильный
education_list = ['образ'] # образование
realty_list = ['жиль', 'недв'] # недвижимость
wedding_list = ['свадь'] # свадьба

# сначала создадим функцию-помощника, которая будет перебирать список корней 
# и проверять вхождение этого корня в строковое значение

def str_in_val_list(str_val, words): # принимаем на вход строковое значение для проверки и список корней
    for word in words: # для каждого корня в списке корней
        if word in str_val: # если корень входит в строковое значение
            return True # возвращаем True
    return False # иначе False


# теперь создаем основную рабочую функцию

def categorise_purpose(cell): # принимием на вход значение ячейки (это наше строковое значение)
    if str_in_val_list(cell, auto_list): # вызываем функцию-помощника, которой передаем значение ячейки и список на проверку
        return 'операции с автомобилем' # если функция-помощник возвращает нам True, то основная возвращает нужную категорию
    elif str_in_val_list(cell, realty_list):
        return 'операции с недвижимостью'
    elif str_in_val_list(cell, wedding_list):
        return 'проведение свадьбы'
    elif str_in_val_list(cell, education_list):
        return 'получение образования'
    else:
        return 'без категории' # если все вызовы функций-помощников вернули нам False, то получаем на выходе "без категорий"


# применим нашу функцию с столбцу "purpose".
# результат работы функции поместим в новый столбец "purpose_category"

df['purpose_category'] = df['purpose'].apply(categorise_purpose)

# [▴](#head)

In [None]:
def calculate_total_price(count, price): 
    total = count * price 
    if total > 1000: 
        total -= total * 0.05 
    return total

items_list = [
    [3, 100.0],
    [2, 501.0],
    [10, 40]
]

for item in items_list:
    print(calculate_total_price(item[0], item[1])) 

# [▴](#head)

In [None]:
def func(x, y):
    if z > y:
        return 'First'
    elif x < y:
        return 'Second'
    else: 
        return 'Equal'

# [▴](#head)

<a id='function_02'></a>
<div class="alert alert-info">
    <h3>Поиск значений усов коробки с усами</h3>
</div>

In [None]:
def whisker_find(df_ser):
    dict_from_desc = df_ser.describe().to_dict()
    bottom_whisker = dict_from_desc['25%'] - ((dict_from_desc['75%'] - dict_from_desc['25%']) * 1.5)
    top_whisker = dict_from_desc['75%'] + ((dict_from_desc['75%'] - dict_from_desc['25%']) * 1.5)
    if bottom_whisker < dict_from_desc['min']:
        bottom_whisker = dict_from_desc['min']
    return round(bottom_whisker, 2), round(top_whisker, 2)

print(whisker_find(df['colname']))

# [▴](#head)

<a id='lambda_function'></a>
<div style="border:solid orange 2px; padding: 40px">
    <h1><p style="text-align: center;">Lambda функции</p></h1>
</div>

Лямбда-функции — функции, которые создаются в одну строку. После ключевого слова `lambda` указывают две части лямбда-функции:
перед двоеточием: аргумент, который получит функция;
после двоеточия: инструкция, которую функция выполнит.


`lambda <аргумент>: <инструкция>`

<a id='lambda_function_01'></a>
<div class="alert alert-info">
    <h3>Пример</h3>
</div>

In [None]:
# обычная
def func(p, f, S, L): 
    return S * (1 + p / f) ** (f * L) - S

# Lambda
func = lambda p, f, S, L: S * (1 + p / f) ** (f * L) - S

In [None]:
def func(x):
    return x + 1

func = lambda x: x + 1

In [None]:
def func(x, y): 
    return x + y

func = lambda x, y: x + y 

In [None]:
my_list = [(1, 1), (2, 0), (3, 4), (1, -1), (2, 2)]
print(sorted(my_list, key=lambda x: x[1]))

In [None]:
my_list = [0, 0, -1, -2, -3, 4, 3, 2, 5] 
print(list(map(lambda x: abs(x), my_list)))

In [None]:
my_list = [1, 2, 3, 4, 5]
print(list(map(lambda x: x**2, my_list)))
for item in map(lambda x: x ** 2, my_list):
    print(item, end=' ')

In [None]:
a = [1, 2, 3, 4, 5]
b = [6, 7, 8, 9, 10]
print(list(map(lambda x, y: x * y, a, b)), "- Перемножение списков")
print(list(map(lambda x, y: x + y, a, b)), "- Пересложение списков")

In [None]:
my_list = [0, 0, -1, -2, -3, 4, 3, 2, 5]
print(list(filter(lambda x: x<=0, my_list)))

In [None]:
movies_table_sorted = sorted(movies_table, key=lambda row: row[5])

# [▴](#head)

<a id='list_comprehension'></a>
<div style="border:solid orange 2px; padding: 40px">
    <h1><p style="text-align: center;">Генераторы списков</p></h1>
</div>

In [None]:
x = [k ** 2 for k in range(2, 12, 3)] # Расшифровывается как: Для каждого К от 2 до 12 c шагом 3, вернуть K**2 
x = [k ** 2 for k in range(2, 12, 3) if k != 8] # Для каждого К от 2 до 12 с шагом 3, вернуть К**2 если K!=8
x = (k ** 2 for k in range(2, 12, 3)) # Если использовать круглые скобки, то X = <class 'generator'>

In [None]:
print([line.split(': ') for line in s1.split('\n') if line])

In [None]:
print("\n".join([" ".join(line.split(': ')) for line in s2.split('\n') if line]))

In [None]:
list = [x for x in range(1, 21) if x > 1 and all(x % i != 0 for i in range(2, x))]

# [▴](#head)

<a id='unpack_list'></a>
<div style="border:solid orange 2px; padding: 40px">
    <h1><p style="text-align: center;">Распаковка списков</p></h1>
</div>

In [None]:
my_list = ["А", 2, None]
x, y, z = my_list

In [None]:
x, y = (1, "а")

In [None]:
for index, value in enumerate(my_list):
    print(index, value)

<a id='plt'></a>
<div style="border:solid orange 2px; padding: 40px">
    <h1><p style="text-align: center;">Диаграммы и графики</p></h1>
</div>

<a id='plt_01'></a>
<div class="alert alert-info">
    <h3>Heatmap для матрицы корреляции</h3>
</div>

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

plt.figure(figsize=(12,10))
corr_matrix = sns.heatmap(df.corr(), 
                          annot=True, 
                          vmin=-1, vmax=1, center=0, 
                          cmap='seismic', # или coolwarm https://matplotlib.org/stable/gallery/color/colormap_reference.html
                          mask=(np.tri(len(df.corr())).T),
                          linewidths=1,
                          linecolor='grey')

corr_matrix.set_title("Корреляционная матрица", fontsize=16)

# Маски:
# mask = np.triu(df.corr())
# mask = np.tril(df.corr())

<a id='plt_02'></a>
<div class="alert alert-info">
    <h3>Seaborn Pairplot</h3>
</div>

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

plt.figure(figsize=(5,5))
sns.pairplot(df)
plt.show()

# [▴](#head)