## Коспектик

**%%timeit** - это "магическая" команда Jupyter, которая замеряет время выполнения. Она не является частью Python. Запустите эту ячейку

### Операции с множествами:
* Объединение (| или .union()): Кто есть хотя бы в одной группе? Все уникальные сотрудники.
* Пересечение (& или .intersection()): Кто есть в обеих группах одновременно? Те, кто и разработчик, и аналитик.
* Разность (- или .difference()): Кто есть в первой группе, но не во второй? Только разработчики.
* Симметричная разность (^ или .symmetric_difference()): Кто состоит только в одной из групп (но не в обеих сразу)?

Основные коды форматирования (кирпичики для шаблона):
* %d — день месяца (01, 02, ..., 31)
* %m — месяц в виде числа (01, 02, ..., 12)
* %Y — год из четырех цифр (e.g., 2024)
* %y — год из двух цифр (e.g., 24)
* %H — час в 24-часовом формате (00, ..., 23)
* %M — минута (00, ..., 59)
* %S — секунда (00, ..., 59)

In [4]:
#strptime - строку в формат даты
#strftime  - дату в строку

import datetime

date_string_1 = "25/12/2024"

# Парсим первую строку
# Шаблон "%d/%m/%Y" точно соответствует формату "день/месяц/год"
date_obj_1 = datetime.datetime.strptime(date_string_1, "%d/%m/%Y")
print(f"Строка: '{date_string_1}'")
print(f"Объект datetime: {date_obj_1}")
print(f"Год из объекта: {date_obj_1.year}\n")


Строка: '25/12/2024'
Объект datetime: 2024-12-25 00:00:00
Год из объекта: 2024



## Домашнее задание к Лекции №3

### Задача 1: Частотный словарь

In [53]:
text = "Это просто пример! Просто очень простой пример текста для примера."
text = (text.lower())
znaki = [".", ",", "!", "?"]
text = (text.lower())
for znak in znaki:
  
    text = text.replace(znak, "")
    
sp_txt = text.split()
type(sp_txt)
d_txt = {}
for d in sp_txt:
    d_txt[d] = d_txt.get(d, 0) + 1
print(d_txt)


{'это': 1, 'просто': 2, 'пример': 2, 'очень': 1, 'простой': 1, 'текста': 1, 'для': 1, 'примера': 1}


In [57]:
def count_word_frequency(text):
    text = (text.lower())
    znaki = [".", ",", "!", "?"]
    text = (text.lower())
    for znak in znaki:
        text = text.replace(znak, "")
        
    sp_txt = text.split()
    type(sp_txt)
    d_txt = {}
    for d in sp_txt:
        d_txt[d] = d_txt.get(d, 0) + 1
    return d_txt
    

In [58]:
count_word_frequency("Это просто пример! Просто очень простой пример текста для примера.")

{'это': 1,
 'просто': 2,
 'пример': 2,
 'очень': 1,
 'простой': 1,
 'текста': 1,
 'для': 1,
 'примера': 1}

### Задача 2: Гибкий калькулятор скидок 

In [81]:
def calculate_price(price, discount=0, tax_rate=0.2):
    """ discount - размер скидки, %
    tax_rate - налог 20%, в долях = 0,2
    price - изначальная цена товара
    """
    if discount > 0:
        discount = discount / 100 # считаем долю скидки
        price =price - (price * discount) * tax_rate
        return price
    else:
        price = price - (price * tax_rate)
        return price

In [82]:
calculate_price(10)

8.0

In [83]:
calculate_price(10, 23)

9.54

### Задача 3: Анализатор лог-файла

In [104]:
def analyze_log(file_path):
    """
    Анализирует лог-файл и возвращает статистику по уровням логирования и временной диапазон.
    
    Args:
        file_path (str): Путь к файлу лога
        
    Returns:
        dict: Словарь с количеством логов по уровням и временным диапазоном
    """
    try:
        with open(file_path, 'r') as f:
            lines = f.readlines()
    except FileNotFoundError: 
        return "Файл не найден"
        
    # Обрабатываем каждую строку файла
    counts = {'INFO': 0, 'WARNING': 0, 'ERROR': 0}
    min_time = None
    max_time = None
    for line in lines:
        line = line.strip()
        # Пропускаем пустые строки
        if not line:
            continue
            
        try:
            parts = line.split(',', 2)
            
            # Проверяем, что строка содержит все три обязательные части
            if len(parts) != 3:
                continue
            date_str, level, message = parts

            date_str = date_str.strip()
            level = level.strip()
            message = message.strip()
            log_time = datetime.datetime.strptime(date_str, '%Y-%m-%d %H:%M:%S')
            # Обновляем счетчик для соответствующего уровня
            if level in counts:
                counts[level] += 1
            else:
                # Если встретился неизвестный уровень, добавляем его в счетчик
                counts[level] = 1
            # Обновляем минимальное и максимальное время
            if min_time is None or log_time < min_time:
                min_time = log_time
            if max_time is None or log_time > max_time:
                max_time = log_time
        except (ValueError, IndexError):
            # Пропускаем строки с некорректным форматом
            # ValueError - при ошибке парсинга даты
            # IndexError - при обращении к несуществующему индексу массива
            continue
    # Формируем результат
    result = {
        'counts': counts,
        'time_range': (None, None)  # Значения по умолчанию
    }
    # Если нашли корректные временные метки, преобразуем их обратно в строки
    if min_time and max_time:
        result['time_range'] = (
            min_time.strftime('%Y-%m-%d %H:%M:%S'),
            max_time.strftime('%Y-%m-%d %H:%M:%S')
        )
    
    return result

In [105]:
analyze_log("/home/mariika/misis_course/.ipynb_checkpoints/log.txt")

 'time_range': ('2024-03-15 10:05:01', '2024-03-15 10:07:00')}

In [91]:
clean_shopping_list = []
with open("/home/mariika/misis_course/.ipynb_checkpoints/log.txt") as f:
    for line in f:
        clean_line = line.strip() # Убираем пробелы и символы переноса по краям
        print(f"Исходная строка: {repr(line)}, Очищенная строка: '{clean_line}'")
        clean_shopping_list.append(clean_line)

Исходная строка: "2024-03-15 10:05:01, INFO, User 'admin' logged in. \n", Очищенная строка: '2024-03-15 10:05:01, INFO, User 'admin' logged in.'
Исходная строка: 'invalid line format.\n', Очищенная строка: 'invalid line format.'
Исходная строка: '2024-03-15 10:06:10,ERROR,Failed to connect to database. \n', Очищенная строка: '2024-03-15 10:06:10,ERROR,Failed to connect to database.'
Исходная строка: "2024-03-15 10:07:00,INFO,User 'guest' viewed the main page.", Очищенная строка: '2024-03-15 10:07:00,INFO,User 'guest' viewed the main page.'


In [92]:
print("\nИтоговый чистый список:")
print(clean_shopping_list)


Итоговый чистый список:
