АТРИБУТЫ И МЕТОДЫ

Мы создали объект по пустому классу. Давайте добавим ему данные. Сделаем класс для отчётов по продажам SalesReport. Пусть у нас в компании есть менеджеры по продажам, которые заключают сделки, и мы хотим посчитать для них метрики общего объёма продаж.

In [23]:
# По-прежнему пока создаём пустой класс
class SalesReport():
    pass


# Создаём первый отчёт по продажам
report = SalesReport()

# Мы добавим новый атрибут объекту.
# Для этого через точку напишем имя атрибута и дальше как с обычной переменной
report.amount = 10 # type: ignore

# То же самое делаем для второго отчёта.
report_2 = SalesReport()
report_2.amount = 20 # type: ignore

# Создадим вспомогательную функцию, она будет печатать общую сумму из отчёта


def print_report(report):
    print("Total amount:", report.amount)


print_report(report)  # => Total amount: 10
print_report(report_2)  # => Total amount: 20


Total amount: 10
Total amount: 20


Для разных отчётов вывелись разные значения, хотя объекты создавались из одного класса. Функция print_report делает операцию над отчётом. Так как классы увязывают данные и действия над ними, положим print_report внутрь класса.

In [24]:
class SalesReport():
    # Наш новый метод внутри класса.
    # Мы определяем его похожим образом с обычными функциями,
    #   но только помещаем внутрь класса и первым аргументом передаём self
    def print_report(self):
        print("Total amount:", self.amount)


# Дальше мы применяем report так же, как и в примере выше
report = SalesReport()
report.amount = 10

report_2 = SalesReport()
report_2.amount = 20

# Используем наши новые методы
report.print_report()  # => Total amount: 10
report_2.print_report()  # => Total amount: 20


Total amount: 10
Total amount: 20


Мы определили метод внутри класса, и он стал доступен у всех экземпляров этого класса. 

Методы в целом похожи на обычные функции, но их ключевое отличие — доступ к самому объекту. 

В методе мы первым аргументом получаем self — в нашем случае это отчёт, что позволяет использовать атрибуты объекта внутри метода, как мы сделали с amount. Self передаётся автоматически. При вызове метода мы не передавали никакие аргументы.

Давайте для примера определим ещё пару методов:

In [25]:
class SalesReport():
    # Позволим добавлять много разных сделок
    def add_deal(self, amount):
        # На первой сделке создадим список для хранения всех сделок
        if not hasattr(self, 'deals'):
            self.deals = []
        # Добавим текущую сделку
        self.deals.append(amount)

    # Посчитаем сумму всех сделок
    def total_amount(self):
        return sum(self.deals)

    def print_report(self):
        print("Total sales:", self.total_amount())


# Используем наши новые возможности
# Добавим две сделки и распечатаем отчёт
report = SalesReport()
report.add_deal(10_000)
report.add_deal(30_000)
report.print_report()  # => Total sales: 40000


Total sales: 40000


Атрибут deals, определённый в одном методе, становится доступен сразу во всех методах класса. Через self становятся доступны и остальные методы, например print_report использует метод total_amount. Это позволяет компактно упаковывать логику внутри класса: внешнее использование становится гораздо лаконичнее

Задание 4.1

Допишите определение класса DepartmentReport, который выводит отчёт по отделам компании. У него должны быть определены:

свойство revenues — список, где мы храним значения выручки отделов;
метод add_revenue(), который добавляет выручку одного отдела в список revenues. Если списка revenues еще не существует, метод должен его создавать (проверку наличия атрибута можно выполнить с помощью встроенной функции hasattr());
метод average_revenue(), который возвращает среднюю выручку по всем отделам (считает среднее по списку revenues).

In [26]:
class DepartmentReport():

    def add_revenue(self, amount):
        """
        Метод для добавления выручки отдела в список revenues.
        Если атрибута revenues ещё не существует, метод должен создавать пустой список перед добавлением выручки.
        """
        # ваш код здесь
        if not hasattr(self, 'revenues'):
            self.revenues = []
        self.revenues.append(amount)

    def average_revenue(self):
        """
        Метод возвращает среднюю выручку по отделам.
        """
        # ваш код здесь
        return sum(self.revenues)/len(self.revenues)


МЕТОД _INIT_

Мы определили несколько методов в классе SalesReport. С ним есть пара проблем. 

Если мы вызовем total_amount до add_deal, то список сделок ещё не будет создан, и мы получим ошибку. Также проверка на наличие списка в методе add_deal не кажется оптимальным решением, потому что создать список нужно один раз, а проверять его наличие мы вынуждены на каждой сделке.

In [27]:
class SalesReport():
    def add_deal(self, amount):
        if not hasattr(self, 'deals'):
            self.deals = []
        self.deals.append(amount)

    def total_amount(self):
        return sum(self.deals)

    def print_report(self):
        print("Total sales:", self.total_amount())


report = SalesReport()
#report.total_amount()
# => AttributeError


Обе проблемы решились бы, если задавать атрибутам исходное значение. Для этого у классов есть метод инициализации __init__. Если мы определим метод с таким именем, код в нём вызовется при создании объекта.

In [28]:
class SalesReport():
    def __init__(self):
        self.deals = []

    def add_deal(self, amount):
        self.deals.append(amount)

    def total_amount(self):
        return sum(self.deals)

    def print_report(self):
        print("Total sales:", self.total_amount())


report = SalesReport()
print(report.deals)
# => []
report.total_amount()
# => 0


[]


0

При создании отчёта вызвался __init__, deals определился в нём пустым списком и проблемы ушли. 

__init__ — это технический метод, поэтому его имя начинается и заканчивается двумя подчёркиваниями. Он получает первым аргументом сам объект, в нём могут выполняться любые операции. Оставшиеся аргументы он получает из вызова при создании: если мы напишем report = SalesReport("Info", 20), то вторым и третьим аргументом в __init__ передадутся "Info" и 20.

In [29]:
class SalesReport():
    # Будем принимать в __init__ ещё и имя менеджера
    def __init__(self, manager_name):
        self.deals = []
        self.manager_name = manager_name

    def add_deal(self, amount):
        self.deals.append(amount)

    def total_amount(self):
        return sum(self.deals)

    def print_report(self):
        # И добавлять это имя в отчёт
        print("Manager:", self.manager_name)
        print("Total sales:", self.total_amount())


report = SalesReport("Ivan Taranov")
report.add_deal(10_000)
report.add_deal(30_000)
report.print_report()
# =>
# Manager: Ivan Taranov
# Total sales: 40000


Manager: Ivan Taranov
Total sales: 40000


Кроме __init__ у классов можно определить ряд технических методов, которые также называют магическими. Дело в том, что они не вызываются напрямую, но позволяют реализовать операции сложения object_1 + object_2 или сравнения object_1 > object_2. 

Они используются реже __init__, так что мы оставим их за скобками модуля. При желании полный список можно найти в документации.

Задание 4.2

Улучшите класс DepartmentReport, добавив в него инициализатор.

Класс при инициализации должен принимать переменную company_name и инициализировать её значением свойство company, а также инициализировать свойство revenues пустым списком.

Также модифицируйте метод average_revenue. Теперь он должен возвращать строку следующего вида "Average department revenue for <company_name>: <average_revenue>".

In [30]:
class DepartmentReport():

    def __init__(self, company_name):
        """
        Метод инициализации класса. 
        Создаёт атрибуты revenues и company
        """
        self.revenues = []
        self.company = company_name

    def add_revenue(self, amount):
        """
        Метод для добавления выручки отдела в список revenues.
        Если атрибута revenues ещё не существует, метод должен создавать пустой список перед добавлением выручки.
        """
        return self.revenues.append(amount)

    def average_revenue(self):
        """
        Вычисляет average_revenue — среднюю выручку по отделам — округляя до целого.
        Метод возвращает строку в формате:
        'Average department revenue for <company>: <average_revenue>'
        """
        average_revenue = round(sum(self.revenues)/len(self.revenues))
        return f'Average department revenue for {self.company}: {average_revenue}'


КРАТКОЕ РЕЗЮМЕ

✔️ Мы рассмотрели базовый синтаксис классов и синтаксис создания объектов. Давайте вспомним некоторые важные моменты:

атрибут объекта — это просто его переменная;
метод объекта — это его функция;
метод объекта автоматически получает первым аргументом сам объект под именем self;
класс описывает объект через его атрибуты и методы;
мы можем создавать множество экземпляров одного класса, и значения их атрибутов независимы друг от друга;
если определить метод __init__, то он будет выполняться при создании объекта;
всё это позволяет компактно увязывать данные и логику внутри объекта.
Чтобы продемонстрировать, что мы имеем в виду под компактностью, давайте добавим ещё метрик в отчёт. 

Допустим, теперь мы хотим получать средний размер сделки и список клиентов, из которого исключены повторения (в случае, если компания заключала несколько сделок с одним и тем же клиентом).

In [31]:
class SalesReport():
    def __init__(self, employee_name):
        self.deals = []
        self.employee_name = employee_name

    def add_deal(self, company, amount):
        self.deals.append({'company': company, 'amount': amount})

    def total_amount(self):
        return sum([deal['amount'] for deal in self.deals])

    def average_deal(self):
        return self.total_amount()/len(self.deals)

    def all_companies(self):
        return list(set([deal['company'] for deal in self.deals]))

    def print_report(self):
        print("Employee: ", self.employee_name)
        print("Total sales:", self.total_amount())
        print("Average sales:", self.average_deal())
        print("Companies:", self.all_companies())


report = SalesReport("Ivan Semenov")

report.add_deal("PepsiCo", 120_000)
report.add_deal("SkyEng", 250_000)
report.add_deal("PepsiCo", 20_000)

report.print_report()
# => Employee:  Ivan Semenov
# Total sales: 390000
# Average sales: 130000.0
# Companies: ['PepsiCo', 'SkyEng']


Employee:  Ivan Semenov
Total sales: 390000
Average sales: 130000.0
Companies: ['SkyEng', 'PepsiCo']


ОТСЛЕЖИВАНИЕ СОСТОЯНИЯ

Одно из классических предписаний для классов — у каждого из множества объектов есть некоторые меняющиеся состояния. 

Вернёмся к примеру: есть база клиентов с основной информацией; в реальном времени нам приходит информация о покупках. Запустим промокампанию, чтобы поощрить старых клиентов, которые сделали у нас много заказов, и выдать им скидку:

In [32]:
class Client():
    # Базовые данные
    def __init__(self, email, order_num, registration_year):
        self.email = email
        self.order_num = order_num
        self.registration_year = registration_year
        self.discount = 0

    # Оформление заказа
    def make_order(self, price):
        self.update_discount()
        self.order_num += 1
        # Здесь было бы оформление заказа, но мы просто выведем его цену
        discounted_price = price * (1 - self.discount)
        print(f"Order price for {self.email} is {discounted_price}")

    # Назначение скидки
    def update_discount(self):
        if self.registration_year < 2018 and self.order_num >= 5:
            self.discount = 0.1


# Применение

# Сделаем подобие базы
client_db = [
    Client("max@gmail.com", 2, 2019),
    Client("lova@yandex.ru", 10, 2015),
    Client("german@sberbank.ru", 4, 2017)
]


# Сгенерируем заказы
client_db[0].make_order(100)
# => Order price for max@gmail.com is 100

client_db[1].make_order(200)
# => Order price for lova@yandex.ru is 180.0

client_db[2].make_order(500)
# => Order price for german@sberbank.ru is 500

client_db[2].make_order(500)
# => Order price for german@sberbank.ru is 450.0


Order price for max@gmail.com is 100
Order price for lova@yandex.ru is 180.0
Order price for german@sberbank.ru is 500
Order price for german@sberbank.ru is 450.0


Задание 5.1

Мы разрабатываем приложение, которое подразумевает функционал авторизации пользователя, а также управление его балансом на некотором виртуальном счете.

Определите класс для пользователей User.

У него должны быть:

атрибуты email, password и balance, которые устанавливаются при инициализации в методе __init__();
метод login(), который реализует проверку почты и пароля. Метод должен принимать в качестве аргументов емайл (email) и пароль (password). Если они совпадают с атрибутами объекта, он возвращает True, а иначе — False;
метод update_balance(), который должен принимать в качестве аргумента amount некоторое число и изменять текущий баланс счёта (атрибут balance) на величину amount.

In [33]:
class User():
    def __init__(self, email, password, balance):
        self.email = email
        self.password = password
        self.balance = balance

    def login(self, email, password):
        return self.email == email and self.password == password

    def update_balance(self, amount):
        self.balance += amount


user = User("gosha@roskino.org", "qwerty", 20_000)
print(user.login("gosha@roskino.org", "qwerty123"))
# False
print(user.login("gosha@roskino.org", "qwerty"))
# True
user.update_balance(200)
user.update_balance(-500)
print(user.balance)
# 19700


False
True
19700


КОМБИНАЦИЯ ОПЕРАЦИЙ

Классы могут пригодиться, если вы регулярно делаете над данными одну и ту же последовательность разноплановых функций. Вы можете упаковать их в класс и в дальнейшем сразу получать результат по загруженным данным.

У нас есть численные данные из разных источников. Если они в виде строк, то нужно привести их к числам, а пропуски — заполнить значениями. Сделаем доступ к медиане, среднему значению и стандартному отклонению:

In [34]:
import statistics


class DataFrame():
    def __init__(self, column, fill_value=0):
        # Инициализируем атрибуты
        self.column = column
        self.fill_value = fill_value
        # Заполним пропуски
        self.fill_missed()
        # Конвертируем все элементы в числа
        self.to_float()

    def fill_missed(self):
        for i, value in enumerate(self.column):
            if value is None or value == '':
                self.column[i] = self.fill_value

    def to_float(self):
        self.column = [float(value) for value in self.column]

    def median(self):
        return statistics.median(self.column)

    def mean(self):
        return statistics.mean(self.column)

    def deviation(self):
        return statistics.stdev(self.column)


# Воспользуемся классом
df = DataFrame(["1", 17, 4, None, 8])

print(df.column)
# => [1.0, 17.0, 4.0, 0.0, 8.0]
print(df.deviation())
# => 6.89
print(df.median())
# => 4.0


[1.0, 17.0, 4.0, 0.0, 8.0]
6.892024376045111
4.0


Задание 5.2

Определите класс IntDataFrame, который в момент инициализации объектов принимает список неотрицательных чисел и приводит к целым значениям все числа в этом списке, отрезая дробную часть с помощью встроенной функции int().

Результирующий список должен быть сохранен в виде атрибута с именем column.

Также класс должен содержать следующие методы:

count(), который возвращает количество ненулевых элементов в списке column;
unique(), который возвращает число уникальных элементов в списке в списке column.

In [35]:
class IntDataFrame():
    def __init__(self, column):
        self.column = list(map(lambda x: int(x), column))  # type: ignore

    def count(self):
        return len(list(filter(lambda x: x != 0, self.column)))

    def unique(self):
        return len(set(self.column))


In [36]:
# Введите свое решение ниже
class IntDataFrame ():
    def __init__(self, column):
        self.column = [int(value) for value in column]

    def count(self):
        return len([i for i in self.column if i != 0])

    def unique(self):
        return len(set(self.column))


df = IntDataFrame([4.7, 4, 3, 0, 2.4, 0.3, 4])

print(df.column)
# [4, 4, 3, 0, 2, 0, 4]

print(df.count())
# 5

print(df.unique())
# 4


[4, 4, 3, 0, 2, 0, 4]
5
4


КЛАСС-ОБЁРТКА 

Классы можно использовать тогда, когда у вас есть процесс, который требует сложной конфигурации, повторяющейся из раза в раз. Можно написать класс-обёртку, который сведёт этот процесс к одному-двум методам.

Представим, вы делаете обработку данных и в конце каждого дня сохраняете результат в архив. Вы хотите, чтобы данные каждого дня лежали в отдельном файле для этого дня, при этом можно было бы получить данные за произвольный день. 

Перед запуском кода создайте папку с названием archive там же, где находится ноутбук:

import pickle
from datetime import datetime
from os import path


class Dumper():
    def __init__(self, archive_dir="archive/"):
        self.archive_dir = archive_dir

    def dump(self, data):
        # Библиотека pickle позволяет доставать и класть объекты в файл
        with open(self.get_file_name(), 'wb') as file:
            pickle.dump(data, file)

    def load_for_day(self, day):
        file_name = path.join(self.archive_dir, day + ".pkl")
        with open(file_name, 'rb') as file:
            sets = pickle.load(file)
        return sets

    # возвращает корректное имя для файла
    def get_file_name(self):
        today = datetime.now().strftime("%y-%m-%d")
        return path.join(self.archive_dir, today + ".pkl")


# Пример использования

data = {
    'perfomance': [10, 20, 10],
    'clients': {"Romashka": 10, "Vector": 34}
}


dumper = Dumper()

# Сохраним данные
dumper.dump(data)

# Восстановим для сегодняшней даты
file_name = datetime.now().strftime("%y-%m-%d")
restored_data = dumper.load_for_day(file_name)
print(restored_data)
# => {'perfomance': [10, 20, 10], 'clients': {'Romashka': 10, 'Vector': 34}}


Напишите класс сборщика технических сообщений OwnLogger.

У него должен быть

атрибут logs, содержащий {"info": None, "warning": None, "error": None, "all": None}.

метод log(message, level), который записывает сообщения. Здесь сообщение message может быть любым, а level — один из "info", "warning", "error".

метод show_last(level), где level может быть "info", "warning", "error", "all".

Для "all" он просто возвращает последнее добавленное сообщение, а для остальных — последнее поступившее сообщение соответствующего уровня. При этом по умолчанию значение именно "all".

Если подходящего сообщения нет, возвращает None.

В случае правильного описания класса код, приведённый ниже, должен выдать следующий результат:


logger = OwnLogger()

logger.log("System started", "info")

logger.show_last("error")

None

Некоторые интерпретаторы Python могут не выводить None, тогда в этой проверке у вас будет пустая строка

logger.log("Connection instable", "warning")

logger.log("Connection lost", "error")

logger.show_last()

Connection lost

logger.show_last("info")

System started

In [37]:
class OwnLogger ():
    def __init__(self):
        self.logs = {"info": None, "warning": None, "error": None, "all": None}

    def log(self, message, level='all'):
        self.logs[level] = message
        self.logs['all'] = message

    def show_last(self, level='all'):
        print(self.logs[level])


logger = OwnLogger()
# print(logger.logs)

logger.log("System started", "info")
# print(logger.logs)

logger.show_last("error")

logger.log("Connection instable", "warning")
# print(logger.logs)

logger.log("Connection lost", "error")
# print(logger.logs)

logger.show_last()

logger.show_last("info")


None
Connection lost
System started


ИМПОРТ И ОРГАНИЗАЦИЯ КОДА

Классы, как и библиотечные функции, можно импортировать в другие программы. Для этого нужно положить класс в отдельный файл в корне проекта и использовать ключевое слово import. 

Например, если мы положим Dumper в файл dumper.py в корне проекта, то его можно импортировать командой:

 from dumper import Dumper  
Пишем from <имя файла без .py> import <имя класса>. Имя файла должно начинаться с буквы и не совпадать с именами библиотечных модулей. Если файлов с классами много, их можно складывать в папки, предварительно положив туда пустой файл __init__.py — это требование Python.

Сгруппируем классы из примеров в папке helpers. Структура файлов:

helpers

-- __init__.py

-- dumper.py

-- data_frame.py

-- client.py

Импортируем, соединяя все шаги через точку с помощью того же синтаксиса, что использовался для импорта библиотечных функций.

In [38]:
from helpers.dumper import Dumper
from helpers.data_frame import DataFrame
from helpers.client import Client


Определите класс Dog, у которого есть методы bark и give_paw. При этом, пусть методы принимают список из любого количества аргументов.

bark возвращает строку "Bark!"
give_paw возвращает строку "Paw"

In [39]:
class Dog():
    def bark(*args):
        return 'Bark!'

    def give_paw(*args):
        return 'Paw'


print(Dog().bark(['Лайка', 'Бим']))


Bark!


Применение ООП для работы с файлами

Чтобы поработать с путями, есть модуль os. Функция os.chdir() позволяет нам изменить директорию, которую мы в данный момент используем. Если вам нужно знать, какой путь вы в данный момент используете, для этого нужно вызвать os.getcwd().

In [40]:
import os


In [41]:
# получить текущий путь
start_path = os.getcwd()
print(start_path)


/Users/anastasialodakova/Desktop/Миша учеба/sf_data_science/PYTHON-15. Принципы ООП в Python и отладка кода


С помощью функции os.listdir() можно получить весь список файлов, находящихся в директории. Если не указать никаких аргументов, то будет взята текущая директория.

In [42]:
# ['SnapchatLoader', 'FBLoader', 'tmp.py', '.gitignore', 'venv', '.git']
print(os.listdir())

if 'tmp.py' not in os.listdir():
    print("Файл отсутствует в данной директории")


['names.txt', 'numbers.txt', '.DS_Store', 'Class.ipynb', 'input.txt', 'test.txt', 'helpers', 'output.txt']
Файл отсутствует в данной директории


Для того чтобы склеивать пути с учётом особенностей ОС, следует использовать функцию os.path.join(). Это связано с тем, что в разных операционных системах могут быть разные разделители каталогов, например в ОС Windows этим разделителем является «\», а в Linux — «/», как мы и говорили в начале юнита. Поэтому, чтобы поиск файла проходил гладко в обеих системах (ведь ваш скрипт могут запускать на любой системе в связи с кросс-платформенностью Python), лучше всё-таки использовать os.path.join().

In [43]:
# соединяет пути с учётом особенностей операционной системы
print(start_path)
print(os.path.join(start_path, 'test'))

# /home/nbuser/library
# /home/nbuser/library/test


/Users/anastasialodakova/Desktop/Миша учеба/sf_data_science/PYTHON-15. Принципы ООП в Python и отладка кода
/Users/anastasialodakova/Desktop/Миша учеба/sf_data_science/PYTHON-15. Принципы ООП в Python и отладка кода/test


Задание 7.3

Задание на самопроверку.

Сделайте функцию, которая принимает от пользователя путь и выводит всю информацию о содержимом этой папки. Для реализации используйте функцию встроенного модуля os.walk(). Если путь не указан, то сравнение начинается с текущей директории.



In [44]:
import os


def Dir_walk(path=os.getcwd()):
    for root, dirs, files in os.walk(path):
        print("Текущая директория", root)
        print("---")

        if dirs:
            print("Список папок", dirs)
        else:
            print("Папок нет")
        print("---")

        if files:
            print("Список файлов", files)
        else:
            print("Файлов нет")
        print("---")

        if files and dirs:
            print("Все пути:")
        for f in files:
            print("Файл ", os.path.join(root, f))
        for d in dirs:
            print("Папка ", os.path.join(root, d))
        print("===")


Dir_walk()


Текущая директория /Users/anastasialodakova/Desktop/Миша учеба/sf_data_science/PYTHON-15. Принципы ООП в Python и отладка кода
---
Список папок ['helpers']
---
Список файлов ['names.txt', 'numbers.txt', '.DS_Store', 'Class.ipynb', 'input.txt', 'test.txt', 'output.txt']
---
Все пути:
Файл  /Users/anastasialodakova/Desktop/Миша учеба/sf_data_science/PYTHON-15. Принципы ООП в Python и отладка кода/names.txt
Файл  /Users/anastasialodakova/Desktop/Миша учеба/sf_data_science/PYTHON-15. Принципы ООП в Python и отладка кода/numbers.txt
Файл  /Users/anastasialodakova/Desktop/Миша учеба/sf_data_science/PYTHON-15. Принципы ООП в Python и отладка кода/.DS_Store
Файл  /Users/anastasialodakova/Desktop/Миша учеба/sf_data_science/PYTHON-15. Принципы ООП в Python и отладка кода/Class.ipynb
Файл  /Users/anastasialodakova/Desktop/Миша учеба/sf_data_science/PYTHON-15. Принципы ООП в Python и отладка кода/input.txt
Файл  /Users/anastasialodakova/Desktop/Миша учеба/sf_data_science/PYTHON-15. Принципы ООП в 

РАБОТА С ФАЙЛАМИ

Python «из коробки» располагает достаточно широким набором инструментов для работы с файлами. Для того чтобы начать работать с файлом, надо его открыть с помощью команды специальной функции open.

f = open('path/to/file', 'filemode', encoding='utf8')

Результатом этой операции будет файл, в котором указатель текущей позиции поставлен на начало или конец файла.

Перед тем, как мы начнём разбирать аргументы, хотелось бы заранее отметить, что указателем называется скорее метка, которая указывает на определённое место в файле. Указателей в классическом понимании программиста, как, например, в C или C++ в Python нет!

Давайте по порядку разберём все аргументы:

path/to/file — путь к файлу может быть относительным или абсолютным. Можно указывать в Unix-стиле (path/to/file) или в Windows-стиле (path\to\file).

filemode — режим, в котором файл нужно открывать.

Записывается в виде строки, может принимать следующие значения:

r — открыть на чтение (по умолчанию);

w — перезаписать и открыть на запись (если файла нет, то он создастся);

x — создать и открыть на запись (если уже есть — исключение);

a — открыть на дозапись (указатель будет поставлен в конец);

t — открыть в текстовом виде (по умолчанию);

b — открыть в бинарном виде.

encoding — указание, в какой кодировке файл записан (utf8, cp1251 и т. д.) По умолчанию стоит utf-8. При этом можно записывать кодировку как через дефис, так и без: utf-8 или utf8.

Открытие файла на запись является блокирующей операцией, то есть она останавливает работу нашей программы до того, пока файл не откроется.

Теперь давайте поговорим про то, как записывать какую-либо информацию в файл.

При открытии файла внутри него ставится указатель текущей позиции для чтения. При открытии в режиме чтения ('r') или записи ('w') указатель ставится на начало, в режиме 'a' (добавление новых записей в конец файла) — в конец.

Откроем файл на запись и с помощью метода write запишем в него строку. В качестве результата метод write возвращает количество записанных символов.

In [45]:
f = open('test.txt', 'w', encoding='utf8')

# Запишем в файл строку
f.write("This is a test string\n")
f.write("This is a new string\n")


21

После вызова команды write ваши данные не сразу попадут и сохранятся в файл. Связано это с особенностями внутренней работы операционных систем. Если для вас критично своевременное попадание информации на жесткий диск компьютера, то после записи вызывайте f.flush() или закрывайте файл. Закрыть файл можно с помощью метода close().

In [46]:
# обязательно нужно закрыть файл иначе он будет заблокирован ОС
f.close()


In [47]:
f = open('test.txt', 'r', encoding='utf8')


f.read(n) — операция, читающая с текущего места n символов, если файл открыт в t режиме, или n байт, если файл открыт в b режиме, и возвращающая прочитанную информацию.

In [48]:
print(f.read(10))  # This is a


This is a 


После прочтения указатель на содержимое остается на той позиции, где чтение закончилось. Если n не указать, будет прочитано «от печки», то есть от текущего места указателя и до самого конца файла.

In [49]:
# считали остаток файла
f.read()  # test string\nThis is a new string\n


'test string\nThis is a new string\n'

In [50]:
# обязательно закрываем файл
f.close()


ЧТЕНИЕ И ЗАПИСЬ ПОСТРОЧНО

Зачастую с файлами удобнее работать построчно, поэтому для этого есть отдельные методы:

writelines — записывает список строк в файл;

readline — считывает из файла одну строку и возвращает её;

readlines — считывает из файла все строки в список и возвращает их.

Метод f.writelines(sequence) не будет сам за вас дописывать символ конца строки ('\n'), поэтому при необходимости его нужно прописать вручную.

In [51]:
f = open('test.txt', 'a', encoding='utf8')  # открываем файл на дозапись

sequence = ["other string\n", "123\n", "test test\n"]
# берет строки из sequence и записывает в файл (без переносов)
f.writelines(sequence)

f.close()


In [52]:
f = open('test.txt', 'r', encoding='utf8')

print(f.readlines())  # считывает все строки в список и возвращает список

f.close()


['This is a test string\n', 'This is a new string\n', 'other string\n', '123\n', 'test test\n']


Метод f.readline() возвращает строку (символы от текущей позиции до символа переноса строки \n, который остаётся в конце строки и опускается только в последней строке файла, если файл не заканчивается новой строкой):

In [53]:
f = open('test.txt', 'r', encoding='utf8')

print(f.readline())  # This is a test string
print(f.read(4))  # This
print(f.readline())  # is a new string

f.close()


This is a test string

This
 is a new string



ФАЙЛ КАК ИТЕРАТОР

Объект файл является итератором, поэтому его можно использовать в цикле for.

?
Для чего это нужно?

Итераторы представляют собой такой объект, который вычисляет какие-то действия на каждом шаге, а не все сразу. На примере файла это выглядит примерно так. Предположим, у вас есть огромный текстовый файл, который весит несколько гигабайт. Если попытаться разом считать его полностью с помощью f.readlines(), то он будет загружен в вашу программу, в то время как переменная, в которую будет записан файл, станет весить столько же, сколько и объём считанного файла.

В большинстве задач с обработкой текста он весь сразу не нужен, поэтому мы можем, например, считывать его построчно, обрабатывать строку и забывать из нашей программы, чтобы считать новую. Тогда весь файл огромного объема не будет «висеть» в памяти компьютера.

Не стоит считывать файл полностью — в большинстве задач с обработкой текста весь файл разом читать не требуется. В таком случае с файлом работают построчно.

In [54]:
f = open('test.txt')  # можно перечислять строки в файле
for line in f:
    print(line, end='')

# This is a test string
# This is a new string
# other string
# 123
# test test

f.close()


This is a test string
This is a new string
other string
123
test test


In [55]:
# В блоке менеджера контекста открытый файл «жив» и с ним можно работать, при выходе из блока - файл закрывается.
with open("test.txt", 'rb') as f:
    a = f.read(10)
    b = f.read(23)
print(a)
print(b)
print(f)
# f.read(3) # Error!


b'This is a '
b'test string\nThis is a n'
<_io.BufferedReader name='test.txt'>


Тело менеджера контекста определяется одним отступом вправо относительно отступов ключевого слова with. Менеджер контекста неявно вызывает закрытие файла после работы, что освобождает вас от забот о том, закрыли ли вы файл или нет. Закрытие файла происходит при любом стечении обстоятельств, даже если внутри with будет ошибка. 

Задание 7.4

Задание на самопроверку.

Создайте любой файл на операционной системе под название input.txt и построчно перепишите его в файл output.txt.

In [56]:
with open('input.txt', 'w') as inpt:
    inpt.write('line1\n')
    inpt.writelines('line2\n')
with open('input.txt', 'r') as inpt:
    for l in inpt:
        print(l, end='')

with open('input.txt', 'r') as inpt:
    with open('output.txt', 'w') as outpt:
        for line in inpt:
            outpt.write(line)

with open('output.txt', 'r') as outpt:
    for l in outpt:
        print(l, end='')


line1
line2
line1
line2


Задание 7.5

Задание на самопроверку.

Дан файл numbers.txt, компоненты которого являются действительными числами (файл создайте самостоятельно и заполните любыми числам, в одной строке одно число). Найдите сумму наибольшего и наименьшего из значений и запишите результат в файл output.txt.

In [57]:
import random


with open('numbers.txt', 'w') as numbers:
    for n in range(20):
        numbers.write(str(random.random()) + '\n')

with open('numbers.txt') as f:
    min_ = max_ = float(f.readline())  # считали первое число
    for line in f:
        num = float(line)
        if num > max_:
            max_ = num
        elif num < min_:
            min_ = num

    sum_ = min_ + max_

with open('output.txt', 'w') as f:
    f.write(str(sum_))
    f.write('\n')


Задание 7.6

Задание на самопроверку.

В текстовый файл построчно записаны фамилии и имена учащихся класса и их оценки за контрольную. Подсчитайте количество учащихся, чья оценка меньше 3 баллов. Cодержание файла:

Иванов О. 4
Петров И. 3
Дмитриев Н. 2
Смирнова О. 4
Керченских В. 5
Котов Д. 2
Бирюкова Н. 1
Данилов П. 3
Аранских В. 5
Лемонов Ю. 2
Олегова К. 4

In [58]:
with open('names.txt', 'w') as names:
    names.writelines('Иванов О. 4\n'
                     'Петров И. 3\n'
                     'Дмитриев Н. 2\n'
                     'Смирнова О. 4\n'
                     'Керченских В. 5\n'
                     'Котов Д. 2\n'
                     'Бирюкова Н. 1\n'
                     'Данилов П. 3\n'
                     'Аранских В. 5\n'
                     'Лемонов Ю. 2\n'
                     'Олегова К. 4\n'
                     )

with open('names.txt', 'r') as f:
    d = {}
    s = {}
    for line in f:
        key = line[:-3]
        value = int(line[-2])
        d[key] = value
        if value < 3:
            s[key] = value
    print(len(s))
    print(d)
    print(s)

count = 0
for line in open("names.txt"):
    points = int(line.split()[-1])
    if points < 3:
        count += 1

print(count)


4
{'Иванов О.': 4, 'Петров И.': 3, 'Дмитриев Н.': 2, 'Смирнова О.': 4, 'Керченских В.': 5, 'Котов Д.': 2, 'Бирюкова Н.': 1, 'Данилов П.': 3, 'Аранских В.': 5, 'Лемонов Ю.': 2, 'Олегова К.': 4}
{'Дмитриев Н.': 2, 'Котов Д.': 2, 'Бирюкова Н.': 1, 'Лемонов Ю.': 2}
4


Задание 7.7

Задание на самопроверку.

Выполните реверсирование строк файла (перестановку строк файла в обратном порядке).

In [59]:
with open("input.txt", "r") as input_file:
    with open("output.txt", "w") as output_file:
        for line in reversed(input_file.readlines()):
            output_file.write(line)


Давайте кратко подведём итоги:

Исключения — это ошибки, которые выбрасываются при неправильной работе программы, и останавливают её выполнение, если они не обработаны.
Конструкция try-except выглядит следующим образом и служит для обработки исключений:

try:

    *код, который может вызвать ту или иную ошибку*

except *ошибка*:

    *код, который выполнится в случае возникновения ошибки*

else:

    *код, который выполнится только в случае если в try ничего не сломалось*

finally:

    *код, который выполнится по любому*
    
Блоки finally и else являются не обязательными, но могут быть использованы для вашего удобства. Код из блока finally выполняется в любом случае, независимо от исхода в блоках try-except. Код из блока else выполняется только в случае успешного выполнения кода в try.
Выбрасывать ошибки можно и по своему желанию с помощью конструкции raise *Тип ошибки* (сообщение, которое нужно вывести в консоль).

Задание 8.7

Задание на самопроверку.

Создать скрипт, который будет в input() принимать строки, и их необходимо будет конвертировать в числа, добавить try-except на то, чтобы строки могли быть сконвертированы в числа.

В случае удачного выполнения скрипта написать: «Вы ввели <введённое число>».

В конце скрипта обязательно написать: «Выход из программы».

ПРИМЕЧАНИЕ: Для отлова ошибок используйте try-except, а также блоки finally и else.



In [6]:
try:
    age = int(input("Сколько тебе лет?"))

    if age > 100 or age <= 0:
        raise ValueError("Тебе не может быть столько лет")

    # Возраст выводится только если пользователь ввёл правильный возраст.
    print(f"Тебе {age} лет!")
except ValueError:
    print("Неправильный возраст")

Тебе 67 лет!


In [11]:
try:
    a = float(input('Введите число: '))
except ValueError:
    print('Вы ввели не число!')
else:
    print('Вы ввели: ', a)
finally:
    print('Выход из программы')

Вы ввели:  4545.0
Выход из программы


BaseException
 +-- SystemExit
 +-- KeyboardInterrupt
 +-- GeneratorExit
 +-- Exception
  	+-- StopIteration
  	+-- StopAsyncIteration
  	+-- ArithmeticError
  	|	FloatingPointError
  	|	OverflowError
  	|	ZeroDivisionError
  	+-- AssertionError
  	+-- AttributeError
  	+-- BufferError
  	+-- EOFError
  	+-- ImportError
  	|	+-- ModuleNotFoundError
  	+-- LookupError
  	|	+-- IndexError
  	|	+-- KeyError
  	+-- MemoryError
  	+-- NameError
  	|	+-- UnboundLocalError
  	+-- OSError
  	|	+-- BlockingIOError
  	|	+-- ChildProcessError
  	|	+-- ConnectionError
  	|	|	+-- BrokenPipeError
  	|	|	+-- ConnectionAbortedError
  	|	|	+-- ConnectionRefusedError
  	|	|	+-- ConnectionResetError
  	|	+-- FileExistsError
  	|	+-- FileNotFoundError
  	|	+-- InterruptedError
  	|	+-- IsADirectoryError
  	|	+-- NotADirectoryError
  	|	+-- PermissionError
  	|	+-- ProcessLookupError
  	|	+-- TimeoutError
  	+-- ReferenceError
  	+-- RuntimeError
  	|	+-- NotImplementedError
  	|	+-- RecursionError
  	+-- SyntaxError
  	|	+-- IndentationError
  	|     	+-- TabError
  	+-- SystemError
  	+-- TypeError
  	+-- ValueError
  	|	+-- UnicodeError
  	|     	+-- UnicodeDecodeError
  	|     	+-- UnicodeEncodeError
  	|     	+-- UnicodeTranslateError
  	+-- Warning
       	+-- DeprecationWarning
       	+-- PendingDeprecationWarning
       	+-- RuntimeWarning
       	+-- SyntaxWarning
       	+-- UserWarning
       	+-- FutureWarning
       	+-- ImportWarning
       	+-- UnicodeWarning
       	+-- BytesWarning
       	+-- ResourceWarning

Классы +-- SystemExit +-- KeyboardInterrupt +-- GeneratorExit являются исключениями, которые нельзя поймать, поскольку их возникновение не зависит от выполнения программы. А все, что наследуются от Exception, можно отловить и обработать (хорошенько так). Однако некоторые из них возникают очень редко.

Главное здесь — понять, что «ловить» в блоке except можно не только сам класс, но и его родителя, например:

try:
    raise ZeroDivisionError  # возбуждаем исключение ZeroDivisionError
except ArithmeticError:  # ловим его родителя
    print("Hello from arithmetic error")
Результат:

Hello from arithmetic error
Такой способ отлова будет работать прекрасно. Но делать так не стоит, потому что вы рискуете упустить детали. С другой стороны, порой даже на больших проектах можно встретить что-то подобное:

# пример из реального проекта
try:
    *код которые мог вызывать ошибку*
except Exception:
    pass

Действуя от обратного, однако, надо быть осторожным. Если, например, надо поймать несколько исключений, то идти следует вверх по дереву.

Например:

try:
    raise ZeroDivisionError
except ArithmeticError:
    print("Arithmetic error")
except ZeroDivisionError:
    print("Zero division error")
Здесь результатом работы программы будет вывод на экран:

Arithmetic error

Принцип написания и отлова собственного исключения следующий:

class MyException(Exception):  # создаём пустой класс исключения 
    pass

 
try:
    raise MyException("message")  # поднимаем наше исключение
except MyException as e:  # ловим его
    print(e)  # выводим информацию об исключении

Давайте теперь попробуем построить собственные исключения с наследованием:

class ParentException(Exception):  # создаём пустой класс исключения, наследуемся от exception
    pass

 
class ChildException(ParentException):  # создаём пустой класс исключения-потомка, наследуемся от ParentException
    pass

 
try:
    raise ChildException("message")  # поднимаем исключение-потомок
except ParentException as e:  # ловим его родителя
    print(e)  # выводим информацию об исключении


class ParentException(Exception):
    def __init__(self, message, error):  # допишем к нашему пустому классу конструктор, который будет печатать дополнительно в консоль информацию об ошибке.
        super().__init__(message)  # помним про вызов конструктора родительского класса
        print(f"Errors: {error}")  # печатаем ошибку

 
class ChildException(ParentException): # создаём пустой класс исключения-потомка, наследуемся от ParentException
    def __init__(self, message, error):
        super().__init__(message, error)
 
 
try:
    raise ChildException("message", "error")  # поднимаем исключение-потомок, передаём дополнительный аргумент
except ParentException as e:
    print(e)  # выводим информацию об исключении

    

В консоли мы увидим следующее:

Errors: error

message

Сначала мы увидим то, что напишет нам конструктор родительского класса, а потом уже —сообщение об ошибке.

Давайте подведём итоги:

Исключения — это такие особенные классы, которые, как и любые классы, можно наследовать. Если вы хотите ловить несколько исключений, то сначала ловите потомков, а потом родителей, чтобы ничего не упустить.

Чтобы создать собственный класс, нужно просто написать пустой класс и наследовать его от класса Exception, этого будет достаточно.

Необязательно «отлавливать» сам класс. При необходимости можно отлавливать его родителя, это тоже будет работать, но вы можете упустить важную информацию.

Задание 9.5

Задание на самопроверку.

Создайте класс Square. Добавьте в конструктор класса Square собственное исключение NonPositiveDigitException, унаследованное от ValueError, которое будет срабатывать каждый раз, когда сторона квадрата меньше или равна 0.

In [15]:
class NonPositiveDigitException(ValueError):
    pass
class Square:
    def _init_ (self, side):
        if side <= 0:
            raise NonPositiveDigitException('Неправильно указана сторона квадрата')