# РОЗДІЛ 5. РОБОТА З ФАЙЛАМИ

## 5.1. Введення інформації у файл

Поки програма виконується її дані зберігаються в пам'яті (Random Access Memory (RAM)). Коли програма завершується або комп'ютер вимикають, дані з пам'яті зникають. Щоб зберігати дані постійно, необхідно помістити їх в файл. Файли зазвичай зберігають на жорсткому диску або носії.

Коли є велика кількість файлів, їх часто організовують в директорії (папки). Кожен файл розпізнається за унікальним ім'ям або по комбінації імені файлу та імені директорії.

Читаючи і записуючи файли, програми можуть обмінюватися інформацією одна з одною і створювати придатні для друку формати, подібні PDF.

Робота з файлами в чомусь подібна роботі з книгами. Щоб прочитати книгу необхідно її відкрити. Коли прочитано необхідне - закрити. Поки книга відкрита, можна або її читати або в неї записувати. В обох випадках відомо, в якому місці книги знаходитесь. Більшу частину часу книга читається по порядку, але також можна пропустити якусь частину.

Все це також відноситься до файлів. Щоб відкрити файл необхідно вказати його ім'я і визначити необхідно його читати або записати в нього якусь інформацію.


Операція відкриття файлу створює файловий об'єкт.

$$
\textbf{fileobj = open(filename, mode)}
$$

Тут
- $fileobj$ - це об'єкт файлу, що повертається функцією *open()*;
- $filename$ - це рядок, що представляє собою ім'я файлу;
- $mode$ - це рядок, який вказує на тип файлу і дії, які необхідно над ним зробити.

Перша літера рядка $mode$ вказує на операцію:

$r$ - Читання;

$w$ - Запис (якщо файлу не існує, він буде створений. Якщо файл існує, він буде перезаписаний);

$x$ - Запис, але тільки якщо файлу ще не існує;

$a$ - Додавання даних в кінець файлу, якщо він існує.

Друга літера рядка $mode$ вказує на тип файлу:

$t$ (або нічого) - означає, що файл текстовий;

$b$ -  означає, що файл бінарний.

Після відкриття файлу викликаються функції для читання або запису даних.

І по завершенню потрібно закрити файл. Текстові файли - файли які містять друковані символи і пробіли, згруповані в рядки, які відокремлені один від одного символами нового рядка. Оскільки Python спеціально створений для оброблення текстових файлів, він надає методи, які роблять таку роботу простою.

In [1]:
week_days = '''Monday,
Tuesday,
Wednesday,
Thursday,
Friday,
Saturday,
Sunday'''

print(len(week_days))

62


Функція *write()* - записує звичайний рядок в файл. Якщо в якості параметра вказано Unicode-рядок, то проводиться спроба перетворити його в звичайний рядок. Так як за замовчуванням використовується кодування ASCII, спроба перетворити Unicode-рядок (що містить українські/російські літери) в звичайний рядок призведе до генерації винятку UnicodeEncodeError.

In [2]:
f = open('file.txt', 'wt')
f.write(week_days)
f.close()

Функція *write()* повертає число записаних байтів. Вона не додає ніяких пробілів або символів нового рядка, як це робить функція *print()*. За допомогою функції *print()* також можна записувати дані в текстовий файл:

In [3]:
f = open('file.txt', 'wt')
print(week_days, file=f)
f.close()

За замовчуванням функція *print()* додає пробіл після кожного аргументу і символ нового рядка в кінці. Для того щоб функція *print()* працювала як функція *write()*, треба передати їй два наступних аргументи:

- sep (роздільник, за замовчуванням це пробіл, ' ');
- end (символ кінця файлу, за замовчуванням це символ нового рядка, '\n').

Функція *print()* використовує значення за замовчуванням, якщо тільки не передати їй щось інше.

In [4]:
f = open('file.txt', 'wt')
print(week_days, file=f, sep='', end='')
f.close()

## 5.2. Зчитування даних з файлу

Щоб повністю зчитати весь файл можна використати функцію *read()* без аргументів. Проте, потрібно мати на увазі, що файл розміром 1 Гбайт споживає 1 Гбайт пам'яті:

In [5]:
f = open('file.txt', 'rt')
days = f.read()
print(days)
f.close()

Monday,
Tuesday,
Wednesday,
Thursday,
Friday,
Saturday,
Sunday


Можна вказати максимальну кількість символів, яку функція *read()* поверне за один виклик.

In [6]:
f = open('file.txt', 'rt')
days = f.read(20)
print(days)
f.close()

Monday,
Tuesday,
Wed


Після того як було зчитано весь файл, подальші виклики функції *read()* повертатимуть порожній рядок ('').

Також можна зчитувати файл по одному рядку за раз за допомогою функції *readline()*.

In [7]:
f = open('file.txt', 'rt')
print(f.readline())
f.close()

Monday,



Для текстового файлу навіть порожній рядок має довжину, рівну $1$ (символ нового рядка), такий рядок буде вважатися $True$. Коли весь файл буде зчитано, функція *readline()* (як і функція *read()*) поверне порожній рядок, який буде розцінено як $False$.

Найпростіший спосіб зчитати текстовий файл - використати ітератор, що буде повертати по одному рядку за раз.

In [9]:
f = open('file.txt', 'rt')
for line in f:
    print(line)
f.close()

Monday,

Tuesday,

Wednesday,

Thursday,

Friday,

Saturday,

Sunday


**Автоматичне закриття файлу**

Якщо забути закрити файл після роботи над ним, його закриє Python після того, як буде видалено останнє посилання на нього. Це означає, що, якщо відкрити файл і не закрити його явно, він буде закритий автоматично по завершенні функції. Але можна відкрити файл всередині довгої функції або навіть основного розділу програми. Файл повинен бути закритий, щоб всі операції, що залишилися та записи були завершені.

У Python є менеджери контексту для очищення об'єктів на зразок відкритих файлів. Можна використовувати конструкцію:

$$
\textbf{with вираз as змінна}
$$

In [11]:
with open('file.txt', 'wt') as f:
    f.write(week_days)

Після того як блок коду, розташований під менеджером контексту (в цьому випадку один рядок), завершиться (або нормально, або шляхом генерації виключення), файл буде закритий автоматично.

## Завдання на комп'ютерний практикум

1. З клавіатури вводиться текстовий рядок. Розробити програму, яка реалізує вказані дії.	

а)	підраховує кількість слів, які мають непарну довжину;

б)	виводить на екран частоту входження кожної літери;

в)	видаляє текст, що розміщено в круглих дужках.

## Питання для самоконтролю

1. Робота з файлами в Python.
2. Відкриття файлу.
3. Закриття файлу.
4. Читання з файлу та запис у файл.
5. Додаткові дії для файлів.
6. Модуль path.
7. Опишіть наявні в Python функції роботи з файлами і методи файлових об'єктів.