## Кортежи (tuples) - продовження

* **Це впорядковані колекції об'єктів будь-яких типів**

Подібно рядкам і спискам, кортежи є колекціями об'єктів впорядкованих за позиціями. Подібно спискм можуть включати об'єкти будь-яких типів.

* **Забезпечують доступ до елементів за зсувом**

Подібно рядкам і спискам, підтримують всі операції, які основані на використанні зсуву, тобто індексування і отримання зрізу.

* **Відносяться до категорії незмінних послідовностей**

Подібно рядкам, є незмінними об'єктами, тому не підтримують жодних операцій безпосередніх змін, які застосовуються до рядків. 

* **Мають фіксовану довжину, гетерогенні і підтримують довільну кількість рівнів вкладеності**

У зв'язку з тим, що є незмінними об'єктами, неможливо змінити довжину кортежу, без створення його копії. З іншого боку, кортежи можуть мати інші складові об'єкти (списки, словники і інші кортежи, тобто підтримують довільне число рівнів вкладеності.

* **Массиви посилань на об'єкти**

Подібно рядкам, простіше уявити кортежи у якості масивів посилань на об'єкти, - кортежи мають посилання на інші об'єкти, а операція індексування над кортежами виконується дуже швидко.

`()` - пустий кортеж

`T = (0,)` - кортеж `T` із одного элементу (не виразу)

`T = (0, 'Ni', 1.2, [3, 4])` - кортеж із чотирьох елементів

`T = tuple('spam')` - створення кортежу із ітерованого об'єкту 

`T = T1 + T2`, `T * 3` - конкатенація, повторення 

`T.index('Ni)` - пошук елементу

`T.count('Ni)` - підрахунок входжень до кортежу `T`

In [None]:
(0, 'Ni', 1.2, [3, 4])

In [None]:
T = tuple('spam')
T

In [None]:
T * 3

## Кортежи в дії

In [None]:
T = (1, 2, 3, 4)
K = T[0], T[1:3]  # індексування і отримання зрізу
K                 # новый кортеж
                  # Чому кортеж? () - що зміниться ?

### Особливості синтаксису у визначенні кортежів: крапки і круглі дужки 

Оскільки круглі дужки можуть використовуватися до визначення виразу, необхідно надати інтерпретатору додаткову інформацію, що єдиний об'єкт в круглих дужках це кортеж, але не вираз. 

Кортеж з єдиним елементом необхідно визначається комою після цього елементу перед закриттям круглої дужки

In [None]:
x = (90)  # ціле число
x

In [None]:
y = (90,)  # кортеж, який має ціле число
y

Інтерпретатор дозволяє опускати дужки у випадку синтаксичної однозначності конструкції кортежу, тобто коли кортеж створюється простим переліченням деяких елементів, розділених комами. За цією операцією присвоювання інтерпретатор розпізнає, що це кортеж навіть при відсутності круглих дужок. 

In [None]:
x = 1, 2, 3, 4
type(x)

> Виключення круглі **дужки є обов'язковими**, – при **передачі кортежів функціям у вигляді літералів** (тобто ці дужки є важливими, тому що відбувається передача параметрів)

### Перетворення, методи і незмінність 

Незважаючи на відмінності синтаксису літералів операції, що виконуються над кортежами є аналогічними операціям, що застосовуються до рядків і списків. Єдина розбіжність у тому, що операції  `+`, `*` і отримання зрізу при застосуванні до кортежів повертають нові кортежі, і у відмінність до рідків, списків і словників, кортежи мають скорочений набір методів. 
Наприклад: сортування змісту кортежу здійснюється перетворенням до списку (об'єкту, що може бути змінений з доступом до методу сортування, або функції сортування - `sorted`).

In [None]:
T = ('аа', "бб", "вв", "гг", "дд")
tmp = list(T)
tmp.sort()
tmp

In [None]:
T[0] = "ааа"       # не може змінюватися - кортеж
tmp[0] = "ааа"     # може змінюватися - список
tmp                # проаналізувати результат

In [None]:
T = tuple(tmp)
T

In [None]:
sorted(T)  # застосування функції - sorted

Методи:

* `index`

* `count`

In [None]:
T = (1, 2, 3, 2, 4, 2)
T.index(0)              # Проаналізувати результат. Помилка...- чому?

In [None]:
T.index(2, 3, len(T))  # аргументи: value, [start, [stop]

In [None]:
T.count(2)

>**Правило незмінності застосовується лише до самого кортежу, але не до об'єктів із яких він створений**.

Наприклад: список в середині кортежу змінюється, як звичайний список, з правильним встановленням індексації елементів списку.

In [21]:
T = (1, [2, 3], 4)

In [None]:
T[1] = "спам"      # проаналізувати результат

In [None]:
T[1][0] = "спам"
T

### Навіщо потрібні кортежи, якщо є списки?

**Незмінність кортежів** забезпечує **підтримку цілосності складових елементів** – можна бути впевненим, що кортеж не буде зміннеий за допомогою іншого посилання із іншого місця програми, чого не можна сказати про списки. 

Таким чином кортежи, мают сенс у якості констант, хоча в Python це визначення пов'язане з об'єктами, але не змінними, як в інших мовах програмування.   

Існує ситуація, коли кортежи можуть використовуватися, але списки - ні: **в якості ключів словника**.

## Файли

Вбудована функція **`open`** створює об'єкт файлу, який забезпечує зв'язок з файлом розташованим в комп'ютері. ПІсля виклику функції `open` можна виконувати операції читання і запису до зовнішнього файду, використовуючи методи отриманого об'єкту 

`open` - відкриття файлу, атрибути `r`, `w`, `b`

`input = open('filename', 'r')` - відкриття для читання
`output = open('filename', 'w')` -  відкриття для запису

**Методи**:

* `input.read()` - **читання файлу у цілому до єдиного рядка**

* `input.read(N)` - **читання наступних N символів (або байтів) до рядка**

* `input.readline()` - **читання наступного текстового рядка (включаючи символ кінця рядка) до рядка**

* `input.readlines()` - **читання файлу до списку рядків (включаючи символ кінця рядка)**

* `output.write(somestring)` - **запис рядка символів (або байтів) до файлу**

* `output.writelines(somelist)` - **запис всіх рядків із спску до файлу**

* `output.close()` - **закриття файлу вручну (виконується до закінчення роботи з файлом)**

* `output.flush()` - **виштовхує вихідні буфери даних на диск, файл залишається відкритим**

* `anyFile.seek(N)` - **змінює поточну позицію в файлі для наступної операції, зсувом її на N байтів від початку**

### ВІдкриття файлів

> Щоб відкрити файл, програма повинна викликати функцію `open`, і передати її і'мя зовнішнього файлу і режим роботи.

Як правило, у якост ірежиму використовується рядок : 
* `'r'` – коли файл відкривається для читання (за замовчуванням),
* `'w'` – коли файл відкривається для запису
* `'a'` – коли файл відкривається для запису в кінець файлу.

У рядку режиму можуть вказуватися і інші параметри:
* Додавання символу  `b` в рядок режиму визначає роботу з бінарними даними 
* Додавання символу `+` в рядок режиму визначає, що файл відкривається до читання і для запису, тобто надається можливість ситати і записувати дані в один і той же файл.

Функція може приймати третій необов'язковий аргумент, що керує **буферизацією даних, що виводяться**, – значення нуль означає, що вихідна інформація не буде буферизуватися (тобто вона буде записуватися до зовнішнього файлу відразу, в момент виклику методу запису). І'мя зовнішнього файлу може включати  префикси, що залежать від платформи, абсолютного або відносного шляху до файлу. Якщо шлях до файлу не вказано, припускається, що він знаходиться в поточному робочому каталозі (тотбто каталозі, де було запущено сценарій).

### Використання файлів

* **Для читання краще за все використовувати ітератори файлів**

Файли мають ітератор, який автоматично читає інформацію із файлу рядок за рядком у контексті циклу `for`, у генераторах списків і в інших ітераційних контекстах

`for line in open('data'): 
    do smth`

* **Зміст файлів знаходится в рядках, але не в об'єктах**

Дані, що получаються із файлу, завжди попадають до сценарію у вигляді рядка, тому необхідно буде виконувати перетвореня даних до інших типів об'єктів мови Python, якщо існуюча форма представлення даних не підходить. Крім того, до складу Python входять додаткові стандартні бібліотечні інструменти, призначені для работи з універсальним об'єктом сховища даних (наприклад, модуль `pickle`) і обробки упакованих двоїчних даних у файлах (наприклад, модуль `struct`)

* **Виклик методу `close` є  необов'язковим**

Виклик методу `close` розриває зв'язок із зовнішнім файлом. Інтерпретатор Python відразу звільнює пам'ять, яку мав об'єкт, як тільки в програмі буде втрачена останнє посилання на цей об'єкт. Як тільки об'єкт файлу звільняється,  
інтерпретатор автоматично закрыває асоційований з  ним файл (що відбувається також у  момент завершення програми).

Завдяки цьому механізму немає необхідності закривати файл вручну, особливо в невеличких сценаріях, які виконуються в короткий термін часу.

>**З іншого  боку метод виклику `close` не зашкодить і його рекомендується використовувати в крупних сстемах**

* **Файли забезпечують буферізацію вводу-виводу і дозволяють виконувати позиціонування в файлі**

За замовчуванням вивід до файлів завжди виконується за допомогою проміжних буферів, тото в момент запису тексту до файлу він не попадає відразу на диск – буфери виштовхують на диск лише в момент закриття файлу або пр виклику методу `flush`.

Існує можливість відкючення механізму буферізації за допомогою додаткових параметрів функції `open`, але наслідком може бути втрата продуктивності операацій вводу виводу. Файли в мові Python підтримують можливість позиціонування – метод `seek` дозволяє сценаріям керувати позицією читання і запису. 

## Робота з файлами 

У першому прикладі здійснюється відкриття нового текстового файлу в режимі для запису, до нього записується два рядка  (які завершуються символом нового рядка `\n`), після чего файл закриваеться.

Далі, цей файл відкривається в режимі для читання і виконується читання рядків із нього. Зверніть увагу, що третій виклик методу `readline` повертає пустий рядок – у такий спосіб методи файлів мови Python повідомляють про те, що був досягнутий кінець файлу.

> `readline` повертає пустий рядок коли досягнутий кінець файлу (пустий рядок в файлі повертається як рядок, який містить єдиний символ нового рядка, але не як дійсно пустий рядок)

In [None]:
myfile = open('./examples/myfile.txt', 'w') # відкриває файл (створює/очищає)
myfile.write('Привіт текстовий файл - правило хорошего тону\n')
# write записує рядок тексту і повертає кількість записаних символів

In [None]:
myfile.write('До побаченя текстовий файл - правило хорошего тону\n')

In [85]:
myfile.close() # ввиштовхує вихідні буфери даних до диску 

In [86]:
myfile = open('./examples/myfile.txt') # відриває файл myfile.txt, 'r' - за замовчуванням 

In [None]:
myfile.readline() # читає рядок

In [None]:
myfile.readline() # читає рядок

In [None]:
myfile.readline() # пустий рядок - конець файлу

In [None]:
open('./examples//myfile.txt').read() # прочитати файл повнітю до рядка 

In [None]:
# краще використовувати ітератор 
for line in open('./examples//myfile.txt'):
    print(line, end='')

### Текстові і бінарні файли в Python 

* Зміст **текстових файлів** представляється у вигляді звичайних рядків типу **`str`**, виконується автоматичне  кодування/декодування символів Юнікоду і за замовчуванням відбувається інтерпретація символів конця рядків 


* Зміст **бінарних файлів** представляється у вигляді рядків типу **`bytes`**, і вони передаються програмі без будь-яких змін

Коли виконується операція читання бінарних даних із файлу, вона повертає об'єкт типу `bytes`  – послідовність коротких
цілих чисел, що представляють абсолютні значення байтів (які можуть відповідати символам), який може нагадувати звичайний рядок 

In [93]:
with open('./examples/data.bin', 'wb') as f:
    f.write(b'\x00\x00\x00\x07spam\x00\x08')

In [None]:
with open('./examples/data.bin', 'rb') as f:
    data = f.read()
    
data

In [None]:
data[4:8]  # представляється як звичайний рядок

In [None]:
data[4:8][0]  # але, у дійсності має записаними 8-бітні цілі числа. Яке число?

In [None]:
bin(data[4:8][0])

Крім того, **бінарні файли не виконують перетворення символів кінця рядка** – текстові файли за замовчуванням відображають всі різновиди символів конця рядка до символу `\n` у процесі запису і читання, та здійснють перетворення символів Юнікоду у відповідності до вказаного кодування.

### Зберігання і інтерпретація об'єктів Python у файлах

**Дані завжди записуються до файлу у вигляді рядків**, а методи запису не виконують автоматичного форматування рядків

In [106]:
X, Y, Z = 43, 44, 45
S = 'Spam'
D = {'a': 1, 'b': 2}
L = [1, 2, 3]

In [107]:
F = open('./examples/datafile.txt', 'w')     # Створює файл для запису
F.write(S + '\n')                 # Рядки завершуються символом \n
F.write('%s,%s,%s\n' % (X, Y, Z)) # Перетворює числа в рядки 
F.write(str(L) + '$' + str(D) + '\n') # Перетворює і розділяє символом $
F.close()

In [None]:
chars = open('./examples/datafile.txt').read()
chars

In [None]:
print(chars)

Щоб перетворити список і словник в третьому рядку файлу, можна скористатися вбудованою функцією `eval`, яка  **інтерпретує рядок як програмний код мови Python** (формально – рядок, змістом якого є вираз мови Python)

In [None]:
line = chars.split('\n')[2]
line

In [None]:
objects = [eval(P) for P in line.split('$')]
objects

### Зберігання об'єктів Python за допомогою модуля  `pickle`

Функція `eval`, що застосована у вищенаведеному прикладі для перетворення рядків в об'єкти, уявляє собою дуже потужний інструмент обробки інформації. Функція **`eval` без додаткових інструкцій виконає будь-який вираз мови Python**, навіть, якщо в результаті будуть видалені всі файли на комп'ютері, за умови якщо передати відповідні права доступу!

Якщо у дійсності необхідно виявляти об'єкти Python із файлів, але не можна довіряти джерелу (постачальнику інформації) цих файлів, ідеальним рішенням буде використання модуля **`pickle`**, що знаходиться в складі стандартної бібліотеки библиотеки Python.

Модуль `pickle` дозволяє зберігати в  файлах практично будь-які об'єкти Python

In [1]:
D = {'a': 1, 'b': 2}

F = open('./examples/datafile.pkl', 'wb')
import pickle
pickle.dump(D, F)  # Модуль pickle записує до файлу будь-який об'єкт
F.close()

In [None]:
F = open('./examples/datafile.pkl', 'rb')
E = pickle.load(F) # Завантажує будь-які об'єкти із файлу 
E

Модуль `pickle` виконує те, що має назву **серіалізація об'єктів**, – перетворення об'єктів до рядка байтів і навпаки, без вимагання жодних додаткових дій.

У дійсності внутрішня реалізація модуля `pickle` виконала перетворення нашого словника до рядка, при цьому це перетворення не було бачимим при виконанні команд

In [None]:
open('./examples/datafile.pkl', 'rb').read()

Модуль **`shelve`** – інструмент, який використовує модуль `pickle` для зберігання об'єктів Python у файлах з доступом по ключу 

### Зберігання і інтерпретація упакованих бінарних даних в файлах