# Глава 4. Введение в типы объектов языка Python

Данные в языке Python представлены в форме **объектов** - области памяти со значениями и ассоциированными с ними наборами операций.

Программы можно разложить на составляющие:

Программы -> модули -> инструкции -> выражения (выражения создают и обрабатывают объекты)

## Базовые типы данных

| **Тип объекта** | **Пример литерала/создания** |
| --- | --- |
| Числа | `1234`, `3.1415`, `3+4j`, `Decimal`, `Fraction` |
| Строки | `'spam'`, `"guido's"` , `b'a\x01c'` |
| Списки | `[1, [2, 'three'], 4]` |
| Словари | `{'food': 'spam', 'taste': 'yum'}` |
| Кортежи (tuples) | `(1, 'spam', 4, 'U')` |
| Файлы | `myfile = open('eggs', 'r')` |
| Множества (set) | `set('abc')`, `{'a', 'b', 'c'}` |
| Прочие базовые типы | Сами типы, `None`, логические значения |
| Типы структурных элементов программ | Модули, функции, классы |
| Типы, имеющие отношение к реализации | Компилированный программный код, стек вызовов |

Но это далеко не полный список, потому что объектами являются все данные, которые приходится обрабатывать в  программах (сокеты, шаблоны и т.д.)

В Python используется **динамическая типизация** (типы данных определяются автоматически и их не требуется объявлять в программном коде).
Но при этом он является языком со **строгой типизацией** (вы сможете
выполнять над объектом только те операции, которые применимы к его типу).

### Числа

Базовый набор объектов языка Python включает в себя вполне ожидаемые типы:

* целые числа (числа без дробной части),


* вещественные числа (грубо говоря, числа с десятичной точкой)


* и более экзотические типы
    * комплексные числа с  мнимой частью,
    * числа с фиксированной точностью,
    * рациональные числа, представленные парой целых чисел, – числитель и знаменатель дроби,
    * и множества.

## Строки

**Строки** - тип данных, используемый для записи текстовой информации, а также произвольной последовательности байтов.

Строки - один из примеров **последовательностей** - упорядоченных коллекций других объектов в языке Python.

> Переменная создается в тот момент, когда ей присваивается значение, при этом переменной можно присвоить значение любого типа

Индексация в обратном порядке - отрицательные индексы:

формально они просто складываются с длиной строки `S[-1]` эквивалентно `S[len(S)-1]`

>**Строки неизменяемы**

### Методы, специфичные для типа строк

* `find` - поиск подстроки в строке (возвращает индекс или -1)


* `replace` - глобальный поиск с заменой


* `split` - разбитие строки по символу


* `strip` - отсечение пробельных символов

При использовании этих методов, мы не изменяем оригинальную строку, а создаем новую, т.к. строки являются неизменяемыми.

> Функция **help** - помощь по какому-либо объекту, методу

In [1]:
help(str.replace)

Help on method_descriptor:

replace(...)
    S.replace(old, new[, count]) -> str
    
    Return a copy of S with all occurrences of substring
    old replaced by new.  If the optional argument count is
    given, only the first count occurrences are replaced.



Поиск по шаблону - модуль **re**

In [2]:
import re
match = re.match('Hello[ \t]*(.*)world', 'Hello  Python world')
match.group(1)

'Python '

## Списки

**Списки** – это самое общее представление последовательностей, реализованных в языке Python.

Списки – это упорядоченные по местоположению коллекции объектов произвольных типов, размер которых не ограничен. 

Кроме того, в отличие от строк, списки являются изменяемыми – они могут модифицироваться как с помощью операций присваивания по смещениям, так и  с помощью разнообразных методов работы со списками.

### Методы, специфичные для типа списков

Списки являются аналогом массивов в других языках, но обладают более широкими возможностями (**не ограничены одним типом элементов, размер не ограничен**)

* `append` - добавление в конец нового элемента


* `pop` - удаляет и возвращает элемент с определенной позиции


* `insert` - вставить элемент в определенную позицию


* `remove` - удаление первого элемента с заданным значением

Т.к. **списки изменяемые**, большинство их методов не создают новый список, а изменяют оригинальный.

In [3]:
a = [1, 2, 3, 2]
a.remove(2)
a

[1, 3, 2]

### Генераторы списков (list comprehension)

In [4]:
[c * 2 for c in 'spam']

['ss', 'pp', 'aa', 'mm']

Генераторы списков можно применять к любым типам, являющимся последовательностями

Фактически с помощью подобных выражений-генераторов можно создавать списки, множества и словари

In [5]:
[ord(x) for x in 'spaam']

[115, 112, 97, 97, 109]

In [6]:
{ord(x) for x in 'spaam'}

{97, 109, 112, 115}

In [7]:
{x: ord(x) for x in 'spaam'}

{'s': 115, 'p': 112, 'a': 97, 'm': 109}

**Итераторы** - круглые скобки

In [8]:
G = (sum(row) for row in [[1, 2], [3, 4]])

In [9]:
next(G)

3

In [10]:
next(G)

7

In [11]:
next(G)

StopIteration: 

## Словари

**Словари** - это отображения - коллекции объектов, доступ к которым осуществляется по ключам

In [12]:
D = {'food': 'Spam', 'quantity': 4, 'color': 'pink'}
D['food']

'Spam'

In [13]:
D['quantity'] += 1
D

{'food': 'Spam', 'quantity': 5, 'color': 'pink'}

## Освобождение памяти

> В языке Python память освобождается автоматически, когда теряется последняя ссылка на объект, например в случае присваивания переменной
какого-либо другого значения

> `rec = 0 # Теперь память, занятая объектом, будет освобождена`

## Сортировка по ключам: циклы for

In [14]:
D = {'b': 2, 'a': 1, 'c': 3, 'd': 4}
D

{'b': 2, 'a': 1, 'c': 3, 'd': 4}

In [15]:
for key in sorted(D):
    print(key, '=>', D[key])

a => 1
b => 2
c => 3
d => 4


Цикл **`for`** является операцией над последовательностью, способен работать с любыми объектами, являющимися последовательностями (но также с некоторыми объектами, которые последовательностями не являются)

## Итерации и оптимизация

Цикл `for` и выражения-генераторы способны работать с любыми объектами, которые поддерживают идею **протокола итераций**, которая по сути подразумевает наличие в памяти последовательности или объекта, который генерирует по одному элементу за раз в контексте выполнения итерации.

Объект попадает в категорию итерируемых, если в  ответ на вызов встроенной функции `iter` (с этим объектом в качестве аргумента) возвращается объект, который позволяет перемещаться по его элементам с  помощью функции `next`. Генераторы списков, с  которыми мы познакомились выше, являются такими объектами.

Генераторы списков и родственные им инструменты функционального
программирования, такие как функции `map` и `filter`, обычно выполняются быстрее, чем цикл `for` (примерно раза в два), что особенно важно для программ, обрабатывающих большие объемы данных.

## Отсутствующие ключи: проверка с помощью оператора `if`

* `if`


* `elif`


* `else`

## Кортежи (tuples)

Кортежи являются **последовательностями** как списки, но они **неизменяемы**, как строки.

In [16]:
T = (1, 2, 3, 2)
T

(1, 2, 3, 2)

In [17]:
T + ('five', 6)

(1, 2, 3, 2, 'five', 6)

In [18]:
T.index(2)

1

In [19]:
T.count(2)

2

Т.к. кортежи неизменяемы, то они обеспечивают своего рода ограничение целостности, что может оказаться полезным в крупных программах

## Файлы

Объекты-файлы - это основной интерфейс между программным кодом на языке Python и внешними файлами на компьютере.

In [20]:
f = open('./exercises/2_4/data_hello.txt', 'w') # Создается новый файл для вывода

In [21]:
f.write('Hello\n') # Запись строки байтов в файл

6

In [22]:
f.write('world!\n') # В Python 3.0 возвращает количество записанных байтов

7

In [23]:
f.close() # Закрывает файл и выталкивает выходные буферы на диск

In [24]:
# содержимое файла
!cat ./exercises/2_4/data_hello.txt

Hello
world!


Cамый лучший на сегодняшний день способ чтения файлов
состоит в том, чтобы не читать его содержимое целиком – **файлы предоставляют итераторы**, которые обеспечивают автоматическое построчное чтение содержимого файла в циклах `for` и в других контекстах

In [25]:
# методы объекта файла
[i for i in dir(f) if not i.startswith('_')]

['buffer',
 'close',
 'closed',
 'detach',
 'encoding',
 'errors',
 'fileno',
 'flush',
 'isatty',
 'line_buffering',
 'mode',
 'name',
 'newlines',
 'read',
 'readable',
 'readline',
 'readlines',
 'seek',
 'seekable',
 'tell',
 'truncate',
 'writable',
 'write',
 'writelines']

**Содержимое текстовых файлов** представляется в виде **строк** и для них автоматически выполняется кодирование и  декодирование символов Юникода.

**Содержимое двоичных файлов** представляется в виде строк специального типа **bytes**, при этом никаких автоматических преобразований содержимого файлов не производится. 

## Другие базовые типы

**Множества (`set`)** - неупорядоченные коллекции уникальных и неизменяемых объектов. Не являются ни последовательностями, ни отображениями.

In [26]:
X = set('spam')
Y = {'h', 'a', 'm'}

In [27]:
X, Y

({'a', 'm', 'p', 's'}, {'a', 'h', 'm'})

In [28]:
X & Y  # Пересечение

{'a', 'm'}

In [29]:
X | Y  # Объединение

{'a', 'h', 'm', 'p', 's'}

In [30]:
X - Y  # Разность

{'p', 's'}

In [31]:
{x ** 2 for x in [1, 2, 3, 4]} # Генератор множеств

{1, 4, 9, 16}

**`decimal`** - вещественные числа с фиксированной точностью

**`fractions`** - рациональные числа (представленные дробью)

In [32]:
import decimal
d = decimal.Decimal('3.141')
d + 1

Decimal('4.141')

In [33]:
from fractions import Fraction
f = Fraction(2, 3)
f + 1

Fraction(5, 3)

* Логический тип данных **`True`** **`False`** (по сути обычные целые числа `0` и `1` с некоторыми особенностями отображения на экране


* **`None`**

In [34]:
type([1, 2])

list

In [35]:
type(list)

type

In [36]:
type(type([1, 2]))

type

## Классы, определяемые пользователем

In [37]:
class Worker:
    def __init__(self, name, pay):    # Инициализация при создании
        self.name = name              # self – это сам объект
        self.pay = pay
        
    def lastName(self):               # Разбить строку по символам пробела
        return self.name.split()[-1]
    
    def giveRaise(self, percent):     # Обновить сумму выплат
        self.pay *= (1.0 + percent)

Данный класс определяет новый тип объектов, которые обладают **атрибутами** `name` и `pay` (иногда атрибуты называют информацией о состоянии), а также двумя описаниями поведения, оформленными в виде функций (которые обычно называют **методами**).

Обращение к имени класса как к функции приводит к созданию экземпляра нового типа, а методы класса автоматически получают ссылку на текущий экземпляр, обрабатываемый этими методами (аргумент `self`)

>В  данном случае пользовательский класс `Worker` – это всего лишь коллекция, состоящая из строки и числа (`name` и `pay` соответственно), плюс функции, выполняющие обработку этих двух встроенных объектов.

In [38]:
bob = Worker('Bob Smith', 50000)

In [39]:
bob.lastName()

'Smith'