# P419 01 Типы данных

Автор: Шабанов Павел Александрович

Email: pa.shabanov@gmail.com

URL: 
+ [Типы данных с сайта Programiz.com](https://www.programiz.com/python-programming/variables-datatypes)

**Дата последнего обновления: 07.10.2018**

### Цель: 

+ ознакомиться с синтаксисом операций для стандартных типов данных;

+ показать особенности синтаксиса в python при выполнении математических операций.

<a id='up'></a>
### План

1. [Типы данных](#datatypes)

2. [Переменные](#variables)
    + [правила имен переменных](#var_names);
    + [ключевые слова](#keywords)
    + [встроенные функции или идентификаторы](#built_in).
    
3. [Инициализация разных типов данных](#init_data)
    + [числа](#numbers);
    + [строки](#strings);
    + [булевы переменные](#bools).

4. [Заключение](#end)

<a id="datatypes"></a>
## Типы данных
[Вверх](#up)

Тип данных - это характеристика объекта, позволяющая определить его возможности взаимодействия с другими объектами. Обычно типов данных в языке немного, ведь типы являются кирпичиками, из которых конструируется код. Необходим баланс между действительно базовыми и специальными, полезными для решения каких-либо конкретных задач, типами данных.

Типичные примеры типов данных в процедурном программировании являются:

+ числа (целые, действительные, комплексные);

+ символы (строки);

+ булевы выражения или переменные (Истина/Ложь);

Более сложные типы данных, такие как последовательности, также могут иметь свой тип данных. Набор типов данных зависит от конкретного языка программирования.

В python, как в языке поддерживающим ООП, все "определённые" типы данных являются классами. Соответственно, ничто не мешает, используя классы, создать свой тип данных. Однако это требуется не так часто, тем более, что создать действительно удобный и полезный новый тип данных сложно.

В большинстве случаев, особенно при обучении основам языка, встроенных типов данных более чем достаточно.

Вот неполный список типов данных python:

+ **число**:
    + целые - **int**;
    + действительные - **float**;
    + комплексные - **complex**.
+ **строка**:
    + обычная строка - **str**;
    + r-строка (raw string) - **r'some_string'**;
+ **булевы переменные** - **bool**;
    + True
    + False

===========================================

+ **последовательность**:
    + упорядоченная:
        + список - **list**;
        + кортеж - **tuple**;
    + неупорядоченная:
        + множество - **set**.
+ **отображение**:
    + словарь - **dict**;
+ **функция** - **function**;
+ **файл** - **file**.

Узнать тип данных объекта можно с помощью встроенной функции `type()`.

In [7]:
# Числа
x = 123 # целое
y = -20.5 # действительное
z = complex(1, 2) # комплексное или 1 + 2j

# генератор списка (использован для удобства)
print('\nЧисла:')
[print(type(g), end='') for g in [x, y, z]]
# Строки
s1 = 'C: \n users' # строка
s2 = r'C: \n users' # r-строка
print('\nСтроки:')
# генератор списка (использован для удобства)
[print(type(g), end='') for g in [s1, s1]]

print('\nБулевы переменные:')
# Булевые переменные
a, b = True, False # булева переменная (Истина)
c = [print(type(g), end='') for g in [a, b]]


Числа:
<class 'int'><class 'float'><class 'complex'>
Строки:
<class 'str'><class 'str'>
Булевы переменные:
<class 'bool'><class 'bool'>

In [8]:
print(s1)
print(s2)


C: 
 users
C: \n users


<a id="variables"></a>
## Переменные

<a id="var_names"></a>
### Переменные и их имена
[Вверх](#up)

Основная работа при кодировании алгоритма - это создание различных переменных и отношений между ними (конструкции-контейнеры в виде ветвления, циклов, функций и др.). В python в переменных хранятся не сами данные (числа, строки, булевы выражения и др.), а ссылка на них. Это очень важно сразу усвоить! Переменная в python похожа на ярлык на коробке, но не является коробкой. Ярлык должен быть понятен читающему его человеку. Поэтому в больших программах не стоит использовать такие имена переменных как **a122** или "gf34" и т.д. 

**Переменная** - это имя, состоящее из букв, символов и цифр. Однако существуют ограничения как на состав имени, так и на порядок символов в имени.

<a id='keywords'></a>
### Ключевые слова. Keywords
[Вверх](#up)

Именем переменной не может быть ключевое слово. Вот список **зарезервированных ключевых слов**.
	
> and , as , assert , break , class , continue , def , del , elif , else , except , exec , finally , for , from , global , if , import , in , is , lambda , not , or , pass , print , raise , return , try , while , with , yield

[Список и краткое описания](https://pythonworld.ru/osnovy/klyuchevye-slova-modul-keyword.html) ключевых слов на портале Pythonworld.ru

In [9]:
# Пример вывод ключевых слов

import keyword
a = keyword.kwlist   #- список всех доступных ключевых слов.


for keyw in a:
    print(keyw) #, end='')

print('\n< ===================== >')

ss = 'def'
if keyword.iskeyword(ss):
    print(ss, 'is a keyword')
else:
    print(ss, 'is NOT a keyword. All OK')

# Заметили ошибку в коде? ;)

False
None
True
and
as
assert
async
await
break
class
continue
def
del
elif
else
except
finally
for
from
global
if
import
in
is
lambda
nonlocal
not
or
pass
raise
return
try
while
with
yield

def is a keyword


<a id='built_in'></a>
### Встроенные функции или идентификаторы
[Вверх](#up)

Следует избегать использования имени **встроенных идентификаторов** при объявлении переменной. К встроенным идентификаторам относятся такие функции как **len()**, **list()**, **str()**, **zip()** и другие. Это не вызовет ошибки, но может привести к неочевидным последствиям при использовании.

> [Список имён встроенных функций](https://docs.python.org/2/library/functions.html#built-in-funcs) языка python.

In [10]:
# Встроенные идентификаторы

print(dir(__builtin__))



#### Другие важные правила при использовании переменных

Нельзя начинать имя переменной с цифры, но можно с буквы или символа подчеркивания!

В имени переменной недопустимы следующие символы: **+, -, *, /, %, & и др.** Допускается нижнее подчёркивание.

Хотя формально можно использовать **кириллицу** для описания имени переменной, лучше этого никогда не делать и использовать только буквы латинского алфавита в верхнем или нижнем регистре.

In [11]:
a = 2   # правильно
cd_25 = 33   # правильно
len = 7   # ОПАСНО, хотя ошибки нет: встроенная функция len переопределена

In [12]:
for = 7   # НЕправильно: for - ключевое (!) слово

SyntaxError: invalid syntax (<ipython-input-12-15190a850af8>, line 1)

In [13]:
1b = 49.7   # неправильно - цифра на первом месте

SyntaxError: invalid syntax (<ipython-input-13-61019d95e9fa>, line 1)

<a id='init_data'></a>
## Инициализация разных типов данных
[Вверх](#up)

Инициализация переменной означает её добавление в некоторое пространство имён. Осуществляется инициализация с помощью операции присвоения, которая выражается знаком равно "=".

Объявленная переменная (левая часть выражения до знака равно =) в python является **ССЫЛКОЙ** на созданный и реально существующий объект в памяти компьютера.

In [15]:
a = 2   # целое число
b12 = [1, 2, 3, 4]    # список целых чисел
c_f = (True, False)   # кортеж булевых переменных
ded = {1:-1, 2:-2, 3:-3}    # словарь

In [16]:
ded.keys()
ded.values()

dict_values([-1, -2, -3])

Приведённый выше пример показывает, что в памяти было размещено 4 объекта и для каждого есть своя ссылка-ярлык в виде имён переменных. Можно добавить ешё несколько переменных, которые будут привязаны всё к тем же объектам, то есть на некоторые объекты (числа, списки, кортежи, словари) будет несколько ссылок.

In [17]:
'''
После присвоения переменные e и a ссылаются на один объект - число 2, а переменные f и dic - на словарь.
'''

a = 11
e = a

dic = {'A':1, 'Z':26}
f = dic

print(e, f)

11 {'A': 1, 'Z': 26}


Если в какой-то момент все переменные, которые ссылаются на один объект, будут удалены, то сам объект будет удалён из памяти. Удалить переменную можно с помощью функции **del()**.

In [18]:
a = 12.98754
print('a=', a)
b = a
del(a)   # удаляем переменную a
print('b=', b)
print('a2=', a) # Ошибка! Переменной "a" уже нет в пространстве имён!

a= 12.98754
b= 12.98754


NameError: name 'a' is not defined

<a id='numbers'></a>
### Числа
[Вверх](#up)

Целые числа задаются набором цифр без пробелов.

Вещественные или действительные числа могут задаваться по-разному (см. пример). Разделителем целой и дробной части является точка. Отрицательные числа задаются с помощью унарного минуса(минуса перед цифрой). Для положительных чисел унарный плюс не требуется.
   
Комплексные числа задаются с помощью функции **complex()**, где в качестве аргументов передаются действительная и мнимая части соответственно.

In [19]:
k = 5   # целое число
i = 312   # целое число
a = 5.61   # действительное число
r = -178.5465   # отрицательное действительное число
u = -2e3   # компактная форма записи вещественного числа
p = 1.5e-2   # компактная форма записи вещественного числа
q = 2.3+5j   # комплексное число

out = [print(g, end='  ') for g in [i, a, r, u, p, q]]

312  5.61  -178.5465  -2000.0  0.015  (2.3+5j)  

<a id='strings'></a>
### Строки
[Вверх](#up)

Строки задаются в кавычках (одиночных или двойных; в паре кавычки должны быть одного вида). Внутри строк может находиться всё что угодно. Пробелы также считаются, наравне с другими, за символом.

Строки бывают простые строки и т.н. "сырые (raw-string) r-строки". Объявляются они одинаково, но перед открывающей кавычкой для r-строки (она же неформатированная строка) ставится буквы r, а перед обычной - ничего.

О различиях между типами строк см. соответствующую тему. Кратко:

+ неформатированная строка представляет символы так, как они есть. Это важно при анализе входящих строк, так как в python некоторые символы в обычных строках (слэш, например) будут восприниматься как служебные с другим значением;

+ обычная строка в python3 поддерживает [Unicode](https://ru.wikipedia.org/wiki/%D0%AE%D0%BD%D0%B8%D0%BA%D0%BE%D0%B4), что позволяет пользоваться не только латинским алфавитом, но и, например, кириллицей (русским языком).

Чтобы создать `пустую строку` нужно просто поставить кавычки без пробелов внутри.

In [20]:
s = 'abc'   # простая строка
print(type(s), s)
r = r'abc'   # r-строка или неформатированная строка
print(type(r), r)
u1 = "абв"   # кириллица в обычной строке
print(type(u1), u1)

empty_s = ''   # пустая строка. Её не видно в консоли

print(u1)   # вывод на экран с помощью функции print()
u1   # неявный вывод на экран консоли. Сравни с print-выводом

<class 'str'> abc
<class 'str'> abc
<class 'str'> абв
абв


'абв'

<a id='bools'></a>
### Булевы переменные
[Вверх](#up)

Булевы переменные могут принимать всего два значения: Истина (True) и Ложь (False). Обратите внимание на регистр заглавной буквы, это важно! Также булевым значениям не требуется кавычек, что отличает их от аналогичных строк.

In [21]:
b = True
f = False
s = 'True'

a = [print(type(g), g) for g in [b,f,s]]

<class 'bool'> True
<class 'bool'> False
<class 'str'> True


#### О запятой после цифр
Обратите внимание на запятую в конце кортежа. Она необязательна, но именно она делает кортеж кортежем. Так для кортежа можно опустить скобки. Чтобы создать список нужно поставить квадратные скобки.

In [22]:
a = 0,
b = 1, 2, 3, 4
c = 1, 2, 3, 4,
d = [1, 2, 3, 4,]
e = 0

k = [print(type(g), g) for g in [a, b, c, d, e]]

<class 'tuple'> (0,)
<class 'tuple'> (1, 2, 3, 4)
<class 'tuple'> (1, 2, 3, 4)
<class 'list'> [1, 2, 3, 4]
<class 'int'> 0


#### Странный случай! 

In [28]:
# 23.09.2018 был обнаружен странный факт. Сравни

a = -1,
print('"a" has {} data type'.format(type(a)))
if type(a) == tuple:
    print(len(a))
else:
    print('It is not a tuple!')

# But!
print(type(-1,))

"a" has <class 'tuple'> data type


TypeError: 'int' object is not callable

<a id='end'></a>
## Заключение
[Вверх](#up)

Были представлены основные типы данных (условно их можно назвать "базовыми" типами данных для python): числа, строки и булевы переменные. Показаны требования к именам переменных, в которые сохраняются любые данные на python. Приведены примеры инициализации (объявления в теле программы) переменных разных "базовых" типов, широко встречающихся в языках программирования.

tuple