# N6 Типы данных

Автор: Шабанов Павел Александрович

Email: pa.shabanov@gmail.com

URL: [Заметки по программированию в науках о Земле](http://progeoru.blogspot.ru/)

Дата последнего обновления: 15.02.2017


### План

1. Типы данных;

2. Переменные;
    + правила имен переменных;
    + встроенные функции или идентификаторы.
    
3. Инициализация разных типов данных
    + числа;
    + строки;
    + булевы переменные;
    + последовательности и отображения.

### Цель: 

+ представить доступные операции для стандартных типов данных;

+ показать особенности синтаксиса в python при выполнении математических операций.

## Типы данных 

Тип данных - это характеристика некоторого объекта, позволяющая определить его возможности взаимодействия с другими объектами. Обычно типов данных в языке немного, ведь типы являются кирпичиками, из которых конструируется код. Необходим баланс между действительно базовыми и полезными для решения каких-либо задач типами данных.

Типичные примеры типов данных в процедурном программировании являются:

+ числа (целые, действительные, комплексные);

+ символы (строки);

+ булевы выражения или переменные (Истина/Ложь);

Более сложные типы данных, такие как последовательности, также могут иметь свой тип данных. Набор типов данных зависит от конкретного языка программирования.

В python все "определённые" типы данных являются классами. Соответственно, ничто не мешает, используя классы, создать свой тип данных. Однако это требуется не так часто, тем более, что создать действительно удобный и полезный новый тип данных сложно.
В большинстве случаев, особенно при обучении основам языка, встроенных типов данных более чем достаточно.

Вот неполный список типов данных python:

+ **число**:
    + целые - **int**;
    + действительные - **float**;
    + комплексные - **complex**.
+ **строка**:
    + обычная строка и r-строка (raw string) - **str**;
    + unicode строка - **unicode**;
+ **булевы переменные** - **bool**;
+ **последовательность**:
    + упорядоченная:
        + список - **list**;
        + кортеж - **tuple**;
    + неупорядоченная:
        + множество - **set**.
+ **отображение**:
    + словарь - **dict**;
+ **функция** - **function**;
+ **файл** - **file**.

Узнать тип данных объекта можно с помощью встроенной функции **type()**.

In [1]:
# Числа
x = 123 # целое
print type(x)
x = -20.5 # действительное
print type(x)
x = complex(1, 2) # комплексное или 1 + 2j
print type(x)
# Строки
s = 'C://users' # строка
print type(s)
s = r'C://users' # r-строка
print type(s)
s = u'C://users' # юникод-строка
print type(s)
# Булевые переменные
b = True # булева переменная (Истина)
print type(b)
print '----------------------'
# Последовательности
y = [1, -1, 1, -1, 1, -1] # список 
print type(y)
y = (1, 0, 1, -1, 0, -1,) # кортеж
print type(y)
d = {'one' : 1, 'two' : 2, 'zero' : 0} # словарь
print type(d)
C = set(y) # множество
print type(C)
# Функции
def abc(): # функция
    pass
print type(abc)

# Файлы
f = open('./pics/test.txt', 'r') # файл
print type(f)

<type 'int'>
<type 'float'>
<type 'complex'>
<type 'str'>
<type 'str'>
<type 'unicode'>
<type 'bool'>
----------------------
<type 'list'>
<type 'tuple'>
<type 'dict'>
<type 'set'>
<type 'function'>
<type 'file'>


## Переменные

### Переменные и их имена

Основная работа при кодировании алгоритма - это создание различных переменных и отношений между ними (конструкции-контейнеры в виде ветвления, циклов, функций и др.). В python в переменных хранятся не сами данные (числа, строки, булевы выражения и др.), а ссылка на них. Это очень важно сразу усвоить! Переменная в python похожа на ярлык на коробке, но не является коробкой. Ярлык должен быть понятен читающему его человеку. Поэтому в больших программах не стоит использовать такие имена переменных как **a122** или "gf34" и т.д. 

**Переменная** - это имя, состоящее из букв, символов и цифр. Однако существуют ограничения как на состав имени, так и на порядок символов в имени.

### Ключевые слова. Keywords

Именем переменной не может быть ключевое слово. Вот список **зарезервированных ключевых слов**.
	
> and , as , assert , break , class , continue , def , del , elif , else , except , exec , finally , for , from , global , if , import , in , is , lambda , not , or , pass , print , raise , return , try , while , with , yield

[Список и краткое описания](https://pythonworld.ru/osnovy/klyuchevye-slova-modul-keyword.html) ключевых слов на портале Pythonworld.ru

In [6]:
# Пример вывод ключевых слов

import keyword
  
a = keyword.kwlist   #- список всех доступных ключевых слов.

print a

for i, keyword in enumerate(a):
    print keyword

ss = 'def'
if keyword.iskeyword(ss):
    print ss, 'is a keyword'
else:
    print ss, 'is NOT a keyword. All OK'
    
    
# Заметили ошибку в коде? ;)

['and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'exec', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'not', 'or', 'pass', 'print', 'raise', 'return', 'try', 'while', 'with', 'yield']
and
as
assert
break
class
continue
def
del
elif
else
except
exec
finally
for
from
global
if
import
in
is
lambda
not
or
pass
print
raise
return
try
while
with
yield


AttributeError: 'str' object has no attribute 'iskeyword'

### Встроенные функции или идентификаторы

Следует избегать использования имени **встроенных идентификаторов** при объявлении переменной. К встроенным идентификаторам относятся такие функции как **len()**, **list()**, **str()**, **zip()** и другие. Это не вызовет ошибки, но может привести к неочевидным последствиям при использовании.

> [Список имён встроенных функций](https://docs.python.org/2/library/functions.html#built-in-funcs) языка python.

In [7]:
# Встроенные идентификаторы

import __builtin__
print dir(__builtin__),



#### Другие важные правила при использовании переменных

Нельзя начинать имя переменной с цифры, но можно с буквы или символа подчеркивания!

В имени переменной недопустимы следующие символы: **+, -, *, /, %, & и др.** Допускается нижнее подчёркивание.

Хотя формально можно использовать **кириллицу** для описания имени переменной, лучше этого никогда не делать и использовать только буквы латинского алфавита в верхнем или нижнем регистре.

In [2]:
a = 2   # правильно
cd_25 = 33   # правильно
len = 7   # неправильно, хотя ошибки нет: встроенная функция len переопределена

In [3]:
for = 7   # неправильно: for - ключевое слово 

SyntaxError: invalid syntax (<ipython-input-3-b2c995d9cc78>, line 1)

In [4]:
1b = 49.7   # неправильно - цифра на первом месте

SyntaxError: invalid syntax (<ipython-input-4-e7c3dfdea71e>, line 1)

### Инициализация переменных

Инициализация переменной означает её добавление в некоторое пространство имён. Осуществляется инициализация с помощью операции присвоения, которая выражается знаком равно "=".

Объявленная переменная (левая часть выражения до знака равно =) в python является ссылкой на созданный и реально существующий объект в памяти компьютера.

In [5]:
a = 2
b12 = [1, 2, 3, 4]
c_f = (True, False)
ded = {1:-1, 2:-2, 3:-3}

Приведённый выше пример показывает, что в памяти было размещено 4 объекта и для каждого есть своя ссылка-ярлык в виде имён переменных. Можно добавить ешё несколько переменных, которые будут привязаны всё к тем же объектам, то есть на некоторые объекты (числа, списки, кортежи, словари) будет несколько ссылок.

In [6]:
'''
После присвоения переменные e и a ссылаются на один объект - число 2, а переменные f и d - на словарь.
'''

e = a
print(e)
f = d
print(f)

2
{'zero': 0, 'two': 2, 'one': 1}


Если в какой-то момент все переменные, которые ссылаются на один объект, будут удалены, то сам объект будет удалён из памяти. Удалить переменную можно с помощью функции **del()**.

In [7]:
a = 12.98754
print(a)
del(a)   # удаляем переменную a
print(a)

12.98754


NameError: name 'a' is not defined

## Инициализация разных типов данных

### Числа

Целые числа задаются набором цифр без пробелов.

Вещественные или действительные числа могут задаваться по-разному (см. пример). Разделителем целой и дробной части является точка. Отрицательные числа задаются с помощью унарного минуса(минуса перед цифрой). Для положительных чисел унарный плюс не требуется.
   
Комплексные числа задаются с помощью функции **complex()**, где в качестве аргументов передаются действительная и мнимая части соответственно.

In [8]:
k = 5   # целое число
i = 312   # целое число
a = 5.61   # действительное число
r = -178.5465   # отрицательное действительное число
u = -2e3   # компактная форма записи вещественного числа
p = 1.5e-2   # компактная форма записи вещественного числа
c = 2.3+5j   # комплексное число

print(k)
print(i)
print(a)
print(r)
print(u)
print(p)
print(c)

5
312
5.61
-178.5465
-2000.0
0.015
(2.3+5j)


### Строки

Строки задаются в кавычках (одиночных или двойных; в паре кавычки должны быть одного вида). Внутри строк может находиться всё что угодно. Пробелы также считаются, наравне с другими, за символом.

Строки бывают простые, r-строки или "сырые" строки, а также юникодовские строки. Объявляются они одинаково, но перед открывающей кавычкой для r-строки (она же неформатированная строка) ставится буквы r, а перед юникод-строкой - буква u соответственно.

О различиях между типами строк см. соответствующую тему. Кратко:

+ неформатированная строка представляет символы так, как они есть. Это важно при анализе входящих строк, так как в python некоторые символы в обычных строках (слэш, например) будут восприниматься как служебные с другим значением;

+ юникод-строка поддерживает [Unicode](https://ru.wikipedia.org/wiki/%D0%AE%D0%BD%D0%B8%D0%BA%D0%BE%D0%B4), что позволяет пользоваться не только латинским алфавитом, но и, например, кириллицей (русским языком).

Чтобы создать пустую строку нужно просто поставить кавычки без пробелов внутри.

In [8]:
s = 'abc'   # простая строка
print(type(s), s)
r = r'abc'   # r-строка или неформатированная строка
print(type(r), r)
u1 = 'абв'   # кириллица в обычной строке
print(type(u1), u1)
u2 = u'абв'   # кириллица в юникод-строке
print(type(u2), u2)

empty_s = ''   # пустая строка. Её не видно в консоли

print(u2)   # вывод на экран с помощью функции print()
u2   # неявный вывод на экран. Сравни с print-выводом

(<type 'str'>, 'abc')
(<type 'str'>, 'abc')
(<type 'str'>, '\xd0\xb0\xd0\xb1\xd0\xb2')
(<type 'unicode'>, u'\u0430\u0431\u0432')
абв


u'\u0430\u0431\u0432'

### Булевы переменные

Булевы переменные могут принимать всего два значения: Истина (True) и Ложь (False). Обратите внимание на регистр заглавной буквы, это важно! Также булевым значениям не требуется кавычек, что отличает их от аналогичных строк.

In [10]:
b = True
f = False
s = 'True'

print(type(b), b)
print(type(f), f)
print(type(s), s)

(<type 'bool'>, True)
(<type 'bool'>, False)
(<type 'str'>, 'True')


### Последовательности и отображения

Одним из самых важных элементов языка python являются последовательности. Последовательности представляют собой наборы данных различного типа (много чисел, символов, строк, перечисленных через запятую).  

Последовательности могут быть как упорядоченными (списки или кортежи), так и неупорядоченными (словари, множества).

Списки, кортежи и словари задаются как с помощью разных скобок:

+ список - [];

+ кортеж - ();

+ словарь - {}.

Внутри списка и кортежа элементы перечисляются через запятую. В словаре через запятую указываются связки **"ключ":"значение"** (обязательно использование двоеточия). 

Ключи (левая часть после двоеточия) должны быть уникальными, иначе такому ключу будет присвоено последнее переданнок значение и часть данных будет потеряна. Значения (правая часть после двоеточия) могут совпадать у разных ключей.

In [9]:
a = [-100, 200, 24.7, 58.1378, 0.0, -124.12]   # список
t = (-100, 200, 24.7, 58.1378, 0.0, -124.12,)   # кортеж
d = {'one':2, 'two':3, 3:'three', True:'False'}   # словарь

print(type(a), a)
print(type(t), t)
print(type(d), d)

(<type 'list'>, [-100, 200, 24.7, 58.1378, 0.0, -124.12])
(<type 'tuple'>, (-100, 200, 24.7, 58.1378, 0.0, -124.12))
(<type 'dict'>, {True: 'False', 3: 'three', 'two': 3, 'one': 2})


In [12]:
d = {'one':2, 'two':3, 'three':True, 'three':'False', 'three':3}   # Warning! Ключи дублируются
print(d)
print(d['three'])


{'three': 3, 'two': 3, 'one': 2}
3


#### О запятой после цифр
Обратите внимание на запятую в конце кортежа. Она необязательна, но именно она делает кортеж кортежем. Так для кортежа можно опустить скобки. Чтобы создать список нужно поставить квадратные скобки.

In [13]:
a = 1, 2, 3, 4,
print(type(a), a)
b = 1, 2, 3, 4
print(type(b), b)
b = [1, 2, 3, 4,]
print(type(b), b)

(<type 'tuple'>, (1, 2, 3, 4))
(<type 'tuple'>, (1, 2, 3, 4))
(<type 'list'>, [1, 2, 3, 4])
