# N4 Особенности синтаксиса в python

Автор: Шабанов Павел Александрович

Email: pa.shabanov@gmail.com

URL: [Заметки по программированию в науках о Земле](http://progeoru.blogspot.ru/)

Дата последнего обновления: 10.02.2016

### Цель: 

+ ознакомить с особенностями написания python-кода;

## Особенности синтаксиса python

Python относится к динамическим языкам программирования, что позволяет ему определять типы данных и осуществлять синтаксический анализ, а также трансляцию «на лету», на этапе выполнения программы.

Синтаксис языка python прост и понятен. Он не злоупотребляет использованием символов и не требует обязательного описания типов данных для введения новых переменных и объектов. 

Python чувствителен к регистру. Так объекты Big и big являются разными объектами, а команды max() и Max() - разными командами.

### Отступы (правило 4 пробелов)

В python внутренняя иерархия алгоритма (ветвление, циклы, функции и др.) поддерживается благодаря отступам. **Четыре пробела** отделяют вложенный уровень от вышестоящего. 

Одиночные пробелы также важны. Если при наборе команд допустить хотя бы один лишний пробел в начале строки, то будет выведена ошибка (*IndentationError: unexpected indent*)

Кому-то такая жёсткая организованность исходных кодов кажется неудобной, так как многие языки поддерживают другие способы организации иерархии исходного кода, например, С++ или Фортран90. 

В любом случае, следует помнить про **4 пробела** в python. Это особенно важно при использовании управляющих конструкций: функций, классов, циклов и ветвления.

Согласно [pep8](http://pythonworld.ru/osnovy/pep-8-rukovodstvo-po-napisaniyu-koda-na-python.html#id3) функции и классы рекомендуется размещать в начале модуля после строк импорта сторонних модулей. Объявление функции/класса начинается с первой позиции строки и заканчивается двоеточием ":". После двоеточия весь вложенный в конструкцию код необходимо начинать с 4 пробелов от позиции объявления конструкции. 

Класс может (и именно в этом его преимущетво) содержать в своём теле описание функций. Такие функции, принадлежащие классу, называются **методами класса**. Первым аргументом метода должен быть объект, который по негласному соглашению носит имя self. Подробнее о классах и их методах см. соответствующий раздел. Здесь важно как в классе может быть объявлена функция: 4 отступа от начала объявления класса.

Тело функции (как и тело цикла и ветвления) также отделятся на 4 пробела от начала объявления соответствующей конструкции.

In [1]:
class My_class():
    print ('Hello, World!')
    def class_def(self):   # объявление метода класса
        print 'This is My_class function!'

def fx(x):
    print(x)   # тело функции должно отстоять на 4 пробела от позиции объявления функции

a = 0
b = [1, 2]

cl = My_class()   # создание экземпляра класса
cl.class_def()   # вызов метода (функции класса) экземпляра класса
fx(a)   # вызов функции 


# c = True   # Ошибка! Необоснованный отступ 

Hello, World!
This is My_class function!
0


В примере выше из-за синтаксической ошибки (неправильно написана команда) интерпретатор даже не выполнит ни создания экземпляра класса, ни вызов функции, который должен случиться раньше, чем возбуждение исключения ошибки.

Для циклов и ветвления (подробнее см. соответствующую тему) принцип такой же, однако они могут иметь вложенность высокого порядка, причём в перемешку. И циклы и ветвление могут лежать как в теле функции, так и просто в модуле.

In [2]:
# Циклы и ветвление в модуле

a = [1, -12., 4, False, 0.0031]

for i in a:
    if i < 0:
        print('Element is negative:', i)
        if (i <= -10):
            print('Element is less than -10', i)
            for j in range(2):
                print('HA-HA')
    elif i == 0:
        print('Element is zero', i)
    else:
        print('Element is positive value:', i)

('Element is positive value:', 1)
('Element is negative:', -12.0)
('Element is less than -10', -12.0)
HA-HA
HA-HA
('Element is positive value:', 4)
('Element is zero', False)
('Element is positive value:', 0.0031)


In [3]:
# Циклы и ветвление в функции

def sums(z):
    for x in z:
        if(x == 1):
            print('1')
        else:
            print('!= 1')

r = [-3, -2, -1, 0, 1, 2, 3, 4]
r2 = [False, False, True, False]

sums(r)
print('--------')
sums(r2)

!= 1
!= 1
!= 1
!= 1
1
!= 1
!= 1
!= 1
--------
!= 1
!= 1
1
!= 1


### Индексация последовательностей

В python, как в C++ или MatLab(c), нумерация элементов последовательности или индексация начинается с **нуля (0)**. В других языках, например, Fortran, индексация начинается с единицы (1). Поэтому список, состоящий из 5 элементов будет иметь следующие индексы: 0, 1, 2, 3, 4.

In [4]:
a = [-10, 20, 24, 8, 0]   # список из 5 элементов
print('Elements', a)
b = []   # создание пустого списка (0 элементов)
for i in a:   # перебор элементов списка a в цикле for 
    indx = a.index(i)   # вычисление индекса элемента i в списке a
    b.append(indx)   # добавление элемента indx в список b
print('Indices', b)   # список из 5 элементов-индексов списка a

('Elements', [-10, 20, 24, 8, 0])
('Indices', [0, 1, 2, 3, 4])


#### Обход индексов в обратную сторону

Python поддерживает индексацию последовательностей в обратную сторону, т.е. от последнего элемента к первому. Последний элемент в последовательности с индексом N также вызывается по индексу **-1**. Предпоследний с индексом N-1 - по индексу -2 и т.д.

При этом индекс элемента(например, показываемый методом **index()** у списков и кортежей) остаётся положительным целым числом. Но появляется возможность обратиться к конечным элементам в более понятной форме, без вычисления длины последовательности.

In [5]:
a = [-10, 20, 24, 8, 0]   # список из 5 элементов
print('Origin', a)
ii = range(-1, -6, -1)   # список из 5 элементов от -1 до -6 не включая с шагом -1
b = []   # создание пустого списка (0 элементов)
for i in ii:   # перебор элементов списка a в цикле for 
    indx = a[i]   # присваивание элемента списка a по отрицательному индексу
    b.append(indx)   # добавление элемента indx в список b
print('Reversed', b)   # перевёрнутый список a

('Origin', [-10, 20, 24, 8, 0])
('Reversed', [0, 8, 24, 20, -10])


### Комментарии

Файлы исходных кодов необходимо снабжать комментариями, которые позволяют стороннему пользователю быстрее понять код и реализацию алгоритма. 

Комментарии можно оставлять как в начале модуля, даже до блока импорта (места, где импортируются модули), так и по ходу кода. Функции и классы особенно необходимо описывать комментариями. Для этого у них есть особая возможность - строка документирования.

#### Однострочный комментарий

Строки, начинающиеся с символа решётка "#", обозначают в python однострочный комментарий. Однострочный комментарий может начинать строку, а может располагаться в конце строки кода. Согласно [pep8](http://pythonworld.ru/osnovy/pep-8-rukovodstvo-po-napisaniyu-koda-na-python.html#id3), стандарту написания кода на python, в этом случае необходимо делать отступ в 3 пробела от последнего символа команды кода.

In [6]:
# Однострочный комментарий - он не будет выполнен, даже если здесь будет строка python-кода

print('Hello, world!')   # это комментарий в конце строки

Hello, world!


#### Многострочный комментарий

Для больших комментариев, которые не могут занять одну строку, существуют многострочные комментарии. Они обозначаются символами трёх кавычек (как одинарных, так и двойных) 

Стоит помнить, что для комментариев также применяется правило отступов. Необходимо соответствие между вложенными частями кода и расположенными в них комментариями. При описании комментариями циклов, ветвлений и функций интерпретатор выдаст ошибку, если комментарии будут расположены на в теле конструкции, в вне её. 

In [7]:
'''
Это многострочный комментарий. 
Его видит только редактор исходного кода
'''

a = ''' А это уже строка! \ 
Обратный слэш служит символом перевода строки, если она \
очень длинная
'''

print(type(a))

<type 'str'>


#### Строка документации

[Строка документации](http://pythonworld.ru/osnovy/dokumentirovanie-koda-v-python-pep-257.html) - это структурная часть функций и классов, а также модулей, которая позволяет хранить в виде строки некоторый текст. По соглашению этот текст посвящён описанию соответствующей структурной единицы и её особенностям. 

Удобство строки документации заключается в том, что если она есть у какого-либо объекта, то строку документации можно вызвать прямо в ходе выполнения программы и использовать информацию из неё. Обращение к строке документации осуществляется с помощью особого метода **\__doc\__** с помощью нотации от объекта, т.е. имя_объекта.\__doc\__.  

In [8]:
# Функция
def x1():
    '''
    Doc string for function x1
    '''
    pass

# Класс
class X1():
    '''
    Doc string for class X1
    '''
    pass
    
'''
Doc string for module __main__
'''

a = 12
b = a - 5
# Модуль хранит имя в переменной __name__
print(x1.__doc__)   # строка документации функции
xx1 = X1()   # создание экземпляра класса X1
print(xx1.__doc__)   # строка документации класса

print('---------------------')

'''
Для модуля, имени которого ме не знаем, можно использовать \
функцию help().
'''

help(__name__)   # строка документации модуля


    Doc string for function x1
    

    Doc string for class X1
    
---------------------
Help on built-in module __main__:

NAME
    __main__ - Для модуля, имени которого ме не знаем, можно использовать функцию help().

FILE
    (built-in)

CLASSES
    My_class
    X1
    
    class My_class
     |  Methods defined here:
     |  
     |  class_def(self)
    
    class X1
     |  Doc string for class X1

FUNCTIONS
    fx(x)
    
    sums(z)
    
    x1()
        Doc string for function x1

DATA
    In = ['', u"class My_class():\n    print ('Hello, World!')...044b\u043...
    Out = {}
    __ = ''
    ___ = ''
    a = 12
    b = 7
    cl = <__main__.My_class instance>
    exit = <IPython.core.autocall.ZMQExitAutocall object>
    i = -5
    ii = [-1, -2, -3, -4, -5]
    indx = -10
    j = 1
    quit = <IPython.core.autocall.ZMQExitAutocall object>
    r = [-3, -2, -1, 0, 1, 2, 3, 4]
    r2 = [False, False, True, False]
    xx1 = <__main__.X1 instance>




Строка документации служит для организации описаний и комментариев в инструмент с единым интерфейсом. Проще говоря, почти у каждого объекта можно вызвать строку документации (все объекты в python имеют классово-объектную основу) с помощью функции \__doc\__(строго говоря это метод класса).

In [9]:
a = 2
b = [1, 2, -2, -1]

'''
Чтобы передать функцию, а не результат её выполнения, \
не нужно ставить в конце скобки
'''
c = {'one':1, 'two':2, 'three':3}

print('----- Doc string for integer number -----')
print(a.__doc__)
print('----- Doc string for list -----')
print(b.__doc__)
print('')
print('----- Doc string for dictionary -----')
print(c.__doc__)

----- Doc string for integer number -----
int(x=0) -> int or long
int(x, base=10) -> int or long

Convert a number or string to an integer, or return 0 if no arguments
are given.  If x is floating point, the conversion truncates towards zero.
If x is outside the integer range, the function returns a long instead.

If x is not a number or if base is given, then x must be a string or
Unicode object representing an integer literal in the given base.  The
literal can be preceded by '+' or '-' and be surrounded by whitespace.
The base defaults to 10.  Valid bases are 0 and 2-36.  Base 0 means to
interpret the base from the string as an integer literal.
>>> int('0b100', base=0)
4
----- Doc string for list -----
list() -> new empty list
list(iterable) -> new list initialized from iterable's items

----- Doc string for dictionary -----
dict() -> new empty dictionary
dict(mapping) -> new dictionary initialized from a mapping object's
    (key, value) pairs
dict(iterable) -> new dictionary initi

### Регистр

Python чувствителен к регистру имён переменных. Так N и n есть разные имена переменных. Это касается и имён функций, модулей и классов. 

Например, для имён классов [по pep8](http://pythonworld.ru/osnovy/pep-8-rukovodstvo-po-napisaniyu-koda-na-python.html#id23) следует руководствоваться т.н. ["стилем верблюда"](https://ru.wikipedia.org/wiki/CamelCase) и начинать имя класса с заглавной буква.

Так логическая переменная **ИСТИНА (True)** всегда пишется с большой буквы без кавычек. Вместо неё нельзя написать *true*.