## Синтаксис языка Python

Лекция основана на [официальной документации языка Python](https://docs.python.org/3/).

Перед тем, как интерпретатор Python может начать выполнение текста программы, он
разбивается на отдельные "слова" или **токены** - минимальные единицы языка Python.

Существуют следующие виды токенов:
- идентификаторы
- ключевые слова
- литералы
- операторы
- делимитеры
- специальные токены индентации

### Идентификаторы и ключевые слова

**Идентификаторы** (или **имена**) &mdash; слова, используемые для обозначения
переменных, функций, классов, модулей и других объектов программы на Python.

Идентификатором может быть любое слово, отвечающее следующим требованиям:
- может содержать строчные и/или заглавные буквы, цифры и символ нижнего
  подчеркивания (`_`, "underscore");
- не начинается с цифры;
- не содержит пробелов/символов табуляции/других разрывов.
- не содержит специальные символы, кроме `_` (`!`, `@`, `#`, `$` и так далее);
- не является *ключевым словом*.

In [None]:
# допустимые идентификаторы (слева от символа =)
myIdentifier123 = 2
___abc___ = 3
f_O_o_B_a_R = 4
python_4_ever = 5

# недопустимые идентификаторы
1startsWithNumber = 1   # не должен начинаться с цифры
my variable = 2         # не должен содержать пробелы
$path = 3               # не может содержать символ $

**Ключевые слова** &mdash; зарезервированные слова языка Python, которые нельзя
использовать в качестве идентификаторов. Эти слова имеют особое значение для
интерпретатора Python и представляют различные синтаксические конструкции,
операторы и константы языка.

Версия Python 3.12.2 содержит 35 ключевых слов:

```dsv
False      await      else       import     pass
None       break      except     in         raise
True       class      finally    is         return
and        continue   for        lambda     try
as         def        from       nonlocal   while
assert     del        global     not        with
async      elif       if         or         yield
```

Также существует ряд "мягких" ключевых слов, зарезервированных только в
определенных контекстах:

```dsv
match      case       _          type
```

Примеры использования некоторых ключевых слов:

In [None]:
def check_condition() -> bool:  # ключевое слово def начинает определение функции
    ...

if check_condition():           # ключевое слово if производит действие при
    ...                         # выполнении условия

for i in range(10):             # ключевые слова for и in используются для 
    ...                         # создания цикла

Попытка использования ключевого слова в роли идентификатора приведет к ошибке:

In [None]:
def = 1

### Литералы

**Литералы** используются для записи константных (постоянных) значений,
например, заранее известных чисел или строк.

#### Строковые литералы

**Строковый литерал** представляет собой последовательность символов Unicode,
заключенную в одинарные (`'`) или двойные (`"`) кавычки.

In [None]:
text_1 = "это строковый литерал!"
text_2 = 'и это тоже!'

Внутри строкового литерала могут содержаться любые символы Unicode кроме символа
кавычки, ограничивающей литерал, при этом символ `\` (обратная косая черта,
backslash) выполняет функцию *символа экранирования*.

Экранирование (escaping) &mdash; процесс замены специальных символов, которые не могут быть
включены в текст непосредственно, на последовательности разрешенных символов (escape-последовательности).

Ниже представлены некоторые из доступных escape-последовательностей:

| Обозначение | Значение                    |
| :---------- | :-------------------------- |
| `\n`        | Символ перевода строки      |
| `\t`        | Символ табуляции            |
| `\\`        | Обратная косая черта        |
| `\'`, `\"`  | Одинарная и двойная кавычки |

С помощью escape-последовательностей можно, например, выводить многострочный текст:

In [4]:
text = '-- How are you?\n-- I\'m fine, thank you.'
print(text)

-- How are you?
-- I'm fine, thank you.


Многострочный текст также можно представлять с помощью литерала, ограниченного тремя парами одинарных или тройных кавычек:

In [6]:
text = '''-- How are you?
-- I'm fine, thank you.'''
print(text)

-- How are you?
-- I'm fine, thank you.


В таком литерале также не требуется экранировать одиночную кавычку.

**Форматированные строковые литералы** (formatted string literals или
**f-strings**) позволяют помещать произвольные значения внутрь строкового
литерала. 

Для того, чтобы объявить строковый литерал, нужно добавить перед
первой кавычкой литерала символ `f` (или `F`):

In [None]:
formatted_string = f"some_text"

Для помещения значения в f-string используются символы фигурных скобок (`{}`) внутри литерала:

In [5]:
greeting = "hello"
name = "world"

message = f"{greeting} {name}!"
print(message)

hello world


#### Числовые литералы

Числовые литералы представляют собой целые, дробные или комплексные (мнимые) числа.

**Целые числа** обычно записываются с помощью десятичных цифр без десятичного разделителя (`.`) и нулей в начале числа.

In [None]:
integer1 = 7
integer2 = 899
integer3 = 1_000_000    # для разделения разрядов можно использовать _
integer4 = -5           # отрицательные числа начинаются со знака -

**Дробные (рациональные) числа** должны включать десятичный разделитель или экспоненту (для использования экспоненциальной нотации):

In [None]:
float1 = 1.0
float2 = 9.     # дробная часть может отсутствовать...
float3 = 0.5
float4 = .1     # ...как и целая
float5 = 1.23e2 # = 1.23 * 10 ** 2 = 123.0

**Комплексные числа** могут быть записаны в виде суммы рациональной и мнимой части, причем рациональная часть может быть либо целым, либо дробным литералом, либо вообще отсутствовать (тогда вместо нее предполагается ноль), а мнимая часть представляется так же, как и другие литералы, но с символом `j` на конце:

In [7]:
print(1 + 2j)
print(1.2 + 3.4j)
print(-12j  )

(1+2j)
(1.2+3.4j)
(-0-12j)


### Операторы

Язык Python определяет следующие последовательности специальных символов как
**операторы**, служащие для выполнения различных операций над значениями в ходе
выполнения программы:

```dsv
+       -       *       **      /       //      %      @
<<      >>      &       |       ^       ~       :=
<       >       <=      >=      ==      !=
```

К примеру, операторы `+`, `-`, `*` и `/` используются для выполнения основных
арифметических операций над числами:

In [8]:
print(4 + 6)
print(3 - 5)
print(8 * 7)
print(9 / 2)

10
-2
56
4.5


### Делимитеры

**Делимитеры (или разделители)** &mdash; специальный вид токенов, служащий для разделения других токенов.

Грамматика Python включает следующие делимитеры:

```dsv
(       )       [       ]       {       }
,       :       .       ;       @       =       ->
+=      -=      *=      /=      //=     %=      @=
&=      |=      ^=      >>=     <<=     **=
```

### Индентация

Программы на Python состоят из инструкций, которые группируются в блоки при
помощи **индентации** &mdash; пробелов (символов табуляции или пробела) в начале
строки. Индентация может быть многоуровневой, например, если один блок
инструкций включает в себя другой. Первая строка кода в файле не может иметь
индентации. Все инструкции одного блока должны иметь одинаковую индентацию.
Увеличение индентации означает начало нового блока, а уменьшение &mdash;
окончание блока.

Python не предъявляет никаких требований к количеству пробелов или знаков
табуляции, до тех пор пока пробелы не смешиваются с знаками табуляциями и
индентация одного уровня остается одинаковой. Тем не менее, существует
[негласное правило](https://peps.python.org/pep-0008/), согласно которому один
уровень индентации должен равняться 4 пробелам.

Пример плохо читаемого, но при этом корректного кода:

In [10]:
def fact(n):
  if n <= 0:
     return 1
  else:
          res = n * fact(n-1)
          return res

fact(5)

120

Пример кода с некорректной индентацией:

In [None]:
 def fact(n): # ошибка: первая строка содержит индентацию
if n <= 0: # ошибка: нет индентации
      return 1
    else:
        res = n * fact(n-1) 
           return n * fact(n-1) # ошибка: неожиданная индентация

fact(5)

Пример корректного кода с индентацией в 4 пробела:

In [11]:
def fact(n):
    if n <= 0:
        return 1
    else:
        res = n * fact(n - 1)
        return res

fact(5)

120

### Выводы

Программы на Python используют:
  - **идентификаторы**, чтобы иметь удобные имена для обращения к переменным, функциям и другим данным
  - **ключевые слова**, чтобы задавать структуру программы
  - **литералы**, чтобы обозначать данные с константными значениями
  - **операторы**, чтобы проводить операции над данными
  - **делимитеры**, чтобы разделять другие токены
  - **индентацию**, чтобы группировать инструкции