### МГУ им. М. В. Ломоносова
### Введение в анализ геоданных
#### [Материалы курса](https://github.com/keyonix/course_geodata)
## Python для анализа данных - Базовый синтаксис

## Введение

**Python** современный высокоуровневый язык программирования. Синтаксис Python прост и лаконичен, что позволяет быстро писать свой код, а также без затруднений читать и понимать чужой. У языка есть своя философия под названием *"The Zen of Python"*, которую можно прочитать при исполнении следующего кода:

In [1]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


## Установка

Наиболее популярным способом получения исчерпывающего функционала Python для анализа данных является установка дистрибутива Anaconda. Для этого нужно зайти на сайт https://www.anaconda.com/download/, выбрать свою операционную систему и скачать необходимые файлы для установки дистрибутива с Python версией 3.\*. Для работы нам понадобится среда разработки Jupyter Notebook, запустить котурую можно на Windows с помощю запуска программы Jupyter Notebook, ярлык на которую должен появиться после установки дистрибутива. Запуск на Mac OS осуществляется с помощью исполнения команды *jupyter notebook* в Terminal.

Если есть необходимость заменить папку в которой будет открываться Jupyter Notebook на ОС Windows, то нужно нажать правой кнопкой мыши на ярлык Jupyter Notebook, далее Свойства. В поле Объект в конец строки через пробел добавить путь, где будет открываться Jupyter Notebook, например, D:\

## Синтаксис

### Переменные

In [2]:
int_var = 5  # Целое число
float_var = 0.5  # Число с плавающей точкой
string_var = 'Hey'  # Строка
bool = True # Bool var

In [3]:
print((1 * float_var + 4 / 2) ** 2)
print(string_var + '!')

6.25
Hey!


Иногда возникают ситуации, когда нужно сделать строку, подставив в неё некоторые данные, полученные в процессе выполнения программы. Подстановку данных можно сделать с помощью форматирования строк. Форматирование можно сделать с помощью оператора %, и метода format.

In [4]:
print('{0}! High {1}!'.format(string_var, int_var))
print('%s! High %d!' % (string_var, int_var))

Hey! High 5!
Hey! High 5!


Оператор % чувствителен к типу данных. Применение оператора % для форматирования строк представлено ниже в таблице

|Формат|Что получится|
|----|---|
|'%d', '%i', '%u'|Десятичное число.|
|'%o'|Число в восьмеричной системе счисления.|
|'%x'|Число в шестнадцатеричной системе счисления (буквы в нижнем регистре).|
|'%X'|Число в шестнадцатеричной системе счисления (буквы в верхнем регистре).|
|'%e'|Число с плавающей точкой с экспонентой (экспонента в нижнем регистре).|
|'%E'|Число с плавающей точкой с экспонентой (экспонента в верхнем регистре).|
|'%f', '%F'|Число с плавающей точкой (обычный формат).|
|'%g'|Число с плавающей точкой. с экспонентой (экспонента в нижнем регистре), если она меньше, чем -4 или точности, иначе обычный формат.|
|'%G'|Число с плавающей точкой. с экспонентой (экспонента в верхнем регистре), если она меньше, чем -4 или точности, иначе обычный формат.|
|'%c'|Символ (строка из одного символа или число - код символа).|
|'%r'|Строка (литерал python).|
|'%s'|Строка (как обычно воспринимается пользователем).|
|'%%'|Знак '%'.|

**ЗАДАНИЕ**<br>
Используя любой метод форматирования строк, создайте переменную my_name, содержащую ваше имя, и сделайте форматирование строки "Меня зовут,!" таким образом, чтобы значение переменной my_name находилось между запятой и восклицательным знаком. Пример результата - "Меня зовут, Николай!" Для демонстрации результата используйте функцию print().

In [5]:
# ВАШ КОД

### Операторы

#### Арифметические операторы
| Символ | Описание |
|----|---|
| +  | Сложение |
| -  | Вычитаение |
| /  | Деление |
| %  | Остаток от деления |
| *  | Умножение |
| //  | Целочисленное деление |
| **  | Возведение в степень |

#### Операторы сравнения
| Символ | Описание |
|----|---|
| == | Проверяет равны ли оба операнда. Если да, то условие становится истинным |
| !=  | Проверяет равны ли оба операнда. Если нет, то условие становится истинным. |
| < | Проверяет меньше ли значение левого операнда, чем значение правого. Если да, то условие становится истинным |
| > | Проверяет больше ли значение левого операнда, чем значение правого. Если да, то условие становится истинным |
| <=  | Проверяет меньше или равно значение левого операнда, чем значение правого. Если да, то условие становится истинным |
| >=  | Проверяет больше или равно значение левого операнда, чем значение правого. Если да, то условие становится истинным |

### Структуры данных

#### Лист

Лист является наиболее часто используемой структурой данных и представляет собой список значений произвольного типа.

In [6]:
my_list = [1,2,3,4]  # создание листа

In [7]:
type(my_list) # тип листа

list

In [8]:
print(my_list) # вывод листа

[1, 2, 3, 4]


In [9]:
my_list[0]  # получение элемента листа по индексу

1

In [10]:
my_list[-1]  # получение элемента листа по индексу

4

In [11]:
my_list[3:]  # срез листа

[4]

In [12]:
my_list[1:3]  # срез листа

[2, 3]

In [13]:
print(my_list) # вывод листа

[1, 2, 3, 4]


In [14]:
my_list.append(5)  # добавление элемента в конец листа
my_list

[1, 2, 3, 4, 5]

In [15]:
my_list = my_list + [6,7,8]  # объединение листов
my_list

[1, 2, 3, 4, 5, 6, 7, 8]

In [16]:
my_list.remove(8)  # удаление элемента листа по значению элемента
my_list

[1, 2, 3, 4, 5, 6, 7]

In [17]:
my_list.insert(0, 0)  # добавление элемента в листа на указанную позицию по индексу
my_list

[0, 1, 2, 3, 4, 5, 6, 7]

In [18]:
len(my_list)  # размер листа

8

In [19]:
max(my_list)  # максимальное значение листа

7

In [20]:
min(my_list)  # минимальное значение листа

0

In [21]:
sum(my_list)  # сумма элементов листа

28

In [22]:
my_list.insert(5, -1)  # добавление элемента в листа на указанную позицию по индексу
print(my_list)

my_list.sort()  # сортировка листа
print(my_list)

[0, 1, 2, 3, 4, -1, 5, 6, 7]
[-1, 0, 1, 2, 3, 4, 5, 6, 7]


In [23]:
my_list.sort(reverse=True)  # сортирвка листа в обратном направлении
print(my_list)

[7, 6, 5, 4, 3, 2, 1, 0, -1]


**ЗАДАНИЕ**<br>
Создайте переменную содержащую лист, который состоит из 5 произвольных числовых значений. Осуществите следующие преобразования и действия с листом:
- Добавьте элемент 5 в конец листа
- Вставьте элемент 3 на 2 позицию листа
- Выведите максимальное и минимальное значение листа, а также сумму элементов листа
- Выведите результат умножения 2-го элемента листа на 4-й элемент листа

In [24]:
# ВАШ КОД

#### Строки - Листы

In [25]:
my_string = 'hello'  # создание строковой переменной

In [26]:
print(my_string[0])
print(my_string[-1])
print(my_string[-2:])

h
o
lo


In [27]:
print(my_string + '!!!')

hello!!!


#### Кортеж

Кортеж, в отличии от листа, является неизменяемой структурой данных, содержащей список значений.

In [28]:
my_tuple = (1,2)  # создание переменной, содержащей кортеж
print(my_tuple)

(1, 2)


In [29]:
my_tuple = tuple([1,2,3])  # конвертация листа в кортеж
print(my_tuple)

(1, 2, 3)


#### Словарь

Словарь представляет собой структуру ключ: значение.

In [30]:
my_dict = {'one': 1, 'two': 2, 'three': 3}  # создание переменной, содержащей словарь
print(my_dict)

{'one': 1, 'two': 2, 'three': 3}


In [31]:
my_dict.clear()  # удаление всех элеменов словаря
print(my_dict)

{}


In [32]:
my_dict['four'] = 4  # добавление элемента словаря
my_dict['five'] = 5  # добавление элемента словаря
print(my_dict)

{'four': 4, 'five': 5}


In [33]:
print(my_dict.keys())  # вывод ключей словаря
print(my_dict.values())  # вывод значений словаря

dict_keys(['four', 'five'])
dict_values([4, 5])


In [34]:
my_dict['four']  # получения элемента словаря по ключу

4

### Условные операторы

Условные операторы помогают создать логигку исполнения приложения.

#### if

In [35]:
my_list = [1, 2, 3, 4]

In [36]:
if len(my_list) > 7:
    print(my_list[3])

In [37]:
my_string = 'hello'
if 'll' in my_string:
    print(my_string)

hello


#### if - else

In [38]:
if len(my_list) > 3:
    print(my_list[3])
else:
    print('Длина листа:', len(my_list))

4


#### if - elif - else

In [39]:
my_list = [1,3,4,5]
if len(my_list) > 4:
    print(my_list[4])
elif len(my_list) == 0:
    print('Пустой лист')
else:
    print('Длина листа:', len(my_list))

Длина листа: 4


**ЗАДАНИЕ**<br>
Создайте переменную, содержащую словарь со значениями 'name': 'Саша', 'age': 18. Создайте условие, при котором, если значение ключа словаря 'age' больше 20, то вывод строки '{} старше 20 лет', где вместо фигурных скобок значение ключа словаря 'name'. В противном случае вывод строки '{} не старше 20 лет', где вместо фигурных скобок значение ключа словаря 'name'.

In [40]:
# ВАШ КОД

### Циклы

#### for

In [41]:
list(range(5))

[0, 1, 2, 3, 4]

In [42]:
for i in [0, 1, 2, 3, 4]:
    print(i)

0
1
2
3
4


In [43]:
my_lists = [[1,2], [3,4], [5,6]]

In [44]:
my_lists

[[1, 2], [3, 4], [5, 6]]

In [45]:
for my_list in my_lists:
    for element in my_list:
        print(element)

1
2
3
4
5
6


#### while

In [46]:
i = 1
while i < 3:
    print(i)
    i = i+1

1
2


#### break

In [47]:
for i in range(100):
    print(i)
    if i >= 7:
        break # остановка цикла

0
1
2
3
4
5
6
7


#### continue

In [48]:
for i in range(10):
    if i > 4:
        print('i > 4')
        continue # продолжение цикла
    elif i < 7:
        print('i =', i)

i = 0
i = 1
i = 2
i = 3
i = 4
i > 4
i > 4
i > 4
i > 4
i > 4


**ЗАДАНИЕ**<br>
Создайте цикл for для элементов последовательности от 0 до 100, в котором выводится значение элемента только при условии, что остаток от деления этого элемента на 10 равно 0. Для создания последовательности воспользуйтесь range(100), для создания условия используйте оператор остатка от деления % и условный оператор равенства ==.

In [49]:
# ВАШ КОД

### Функции

Функции делают возможным переиспользование кода.

In [50]:
# Функция с одним параметром
def say_hello(name):
    print('Hello, {0}!'.format(name))

In [51]:
say_hello('Vasya')

Hello, Vasya!


In [52]:
# Функция с двумя параметрами
def times(x, y):
    return x*y

In [53]:
two_times_three = times(2, 3)

In [54]:
two_times_three

6

In [55]:
print(two_times_three)

6


In [56]:
# Функция возвращающая значения
def numeric_list_stat(my_list):
    highest = max(my_list)
    lowest = min(my_list)
    first = my_list[0]
    last = my_list[-1]
    return highest, lowest, first, last

In [57]:
numeric_list_stat([50,2,40,23,15,18])

(50, 2, 50, 18)

In [58]:
high, low, first, last = numeric_list_stat([50,2,40,23,15,18])

In [59]:
print(high, low, first, last)

50 2 50 18


In [60]:
# Функция с параметром заданным по умолчанию
def say_hello(name, loud=False):
    if loud == True:
        print('HELLO, %s!!!' % name.upper())
    else:
        print('Hello, %s' % name)

In [61]:
say_hello('Vasya')

Hello, Vasya


In [62]:
say_hello('Petya', loud=True)

HELLO, PETYA!!!


In [63]:
# Функция с неопределенным количеством параметров
def sum_arguments(*args):
    return sum(args)

In [64]:
# Функция с неопределенным количеством именованных параметров
def print_named_args(**kwargs):
    for key, value in kwargs.items():
        print("{0} = {1}".format(key, value))

In [65]:
sum_arguments(1,2,3)

6

In [66]:
print_named_args(x=1, y=2)

x = 1
y = 2


**ЗАДАНИЕ**<br>
Создайте функцию, которая принимает обязательный параметр - строку my_string и второй параметр - строку skip_symbol со значением по умолчанию равным пробелу ' '. Метод должен выводить по отдельности каждый символ параметра my_string, если он не равен значению параметра skip_symbol. Для итерации по символам в строке используйте цикл for.

In [67]:
# ВАШ КОД