# 1 введение в Python

### Пара слов о курсе

Это краткий вводный курс Python. Подготовлен для физиков и астрономов, желающих освоить основы компьютерной обработки данных. Основные библиотеки курса: numpy, matplotlib, pandas, seaborn. Они позволяют проводить вычисления, работать с таблицами, представлять данные графически. Курс состоит из нескольких занятий, изложенных в jupyter ноутбуках, они содержат необходимую теорию, примеры и задания для отработки. Желательно иметь минимальный опыт в каком-либо языке программирования, владеть математикой 10-11 класса, но не обязательно.

### Рабочее окружение

Прежде всего следует установить и настроить необходимые программы:  
Python устанавливается установщиком с официального [сайта](https://www.python.org/downloads/)  
Современный Python включает в себя установщик пакетов pip, можно проверить его наличие командой
`pip --version` (для этого нужно запустить терминал, Win+R)  
Jupyter lab: `pip install jupyterlab`, запуск: `jupyter lab`. Может не повезти и придётся настраивать переменную среды.  
Нужные библиотеки:  
```
pip install numpy
pip install matplotlib
pip install pandas
pip install seaborn
```
Также рекомендуется поставить удобный текстовый редактор, например, VS Code, но в рамках курса он, скорее всего, не потребуется.  
Следует ожидать, что не всё удастся с первого раза, возможно, потребуется помощь или изучение дополнительных источников.

### Hello World!

В этом разделе обсудим структуру программы, познакомимся с работой ноутбуков (которые notebook, не laptop).  
Первым делом создайте ноутбук (не обязательно, всё на самом деле будет и здесь). Перед вами будет путая ячейка для кода:

Таких ячеек допускается создавать неограниченно много, в каждой из них неограниченно много кода. Код ноутбука выполняется последовательно, от чейки к ячейке, что позволяет выделять в отдельные ячейки наиболее важные части и контролировать их выполнение отдельно. При этом все ячейки являются одним большим кодом, переменная, созданная в первой ячейке, будет действительна в любой другой ячейке далее (соблюдайте осторожность с изменением значений переменных, иногда приходится запускать ячейки с самого начала, чтобы исправить неправильно записанные данные).  
Выполнение кода: Shift+Enter

In [7]:
x = 100
y = 5
z = x + y
z

105

Если поместить какую-либо переменную в конце ячейки без операций, то в output будет помещено значение переменной и, возможно, дополнительная информация. Туда же выбрасываются ошибки и картинки.  
Ниже пример использования функции вывода текста. Её не обязательно помещать в конец ячейки, текст будет выведен всегда.

In [12]:
print('Привет мир!')

Привет мир!


### Базовые конструкции

Здесь примеры простейших циклов и условных конструкций с необходимыми комментариями.

In [15]:
# цикл for: перебирает все значения в списке range(10): [0, 1 ... 8, 9] и выполняет с ними код в теле.
for i in range(10):
    print(i)

0
1
2
3
4
5
6
7
8
9


In [16]:
# цикл while: выполняет последовательно код в теле, пока верно условие.
i = 2
while i <= 5:
    i = i**2
    print(i)

4
16


In [17]:
# if: конструкция ветвления.
if i == 10:
    print('OK!')
elif i == 15:
    print('Maybe...')
else:
    print('Nooo!')

Nooo!


### Функции

Часто, для удобства чтения кода и из практических соображений часть команд помещают в функцию:

In [18]:
def my_function (x):
    print('Дано:')
    print(x)
    result = x*10 + 2
    print('Получилось:')
    print(result)
    return result

return не является обязательным, он лишь позволяет функции возвращать некое значение при вызове:

In [22]:
a = my_function(10)
print('They got:', a)

Дано:
10
Получилось:
102
They got: 102


Через запятую указывается последовательность аргументов функции. Есть возможность также напрямую указать, какой конкретно аргумент нужен при вызове (если их много):

In [23]:
def my_second_function (x, a=10, b=20):
    print(a*x+b)

my_second_function(10, b=0)

100


### Хранение данных

В Python нет массивов в чистом виде, их функцию частично берут на себя списки:

In [24]:
ls = [1, 2, 3]

Нет ограничений на тип элементов списка, в том числе, элементом списка может быть список:

In [25]:
ls = ['hi', 1, [1, 2]]

range() возвращает список, так что можно ставить любой список в цикл for:

In [26]:
ls = ['a', 'b', 'c', 'd']
for i in ls:
    print(i)

a
b
c
d


Некоторые методы списка:  
```
ls[i] #  обращение к элементу по индексу
ls.append(X) #  добавляет элемент x в конец списка
ls.extend(X) #  добавляет список x в коне списка
ls.pop(X) #  удаляет x-тый элемент списка и возвращает его
ls.sort(X) #  сортировка по функции x
ls.count(X) #  количество элементов эквивалентных х
ls.index(X) #  возвращает положение первого элемента со значением х
```
Ничто не заменит самостоятельного чтения документации (желательно, оригинальной)! И поиска, поиска, поиска...  
Также небольшое *предостережение*: методы библиотек или такие фундаментальные, как методы списков, предпочтительнее в использовании, чем аналоги, написанные в рамках дефолтного Python. Всем известно, что Python работает медленнее из-за внутреннего устройства, особенностей интерпретатора и тд. Действительно, цикл for с тяжелой функцией в теле на больших количествах итераций даст плохие результаты по времени и ресурсам. Но библиотеки написаны не так! Часто внутри всё реализуется на С/С++ (или ещё как-нибудь), поэтому производительность страдает минимально.  
Далее немного обсудим работу с файлами.

In [None]:
file = open('input.txt', 'r') #  Загрузка файла, флаги: r - чтение, w - запись, a - дозапись в конец
file.read(1) #  чтение одного символа
file.read() #  чтение всех символов
for line in file: #  перебор всех строк файла
    pass
file.write('Some text\n') # запись что-либо
file.close() # лучше закрывать файл по окончании работы с ним

### Задание

Перед вами небольшой датасет с информацией о звездах (data1.csv). Формат файла - comma separated values, наиболее распространённый способ хранить таблицы. Задания - типичные операции при работе с данными. На следующих занятиях мы освоим более приятные пути их реализации.  
<span style="color:blue">ЗАДАНИЕ 1</span> Откройте файл, прочитайте его построчно. Сколько всего строк? (Длину списка возвращает функция len(list))


<span style="color:blue">ЗАДАНИЕ 2</span> Разбейте каждую строку на значения в столбцах, строковый метод split(). Выведете спектральный класс звезды с индексом 1000.

<span style="color:blue">ЗАДАНИЕ 3</span> Удалите столбец e_Plx, для этого придётся воспользоваться циклом.

<span style="color:blue">ЗАДАНИЕ 4</span> Сколько звёзд с TargetClass==1?

<span style="color:blue">ЗАДАНИЕ 5</span> Оставьте только жёлтые звёзды.

<span style="color:blue">ЗАДАНИЕ 6</span> Вычислите среднее значение Vmag.