# Определение эволюционной стадии формирующихся звёздных скоплений по данным инфракрасной фотометрии

Звёзды всегда образуются скоплениями. Большое межзвёздное облако из газа и пыли сжимается под действием гравитации и разбивается на фрагменты, каждый из которых постепенно становится звездой. Этот процесс занимает миллионы и даже десятки миллионов лет. При этом не все звёзды формируются и эволюционируют одновременно. \
Для молодых звёзд характерен избыток инфракрасного (ИК) излучения, который обусловлен присутствием вокруг них газа и пыли — остатков родительского облака, продолжающих падать на сформировавшуюся протозвезду. Со временем это вещество рассеивается и ИК избыток уменьшается. По его величине можно оценить возраст отдельной молодой звезды. А процентное соотношение звёзд разного возраста указывает на возраст самого скопления.

В данном практикуме мы будем использовать наблюдательные данные в ближнем и дальнем инфракрасном диапазоне. Мы рассмотрим две области образования маломассивных звёзд: в *Змееносце [(rho Ophiuchi molecular cloud)](https://en.wikipedia.org/wiki/Rho_Ophiuchi_cloud_complex)* и в *Тельце [(TMC, Taurus molecular cloud)](https://en.wikipedia.org/wiki/Taurus_molecular_cloud)*. По фотометрическим данным научимся определять эволюционные стадии молодых звёзд и сравнивать возраст звёздных скоплений.

## 1. Теория
Звёзды образуются в молекулярных облаках — самых холодных и плотных участках межзвёздной среды. Газ и пыль из остатков родительского облака окружают молодые звёздные скопления. Сами молодые звёзды тоже окружены газом и пылью: *протопланетным диском* и *околозвёздной оболочкой*. Пыль в них поглощает свет сформировавшейся протозвезды, делая его заметно более тусклым и красным, что препятствует наблюдениям. На самых ранних стадиях звезду может быть совсем не видно из-за заслоняющей её пыли.

Пыль, окружающая молодые звёзды, может не только мешать их наблюдению, но и наоборот помогать в их исследовании. Нагретая поглощённым излучением звезды, пыль начинает светиться в ИК диапазоне. Более холодная пыль (20-50 К) светит в дальнем ИК, более тёплая (100-500 К) — в среднем ИК. Это излучение и наблюдается в областях звездообразования. У многих звёзд, видимых там в оптическом диапазоне, присутствует **избыток ИК излучения** по сравнению с обычными, немолодыми звёздами. Величина этого ИК избытка зависит от того, сколько вещества окружает звезду, на каком расстоянии оно находится и из чего состоит.

Удобно рассматривать излучение молодых (и не только) звёзд с помощью **спектрального распределения энергии** (или по-английски SED — Spectral Energy Distribution). Спектральное распределение энергии показывает, сколько энергии излучает объект на разных длинах волн. \
<ins>Примеры SEDов:</ins>

![sed](Images/Sed1.png)

Упрощённо SED молодого звёздного объекта можно представить в виде трёх слагаемых: *излучение от протозвезды, протопланетного диска и от внешней околозвёздной оболочки*. 
* Протозвезда светит в видимом и в ближнем ИК диапазоне, при этом её излучение немного ослабляется и краснеет за счёт поглощения пылью. 
* Газопылевой протопланетный диск светит в среднем ИК диапазоне.
* Сферическая пылевая оболочка излучает в дальнем ИК. 

В зависимости от эволюционной стадии в спектральном распределении энергии доминирует то или иное слагаемое.

Это соотношение можно охарактеризовать одним числом &mdash; **спектральным индексом $\alpha$** между 2 и 25 мкм. Эта величина — наклон прямой, проведённой между этими точками SEDа. \
Пусть $F_{\lambda}$ — поток излучения на заданной длине волны $\lambda$; $F_{1}$ — поток излучения на $\lambda_1=2$ мкм;
$F_{2}$ — поток излучения на $\lambda_2=25$ мкм. Тогда спектральный индекс $\alpha$ можно посчитать следующим образом:

$\LARGE \alpha =
\frac{\Delta(\lambda F_{\lambda})}{\Delta \lambda}=
\frac{F_{2}\lambda_2-F_1\lambda_1}{\lambda_2-\lambda_1}$

Альтернативно можно определить спектральный индекс через  $F_{\nu}$ — поток излучения на данной частоте $\nu$:

$\LARGE \alpha =
\frac{\Delta(\nu F_{\nu})}{\Delta \nu}$

### Эволюционные стадии молодых звёзд

Разделение молодых звёздных объектов на классы по спектральному индексу в ИК диапазоне было предложено в работе *[Lada (1987)](https://articles.adsabs.harvard.edu/pdf/1987IAUS..115....1L)*. В зависимости от значения $\alpha$ объект относится к классам I, II и III. Классы расположены в порядке убывания спектрального индекса, то есть уменьшения инфракрасного избытка, что примерно отражает эволюционную последовательность. Позже стали выделять более ранние объекты класса 0, а также промежуточные между классами I и II  объекты FS (объекты с плоским спектром, flat spectrum).

В данной работе мы будем придерживаться классического определения, выделяя три основных класса на основании значения $\alpha$.

К **классу I** относятся молодые звёздные объекты, у которых $\alpha>0$, то есть поток излучения возрастает с длиной волны. Они представляют самую раннюю эволюционную стадию молодой звезды: протозвезда, окружённая протопланетным диском и аккрецирующей газо-пылевой оболочкой. На этой стадии увидеть диск в ИК диапазоне практически невозможно из-за поглощения. Однако это можно сделать в субмиллиметровом (радио) диапазоне, где светит холодная пыль, а оболочка прозрачна для излучения. Те объекты класса I, в которых не детектируется излучение на длинах волн короче 20 мкм, относят к классу 0.
![Class 1](Images/1.png)

По мере эволюции газопылевая оболочка истощается, а протозвезда становится ярче и горячее. Звёздный ветер рассеивает оболочку, и в излучении объекта начинает преобладать звездная фотосфера вместе с околозвёздным диском. Такие объекты относятся к **классу II** и имеют спектральный индекс в диапазоне $-2<\alpha<0$.
![Class 2](Images/2.png)

Околозвездный протопланетный диск также рассеивается с течением времени, оставляя в спектре практически только излучение протозвезды, с небольшим избытком в ближнем ИК от остатков рассеянного диска. Это самая поздняя стадия молодых звёздных объектов: **класс III**, с $\alpha<-2$. SED такого объекта похож на спектр абсолютно чёрного тела (АЧТ), но более красный и тусклый из-за поглощения. \
Объекты класса III часто идентифицируют уже не по ИК избытку, а с помощью других инструментов, например, по собственному движению вместе с молодым скоплением, избытку УФ или рентгеновского излучения, а также по слабому излучению в оптическом диапазоне.
![Class 3](Images/3.png)

Данная классификация применяется для *молодых звёзд малых масс* (<8 масс Солнца). Эволюция более массивных звёзд происходит быстрее, и яркая горячая звезда очень быстро рассеивает окружающее её вещество. Здесь мы рассматриваем области образования именно <ins>маломассивных звёзд</ins>. \
Классификация молодых звёздных объектов до сих пор модифицируется. Так что критерии разделения звёзд по классам могут отличаться в разных работах и включать дополнительные характеристики такие как: наличие ультрафиолетового избытка излучения, истечений, соотношение между массой звезды и окружающей оболочки. \
Также важно отметить, что хотя эта классификация примерно отражает эволюционную последовательность, она не строго с ней связана. Например, звезда без оболочки, окружённая протопланетным диском, может выглядеть как объект класса I, видимый с ребра. Однако используемая нами классификация полезна для примерной оценки эволюционной стадии молодой звезды, особенно при исследовании групп звёзд.

## 2. Загрузка данных

В этой практике мы исследуем две области звездообразования: в созвездии Тельца и в созвездии Змееносца. Оба скопления находятся на расстоянии около 140 пк (парсек) от Земли и состоят из десятков-сотен молодых звёздных объектов. Многие из них наблюдались с Земли в видимом и ближнем ИК диапазоне. Однако более детальное исследование их в контексте эволюции молодых звёзд стало возможно благодаря появлению наблюдений в недоступном с Земли среднем и дальнем ИК диапазоне. \
Мы будем использовать фотометрические данные на 12, 25, 60 и 100 мкм, полученные инфракрасной космической обсерваторией IRAS, запущенной в 1983 году. Предлагаемые наборы данных основаны на работах [Wilking, Lada & Young (1989)](https://articles.adsabs.harvard.edu/pdf/1989ApJ...340..823W) для $\rho$ Змееносца и [Kenyon & Hartman (1995)](https://articles.adsabs.harvard.edu/pdf/1995ApJS..101..117K) для Тельца.

Все данные находятся в папке `Data`. Объекты из Тельца и Змееносца разделены по папками `Taurus` и `Ophiuchus` (латинские названия этих созвездий) соответственно. Каждый файл содержит данные по одному объекту, всего их 102 в папке `Taurus` и 33 в папке `Ophiuchus`. В файлах:
* первый столбец &mdash; длина волны, на которой мы наблюдаем звезду ($\lambda$), единицы измерения &mdash; микроны (мкм)
* второй столбец &mdash; значение потока на этой длине волны, умноженное на эту длину ($F_{\lambda} \cdot \lambda$), единицы измерения &mdash; $\large {эрг}\over \large {с\cdotсм^2}$

### Скопление в Тельце

Для загрузки данных используем библиотеку `numpy`

In [None]:
import numpy as np

Из него мы возьмём функцию `loadtxt`. В качестве первого аргумента нужно поставить путь к файлу и его имя, например: `Data/Taurus/filename.txt`.

*Напомним, что такой путь называется <ins>относительным</ins>, так как он указывается относительно папки, в которой находится файл с нашим Jupiter notebook-ом. То есть из текущего местоположения нам нужно пойти в папку `Data`, потом в папку `Taurus` и затем открыть нужный файл.*

Для загрузки столбцов данных в раздельные переменные будем использовать аргумент `unpack=True`. 

Чтобы воспользоваться функцией из библиотеки, нужно указать краткое название пакета и затем саму функцию: `np.loadtxt()`.

Либо можно сразу импортировать конкретную функцию: 
```python
from numpy import loadtxt
```
Тогда указывать ссылку на библиотеку `np.` уже не нужно. Это удобно в случаях, когда во всём коде используется только 1-2 функции из библиотки.

In [None]:
wv1, flux1 = np.loadtxt('', unpack=True) # в кавычках укажите путь до нужного файла и его название

## 3. Спектральное распределение энергии

Чтобы понять, что же означают наши данные, мы можем их визуализировать &mdash; построить график. Для этого используем пакет `matplotlib.pyplot`.

In [None]:
import matplotlib.pyplot as plt

Используем функцию `plot`. Её основные аргументы: значения по осям Х и Y:

In [None]:
plt.plot(x, y) # впишите нужные аргуметы вместо х и y

Без использования дополнительных функций график выглядит маленьким и непонятным. Чтобы это исправить, воспользуемся ещё несколькими функциями из `matplotlib.pyplot`:

In [None]:
plt.figure(figsize=(14,9)) # здесь мы создаём основу для графика - так называемую фигуру, и задаём её размеры
plt.title('', fontsize=20) # используется, чтобы вписать название графика вверху фигуры
                           # fontsize задаёт размер шрифта
plt.xlabel('', fontsize=18) # так можно сделать подпись оси Х: какая величина там представлена 
                            # и в каких единицах измерения
                            # эту информацию можно посмотреть в первой строке исходного файла
plt.ylabel('', fontsize=18) # то же самое для оси Y, необходимую информацию также возмите из файла с данными
plt.gca().tick_params(labelsize=16) # таким способом можно задать размер чисел на осях графика

# Теперь можно рисовать сам график:
plt.plot(wv1, flux1, marker='o') # последний аргумент задаёт формат точек, отражающих местоположение
                                 # значений из данных. Без него график будет нарисован только линиями

# Чтобы не показывалась надпись [<matplotlib.lines.Line2D at 0x7fb391c06730>] над графиком,
# можно добавить финальный штрих
plt.show()

Хм, что-то это не совсем похоже на SEDы, которые мы видели в примерах из теоретической части...\
Дело в том, что для их рисования используется <ins>логарифмическая шкала</ins>. Это значит, что мы берём не само число, а его порядок (или число, умноженное на 10 в некоторой степени). Например, порядок числа 1000 &mdash; это три, его можно переписать в виде $ 1 \cdot 10^3 $. А порядок числа 0.01 &mdash; это -2, то есть $ 0.01 = 1 \cdot 10^{-2} $.

Чтобы построить график с осями в логарифмическом масштабе, воспользуемся функцией `plt.loglog`. Ей на вход подаются те же самые аргументы, что и для `plot`.

In [None]:
# Нарисуйте график, используя plt.loglog

Теперь мы получили самый настоящий SED!
Попробуем построить несколько штук и сравнить их между собой.
Для этого нужно так же загрузить файлы с помощью `np.loadtxt` и построить с помощью `plt.loglog`.

<p><details><summary>Если хотите сделать так, чтобы по оси X подписывались не степени числа 10, а нормальные человеческие числа &mdash; кликните <ins>сюда</ins>.</summary>
    Для этого существует функция plt.xticks (и аналогичная ей plt.yticks). Первым аргументам ей списком указывается расположение нужных нам подписей (например, [0.1, 1, 10, 100]), вторым аргументом сами лэйлблы/подписи. Тут можно использовать либо тот же самый список [0.1, 1, 10, 100], либо подписать их чем угодно &mdash; словами, датами и т.д., передавая соответствующий список.
    </details>
    </p>

In [None]:
# Загрузите данные ещё для двух объектов

In [None]:
# Постройте графики для всех трёх объектов

Для удобства можем также сделать легенду графика &mdash; указать каким цветом обозначены какие данные. Для этого в функции `plt.loglog` необходимо указать аргумент `label`: например, `label="Объект 1"`. И в списочек функций нужно добавить `plt.legend()`.

In [None]:
plt.figure(figsize=(14,9))
plt.title('', fontsize=20)
plt.xlabel('', fontsize=18)
plt.ylabel('', fontsize=18)
plt.gca().tick_params(labelsize=16)

# Сюда вставьте функции plt.loglog, указывая в них аргумент label

plt.legend(fontsize=16) # чтобы поменять размер окошечка с легендой можно использовать аргумент fontsize
plt.show()

## 4. Спектр абсолютно чёрного тела

Выше мы уже упоминали это словосочетание. Разберёмся с ним чуть подробнее. 

[**Абсолютно чёрное тело (АЧТ)**](https://ru.wikipedia.org/wiki/%D0%90%D0%B1%D1%81%D0%BE%D0%BB%D1%8E%D1%82%D0%BD%D0%BE_%D1%87%D1%91%D1%80%D0%BD%D0%BE%D0%B5_%D1%82%D0%B5%D0%BB%D0%BE) &mdash; некая идеализированная физическая концепция; тело, которое поглощает всё падающее на него излучение (в то время как другие объекты могут отражать или рассеивать часть излучения). При этом само абсолютно чёрное тело испускает электромагнитное излучение, спектр которого определяется только его температурой.

Абсолютно чёрных тел практически не существует в природе, но есть объекты, спектр которых приближённо можно считать спектром АЧТ.  Такое излучение называют тепловым. В частности, у звёзд присутствует компонента АЧТ, благодаря которой можно оценить температуру объекта.

В случае наших молодых звёзд мы будем считать, что звезда и окружающее её облако/диск из пыли излучают примерно как абсолютно чёрное тело, каждое со своими параметрами (температурой и размером). Так у объектов класса I будет наблюдаться два таких  слагаемых, а у объектов III класса компонент будет всего один, так как рассеявшаяся пыль уже не будет давать существенного вклада в спектр объекта. Советуем вам вернуться к теоретическому блоку, там на графиках показаны соотношения спектров АЧТ и молодых звёздных объектов разных классов.

Для получения спектра АЧТ мы будем пользоваться функцией `acht` из модуля `lksh`. 

Так как SEDы мы строим в значениях потока, а не интенсивности, необходимо делать нормировку на коэффициент, зависящий от расстояния до объекта и его размера. 

В функции `acht` есть 5 обязательных аргумента и 1 опциональный:

```python
acht(wavel, waver, temp, radius, units, distance=140)
```
Первые два задают границы графика АЧТ по оси Х. Например, спектр звёзды стоит строить в промежутке от 0.1 до 10 мкм. 

Третий аргумент &mdash; температура в [Кельвинах](https://ru.wikipedia.org/wiki/%D0%9A%D0%B5%D0%BB%D1%8C%D0%B2%D0%B8%D0%BD).

Четвёртый &mdash; радиус объекта.

Для звёзд радиус удобно записывать в [радиусах Солнца](https://ru.wikipedia.org/wiki/%D0%A1%D0%BE%D0%BB%D0%BD%D0%B5%D1%87%D0%BD%D1%8B%D0%B9_%D1%80%D0%B0%D0%B4%D0%B8%D1%83%D1%81#:~:text=%D0%A1%D0%BE%CC%81%D0%BB%D0%BD%D0%B5%D1%87%D0%BD%D1%8B%D0%B9%20%D1%80%D0%B0%CC%81%D0%B4%D0%B8%D1%83%D1%81%20(%D0%BE%D0%B1%D0%BE%D0%B7%D0%BD%D0%B0%D1%87%D0%B5%D0%BD%D0%B8%D0%B5%3A%20R%E2%8A%99,%D0%97%D0%B5%D0%BC%D0%BB%D0%B8%20%D0%B8%D0%BB%D0%B8%20400%20%D1%80%D0%B0%D0%B4%D0%B8%D1%83%D1%81%D0%B0%D0%BC%20%D0%9B%D1%83%D0%BD%D1%8B.). А для окружающего диска &mdash; в [астрономических единицах](https://ru.wikipedia.org/wiki/%D0%90%D1%81%D1%82%D1%80%D0%BE%D0%BD%D0%BE%D0%BC%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D0%B5%D0%B4%D0%B8%D0%BD%D0%B8%D1%86%D0%B0#:~:text=%D0%90%D1%81%D1%82%D1%80%D0%BE%D0%BD%D0%BE%D0%BC%D0%B8%CC%81%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F%20%D0%B5%D0%B4%D0%B8%D0%BD%D0%B8%CC%81%D1%86%D0%B0%20(%D1%80%D1%83%D1%81%D1%81%D0%BA%D0%BE%D0%B5%20%D0%BE%D0%B1%D0%BE%D0%B7%D0%BD%D0%B0%D1%87%D0%B5%D0%BD%D0%B8%D0%B5%3A%20%D0%B0,149%20597%20870%20700%20%D0%BC%D0%B5%D1%82%D1%80%D0%B0%D0%BC.). Чтобы разделить эти два случая, используется пятый аргумент, который может принимать значения `'rad_sun'` для Солнечных радиусов и `'au'` для астрономических единиц.

Последний аргумент задаёт расстояние до объекта в [парсеках](https://ru.wikipedia.org/wiki/%D0%9F%D0%B0%D1%80%D1%81%D0%B5%D0%BA). В нашей функции он опционален, так как оба исследуемых скопления расположены на расстоянии 140 пк от Земли.

Также важно упомянуть, что функция `acht` выводит массив из двух элементов: список длин волн и список соответсвующих значений потока. Поэтому при рисовании графика необходимо указывать, какой элемент массива мы используем в качестве аргумента Х, а какой в качестве Y:
```python
plt.plot(acht(wavel, waver, temp, radius, units, distance=140)[0], acht(wavel, waver, temp, radius, units,      distance=140)[1])
```

In [None]:
# Импортируйте функцию acht из модуля lksh

Попробуйте нарисовать график потока АЧТ для звезды температурой 4000 К и радиусом 5 Солнечных. Для наглядности используйте функцию `plt.loglog`. 

Посмотрите, как меняется график при изменении значений параметров.

На одном рисунке постройте SED объекта №78 *(его название &mdash; LK Ca15)* и поток АЧТ. Подберите значения температуры и размера звезды так, чтобы пик графиков максимально совпадал. Помните, что наши объекты &mdash; не идеальные чёрные тела. Это нормально, что на каких-то длинах волн в потоке звезды присутствует поглощение и графики не совпадают идеально.

In [None]:
# Загрузите данные из файла Obj78.txt

In [None]:
# Постройте SED этого объекта
# Тут же постройте график АЧТ и подберите параметры функции так, чтобы пик графиков совпадал

*Меняйте первые два аргумента функции acht, чтобы оба графика были сопоставимого размера.*

In [None]:
# Проделайте те же действия для объектов № 66 и 96. Их названия - DM Tau и GM Aur соответственно.

Теперь можем сравнить полученные нами значения температуры и размеров с "официальными" научными данными. Температуры звёзд можно найти в следующих статьях: [№ 1](https://arxiv.org/pdf/astro-ph/0612534.pdf) (объекты LK Ca15 и DM Tau) и [№ 2](https://arxiv.org/pdf/2109.06268.pdf) (объект GM Aur). Нужные значения указаны в табличке а не в тексте, главное обращайте внимание на название таблиц и колонок. **Если не удаётся найти информацию в статьях, обратитесь за помощью к волонтёрам!**

Попробуйте построить SEDы и графики АЧТ по найденным данным.

In [None]:
# Ваш код

Совпадают ли пики у графиков? Подумайте, с чем это может быть связано. Свои предположения можете высказать волонтёрам, и они расскажут правильный ответ.

## 5. Спектральный индекс

Теперь рассчитаем спектральные индексы для наших объектов. Для этого вспомним формулу из теории:
$\LARGE \alpha =
\frac{\Delta(\lambda F_{\lambda})}{\Delta \lambda}=
\frac{F_{2}\lambda_2-F_1\lambda_1}{\lambda_2-\lambda_1}$

Записать все эти рассчёты на питоне &mdash; не такая тривиальная задача, поэтому у нас есть готовая функция `spectral_ind`, которой нужно давать два аргумента &mdash; длину волны и значения потока для одного объекта. Она будет выводить одно число &mdash; спектральный индекс (помните, что он может быть отрицательным, это нормально!). 

Эту функцию нужно импортировать из нашего модуля `lksh`:

In [None]:
from lksh import spectral_ind

In [None]:
# Посмотрите спектральный индекс у одного или нескольких объектов

Вручную загружать все файлы и считать их спектральный индекс &mdash; долгая и муторная задачка. Поэтому предлагаем вам с помощью наших подсказок оптимизировать этот процесс: написать цикл (или даже функцию), в котором все шаги будут выполняться автоматически. Так вы сможете на практике применить знания из сегодняшней лекции по Питону и лучше ориентироваться в его возможностях!

Для начала нам понадобится список всех файлов, которые есть в нужной директории (в нашем случае &mdash; `Data/`). Для этого есть функция `listdir`. Находится она в модуле `os`, так что первым делом импортируем его:

In [None]:
import os

Посмотрим как работает функция:

In [None]:
os.listdir('') # в кавычках впишите директорию, в которой нужно посмотреть список файлов
               # чтобы посмотреть все файлы в текущей директории, можно просто поставить точку

Для загрузки данных нам нужны были не только названия файлов, но и путь до них. Функция `listdir` такого не делает. Попробуем сами написать дополнение к ней в виде цикла `for`. \
Вам необходимо перебрать элементы списка, который выдаёт функция `listdir`, и к каждому из них в начале добавить строчку с путём до нужной директории, например 'Data/'. Результат каждой итерации добавляйте в заранее созданный пустой список.\
**Если возникают вопросы, не стесняйтесь задвать их волонтёрам!**

In [None]:
# Ваш цикл for

<ins> Подсказка 1</ins>. Цикл `for`, в котором вы работаете со списком удобно записывать в одну строчку, как в примере ниже:

In [None]:
a = [i+1 for i in range(10)]
a

Более сложные циклы, записанные в одну строчку, бывают не так наглядны: по началу вам может быть сложно написать или "прочитать" их. Однако со временем вы можете привыкнуть и сокращать таким образом количество строчек в вашем коде и время, затраченное на него.

*Здесь и далее звёздочками помечены необязательные задания* \
✨ Попробуйте переписать ваш цикл в одну строчку

In [None]:
# Ваш код

Самый продвинутый уровень удобства вашего кода &mdash; это написание собственных функций. С ними вы можете не копировать несколько раз один и тот же цикл, вставляя в него разные значения. Вместо этого можно всё записать в функцию и просто менять в ней аргументы. \
Попробуйте написать свою функцию `listdir`:

In [None]:
def listdir(): # написание функции обозначается командой def (от слова define). После названия в скобках
               # указываются аргументы, необходимые вашей функции.
        
        # здесь задаётся сама функция. Перепишите сюда свой цикл. Не забудьте указать аргумент в скобках выше
        
        return  # здесь указывается, что должна вернуть ваша функция: значение переменной, список или что-то ещё

Вернёмся к спектральным индексам. Наша основная задача &mdash; получить список всех спектральных индексов для объектов одного скопления. Пользуясь нашей функцией `listdir`, можем написать цикл `for`, который будет перебирать все названия файлов (с путём до них), загружать данные, считать спектральный индекс и добавлять его в заранее созданный пустой список. 

In [None]:
# Ваш цикл for

✨ Можете тоже записать этот цикл в виде функции

✨✨ Также можете попробовать объединить две функции в одну. На вход ей будет подаваться путь к нужной директории. В теле функции будет создаваться список файлов с путём до них и затем подсчитываться спектральный индекс. \
<ins>Подсказка 2</ins>. Функция может возвращать несколько значений/списков. Для этого в строке `return` нужно указать все выводимые результаты через запятую.

## 6. Гистограмма распределения объектов по спектральным индексам

Для начала выясним: **что такое гистограмма?** (если вы уже знакомы с этим понятием, можете пробежаться по дальнейшему тексту глазами и переходить к построению гистограммы)

Гистограмма &mdash; это один из способов визуализации данных. По сути она отражает распределение данных по некоторым значениям. Чтобы это осознать, разберём несложный пример.

Скажем, у нас есть некоторый набор данных &mdash; список из 30 чисел от 0 до 10:

In [None]:
a = [1, 2, 4, 6, 9, 10, 4, 5, 8, 1, 4, 5, 9, 7, 0, 1, 4, 0, 6, 3, 6, 2, 5, 8, 4, 9, 2, 0, 1, 4]
len(a) # показывает длину списка

Мы озадачились вопросом: как часто в нашем списке встречается число 5? Конечно, можно просто глазами пробежаться по списку и посчитать. Либо использовать метод `.count()`:

In [None]:
a.count(5)

Но что если мы хотим узнать частоту появлений для каждого числа? И наглядно увидеть, какие встречаются чаще, а какие реже? В этом случае мы используем гистограмму.

In [None]:
plt.figure(figsize=(14,9))
plt.hist(a, 10, edgecolor='black') # эта функция строит гистограмму по заданному массиву данных
                                   # 10 здесь - это количество бинов (о них пойдёт речь далее)
                                   # edgecolor рисует линии по границам прямоугольников гистограммы
plt.xticks([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) # передаём список чисел, которые хотим видеть по оси Х
plt.xlabel('Число из списка', fontsize=18)
plt.ylabel('Количество появлений числа в списке', fontsize=18)
plt.gca().tick_params(labelsize=16)
plt.show()

Первая колонка отражает, сколько с нашем списке нулей &mdash; 3 штуки. Соответственно единичек &mdash; 4 штуки и т.д. Минимальное количество появлений &mdash; у чисел 3 и 7, максимальное &mdash; у числа 4. 

В нашем примере на гистограмме отражалось количество появлений отдельных чисел. Но бывает, например, что в списке есть числа от 0 до 100 и нам нужно посмотреть частоту появлений на некотором промежутке, скажем от 30 до 40. Тогда нам не очень удобно строить гистограмму по появлению каждого отдельного числа, а потом суммировать значения для чисел 30, 31, 32, ..., 40. Гораздо проще сразу выбрать разбиение по десяткам:
![hist](Images/histnorm.png)

Здесь сразу видно, что числа от 30 до 40 встретились в списке примерно 13 раз.\
Также гистограмма наглядно показывает, какие числа встречаются наиболее часто (в данном примере это промежуток от 50 до 60). Это бывает полезно для простого статистического анализа данных.

Длину интервалов (или по-другому *бинов*), как и их количество, можно выбирать самостоятельно. Чаще всего задаётся именно количество бинов, а длина их подбирается так, чтобы все прямоугольники на гистограмме были одинаковой ширины.

Суммируя вышесказанное, **построение гистограммы происходит следующим образом**:
1. Задаётся количество бинов (например, 10).
2. В списке ищется максимальное и минимальное значение (например, 0 и 100).
3. Высчитывается длина интервалов: разность между максимумом и минимумом делится на количество бинов ($\frac{100-0}{10}=10$).
4. Подсчитывается, сколько элементов списка попадает в каждый из промежутков (например, в интервал от 0 до 10 попадает 4 элемента, от 10 до 20 &mdash; 3 элемента и т.д.)

Количество бинов задаётся в функции `plt.hist()` аргументом `bins`. Можно не указывать название аргумента, а просто писать требуемое число через запятую после массива данных.

In [None]:
# Постройте гистограмму распределения спектральных индексов в скоплении

Вспомните классификацию молодых звёздных объектов по спектральному индексу. Объекты какого класса преобладают в скоплении Тельца?

### Скопление в Змееносце

Теперь нам нужно проделать все те же шаги для звёздного скопления в Змееносце. Используя имеющиеся инструменты, постройте ещё одну гистограмму распределения спектральных индексов.

In [None]:
# Загрузите 2-3 файла с данными из директории Data/Ophiuchus

In [None]:
# Нарисуйте SEDы, чтобы убедиться в корректности данных
# Можете также сравнить SEDы для объектов из разных скоплений

In [None]:
# Сделайте список всех спектральных индексов по второму скоплению

In [None]:
# Постройте гистограмму по этому списку

Объекты какого класса преобладают в скоплении $\rho$ Змееносца?

## 7. Сравнение возраста скоплений

Финальная наша задача &mdash; сравнить возраст двух изученных скоплений. 

Постройте две гистограммы на одном графике. Учтите, что в Тельце мы собрали данные по 100 объектам, в Змееносце &mdash; по 30 объектам, так что первая гистограмма будет заведомо выше другой. Это не повлияет на анализ их возраста.

In [None]:
# Ваш код

Обратите внимание, что ширина бинов у двух гистограмм разная. В данном случае это не сильно влияет на сравнение возраста скоплений. Однако рекомендуем Вам немного преобразовать вид нашего графика.

Количество бинов можно задавать не только числом, но и списком. В нём необходимо указать интервалы бинов: например, `bins=[0, 1, 2, 3, 4, 5]` &mdash; в этом случае первый бин будет от 0 до 1, второй от 1 до 2 и т.д.

Подумайте, какое разбиение на интервалы было бы наиболее удобно в нашем случае. Важно, чтобы оно полностью охватывало элементы обоих списков и при этом позволяло наглядно оценить количество звёзд разных классов в скоплении.

<ins>Подсказка 3</ins>. Для удобства одну из гистограмм можно сделать более тусклой. Это задаётся аргументом `alpha`. \
`alpha=0` &mdash; это полностью прозрачный объект, `alpha=1` &mdash; полностью непрозрачный.\
Этот аргумент работает не только в `plt.hist`, но и в других функциях для рисования графиков: `plt.plot`, `plt.loglog`...

In [None]:
# Нарисуйте две гистограммы с одинаковыми бинами

Как гистограммы располагаются относительно друг друга? Что это говорит о возрасте звёзд в этих скоплениях? Какое из них старше?

## ✨✨✨ 8. Написание функции `acht`

Это блок повышенной сложности. В нём мы предлагаем вам самим написать функцию, рисующую график АЧТ. Конечно, можно просто зайти в файл с модулем `lksh` и найти там нужную функцию. Если вы так и сделаете, и при этом разберётесь в том, какое действие выполняет каждая строчка, будет уже замечательно! Но если вам хочется попробовать себя в самостоятельном написании непростого кода, советуем вам не "заглядывать в ответы", а воспользоваться своей фантазией, знаниями о питоне и подсказками от авторки практики. Можете ловить меня на самой школе и задавать вопросы. Либо пишите в телеграмм @hi_i_am_katya. Удачи!

In [None]:
# Пространство для вашего кода