# Практика по спектроскопии 

## Введение

На этой практике вам предстоит детектировать разные газы в атмосфере Марса. Спектроскопия &mdash; один из стандартных для этого методов. Достоинство спектроскопии заключается в том, что она позволяет дистанционно измерять присутствие и характеристики разных газов в атмосфере Марса. Часто помимо использования спектроскопии это требует применения [сложных методов обработки данных](https://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%80%D0%B0%D1%82%D0%BD%D0%B0%D1%8F_%D0%B7%D0%B0%D0%B4%D0%B0%D1%87%D0%B0). Мы же будем использовать более простую формулировку задачи для таких *[in situ](https://en.wikipedia.org/wiki/In_situ)* экспериментов как роверы. В подобных случаях часто используют специальное хранилище газа &mdash; кювету, нагнетают туда газ из атмосферы под большим давлением и измереяют его спектр поглощения.
\
\
Схема нашего эксперимента выглядит так: 
![Схема](scheme.png)

Свет проходит через кювету с газом, в которой установлены зеркала с очень высоким коэффициентом отражения. Таким образом можно многократно увеличить оптический путь света, а значит и поглощение. Другой способ усилить поглощение &mdash; увеличить давление газа. В нашем случае газ из марсианской атмосферы нагнетается до давления в 0.5 бар (земной атмосферы). Эта схема очень похожа на прибор [TLS](https://doi.org/10.1007/s11214-012-9879-z).
\
\
С точки зрения математики выглядит это так:
$$
\Large  I = I_0T
$$
Где $I$ &mdash; это измеряемая интенсивность света, $I_0$ &mdash; интенсивность источника, а $T=e^{-\tau}$ &mdash; пропускание света.
Наши данные представлены не в виде интенсивности, а именно в виде пропускания, которое рассчитывается по [формуле Бугера-Лаберта-Бера](https://ru.wikipedia.org/wiki/%D0%97%D0%B0%D0%BA%D0%BE%D0%BD_%D0%91%D1%83%D0%B3%D0%B5%D1%80%D0%B0_%E2%80%94_%D0%9B%D0%B0%D0%BC%D0%B1%D0%B5%D1%80%D1%82%D0%B0_%E2%80%94_%D0%91%D0%B5%D1%80%D0%B0): 
$$
\Large\ T = e^{-k n l}
$$
Где $T$ &mdash; пропускание газа, то есть доля света, проходящего через среду. Значение пропускания, равное **1**, означает, что свет на этой длине волны проходит полностью и не поглощается молекулами газа. Значение **0** значит, что весь свет поглотился и через газ не прошло ни одного фотона света. $l$ &mdash; оптический путь, который проходит свет сквозь среду. В нашем случае свет много раз отражается в зеркалах кюветы и проходит путь, гораздо больший чем длина кюветы. $n$ &mdash; относительное содержание газа (в долях от единицы), а $k$ &mdash; коэффициент поглощения. Коэффициент поглощения &mdash; это величина, которая пропорциональна поглощению отдельными молекулами газа, и зависит от температуры, давления и других параметров вещества. **В вашем распряжении будут данные, которые очень близки к реальным спектрам с Марса, и сечения поглощения каждого газа. Вам нужно будет подобрать концетрацию этих газов так, чтобы они вместе описывали конкретный спектр.**
\
\
Как и на всех других практиках, вокруг вас находятся волонтеры и люди, готовые ответить на любой ваш вопрос. **Пожалуйста, не стесняйтесь спрашивать их вопросы по заданию!**

## Часть первая: спектр около места посадки Mars2020
### Загрузка данных

Мы сгенерировали для вас спектры, которые могли бы быть измерены в районе посадки трех марсоходов: _Сuriosity_, _Mars 2020_ (_Perseverance_) и _Zhurong_. Далее мы попробуем выяснить, сколько в каждом из спектров различных газов.


Для загрузки данных используем пакет `numpy`.

In [None]:
import numpy as np

Будем использовать функцию `loadtxt`, в которой необходимо прописать имя файла вместе с путем к нему (например: `data/filename.txt`)

In [None]:
wavelength, t = np.loadtxt('data/filename.txt', unpack=True) # впишите нужное имя файла

Для вывода данных используем пакет `matplotlib.pyplot`:

In [None]:
import matplotlib.pyplot as plt

Теперь построим график:

In [None]:
plt.plot(x, y) # впишите нужные "x" и "y" в аргументы функции

Напомним, что при рисовании графика очень важно указывать, что отображено по осям. Вы можете посмотреть описание данных, открыв файл в приложении "Блокнот". Впишите в кавычках что указано по оси x и что указано по оси y:

In [None]:
plt.figure(figsize=(16,9))

plt.xlabel('xlabel', fontsize=)   # впишите правильную подпись оси x согласно содержанию текстового файла 
                                  # и выберите подходящий размер шрифта fontsize
plt.ylabel('ylabel', fontsize=)   # впишите правильную подпись оси y согласно содержанию текстового файла 
                                  # и выберите подходящий размер шрифта fontsize
plt.gca().tick_params(labelsize=) # выберите хороший размер чисел по осям

plt.plot(x, y)                    # впишите нужные "x" и "y" в аргументы функции

### Моделирование пропускания
Теперь попробуем это промоделировать. Для этого будем использовать функцию из модуля `lksh`:

In [None]:
from lksh import beerlambert

Для расчета пропускания нам нужны коэффициенты поглощения. Мы подготовили для вас сечения поглощения разных газов. Давайте загрузим, например, CO$_2$:

In [None]:
k_co2 = np.loadtxt('data/task1/cross-sections/co2.txt') # укажите правильный путь до файла

Функция `beerlambert` имеет 5 аргументов:
\
`beerlambert(wavelength, k, n, l, r)`:
\
`wavelength` &mdash; это длины волн, которые мы загрузили в предыдущих ячейках, `k` &mdash; коэффициенты поглощения CO$_2$, которые мы тоже загрузили ранее, `n = 0.96` &mdash; доля содержания CO$_2$ в атмосфере Марса (она состоит из 96% CO$_2$),  `l=100` это оптический путь в метрах, все как в формуле Бугера-Ламберта-Бера, `r=1000` спектральное разрешение прибора.
- Используйте функцию `beerlambert` и подставьте туда правильные аргументы.

In [None]:
wv_co2, t_co2 = beerlambert(wavelength, k, n, l=100) # обратите внимание что wv_co2 не равно wavelength
                                                     # который вы загружали раннее

- Выведите результат, используя `plt.plot` (не забудьте подписать оси и графики).
- Сравните этот спектр с загруженным ранее спектром, измеренным рядом с местом посадки Mars2020.

In [None]:
plt.plot(wv_co2, t_co2)

### Работа со спектром
Теперь попробуем получить коэффициенты пропускания для разных газов. Повторите процесс, описанный в предыдущем пункте, для H$_2$O и CO, выбрав соответствующие файлы из директорий для коэффициентов поглощения `k` и правильную долю содержания `n`.

In [None]:
k_co = np.loadtxt('data/Mars2020/absorption-coefficients/filename1.txt') 
k_h2o = np.loadtxt('data/Mars2020/absorption-coefficients/filename2.txt') 

In [None]:
wv_co, t_co =  beerlambert(wavelength, k=, n=, l=100)
wv_h20, t_h20 = beerlambert(wavelength, k=, n=, l=100)

Теперь необходимо построить графики пропускания атмосферы и отдельных газов. Данные по атмосферы были получены нами в первом пункте при чтении `wavelength` и `t`. Воспользуемся ими ещё раз.

In [None]:
plt.plot(wavelength, t_1, label='main') 
plt.plot(wavelength, t_2, label='gas_name') 
plt.legend()

- Хорошо ли совпадают графики? 
- Подберите значения концентраций `CO2`, `H2O` и `CO` в данных так, чтобы они совпадали с данными

## Часть вторая: место посадки Curiosity

Ровер Curiosity находится в кратере Гейла на Марса. Несколько раз он детектировал метан с помощью прибора TLS. Эти и другие детектирования находятся на пределе возможностей прибора, и _не подтверждены_ более мощными приборами, которые измеряют метан в средней и верхней атмосфере. Одна из гипотез заключается в том, что источник метана находится где-то около поверхности, а его появление носит сезонный характер. Представим себе, что наш прибор проводит измерения именно в момент хорошего содержания метана.
- Загрузите данные из файла `data/Curiosity/spectrum.txt`.

In [None]:
# Ваш код

Возможно, вам будет удобнее выделить полосу поглощения метана на графике и работать только с ней. Для этого можно ограничить рамки графика по осям x и y коммандами `plt.xlim()` и `plt.ylim()`. Это нужно для подробного расмотрения узких интервалов и детального рассмотрения полос спектра.
\
\
- Попробуйте вывести данные в узком диапазоне длин волн. 

In [None]:
plt.plot(wavelength, t_1, label='main') 
plt.plot(wavelength, t_2, label='gas_name') 
plt.xlim() 
plt.ylim()
plt.legend()

- Найдите метан и определите его концетрацию в данных с места посадки Curiosity. Для моделирования используйте коэффициенты поглощения уже из директории `data/Curiosity/absorption-coefficients` &mdash; для каждой локации немного отличается температура и давление, что влияет на спектры.

In [None]:
# Ваш код

- ✨ **Дополнительное задание:** попробуйте найти концетрации других малых газов в этом и предыдущем спектрах.

☝️ _Примечание_: если перемножить модельные спектры, получится не спектр газа, который состоит из этих двух компонент, а нечто другое. Это связано с тем, что для простоты свертка зашита в `beerlambert`. Если хотите точное воспроизведение экспериментальных данных, вызовите `beerlambert` с аргументом `r=None`, перемножьте пропускание интересующих вас газов, а потом сверните результат умножения с помощью функции convolve из модуля `lksh`.

## Часть третья: место посадки Zhurong и спектры высокого разрешения

До этого мы использовали данные низкого разрешения. Такие спектры более наглядные, однако, работая с более высоким разрешением, можно детектировать гораздо меньшие доли компонентов. 
- Попробуйте поменять значение параметра `r`, который отвечает за разрешение спектрометра. Подставьте значения `1000` (стандартное), `5000`, `10000` и `20000`.
- Посмотрите, как выглядят спектры с разным разрешением.

In [None]:
# Ваш код

Теперь попробуем поработать со спектром высокого разрешения и восстановим значение водяного пара (`H2O`) из данных.
- Определите концетрацию водяного пара из данных в файле `data/Zhurong/spectrum.txt`. В этих данных `r=10000`.

In [None]:
# Ваш код

- ✨ **Дополнительное задание:** попробуйте найти концетрации других малых газов в этом спектре.

## ✨✨✨ Часть четвертая: настоящая наука

Если вы чувствуете себя уверенно и хотите попробовать экспириенс, максимально близкий к научному, то попробуйте оптимизировать и автоматизировать процесс. Обратите внимание, что это **гораздо** более сложная задача, чем все предыдущие, но зато она вам даст отличный опыт работ с оптимизацией. 
\
\
Как автоматизировать процесс поиска концентраций опредленных газов? Нужно минимизировать разницу между моделью и данными! Сначала нужно найти эту самую разницу. Вообще говоря, сделать это не так то просто: модельные и экспериментальные данные определены у нас на разных сетках. Вам необходимо проинтерполировать экспериментальные данные на сетку модельных. Лучше всего использовать для этого функцию [interp1d из scipy](https://docs.scipy.org/doc/scipy/reference/generated/scipy.interpolate.interp1d.html). На русском есть гайд вот [здесь](https://github.com/teimy/iki-course/blob/master/Lection3.ipynb), но лучше посмотрите в гугле на английском.

In [None]:
# Ваш код
# Здесь уже без подсказок

Отлично, теперь нам нужно минимизировать разницу. Этот процес называется оптимизация, и это очень большой и сложный раздел математики и программирования. Вот [здесь же](https://github.com/teimy/iki-course/blob/master/Lection3.ipynb), в главе `Аппроксимация` есть подробное описание и короткий гайд к использованию функции [`curve_fit`](https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.curve_fit.html). Вам нужно грубо говоря сделать то же самое, только вместо `func(x, a, b, c)` у нас `beerlambert`.
\
\
Совет: сначала попробуйте сделать пример из курса по ссылке, потом пробуйте здесь. Между примером по ссылке и нашим примером есть одна огромная разница: там функция считается всего пару микросекунд, а у нас, из-за вшитой свертки, она считается очень долго. У этой проблемы есть глобально два решения: простое заключается в обрезании данных маской по длиннам волн до узкого окна, а значит сокращении времени работы функции `beerlambert` на порядок. Сложное заключается в генерации сетки данных с разной концентрации n, а потом двумерную интреполяцию в диапзоне длин волн и концентраций. Это решение гораздо более быстрое и правильное, но надо написать много сложного кода.
\
\
Если у вас получится реализовать до конца Летней Космической Школы 2024 любое из этих решений &mdash; присылайте его на почту `aleksander.lomakin96@gmail.com`, с меня сувенир :)

In [None]:
# Ваш код