<a href="https://colab.research.google.com/github/physteacherlab/qe_data_science/blob/Physics-Data-Analysis/QE_DS_classwork_all.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Задачи для самостоятельной работы по анализу данных

В этом разделе 5 задач, которые помогут закрепить навыки загрузки, обработки, анализа и визуализации данных на Python.

Для каждой задачи предусмотрен свой CSV-файл с исходными данными.
Внимательно читайте условия и используйте подсказки к решению.

## Задача 1: Очистка временного ряда с пропусками и выбросами

Дан csv-файл с двумя столбцами: "time" (временные точки) и "value" (значения ряда). Есть пропуски и выбросы.


### Задание:
- Загрузите данные с помощью pandas.
- Обработайте пропуски методом интерполяции по времени.
- Примените медианный фильтр (с окном 3 или 5) для замены выбросов.
- Постройте график до и после очистки.

### Подсказки:
- Используйте `pandas.read_csv`, `df.interpolate(method='time')`.
- Для медианного фильтра — `scipy.signal.medfilt`.
- Для визуализации — `matplotlib.pyplot.plot`.

## Задача 2: Сглаживание и НЧ-фильтрация временного сигнала

Дан csv с временным рядом: "time", "signal" — сигнал содержит полезный тренд, гармонический компонент и шум.

### Задание:
- Загрузите данные из csv.
- Выполните скользящее среднее и экспоненциальное сглаживание.
- Посчитайте спектр через БПФ, выделите доминирующую частоту.
- Реализуйте низкочастотный фильтр: обнулите спектр выше выбранного порога и восстановите сигнал.
- Постройте графики: исходный сигнал, оба вида сглаженных сигналов, спектр, отфильтрованный сигнал.

## Задача 3: Подбор параметров модели и доверительные интервалы

В csv два столбца: "x", "y" — экспериментальные данные, \(y=f(x) + \) шум.

### Задание:
- Загрузите данные.
- Подберите параметры линейной модели двумя способами: формулы МНК и `scipy.optimize.curve_fit`.
- Рассчитайте ковариационную матрицу параметров, стандартные ошибки и 95% доверительные интервалы.
- Постройте график с данными, линией модели и доверительной полосой.

## Задача 4: Сравнение моделей и анализ остатков

Даны измерения (x, y), подходит несколько моделей: линейная, полиномиальная (степени 2 или 3), экспоненциальная.

### Задание:
- Загрузите данные.
- Постройте модели — все три типа.
- Вычислите метрики качества: RSS, R^2, AIC, BIC для каждой.
- Постройте графики остатков vs x, гистограммы остатков.
- Проверьте нормальность остатков тестом Шапиро-Уилка.
- Выберите лучшую модель, объясните выбор.

## Задача 5: Анализ данных физического эксперимента - изучение зависимости периода маятника от длины

В csv данные — измеренная длина "L" маятника и период колебаний "T", с шумом и выбросами.
### Задание:
- Загрузите данные.
- Очистите данные от выбросов с помощью метода интерквартильного размаха (IQR).
- Линеаризуйте модель: \(T^2 = \frac{4 \pi^2}{g} L\).
- Подберите параметры через линейную регрессию, оцените ускорение свободного падения и доверительный интервал.
- Постройте графики: исходные данные T(L), линеаризованный график T^2(L) с линией аппроксимации и теоретической моделью.
- Кратко прокомментируйте влияние очистки данных на оценку g.

## Задача 6: Радиоактивный распад с учетом фона
**Физика:** Закон радиоактивного распада $N(t) = N_0 e^{-\lambda t}$. В реальности детектор всегда регистрирует еще и постоянный радиационный фон $B$.
Итоговая модель:
$$ y(t) = N_0 e^{-\lambda t} + B $$

**Задание:**
1. Загрузите данные (время $t$, активность $y$).
2. Постройте график $y(t)$. Обратите внимание, что «хвост» данных выходит не в ноль, а на константу (фон).
3. Оцените уровень фона $B$ как среднее значение последних 10-20 точек.
4. Постройте график в координатах $\ln(y - B)$ от $t$. Проверьте, ложатся ли точки на прямую.
5. Используя `scipy.optimize.curve_fit`, выполните подгонку полной модели ($N_0 e^{-\lambda t} + B$) к исходным данным (без ручного вычитания фона).
6. Определите период полураспада $T_{1/2} = \frac{\ln 2}{\lambda}$ и его погрешность.

**Инструменты:** `scipy.optimize.curve_fit`, `plt.yscale('log')`.

## Задача 7: Резонансная кривая колебательного контура
**Физика:** Амплитудно-частотная характеристика (АЧХ) колебательного контура вблизи резонанса описывается функцией Лоренца:
$$ U(f) = \frac{U_{max}}{\sqrt{1 + Q^2 \left(\frac{f}{f_0} - \frac{f_0}{f}\right)^2}} $$
где $f_0$ — резонансная частота, $Q$ — добротность контура.

**Задание:**
1. Постройте график экспериментальных точек $(f, U)$.
2. Грубо оцените $f_0$ (по положению максимума) и $U_{max}$.
3. Аппроксимируйте данные теоретической формулой, чтобы найти точные значения $f_0$ и $Q$.
4. **Численно** найдите ширину резонанса на полувысоте (FWHM — Full Width at Half Maximum), решив уравнение $U(f) = U_{max}/\sqrt{2}$ относительно $f$ (или найдя ширину по аппроксимированной кривой).

**Инструменты:** Определение сложной функции для `curve_fit`, методы поиска корней (`scipy.optimize.root` или интерполяция).

## Задача 8: Закон остывания Ньютона (Численное дифференцирование)
**Физика:** Скорость остывания тела пропорциональна разности температур тела и среды:
$$ \frac{dT}{dt} = -k (T - T_{env}) $$

**Задание:**
1. Загрузите данные измерений температуры $T(t)$. Температура среды $T_{env}$ известна.
2. Сгладьте зашумленные данные температуры (например, фильтром Савицкого-Голея), так как прямое дифференцирование шума дает большую погрешность.
3. Вычислите производную $\frac{dT}{dt}$ численно (например, функцией `np.gradient`).
4. Постройте график зависимости скорости остывания $\frac{dT}{dt}$ от разности температур $(T - T_{env})$ — так называемый фазовый портрет.
5. Проверьте линейность этой зависимости и найдите коэффициент остывания $k$ с помощью линейной регрессии.

**Инструменты:** `scipy.signal.savgol_filter`, `np.gradient`, `scipy.stats.linregress`.

## Задача 9: Петля магнитного гистерезиса (Численное интегрирование)
**Физика:** Зависимость намагниченности $M$ от внешнего поля $H$ при циклическом перемагничивании образует замкнутую петлю. Площадь внутри петли пропорциональна потерям энергии на гистерезис за один цикл:
$$ W = \oint M \, dH $$

**Задание:**
1. Загрузите данные цикла перемагничивания $(H, M)$.
2. Разделите данные на «верхнюю» (ход поля в одну сторону) и «нижнюю» (ход поля обратно) ветви, если необходимо, или работайте с полным массивом.
3. Визуализировать петлю гистерезиса.
4. Вычислите площадь внутри петли методом численного интегрирования (формула трапеций или Симпсона).
5. *(Дополнительно)* Найдите коэрцитивную силу $H_c$ (пересечение с осью $H$) и остаточную намагниченность $M_r$ (пересечение с осью $M$).

**Инструменты:** `np.trapz` (метод трапеций) или `scipy.integrate.simpson`.

## Задача 10: Поиск сигнала на фоне (Анализ гистограмм)
**Физика:** В спектроскопии часто нужно выделить узкий пик (сигнал) на широком пьедестале (фоне).
Модель спектра:
$$ F(x) = \text{Gaussian}(x, A, \mu, \sigma) + \text{Background}(x, a, b) $$
где фон, например, линейный или экспоненциальный.

**Задание:**
1. Загрузите массив «сырых» данных (энергии частиц). Это не график, а набор чисел.
2. Постройте гистограмму распределения энергий. Подберите оптимальное число бинов.
3. Получите высоты бинов и центры интервалов.
4. Аппроксимируйте гистограмму суммарной моделью (Гаусс + линейный фон).
5. Вычтите найденный фон из гистограммы, оставив только «чистый» пик.
6. Оцените полное число событий в сигнальном пике (как площадь под гауссианой или сумму отсчетов в очищенной гистограмме).

**Инструменты:** `plt.hist` (возвращает значения), составная функция для `curve_fit`.