# Функции

<div class="alert alert-block alert-warning" style="margin-top: 20px">

<font size=4>**Задание 1**</font>     

Внутри директории `data/` есть три файла - `star1.csv`, `star2.csv`, `star3.csv`. В них находятся наблюдения блесков трёх звёзд. Схема данных каждого файла следующая:
- Первый столбец - время наблюдения
- Второй столбец - яркость звезды в данный момент

Нужно найти амплитуду блеска (aka разницу между максимумом и минимумом) всех трёх звёзд и вывести одной строкой, разделённые запятыми.

</div>

In [None]:
files = ["data/star1.csv", "data/star2.csv", "data/star3.csv"]
amplitudes = []

for fname in files:
    values = []
    with open(fname) as f:
        for line in f:
            parts = line.split(",")
            values.append(float(parts[1]))

    amplitude = max(values) - min(values)
    amplitudes.append(str(amplitude))

print(amplitudes[0] + "," + amplitudes[1] + "," + amplitudes[2])

В этом задании уже видно, что если нам нужно проделать одни и те же действия над несколькими объектами (в данном случае - файлами), то приходится дублировать код. Дублирование кода в большинстве случаев - плохо, потому что приводит к нескольким проблемам:

- Такой код сложнее читать - мозг думает, что разные участки кода делают разные вещи и пытается вникнуть отдельно в каждый.
- Если нужно добавить что-то новое, то изменение нужно копипастить в несколько мест

Описать функцию можно своим специальным синтаксисом:

In [None]:
# Описание функции
def my_printer():
    print("Строка которая не меняется")

# Вызовы функции
my_printer()
my_printer()
my_printer()
my_printer()

Как видно, функция описывается один раз, и дальше её можно вызвать сколько угодно раз. 

При этом, чтобы менять поведение того, что внутри функции, в неё можно передавать данные (они называются аргументами):

In [None]:
def my_printer_with_name(name: str):
    print("Строка, которая печатает разное. Например:", name)

my_printer_with_name("Биба")
my_printer_with_name("Боба")

И, наконец, из функции можно возвращать значения:

In [None]:
def gravitational_force(m1_kg: float, m2_kg: float, r_m: float) -> float:
    G = 6.674e-11
    force = G * m1_kg * m2_kg / r_m ** 2 

    return force

earth_mass = 5.972e24      # кг
moon_mass = 7.348e22       # кг
distance = 384400000       # м

force_earth_moon = gravitational_force(earth_mass, moon_mass, distance)
print("Сила притяжения между Землей и Луной:", force_earth_moon, "Н")

person1_mass = 70          # кг
person2_mass = 80          # кг
distance_people = 1        # м

force_people = gravitational_force(person1_mass, person2_mass, distance_people)
print("Сила притяжения между двумя людьми:", force_people, "Н")

Разберём теперь подробно, что именно происходит при описании функции:

> `def gravitational_force(m1_kg: float, m2_kg: float, r_m: float) -> float:`

- `def` - ключевое слово, говорящее "дальше идёт описание функции".

- `gravitational_force` - имя функции, с которым оно будет дальше использоваться.

- `m1_kg` - название первого аргумента.

- `: float` - описание типа первого аргумента. Мы подсказываем Python, что внутри `m1_kg` будет лежать число с плавающей точкой.

- `m2_kg: float` - название и описание типа второго аргумента. Внутри функции будет доступно число с плавающей запятой в переменной `m2_kg`.

- `r_m: float` - название и описание типа первого аргумента. Внутри функции будет доступно число с плавающей запятой в переменной `r_m`.

- `-> float` - подсказка с типом возвращаемого значения. Говорит, что эта функция возвращает число с плавающей точкой.

То, что лежит внутри функции - обычный код на Python (произвольно сложный), кроме одной строки:

- `return force` - ключевое слово, говорящее "после этой строки функция больше не исполняется, возвращаемое значение - значение переменной `force`"

Внутри функций может быть сколько угодно `return`-ов:

In [None]:
def get_parity(number: int) -> str:
    if number % 2 == 0:
        return "even"
    else:
        return "odd"
    
print(get_parity(2))
print(get_parity(101))

<div class="alert alert-block alert-warning" style="margin-top: 20px">

<font size=4>**Задание 2**</font>

Дан список. Нужно написать функции для получения максимума и минимума в нём.

</div>

In [None]:
def get_max(lst: list[float]) -> float:
    max_value = lst[0]
    for item in lst[1:]:
        if item > max_value:
            max_value = item
    return max_value

def get_min(lst: list[float]) -> float:
    min_value = lst[0]
    for item in lst[1:]:
        if item < min_value:
            min_value = item
    return min_value

data = [825.65, 124.13, 345.97, 866.81, 13.77, 21.13, 149.56, 146.31, 563.35, 462.08, 693.3, 311.25]
print(get_max(data))
print(get_min(data))

<div class="alert alert-block alert-warning" style="margin-top: 20px">

<font size=4>**Задание 3**</font>

Использовать функции выше для получения амплитуд звёзд из задания 1.

</div>

In [None]:
def get_amplitude(lst: list[float]) -> float:
    return get_max(lst) - get_min(lst)

def read_star_data(filename: str) -> list[float]:
    values = []
    with open(filename) as f:
        for line in f:
            parts = line.strip().split(",")
            if len(parts) == 2:
                try:
                    values.append(float(parts[1]))
                except ValueError:
                    continue
    return values

star1 = read_star_data("data/star1.csv")
star2 = read_star_data("data/star2.csv")
star3 = read_star_data("data/star3.csv")

print(get_amplitude(star1))
print(get_amplitude(star2))
print(get_amplitude(star3))

# Структуры

Иногда нам может хотеться группировать данные. Пример - наблюдения телескопа. Такое мы уже можем делать словарями:

In [15]:
observations = [
    {
        "object": "NGC5123",
        "timestamp": "2025-05-04 22:42:59",
        "exposure": 12.5,
    },
    {
        "object": "M31",
        "timestamp": "2025-05-04 23:10:15",
        "exposure": 15.0,
    },
    {
        "object": "NGC2244",
        "timestamp": "2025-05-05 00:05:42",
        "exposure": 10.0,
    },
    {
        "object": "M42",
        "timestamp": "2025-05-05 01:20:30",
        "exposure": 18.2,
    },
    {
        "object": "NGC7000",
        "timestamp": "2025-05-05 02:45:12",
        "exposure": 20.0,
    },
    {
        "object": "M51",
        "timestamp": "2025-05-05 03:30:00",
        "exposure": 14.7,
    }
]

Здесь список наблюдений, где каждое наблюдение - словарь, в котором есть заранее известный набор ключей - `object`, `timestamp`, `exposure`. Теперь если мы хотим проделать над этим какие-то операции, мы можем достаточно просто проитерироваться:

In [None]:
for obs in observations:
    print(obs["object"], "was observed on", obs["timestamp"], "with exposure", obs["exposure"])

Тем не менее, у такого подхода есть набор минусов:

- Очень легко опечататься - если мы где-то вставим не тот ключ (`ojbect` вместо `object`), то узнаем об этом только в момент обработки самих данных.
- Нет подсказок от IDE.
- Нужно писать много текста. Для каждого наблюдения нужно явным образом указывать все ключи.
- Нет подсказок о типах данных по ключам.

Если мы имеем такие однородные данные, нам могут помочь структуры (aka датаклассы):

In [None]:
from dataclasses import dataclass

@dataclass
class Observation:
    object: str
    timestamp: str
    exposure: float

obs1 = Observation("M42", "2025-05-05 01:20:30", 18.2)
obs2 = Observation("NGC7000", "2025-05-05 02:45:12", 20.0)

observations = [
    obs1,
    obs2,
    Observation("M51", "2025-05-05 03:30:00", 14.7),
    Observation("M31", "2025-05-06 00:15:45", 22.5),
    Observation("NGC869", "2025-05-06 01:50:10", 16.3),
    Observation("M13", "2025-05-06 03:05:27", 19.8)
]

for obs in observations:
    print(obs.object, "was observed on", obs.timestamp, "with exposure", obs.exposure)

Много чего написано! Посмотрим подробнее:

> `from dataclasses import dataclass`

Пока что можно игнорировать. Структуры просто так не доступны в коде (как доступны `print` или `input`), поэтому их нужно подключать извне. Подробнее эти строчки мы разберём на следующем занятии.

> `@dataclass`

Слово, говорящее "дальше будет описание структуры данных"

> `class Observation:`

- `class` - ключевое слово, говорящее "структура данных будет называться так, как написано справа".
- `Observation` - название структуры данных. Может быть любым, обычно пишет с большой буквы.

> `object: str`

Описание первого поля структуры. Это поле будет называться `object` и будет содержать строку.

> `timestamp: str`

Описание второго поля структуры - будет называться `timestamp` и так же будет строкой.

> `exposure: float`

Третье поле структуры - называется `exposure`, является числом с плавающей точкой.

На этом объявление структуры закончено, дальше идёт обычный код.

> `obs1 = Observation("M42", "2025-05-05 01:20:30", 18.2)`

Объявление переменной, хранящей в себе объект структуры `Observation`. Это будет наблюдение объекта с именем `M42`, указанным временем наблюдения и экспозицией `18.2`. Вызов очень похож на вызов функции с тремя аргументами. Аргументы передаются в том же порядке, в каком они указаны внутри структуры.

Дальше такие объекты можно использовать при помощи синтаксиса с точкой вместо квадратных скобок:

> `print(obs.object, "was observed on", obs.timestamp, "with exposure", obs.exposure)`

`obs["object"]` заменяется на `obs.object`. Остальное - аналогично.

<div class="alert alert-block alert-warning" style="margin-top: 20px">

<font size=4>**Задание 4**</font>

Вывести время, когда реализовался максимум и минимум блеска всех трёх звёзд из задания 1.

Для хранения наблюдений использовать структуру, хранящую время и блеск в каждый момент времени.

</div>

In [17]:
from dataclasses import dataclass

@dataclass
class StarObservation:
    timestamp: str
    magnitude: float

def read_star_observations(filename: str) -> list[StarObservation]:
    observations: list[StarObservation] = []
    with open(filename) as f:
        for line in f:
            timestamp, magnitude = line.split(",")
            observations.append(StarObservation(timestamp, float(magnitude)))
    
    return observations

star1 = read_star_observations("data/star1.csv")
star2 = read_star_observations("data/star2.csv")
star3 = read_star_observations("data/star3.csv")

def find_min_max(observations: list[StarObservation]) -> tuple:
    min_obs = observations[0]
    max_obs = observations[0]
    for obs in observations:
        if obs.magnitude < min_obs.magnitude:
            min_obs = obs
        if obs.magnitude > max_obs.magnitude:
            max_obs = obs
    return min_obs, max_obs

for star in [star1, star2, star3]:
    min_obs, max_obs = find_min_max(star)
    
    print("Min magnitude at", min_obs.timestamp, "| magnitude", min_obs.magnitude)
    print("Min magnitude at", max_obs.timestamp, "| magnitude", max_obs.magnitude)
    print()

Min magnitude at 2024-01-10 09:16:40.268456 | magnitude 10.60243414228243
Min magnitude at 2024-01-08 04:30:36.241611 | magnitude 12.374436494285334

Min magnitude at 2024-01-02 02:40:25.771812 | magnitude 8.853653332852627
Min magnitude at 2024-01-02 17:45:01.208054 | magnitude 10.193881500206954

Min magnitude at 2024-08-09 11:26:10.469799 | magnitude -3.950892722477671
Min magnitude at 2024-06-22 03:42:16.912752 | magnitude -0.024373475474043116

