# Практическая работа №1

## Вариант 3

## Работа с типами данных. Повторение базового уровня Python

**Цель работы**

Провести анализ показателей населения, географических и временных характеристик городов в составе федеративного государства, используя инструменты Python для обработки данных, расчётов и выявления закономерностей. Исследовать роль неизменяемости данных в обеспечении целостности анализа.

**Задание**

1. Выберите страну с федеративным устройством, включающую не менее трёх республик или автономных субъектов (например, Индия, Нигерия, Малайзия). Добавьте (картинку) карту с выбранными данными. Почему именно они вызвали интерес к анализу?

2. Для каждого из трёх субъектов выберите минимум по 5 городов, включая его столицу.

3. Самостоятельно соберите данные для каждого города:

    Данные должны включать:
    - Полное название города.
    - Республика (субъект), к которой относится.
    - Географические координаты (широта, долгота) — Создайте две версии набора данных: с высокой точностью: координаты с 6 знаками и с низкой точностью: те же координаты, округлённые до 2 знаков.
    - Часовой пояс.
    - При одном часовом поясе в одном субъекте: моменты времени захода и восхода солнца (на анализируемый период времени).
    - Указание, является ли город столицей республики (булева переменная).

**Выбор страны, регионов, городов и составление датасета**

В качестве страны с федеративным устройством были выбраны США.

Для анализа были выбраны следующие три штата и по пять городов (включая столицу) в каждом из них:

<img src="./img/selected_states_map.png" alt="Выбранные штаты США" width="700" height="auto">

1. **Калифорния:**
    1. Сакраменто (столица штата)
    2. Лос-Анджелес
    3. Сан-Франциско
    4. Фресно
    5. Реддинг
2. **Техас:**
    1. Остин (столица штата)
    2. Хьюстон
    3. Даллас
    4. Эль-Пасо
    5. Амарилло
3. **Аризона:**
    1. Финикс (столица штата)
    2. Тусон
    3. Флагстафф
    4. Юма
    5. Меса

В Интернете были найдены требующиеся данные по выбранным городам (на дату 13.09.2025):

| Название города | Штат | Широта | Долгота | Часовой пояс (относительно UTC) | Время восхода Солнца | Время захода Солнца | Столица штата? |
|-----|-----|-----|-----|-----|-----|-----|-----|
| Сакраменто | Калифорния | 38.581667 | -121.494444 | -7 | 06:46 | 19:16 | Да  |
| Лос-Анджелес | Калифорния | 34.052234 | -118.243685 | -7 | 06:35 | 19:01 | Нет |
| Сан-Франциско | Калифорния | 37.783333 | -122.416667 | -7 | 06:50 | 19:19 | Нет |
| Фресно | Калифорния | 36.737798 | -119.787125 | -7 | 06:40 | 19:08 | Нет |
| Реддинг | Калифорния | 40.586389 | -122.391667 | -7 | 06:48 | 19:21 | Нет |
| Остин | Техас | 30.267222 | -97.743056 | -5 | 07:14 | 19:38 | Да |
| Хьюстон | Техас | 29.762778 | -95.383056 | -5 | 07:05 | 19:28 | Нет |
| Даллас | Техас | 32.779167 | -96.808889 | -5 | 07:09 | 19:35 | Нет |
| Эль-Пасо | Техас | 31.759167 | -106.488611 | -6 | 06:49 | 19:13 | Нет |
| Амарилло | Техас | 35.199167 | -101.845278 | -5 | 07:28 | 19:56 | Нет |
| Финикс | Аризона | 33.448333 | -112.073889 | -7 | 06:10 | 18:36 | Да |
| Тусон | Аризона | 32.221667 | -110.926389 | -7 | 06:06 | 18:31 | Нет |
| Флагстафф | Аризона | 35.198284 | -111.651299 | -7 | 06:08 | 18:35 | Нет |
| Юма | Аризона | 32.666667 | -114.572222 | -7 | 06:21 | 18:46 | Нет |
| Меса | Аризона | 33.422222 | -111.822778 | -7 | 06:09 | 18:35 | Нет |

### Реализация на Python

**1. Организация данных**

- Реализуйте хранение информации о каждом городе с учётом категории данных.
- Обеспечьте целостность и защиту от случайных изменений неизменяемых важных параметров.
- Используйте разные структуры данных в зависимости от логики использования.
- Проведите анализ занимаемой памяти для двух наборов данных с различными точностями.
- Какой выигрыш в памяти? Почему получен данный результат?

In [7]:
# Установка библиотек
# %pip install pandas

In [8]:
# Импорты
from typing import NamedTuple
from datetime import date
import pandas as pd

In [9]:
# Создаём неизменяемую структуру для хранения данных о городе
class CityData(NamedTuple):
    name: str
    state: str
    latitude: float
    longitude: float
    timezone: int
    sunrise: str
    sunset: str
    is_capital: bool
    collected_date: date

In [10]:
# Собираем все города в один список
cities_data = [
    # Калифорния
    CityData("Сакраменто", "Калифорния", 38.581667, -121.494444, -7, "06:46", "19:16", True, date(2025, 9, 13)),
    CityData("Лос-Анджелес", "Калифорния", 34.052234, -118.243685, -7, "06:35", "19:01", False, date(2025, 9, 13)),
    CityData("Сан-Франциско", "Калифорния", 37.783333, -122.416667, -7, "06:50", "19:19", False, date(2025, 9, 13)),
    CityData("Фресно", "Калифорния", 36.737798, -119.787125, -7, "06:40", "19:08", False, date(2025, 9, 13)),
    CityData("Реддинг", "Калифорния", 40.586389, -122.391667, -7, "06:48", "19:21", False, date(2025, 9, 13)),
    
    # Техас
    CityData("Остин", "Техас", 30.267222, -97.743056, -5, "07:14", "19:38", True, date(2025, 9, 13)),
    CityData("Хьюстон", "Техас", 29.762778, -95.383056, -5, "07:05", "19:28", False, date(2025, 9, 13)),
    CityData("Даллас", "Техас", 32.779167, -96.808889, -5, "07:09", "19:35", False, date(2025, 9, 13)),
    CityData("Эль-Пасо", "Техас", 31.759167, -106.488611, -6, "06:49", "19:13", False, date(2025, 9, 13)),
    CityData("Амарилло", "Техас", 35.199167, -101.845278, -5, "07:28", "19:56", False, date(2025, 9, 13)),
    
    # Аризона
    CityData("Финикс", "Аризона", 33.448333, -112.073889, -7, "06:10", "18:36", True, date(2025, 9, 13)),
    CityData("Тусон", "Аризона", 32.221667, -110.926389, -7, "06:06", "18:31", False, date(2025, 9, 13)),
    CityData("Флагстафф", "Аризона", 35.198284, -111.651299, -7, "06:08", "18:35", False, date(2025, 9, 13)),
    CityData("Юма", "Аризона", 32.666667, -114.572222, -7, "06:21", "18:46", False, date(2025, 9, 13)),
    CityData("Меса", "Аризона", 33.422222, -111.822778, -7, "06:09", "18:35", False, date(2025, 9, 13))
]

In [None]:
# Теперь данные можно преобразовать в pandas DataFrame
df = pd.DataFrame(cities_data)
df.head()

Unnamed: 0,name,state,latitude,longitude,timezone,sunrise,sunset,is_capital,collected_date
0,Сакраменто,Калифорния,38.581667,-121.494444,-7,06:46,19:16,True,2025-09-13
1,Лос-Анджелес,Калифорния,34.052234,-118.243685,-7,06:35,19:01,False,2025-09-13
2,Сан-Франциско,Калифорния,37.783333,-122.416667,-7,06:50,19:19,False,2025-09-13
3,Фресно,Калифорния,36.737798,-119.787125,-7,06:40,19:08,False,2025-09-13
4,Реддинг,Калифорния,40.586389,-122.391667,-7,06:48,19:21,False,2025-09-13
