## 1. Какой квантиль распределения проще оценить 20% или 90%? Почему? Бывает ли наоборот?

### Ответ:

Как правило, оценка нижних квантилей распределения, таких как 20%-ный квантиль, считается проще, чем оценка верхних квантилей, например 90%-ного. Это связано с несколькими факторами:

- Распределение данных: во многих реальных распределениях данных, таких как доходы, цены на недвижимость или распределение населения по возрастам, большинство значений сосредоточено в нижнем диапазоне. Это означает, что данные для нижних квантилей более плотные и, следовательно, оценки этих квантилей могут быть более точными и стабильными;

- Влияние выбросов: верхние квантили, особенно в распределениях с тяжёлыми хвостами, часто подвержены влиянию выбросов. Выбросы могут сильно искажать оценку квантилей, делая их менее надежными и предсказуемыми;

- Доступность данных: иногда данные для оценки верхних квантилей ограничены или их сложнее собрать, что также увеличивает сложность их оценки.

Однако могут быть ситуации, когда оценка верхних квантилей будет проще, особенно если распределение данных смещено вверх или если исследование фокусируется на верхнем сегменте распределения. Например, в случае распределений, где верхние значения являются более стандартизированными или регулярными (например, оценки высокопроизводительных спортсменов), оценка верхних квантилей может быть проще и более точной.

Таким образом, хотя общая тенденция заключается в том, что оценка нижних квантилей проще, в зависимости от контекста и свойств распределения данные могут показывать обратную тенденцию.

## 2. Какие есть идеи по отображению 5-го атрибута на графике (в добавок к уже отображенным четырем)?

### Ответ:

Существуют различные способы, как это можно сделать. Вот несколько идей:

- Цвет: один из самых распространенных способов добавить дополнительный атрибут - использовать цвет. Каждому уровню или диапазону пятого атрибута можно присвоить определенный цвет. Это работает хорошо для категориальных и даже для некоторых количественных данных;

- Размер: можно использовать размер элементов на графике (например, размер точек в точечной диаграмме) для представления пятого атрибута. Этот метод особенно эффективен, если пятый атрибут количественный;

- Форма: если данные позволяют, можно использовать разные формы маркеров для представления различных категорий или уровней пятого атрибута. Это особенно удобно для категориальных данных;

- Текстура или узор: для категориальных данных можно использовать различные текстуры или узоры для областей на графике (например, в столбиковой диаграмме).

Выбор метода зависит от типа данных (категориальные или количественные), целей анализа и важности легкости интерпретации.

## 3. Имеется многоядерный процессор. Как обеспечить эффективную загрузку большого числа ядер многопоточным способом при проведении вычислений на Python? Сравните с возможности по многопоточности с каким-то другим, известным вам, языком программирования.

### Ответ:

Для обеспечения эффективной загрузки многоядерного процессора многопоточным способом в Python, важно понимать особенности языка и его ограничения. Затем можно сравнить это с возможностями другого языка программирования, например, C++.

#### Python

- Global Interpreter Lock (GIL): Python, особенно его наиболее популярная реализация CPython, имеет GIL, который ограничивает выполнение байт-кода только одним потоком в один момент времени. Это значит, что многопоточность в Python не эффективна для CPU-bound задач, поскольку в любой момент времени только один поток может исполняться;

- Многопроцессность: Альтернативой многопоточности в Python является использование многопроцессности, что позволяет обойти ограничения GIL. Модуль multiprocessing позволяет создавать отдельные процессы, каждый со своим интерпретатором Python и собственной памятью, что позволяет использовать несколько ядер процессора эффективно;

- Специализированные библиотеки: Библиотеки, такие как NumPy или SciPy, могут использовать внутреннюю многопоточность и оптимизации для проведения вычислений, что позволяет обойти GIL и использовать многоядерность эффективно.

#### Сравнение с C++

- Поддержка нативной многопоточности: В отличие от Python, C++ поддерживает нативную многопоточность без таких ограничений, как GIL. Стандарт C++11 и последующие версии предоставляют богатые возможности для работы с потоками через библиотеку <thread>, позволяя эффективно использовать многопоточность для CPU-bound задач;

- Производительность и контроль над памятью: C++ предоставляет более глубокий контроль над системными ресурсами и памятью. Это позволяет более эффективно использовать многоядерные процессоры, особенно в вычислительно интенсивных задачах;

- Компиляция: C++ является компилируемым языком, что может дать дополнительные преимущества в производительности по сравнению с интерпретируемым Python.

#### Вывод

Python хорошо подходит для многопроцессорных вычислений, но из-за GIL он неэффективен для многопоточных CPU-bound задач. Однако, с помощью специализированных библиотек, можно достичь высокой производительности для определенных типов задач.

C++ предлагает более мощные возможности для многопоточных вычислений и лучше подходит для задач, требующих высокой производительности и эффективного использования многоядерных процессоров.
Выбор языка и подхода зависит от конкретных требований задачи, доступных ресурсов и предпочтений разработчика.

## 4. Разработан аналитический показатель, представляющий собой отношение двух стохастических наблюдений во времени. Каких особенностей на практике следует ожидать от такого показателя?

### Ответ:


Аналитический показатель, представляющий собой отношение двух стохастических (случайных) наблюдений во времени, обладает рядом характеристик и особенностей, на которые следует обратить внимание при его анализе и использовании:

- Волатильность: Показатель, основанный на двух стохастических величинах, вероятно, будет демонстрировать значительную волатильность, особенно если исходные данные волатильны. Это особенно важно учитывать при интерпретации краткосрочных изменений показателя;

- Сезонность и тренды: Если исходные данные подвержены сезонным колебаниям или долгосрочным трендам, это может повлиять на показатель. Важно идентифицировать и, при необходимости, корректировать эти факторы для получения более точной картины;

- Зависимость между переменными: Необходимо учитывать степень зависимости или корреляции между двумя наблюдениями. Если они сильно коррелированы, это может искажать аналитический показатель и его интерпретацию;

- Риск деления на ноль или очень маленькое число: Если в знаменателе отношения есть риск очень малых значений или нуля, это может привести к экстремальным значениям показателя или его неопределенности;

- Проблемы масштабирования: Различия в масштабах или единицах измерения двух переменных могут повлиять на аналитический показатель. Важно обеспечить соответствующее масштабирование или нормализацию данных;

- Статистическая значимость: При анализе изменений в таком показателе важно убедиться, что наблюдаемые изменения статистически значимы, а не являются результатом случайных колебаний;

- Скользящие средние и сглаживание: Использование скользящих средних или других методов сглаживания может помочь уменьшить влияние краткосрочных колебаний и выделить более долгосрочные тенденции;

- Чувствительность к выбросам: Показатель может быть чувствителен к выбросам в данных, что может привести к искажению результатов. Применение методов для обработки или исключения выбросов может быть необходимым;

В общем, при работе с такими показателями важно тщательно анализировать и обрабатывать исходные данные, а также корректно интерпретировать результаты с учетом возможных искажений и ограничений.

## 5. Модель искусственной нейронной сети обеспечивает аппроксимацию некоторой зависимости в среднем, однако не гарантирует равномерной аппроксимации. К чему это может приводить на практике?

### Ответ:

Использование модели искусственной нейронной сети, которая обеспечивает аппроксимацию некоторой зависимости в среднем, но не гарантирует равномерной аппроксимации, может привести к нескольким практическим последствиям:

- Неравномерность производительности по разным областям входных данных: Модель может хорошо работать в целом, но показывать плохие результаты на определенных подмножествах данных. Это может быть особенно критично, если плохо аппроксимированные области имеют важное значение;

- Переобучение на определенных данных: Если модель слишком сильно оптимизирована под большинство данных, она может терять способность обобщать и терпеть неудачу на менее представленных данных, что указывает на переобучение;

- Проблемы с экстраполяцией: Модель, оптимизированная для хорошей средней аппроксимации, может плохо справляться с данными, которые находятся вне диапазона тренировочного набора, особенно если эти данные отличаются от общего распределения;

- Риск непредвиденных ошибок в критических приложениях: В приложениях, где важны точность и надежность (например, в медицинских или финансовых системах), неравномерная аппроксимация может привести к серьезным ошибкам и неправильным решениям;

- Недостаточная адаптация к редким событиям: Если редкие события или аномалии важны для задачи (например, в системах обнаружения мошенничества), модель может не улавливать их из-за сосредоточения на аппроксимации более частых событий;

- Трудности в интерпретации и доверии: Неравномерная аппроксимация может усложнить интерпретацию результатов модели и снизить доверие к ней со стороны пользователей.

Для устранения или минимизации этих проблем может потребоваться использование более сложных методов обучения, включая тщательный выбор и балансировку тренировочного набора данных, применение методов регуляризации для избежания переобучения, и использование техник постобработки результатов, таких как калибровка. Также важно проводить тщательное тестирование модели на разнообразных данных, чтобы выявить и устранить возможные проблемы неравномерной аппроксимации.







## 6. Как (и можно ли?) применить динамическое программирование к оптимизации функции, которая не является аддитивной (не является суммой слагаемых или их логарифмов)?

### Ответ:

Для функций, которые не являются аддитивными, применение ДП может быть сложным:

- Преобразование задачи: в некоторых случаях можно преобразовать оптимизационную задачу так, чтобы она подходила под схему ДП. Это может включать в себя изменение функции цели или введение дополнительных ограничений, чтобы задача стала пригодной для аддитивного разложения;

- Поиск подструктуры: основная идея ДП заключается в выявлении оптимальной подструктуры. Даже если функция не является аддитивной, может существовать способ разбить задачу на подзадачи так, чтобы решение каждой подзадачи могло быть использовано для построения решения более крупной задачи;

- Использование аппроксимации: если прямое применение ДП невозможно, можно искать аппроксимативные или эвристические методы, которые позволяют использовать принципы ДП для приближенного решения задачи;

- Анализ частных случаев: в некоторых случаях оптимизация неаддитивных функций может быть упрощена для специфических видов данных или особых условий задачи.

В общем, применение ДП к неаддитивным функциям требует творческого подхода и глубокого понимания специфики задачи. Важно определить, можно ли разбить задачу на подзадачи таким образом, чтобы решения этих подзадач могли быть эффективно использованы для построения общего решения.

## 7. Предложите алгоритм скользящего вычисления дисперсии значений (числовых наблюдений), которые поступают в систему по одному. Сколько для этого требуется памяти?

### Ответ:

Алгоритм скользящего вычисления дисперсии для числовых наблюдений, поступающих по одному, может быть реализован с использованием формулы для онлайн-вычисления дисперсии. Одна из таких формул основана на алгоритме Вельфорда, который позволяет вычислять среднее и дисперсию в один проход.

Пусть
- $n$ - количество наблюдений,
- $x_i$ - новое наблюдение,
- $\bar{x}$ - текущее среднее,
- $S$ - текущая сумма квадратов разностей от среднего, тогда алгоритм обновления этих значений при поступлении нового наблюдения будет выглядеть следующим образом:

Инициализация:
- $ n = 0 $,
- $ \bar{x} = 0 $,
- $ S = 0 $.

Для каждого нового наблюдения $ x_i $:
1. $ n = n + 1 $
2. $ \delta = x_i - \bar{x} $
4. $ S = S + \delta \cdot (x_i - \bar{x}) $

Дисперсия $ \sigma^2 $ рассчитывается как $ S / (n - 1) $ для выборки или $ S / n $ для генеральной совокупности.

Этот алгоритм требует хранения трех переменных независимо от количества наблюдений: текущее количество наблюдений $n$, текущее среднее $\bar{x}$ и сумму квадратов разностей $S$. Таким образом, требуемый объем памяти фиксирован и не зависит от количества наблюдений, что делает этот алгоритм очень эффективным с точки зрения использования памяти.

Однако стоит отметить, что при работе с очень большими данными или данными с большими значениями может возникнуть проблема числовой устойчивости, вызванная накоплением ошибок округления. В таких случаях могут потребоваться дополнительные методы для уменьшения этого влияния.


## 8. Существуют вероятностные распределения, у которых конечным является только первый момент. Приведите пример. Почему с такими распределениями может оказаться трудно работать на практике?


### Ответ:

Примером вероятностного распределения, у которого конечным является только первый момент (среднее значение), а высшие моменты (например, дисперсия, асимметрия, эксцесс) бесконечны или не определены, является распределение Коши.

Распределение Коши определяется функцией плотности вероятности:

$f(x; x_0, \gamma) = \frac{1}{\pi \gamma \left[ 1 + \left( \frac{x - x_0}{\gamma} \right)^2 \right] }$

где $x_0$ - параметр местоположения, а $gamma$ - параметр масштаба.

Хотя у распределения Коши есть определенное среднее значение (первый момент), его дисперсия (а также моменты более высокого порядка) являются бесконечными или не определены. Это связано с тем, что хвосты распределения Коши "тяжелее", чем у нормального распределения, что означает, что вероятность очень больших значений значительно выше.

Работа с такими распределениями на практике может быть затруднена по нескольким причинам:

- **Ненадежные оценки статистик**: Поскольку высшие моменты (включая дисперсию) не определены или бесконечны, оценки стандартного отклонения, асимметрии и эксцесса не будут надежными. Это усложняет статистический анализ и интерпретацию данных;
- **Сложности с прогнозированием**: Модели, основанные на данных, следующих распределению Коши, будут иметь проблемы с точностью прогнозирования, особенно в долгосрочной перспективе, из-за высокой вероятности экстремальных значений;
- **Проблемы с использованием стандартных методов**: Многие стандартные статистические методы и модели (например, метод наименьших квадратов) предполагают, что данные имеют конечную дисперсию. Эти методы могут быть неэффективны или вводить в заблуждение при работе с распределением Коши;
- **Риск смещенных оценок**: Использование стандартных оценок центральной тенденции, таких как среднее арифметическое, может привести к сильно смещенным результатам из-за влияния выбросов.

В общем, при работе с распределениями типа Коши требуется осторожность и, возможно, применение специализированных методов анализа, учитывающих особенности таких распределений.


## 9. Как можно проверить, что представленная выборка чисел распределена по закону Пуассона? На что нужно при анализе обратить внимание?


### Ответ:

Для проверки того, что представленная выборка чисел распределена по закону Пуассона, можно использовать несколько статистических методов и техник анализа данных. Закон Пуассона часто используется для моделирования количества раз, когда происходит определенное событие за фиксированный период времени или в фиксированном пространстве, при условии, что события происходят независимо друг от друга и с постоянной средней скоростью. Вот несколько шагов, которые можно предпринять:

- **Визуальная проверка**: Построить гистограмму выборки и сравнить ее с теоретической плотностью распределения Пуассона. Распределение Пуассона имеет специфическую форму, где наиболее вероятные значения сгруппированы вокруг некоторого среднего значения, и вероятности быстро уменьшаются для значений, значительно превышающих среднее.

- **Проверка характеристик распределения Пуассона**:
  - Среднее (математическое ожидание) и дисперсия выборки должны быть приблизительно равны, поскольку для распределения Пуассона они оба равны параметру $\lambda$ (интенсивности событий).
  - Данные должны быть целочисленными и неотрицательными, так как распределение Пуассона применимо к событиям, которые могут быть подсчитаны (например, число звонков в колл-центре за час).

- **Статистические тесты**:
  - **Тест хи-квадрат**: Этот тест может использоваться для сравнения наблюдаемого распределения значений с ожидаемым распределением Пуассона. Однако важно помнить, что тест чувствителен к размеру выборки и может потребовать объединения категорий, если в них слишком мало наблюдений.
  - **Тест согласия Колмогорова-Смирнова**: Этот тест также может быть использован, но он менее мощный по сравнению с тестом хи-квадрат для дискретных распределений.

- **Анализ моментов**: Проверить, совпадают ли первый (среднее) и второй (дисперсия) моменты выборки с теоретическими моментами распределения Пуассона.

- **Проверка предпосылок**: Убедиться, что данные соответствуют основным предпосылкам распределения Пуассона, в частности, что события происходят независимо и с постоянной скоростью.

Важно отметить, что ни один из этих методов не может с абсолютной уверенностью утверждать, что данные распределены по закону Пуассона. Они могут только предоставить доказательства, которые поддерживают или опровергают эту гипотезу. Кроме того, результаты могут быть чувствительны к размеру выборки и способу обработки данных.


## 10. В организации разработана регрессионная модель для важного показателя, имеющая 42 входных числовых признака, поступающих из 7 разных источников данных. Модель предполагается использовать ежедневно. С какими потенциальными сложностями при применении такой модели может столкнуться эта организация? Попробуйте составить как можно более полный перечень. Какие проблемы могут встретиться в краткосрочной и долгосрочной перспективах (день-неделя-месяц-год-5 лет)?


### Ответ:

Разработка и применение регрессионной модели с 42 входными числовыми признаками, поступающими из 7 разных источников данных, может привести к ряду потенциальных сложностей, как в краткосрочной, так и в долгосрочной перспективе. Ниже представлен перечень потенциальных проблем:

### Краткосрочные проблемы (день-неделя-месяц)
- **Интеграция данных**: Сложности с агрегацией данных из различных источников, включая проблемы совместимости форматов и структур данных.
- **Качество данных**: Ошибки в данных, пропущенные значения, неконсистентность данных между различными источниками.
- **Переобучение**: Модель может быть переобучена из-за большого количества признаков по отношению к размеру обучающего набора данных.
- **Вычислительные затраты**: Высокая сложность модели может привести к большим вычислительным затратам при ежедневном использовании.
- **Интерпретация результатов**: Сложность интерпретации результатов из-за большого количества признаков, что может затруднить понимание того, как модель пришла к определенному прогнозу.

### Долгосрочные проблемы (год-5 лет)
- **Обновление и поддержка данных**: Необходимость регулярного обновления и поддержания качества данных из всех источников.
- **Изменения в данных**: Со временем данные могут меняться (концептуальный дрейф), что потребует периодического переобучения и адаптации модели.
- **Масштабируемость**: Проблемы масштабируемости модели при увеличении объема данных или изменении бизнес-потребностей.
- **Устаревание модели**: Со временем модель может устареть и перестать адекватно отражать реальность, если она не будет регулярно обновляться и адаптироваться к изменениям.
- **Технические изменения**: Появление новых технологий и методик, которые могут сделать текущий подход устаревшим.
- **Зависимость от внешних поставщиков данных**: Проблемы, связанные с надежностью и стабильностью внешних источников данных.
- **Безопасность и конфиденциальность данных**: Сохранение конфиденциальности и защита данных в долгосрочной перспективе, особенно при работе с чувствительными данными.
- **Соответствие нормативным требованиям**: Со временем могут измениться законы и нормативы, регулирующие использование и обработку данных, что потребует дополнительных усилий для соответствия.

### Общие рекомендации
- Регулярно проводить аудит качества данных.
- Использовать методы регуляризации для борьбы с переобучением.
- Проводить регулярное обновление и переобучение модели для учета изменений в данных.
- Использовать методы уменьшения размерности для упрощения модели и улучшения интерпретируемости.
- Внедрить систему мониторинга производительности модели.


## 11. Имеется кластерная модель, группирующая 10000 организаций по 20 количественным и качественным признакам. Как оценить качество такой модели? Какие можно предложить критерии и как их проверить?


### Ответ:

Оценка качества кластерной модели, особенно когда она включает как количественные, так и качественные признаки, может быть довольно сложной задачей. Вот несколько ключевых критериев и методов, которые можно использовать для оценки качества кластеризации:

- **Внутрикластерное расстояние**: Один из способов оценки качества кластеризации - измерение степени, в которой объекты внутри одного кластера похожи друг на друга. Это можно сделать, рассчитав среднее расстояние между точками внутри каждого кластера или сумму квадратов внутрикластерных расстояний.
- **Межкластерное расстояние**: Хорошая кластеризация также означает, что кластеры достаточно отличаются друг от друга. Можно измерить среднее расстояние между кластерами или минимальное расстояние между точками разных кластеров.
- **Индекс силуэта**: Этот индекс сочетает в себе идеи внутри- и межкластерных расстояний. Он измеряет, насколько хорошо каждый объект был сгруппирован, путем сравнения его близости к объектам внутри своего кластера с близостью к объектам в соседних кластерах.
- **Индексы качества кластеризации**: Существуют различные статистические индексы, такие как индекс Данна или индекс Дэвиса-Боулдина, которые могут быть использованы для оценки качества кластеризации.
- **Стабильность кластеров**: Оцените, насколько стабильными оказываются кластеры при небольших изменениях в данных или методе кластеризации. Это можно сделать, используя подходы, такие как повторная выборка или кросс-валидация.
- **Интерпретируемость и значимость кластеров**: Важно, чтобы кластеры имели практическую или теоретическую значимость. Экспертная оценка может быть использована для оценки того, насколько результаты кластеризации имеют смысл в контексте задачи.
- **Сравнение с известными разбиениями**: Если доступны данные с заранее известным разбиением на группы (например, в случае с контролируемыми данными), можно сравнить результаты кластеризации с этими разбиениями.
- **Анализ чувствительности**: Исследуйте, как изменение параметров модели (например, числа кластеров) влияет на результат кластеризации.

Важно помнить, что ни один из этих методов не является универсальным, и часто лучшие результаты достигаются при их комбинировании. Выбор метода оценки зависит от специфики задачи, характеристик данных и целей исследования.

## 12. В больнице-стационаре имеется 100 больничных коек. Известно, что в среднем, в течение года, 85 из них заняты. Сколько дней в году следует ожидать, что в этой больнице не окажется свободных мест для вновь поступивших пациентов? Если для ответа на вопрос недостаточно  информации, сделайте дополнительные предположения. Как изменится ответ, если в среднем занято 90 коек?


### Ответ:

Для ответа на этот вопрос можно использовать моделирование с помощью распределения Пуассона. Распределение Пуассона хорошо подходит для моделирования событий, которые происходят с некоторой фиксированной средней интенсивностью в течение определенного временного интервала.

### Предположения
- Среднее количество занятых коек (85 или 90) можно интерпретировать как среднее количество прибывающих пациентов (λ) для распределения Пуассона.
- Прибытие пациентов является независимым событием и равномерно распределено во времени.

### Расчет
Мы можем рассчитать вероятность того, что в определенный день все 100 коек будут заняты, исходя из распределения Пуассона. Формула вероятности Пуассона:

$P(k; \lambda) = \frac{\lambda^k \cdot e^{-\lambda}}{k!}$

где $P(k; \lambda)$ - вероятность того, что произойдет $k$ событий при среднем числе событий $\lambda$.

Нам нужно рассчитать вероятность того, что будет 100 или более прибытий, при условии, что в среднем занято 85 или 90 коек. Так как расчет этой вероятности напрямую может быть сложным, мы можем использовать приближение, рассчитывая вероятность того, что будет менее 100 прибытий, и вычитая ее из 1:

$P(X \geq 100) = 1 - P(X < 100)$

где $P(X < 100)$ - вероятность того, что прибудет менее 100 пациентов, которую можно приблизительно рассчитать, сложив вероятности для всех $k$ от 0 до 99.

#### Расчет для 85 занятых коек
Для $\lambda = 85$, мы рассчитываем $P(X \geq 100)$.

#### Расчет для 90 занятых коек
Аналогично, для $\lambda = 90$, мы также рассчитываем $P(X \geq 100)$.

После вычисления вероятности $P(X \geq 100)$ для каждого случая, мы можем умножить эту вероятность на количество дней в году (365), чтобы получить ожидаемое количество дней, когда не будет свободных мест.

Вероятность того, что все 100 коек будут заняты в больнице, когда в среднем занято 85 коек, составляет примерно 6.07%. Это означает, что в среднем можно ожидать, что примерно 22 дня в году (22.17 дней, чтобы быть точным) в больнице не окажется свободных мест для вновь поступивших пациентов.

Когда в среднем занято 90 коек, вероятность того, что все коек будут заняты, возрастает до примерно 15.82%. В этом случае в среднем можно ожидать, что примерно 58 дней в году (57.75 дней) в больнице не будет свободных мест.

Эти расчеты основаны на предположении, что число прибывающих пациентов подчиняется распределению Пуассона, и что среднее количество занятых коек равно среднему числу прибывающих пациентов.


In [1]:
from scipy.stats import poisson

# Параметры
lambda_85 = 85      # Среднее количество занятых коек в случае 85
lambda_90 = 90      # Среднее количество занятых коек в случае 90
total_beds = 100    # Общее количество коек
days_in_year = 365  # Количество дней в году

# Расчет вероятности того, что все коек будут заняты
# Для 85 коек
probability_85 = 1 - poisson.cdf(total_beds - 1, lambda_85)

# Для 90 коек
probability_90 = 1 - poisson.cdf(total_beds - 1, lambda_90)

# Ожидаемое количество дней в году, когда не будет свободных мест
expected_days_85 = probability_85 * days_in_year
expected_days_90 = probability_90 * days_in_year

probability_85, probability_90, expected_days_85, expected_days_90

(0.060744095651460106,
 0.15822098918643002,
 22.17159491278294,
 57.750661053046954)