#Преобразование Фурье
Ярослав Холодов


##Анализ сезонности во временных рядах.

Во временных рядах нередко присутствует периодическая (сезонная) составляющая. Например, продажи в магазинах растут в субботу и воскресение, а также в канун Нового Года. Рост пассажиропотока увеличивается к летним месяцам. Таких сезонных составляющих может быть много, и выявить их порой непросто. Посмотрим детально, как выделить сезонность во временных рядах.

Для начала смоделируем временной ряд. Предположим, что у нас есть данные о продажах за 3 года с периодом взятия выборки в 1 день.

Пусть в графике продаж присутствуют следующие сезонные фракторы:
- Годовой - на Новый Год продажи растут.
- Квартальный - ежеквартально люди получают премии, у них появляется больше денег, и они склонны больше тратить.
- Еженедельный - на субботу и воскресение продажи вырастают.
- Есть некоторый искажающий фактор (шум), влияющий на объем продаж.
Временной ряд создадим с помощью Pandas.DataFrame.

Берем исходную дату $01.01 .2019$ в качеєтве начала временного ряда и количество уеагs $=3$, задав частоту дискретизации freq = 'D' = 1 день.
В случае с временным рядом, описывающим продажи за определенный промежуток времени, аналогом общепринятого в цифровой обработке сигналов промежутка в 1 сек., выступает весь интервал взятия выборок, т.е. SR = количеству дней за 3 года.  

Соответственно определяем, что:

fyear = years $=3$ - частота повторения по годам. Данные у нас взяты за 3 года, соответственно, частота = $3 .$

f_quarter = years*quarters $=12$ - квартальная частота повторёния.

f_week = yearsmonthsweeks $=144$ - недельные повторения.

Чтобы визуально гармонические составляющие для годовых, квартальных и недельных сезонных составляющих хорошо визуализировались на графике, добавляем постоянную составляющую для сдвига по оси у. В этом случае сезонные составляющие получаются более физичными, поскольку отрицательные продажи - это убыток.


Фаза fi = pi/2 смещает максимальное значение на начало года, делая более физичным, поскольку максимум продаж приходится на дату в районе 1 января каждого года. Можно вместо sin взять cos, чтобы не добавлять фазовый сдвиг.


Поскольку на данный момент в качестве time берется ряд дат, для формирования временной последовательности, которую можно будет подать в качестве аргумента для sin, нужно сформировать числовую последовательность. Количество отсчетов в последовательности должно быть равно количеству дат в исходном ряде. В данном случае максимальное значение в ряде равно SR, и общее количество отсчетов (третий аргумент функции) взято также SR.

Отобразим созданные временные ряды на графике

##Дискретное преобразование Фурье.



Любой временной ряд может быть представлен в виде суммы гармонических функций с различными амплитудами, частотами и фазами.
Подобный ряд гармонических функций называется рядом Фурье.
Трансформация сигнала во временной области в частотную называется преобразованием Фурье.


В нашем случае ряд Фурье представлен в виде суммы трех гармонических функций. Это модельный вариант, однако он дает возможность проверить наличие во временном ряде явно выраженных сезонны факторов. Воспользуемся встроенными функциями Руthon numpy для дискретного преобразования Фурье. Поскольку сигнал действительный, то для ускорения использовалась функция rff.  

Амплитуда 0-й гармоники (постоянная составляющая - сдвиг по оси у) не требует преобразования по амплитуде. Амплитуду других гармоник необходимо умножить на 2 , чтобы получить корректное значение амплитуды исходного гармонического сигнала. Частота временного ряда = 144, говорит об 144 изменениях за период в 3 года.  

Заметим, что полученная постоянная составляющая равна 3, что соответствует исходной величине амплитуды, заданной при создании функции. Постоянная составляющая (0-я гармоника) нередко значительная, поэтому отобразим на другом графике полученное преобразование, исключив гармонику с 0-й частотой.

Как видно по графику, на частоте, равной 144, выявлена гармоника с амплитудой 0.5, что соответствует заданной при моделировании временного ряда.  

Сделаем теперь преобразование Фурье для смешанного временного ряда, заменив аргумент на у_mix.  



На графике видно, что амплитуда самой низкой годовой (с частотой = 3) = 1, квартальной (с частотой $=12)=0.7$ и недельной (с частотой = 144) $=0.5$ на фоне гармоник «белого шума» с низкой амплитудой.


В частотной области легко произвести очистку исходного временного ряда, отбросив значения ниже определенного уровня, соответствующие шуму, и оставив только нужные гармоники. Затем можно произвести обратное преобразование Фурье и получить исходный временной ряд, очищенный от шума. 

При анализе наблюдений важно понимать, есть ли во временном ряде явно выраженные сезонные факторы. Нейронные сети позволяют выявить подобные закономерности неявно, работая как «черный ящик», т.е. предсказание может быть весьма точным, но почему оно такое, понять нельзя. Нередко матобработка временного ряда перед подачей на нейронную сеть позволяет существенно улучшить качество прогноза нейронкой. Поэтому предварительный анализ временного ряда различными преобразованиями, в т.ч. Фурье весьма полезны.  