Учебный проект по анализу данных сайта Stack Exchange.
Этап обработки разбивается на две части:
-
Использовать автономный уровень ADO.NET для загрузки данных, по разделам, в оперативную память и проведение первичной обработки. В результате должны получиться данные, которые можно визуализировать, для выявления интересных закономерностей или для дальнейшей обработки.
-
Использовать Python для визуализации данных. Модуль multiprocessing для распараллеливания процесса построения графиков.
Данные доступны по следующей ссылке.
- Часть, написанная на C#:
- Visual Studio 2017.
- .Net Framework 4.7.
- Часть, написанная на Python:
- Версия Python 3.6 или выше.
- Установленные пакеты matplotlib, pandas, numpy.