Skip to content
This repository has been archived by the owner on Jan 4, 2021. It is now read-only.
/ se-analysis Public archive

Учебный проект по анализу данных Stack Exchange.

License

Notifications You must be signed in to change notification settings

KernelA/se-analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

30 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Анализ данных Stack Exchange

Учебный проект по анализу данных сайта Stack Exchange.

Основная цель

Этап обработки разбивается на две части:

  1. Использовать автономный уровень ADO.NET для загрузки данных, по разделам, в оперативную память и проведение первичной обработки. В результате должны получиться данные, которые можно визуализировать, для выявления интересных закономерностей или для дальнейшей обработки.

  2. Использовать Python для визуализации данных. Модуль multiprocessing для распараллеливания процесса построения графиков.

Исходные данные

Данные доступны по следующей ссылке.

Требования для запуска

  • Часть, написанная на C#:
    • Visual Studio 2017.
    • .Net Framework 4.7.
  • Часть, написанная на Python:
    • Версия Python 3.6 или выше.
    • Установленные пакеты matplotlib, pandas, numpy.

Как запускать

  1. Предварительная обработка файлов на C#.
  2. Построение графиков на Python.

About

Учебный проект по анализу данных Stack Exchange.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published