Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Извлечь данные из сайта Управления статистики уровня жизни и обследований домашних хозяйств Федеральной службы государственной статистики (Росстат) и загрузить их в хаб открытых данных #20

Open
ivbeg opened this issue Jun 22, 2018 · 0 comments

Comments

@ivbeg
Copy link
Member

ivbeg commented Jun 22, 2018

Цель

На сайте управления Росстата http://obdx.gks.ru/ публикуются результаты обследования домохозяйств с 2003 по 2012 годы, в форматах NESSTAR (http://www.nesstar.com/), Excel и описанием структур данных в DOC файлах.

Собрать данные из базы данных сайта управление статистики уровня жизни и обследований домашних хозяйств Федеральной службы государственной статистики (Росстат) и перенести на хаб открытых данных

Задача

  • написать парсеры и выгрузить данные структуры данных в форматах CSV и JSON
  • выгрузить данные в формате NESSTAR и Excel
  • загрузить данные в хаб открытых данных

Требования

  • открытый исходный код в Github под свободной лицензией
  • межплатформенный код (возможность запуска на Linux/Windows)
  • предусмотреть перенос всех метаданных в CKAN в виде тегов и атрибутов
  • переносить все данные в CKAN или на отдельный хостинг (например, в Github)

Пожелания

  • реализация в виде программы командной строки или веб-приложения
  • возможность запуска на MacOSX
  • использовать скриптовые языки такие как Python, Ruby, R или другие.
  • преобразовать данные из формата NESSTAR в форматы удобные для работы, такие как CSV и загрузить их в github и/или хаб открытых данных

Оценки трудоёмкости

Ожидаемое время на задачу не более 1-3 дня (8-24 часа).

Вспомогательные материалы:

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Development

No branches or pull requests

1 participant