# Анализ автономных некоммерческих организаций получателей федеральных субсидий

Для работы необходимо:
1. Скачать перечень получателей субсидий из федерального бюджета по ссылке https://sub.clearspending.ru/opendata/ файл receivers.zip
2. Распаковать файл receivers.json из архива receivers.zip
3. Загрузить содержимое файла в MongoDB. Команда "mongoimport -d subs -c receivers receivers.json"

Цель этого упражнения: научиться работать с данными субсидий и классифицировать НКО по типу и виду деятельности

Задача: определить число организаций в статусе АНО и не являющихся ВУЗами получавших субсидии и общую сумму полученных ими субсидий.

In [24]:
import json
import pprint
from pymongo import MongoClient
from IPython.display import HTML, display
import tabulate
import pandas as pd

MONGO_SERVER = 'localhost'
MONGO_PORT = 27017


Подключаемся к таблице **receivers** 

In [6]:
client = MongoClient(MONGO_SERVER, MONGO_PORT)
db = client['subs']
receivers = db['receivers']


Делаем выборку организаций имеющих тип АНО

In [50]:
# Поля которые мы хотим получить в итоге при выводе
fields = ['fullName', 'ogrn', 'inn', 'okopfCode', 'okopfName', 'okfsCode', 'okfsName']

# Поля необходимые для запроса в MongoDB (нужен префикс "info." поскольку все они в этом блоке)
query_fields = []
for f in fields:
    query_fields.append('info.' + f)

filtered = {}
for f in query_fields :
    filtered[f] = 1

uniq = []    
table = []
for o in receivers.find({'info.okopfCode' : '71400', }, filtered):
    if o['info']['ogrn'] in uniq: 
        continue
    else:
        uniq.append(o['info']['ogrn'])
    record = []
    for f in fields:
        record.append(o['info'][f])
    table.append(record)

# Смотрим на итоговую таблицу получателей
pd.DataFrame(table, columns=fields)


Unnamed: 0,fullName,ogrn,inn,okopfCode,okopfName,okfsCode,okfsName
0,АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ДУХОВНО-...,1170327003505,0317317649,71400,Автономные некоммерческие организации,16,Частная собственность
1,АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ПО СТРОИ...,1175658001518,5603044840,71400,Автономные некоммерческие организации,16,Частная собственность
2,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ИШИМСКИ...",1157232043396,7205028578,71400,Автономные некоммерческие организации,16,Частная собственность
3,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ДУХОВНО...",1177400000238,7456035450,71400,Автономные некоммерческие организации,15,Собственность общественных и религиозных орган...
4,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""СТРОИТЕ...",1151832011473,1837013712,71400,Автономные некоммерческие организации,15,Собственность общественных и религиозных орган...
5,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""БИЙСКИЙ...",1152225028647,2204077911,71400,Автономные некоммерческие организации,16,Частная собственность
6,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ДУХОВНО...",1175958004848,5981006923,71400,Автономные некоммерческие организации,16,Частная собственность
7,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ДУХОВНО...",1173525001528,3528267520,71400,Автономные некоммерческие организации,16,Частная собственность
8,АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ПО СТРОИ...,1151001016385,1004005530,71400,Автономные некоммерческие организации,16,Частная собственность
9,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ВОЗРОЖД...",1176000000021,6025049344,71400,Автономные некоммерческие организации,16,Частная собственность


In [None]:
# Собираем сведения об объёме полученных субсидий и складываем их в новую коллекцию
import requests as rq

db.drop_collection('subsidies')
subsidies = db['subsidies']

n = 0
for o in table:
    n += 1
    print('%d. Собираем данные по %s' % (n, o[0]) )
    summ = 0
    page = 1
    while True:
        url = "https://api.sub.clearspending.ru/v1/subsidy/?receiver_inn=" + o[2]+'&page=%d' % (page)
        rec = rq.get(url).json()
        for s in rec['items']:
            subsidies.save(s)
        if rec['count'] == 50:            
            page += 1            
        else:
            break




На основе собранной коллекции подсчитываем общую сумма бюджета на субсидии именно АНО в миллиардах рублей

In [63]:
total_summ = 0
for o in subsidies.find():
    total_summ += o['info']['currencySum']

final = float(total_summ) / 1000000000
print('Всего перечислено федеральных субсидий АНО: %d млрд. руб.' % (final))
    

Всего перечислено федеральных субсидий АНО: 155 млрд. руб.


А теперь попробуем найти топ получателей и сколько получил каждый их них

In [96]:
m_table = []
for o in table:
    summ = 0
    for s in subsidies.find({'receiver.inn' : o[2]}):
        summ += s['info']['currencySum']    
    m_table.append([o[0], o[2], summ])
    
df = pd.DataFrame(m_table, columns=['name', 'inn', 'summ'])
sdf = df.sort_values(by=['summ'], ascending=False)
out_table = [['млрд. рублей', "организация"]]
for o in sdf.values:
    out_table.append([o[2] / 1000000000, o[0]])

display(HTML(tabulate.tabulate(out_table, tablefmt='html')))
#print(df.nlargest(2, 'summ').sum().values[2] / 1000000000)

0,1
млрд. рублей,организация
110.3726411,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ТВ-НОВОСТИ"""
10.3244403,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ОБЩЕСТВЕННОЕ ТЕЛЕВИДЕНИЕ РОССИИ"""
7.528008321,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ЕДИНАЯ ТРАНСПОРТНАЯ ДИРЕКЦИЯ"""
6.3337815624,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""АРЕНА-2018"""
4.18850747,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ИСПОЛНИТЕЛЬНАЯ ДИРЕКЦИЯ XXVII ВСЕМИРНОЙ ЛЕТНЕЙ УНИВЕРСИАДЫ 2013 ГОДА В Г.КАЗАНИ"""
3.83738423533,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ТРАНСПОРТНАЯ ДИРЕКЦИЯ ЧЕМПИОНАТА МИРА ПО ФУТБОЛУ 2018 ГОДА В РОССИЙСКОЙ ФЕДЕРАЦИИ"""
3.42744004387,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""АГЕНТСТВО ДАЛЬНЕГО ВОСТОКА ПО ПРИВЛЕЧЕНИЮ ИНВЕСТИЦИЙ И ПОДДЕРЖКЕ ЭКСПОРТА"""
1.8863320390099998,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""АНАЛИТИЧЕСКИЙ ЦЕНТР ПРИ ПРАВИТЕЛЬСТВЕ РОССИЙСКОЙ ФЕДЕРАЦИИ"""
1.4154023033299998,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""АГЕНТСТВО ПО РАЗВИТИЮ ЧЕЛОВЕЧЕСКОГО КАПИТАЛА НА ДАЛЬНЕМ ВОСТОКЕ"""


Попробуем разобраться как это соотносится с деятельностью организаций. Получим основные коды ОКВЭД каждой организации получившей более 100 миллионов рублей


In [102]:
out_table = [['млрд. рублей', "код деятельности", "деятельность", "организация"]]
for o in sdf[(sdf['summ']>100000000)].values:
    i = receivers.find_one({'info.inn' : o[1]})
    out_table.append([o[2] / 1000000000, i['activities'][0]['activityCode'], i['activities'][0]['activityName'], o[0]])
    
display(HTML(tabulate.tabulate(out_table, tablefmt='html')))


0,1,2,3
млрд. рублей,код деятельности,деятельность,организация
110.3726411,60.10,Деятельность в области радиовещания,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ТВ-НОВОСТИ"""
10.3244403,60.20,Деятельность в области телевизионного вещания,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ОБЩЕСТВЕННОЕ ТЕЛЕВИДЕНИЕ РОССИИ"""
7.528008321,52.2,Деятельность транспортная вспомогательная,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ЕДИНАЯ ТРАНСПОРТНАЯ ДИРЕКЦИЯ"""
6.3337815624,93.1,Деятельность в области спорта,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""АРЕНА-2018"""
4.18850747,93.19,Деятельность в области спорта прочая,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ИСПОЛНИТЕЛЬНАЯ ДИРЕКЦИЯ XXVII ВСЕМИРНОЙ ЛЕТНЕЙ УНИВЕРСИАДЫ 2013 ГОДА В Г.КАЗАНИ"""
3.83738423533,52.21,"Деятельность вспомогательная, связанная с сухопутным транспортом","АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ТРАНСПОРТНАЯ ДИРЕКЦИЯ ЧЕМПИОНАТА МИРА ПО ФУТБОЛУ 2018 ГОДА В РОССИЙСКОЙ ФЕДЕРАЦИИ"""
3.42744004387,70.22,Консультирование по вопросам коммерческой деятельности и управления,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""АГЕНТСТВО ДАЛЬНЕГО ВОСТОКА ПО ПРИВЛЕЧЕНИЮ ИНВЕСТИЦИЙ И ПОДДЕРЖКЕ ЭКСПОРТА"""
1.8863320390099998,74.84,Предоставление прочих услуг,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""АНАЛИТИЧЕСКИЙ ЦЕНТР ПРИ ПРАВИТЕЛЬСТВЕ РОССИЙСКОЙ ФЕДЕРАЦИИ"""
1.4154023033299998,78.10,Деятельность агентств по подбору персонала,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""АГЕНТСТВО ПО РАЗВИТИЮ ЧЕЛОВЕЧЕСКОГО КАПИТАЛА НА ДАЛЬНЕМ ВОСТОКЕ"""


Из перечисленных некоммерческих организаций мы видим 3 университета: Российский новый университет, Сколтех и Гуманитарный университет которые получают субсидии как организации высшего образования. Остальные организации это специально созданные организации по выполнению тех или иных государственных задач. Отфильтруем только их и посмотрим сколько средств уходит на подобные организации в форме АНО. Добавим в текущий DataFrame данные по кодам деятельности организаций и отфильтруем те организации которые не относятся к высшему образованию.

In [107]:
out_table = [['млрд. рублей', "код деятельности", "деятельность", "организация"]]
act_col_code = []
act_col_name = []
for o in sdf.values:
    i = receivers.find_one({'info.inn' : o[1]})
    act_col_code.append( i['activities'][0]['activityCode'])
    act_col_name.append( i['activities'][0]['activityName'])
sdf['activityCode'] = act_col_code
sdf['activityName'] = act_col_name
    
display(HTML(tabulate.tabulate(sdf[(sdf['summ']>100000000) & (sdf['activityCode'] != '82.22')], tablefmt='html')))

0,1,2,3,4,5
97,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ТВ-НОВОСТИ""",7704552473,110373000000.0,60.10,Деятельность в области радиовещания
107,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ОБЩЕСТВЕННОЕ ТЕЛЕВИДЕНИЕ РОССИИ""",7717163097,10324400000.0,60.20,Деятельность в области телевизионного вещания
89,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ЕДИНАЯ ТРАНСПОРТНАЯ ДИРЕКЦИЯ""",2320172436,7528010000.0,52.2,Деятельность транспортная вспомогательная
51,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""АРЕНА-2018""",7704279496,6333780000.0,93.1,Деятельность в области спорта
98,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ИСПОЛНИТЕЛЬНАЯ ДИРЕКЦИЯ XXVII ВСЕМИРНОЙ ЛЕТНЕЙ УНИВЕРСИАДЫ 2013 ГОДА В Г.КАЗАНИ""",1655068636,4188510000.0,93.19,Деятельность в области спорта прочая
82,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""ТРАНСПОРТНАЯ ДИРЕКЦИЯ ЧЕМПИОНАТА МИРА ПО ФУТБОЛУ 2018 ГОДА В РОССИЙСКОЙ ФЕДЕРАЦИИ""",7710481750,3837380000.0,52.21,"Деятельность вспомогательная, связанная с сухопутным транспортом"
72,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""АГЕНТСТВО ДАЛЬНЕГО ВОСТОКА ПО ПРИВЛЕЧЕНИЮ ИНВЕСТИЦИЙ И ПОДДЕРЖКЕ ЭКСПОРТА""",7703408491,3427440000.0,70.22,Консультирование по вопросам коммерческой деятельности и управления
79,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""АНАЛИТИЧЕСКИЙ ЦЕНТР ПРИ ПРАВИТЕЛЬСТВЕ РОССИЙСКОЙ ФЕДЕРАЦИИ""",7708244720,1886330000.0,74.84,Предоставление прочих услуг
73,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ""АГЕНТСТВО ПО РАЗВИТИЮ ЧЕЛОВЕЧЕСКОГО КАПИТАЛА НА ДАЛЬНЕМ ВОСТОКЕ""",7723416966,1415400000.0,78.10,Деятельность агентств по подбору персонала
100,"АВТОНОМНАЯ НЕКОММЕРЧЕСКАЯ ОРГАНИЗАЦИЯ ВЫСШЕГО ОБРАЗОВАНИЯ ""РОССИЙСКИЙ НОВЫЙ УНИВЕРСИТЕТ""",7709469701,984780000.0,85.22,Образование высшее


    В завершение подсчитаем сколько всего организаций в статусе АНО и и не являющихся ВУЗами получили субсидий из федерального бюджета и на какую сумму

In [117]:
filtered_df = sdf[(sdf['summ']>100000000) & (sdf['activityCode'] != '82.22')]
print('Всего получателей субсидий в форме АНО (кроме ВУЗов) и получивших от 100 млн. рублей: %d' % (len(filtered_df.values)))


print('Общая сумма: %f млрд рублей' % (filtered_df.sum().values[2] / 1000000000))


Всего получателей субсидий в форме АНО (кроме ВУЗов) и получивших от 100 млн. рублей: 20
Общая сумма: 154.348284 млрд рублей


Итого, на конец марта 2019 года, 20 организаций в форме АНО и не являющихся ВУЗами получили 154 миллиарда рублей. 
Тем самым 154 миллиарда рублей были выведены из под законов 44-ФЗ и 223-ФЗ о госзакупках.

Вопросы и предложения направляйте на ibegtin@infoculture.ru