## Демографический прогноз

Данный проект посвящен прогнозированию численности населения выбранных регионов и сравнению их с реальной численностью в ретроспективе. В качестве датасетов выбраны данные росстата по регионам РФ, отражающие базовые демографические показатели. Проект упростит работу со статистическими данными, значительно ускорив процесс рассчетов показателей. 

**Перейдем непосредственно к базовому датасету - данным за 2023 год; именно с ними мы будем сравнивать прогнозируемые значения численности населения**

In [11]:
with open('data_2023.txt', encoding = 'ansi') as f:
    print(f.read())

"2. РОДИВШИЕСЯ, УМЕРШИЕ И ЕСТЕСТВЕННЫЙ ПРИРОСТ НАСЕЛЕНИЯ ПО СУБЪЕКТАМ 
РОССИЙСКОЙ ФЕДЕРАЦИИ В 2023 ГОДУ"						
						
						
	Человек			На 1000 человек населения		
	  Число родившихся	  Число  умерших	Естественный прирост, убыль (-)	  Число родившихся	  Число  умерших	Естественный прирост, убыль ( - )
РОССИЙСКАЯ ФЕДЕРАЦИЯ	1264354	1764618	-500264	8,6	12,1	-3,5
Центральный федеральный округ	320604	484607	-164003	8	12	-4
Белгородская область	10013	20232	-10219	6,6	13,4	-6,8
Брянская область	7933	16446	-8513	6,9	14,3	-7,4
Владимирская область	8449	20429	-11980	6,4	15,5	-9,1
Воронежская область	16403	32660	-16257	7,2	14,3	-7,1
Ивановская область	6578	14631	-8053	7,2	16,1	-8,9
Калужская область	8241	14132	-5891	7,7	13,2	-5,5
Костромская область	4448	8819	-4371	7,8	15,5	-7,7
Курская область	7588	15421	-7833	7,1	14,5	-7,4
Липецкая область	7943	16198	-8255	7,1	14,4	-7,3
Московская область	72999	94780	-21781	8,5	11	-2,5
Орловская область	4628	10948	-6320	6,6	15,7	-9,1
Рязанская область	6511	1609

## Функция нахождения необходимых данных в файле росстата

Для того, чтобы быстро найти необходимые показатели для любого региона можно воспользоваться приведенным ниже фрагментом кода:

In [17]:
file = input() 
def search(a):
    with open(str(a), 'r+', encoding = 'ansi') as f:
        filedata = f.read()
        filedata = filedata.replace(',', '.')
        pass
        f.write(filedata)
        f.close()
#замена запятых в .txt файле на точки
    
    with open(str(a), encoding = 'ansi') as l:
        c = input()
        file_content = l.readline()
        for n, line in enumerate(l):
            if c in line:
                linee = line.rstrip()

        region_data = linee.split('	')
        return region_data
#поиск и возвращение списка с данными о регионе (строка в исходной таблице)

def demography(a):
    region_name = a[0]
    births_abs = a[1]
    deaths_abs = a[2]
    natural_encrease_abs = a[3]
    births = a[4]
    deaths = a[5]
    natural_encrease = a[6]
    people_total_2023 = float(deaths_abs)/(float(deaths)/1000)
    print(f'Количество рождений в регионе "{region_name}" = {births_abs}')
    print(f'Количество смертей в регионе "{region_name}" = {deaths_abs}')
    print(f'Естественный прирост населения "{region_name}" = {natural_encrease_abs}')
    print(f'Коэффициент рождаемости "{region_name}" = {births}')
    print(f'Коэффициент смертности "{region_name}" = {deaths}')
    print(f'Коэффициент естественного прироста "{region_name}" = {natural_encrease}')
    print(f'Численность населения "{region_name}" =  {people_total_2023}')
    print(f'При сохранении текущего уровня естественного прироста, численность населения региона "{region_name}" через 5 лет будет равна {people_total_2023*((1+(float(natural_encrease)/100))**5)}') 
print(demography(search(file)))

# Для запуска кода необходимо сначала вписать название файла, с которого будут считываться данные, а после название региона.

 data_2023.txt
 Республика Татарстан


Количество рождений в регионе "Республика Татарстан" = 36398
Количество смертей в регионе "Республика Татарстан" = 43092
Естественный прирост населения "Республика Татарстан" = -6694
Коэффициент рождаемости "Республика Татарстан" = 9.1
Коэффициент смертности "Республика Татарстан" = 10.8
Коэффициент естественного прироста "Республика Татарстан" = -1.7
Численность населения "Республика Татарстан" =  3990000.0
При сохранении текущего уровня естественного прироста, численность населения региона "Республика Татарстан" через 5 лет будет равна 3662186.73187872
None


## Следующий шаг

Далее переходим непосредственно к аналитической части. Для наиболее детального рассмотрения мы выбрали 2 региона - родины авторов проекта: Владимирскую область и Республику Татарстан. В дальнейшем работать будем с ними!


In [None]:
# Рассчитываем показатели за 2023 год

with open('data_2023.txt', 'r+', encoding = 'ansi') as data_2023: 
        filedata = data_2023.read()
        filedata = filedata.replace(',', '.')
        pass
        data_2023.write(filedata)
        data_2023.close()

with open('data_2023.txt', encoding = 'ansi') as f:
    file_content = f.readline()
    for n, line in enumerate(f):
        if 'Владимир' in line:
            line_vladimir = line.rstrip()
        if 'Татарстан' in line:
            line_tatar = line.rstrip()
            
vladimir_2023 = line_vladimir.split('	')
births_abs_vladimir_2023 = vladimir_2023[1]
deaths_abs_vladimir_2023 = vladimir_2023[2]
encrease_abs_vladimir_2023 = vladimir_2023[3]
births_vladimir_2023 = vladimir_2023[4]
deaths_vladimir_2023 = vladimir_2023[5]
encrease_vladimir_2023 = vladimir_2023[6]
total_vladimir_2023 = float(deaths_abs_vladimir_2023)/float(deaths_vladimir_2023)*1000

tatar_2023 = line_tatar.split('	')
births_abs_tatar_2023 = tatar_2023[1]
deaths_abs_tatar_2023 = tatar_2023[2]
encrease_abs_tatar_2023 = tatar_2023[3]
births_tatar_2023 = tatar_2023[4]
deaths_tatar_2023 = tatar_2023[5]
encrease_tatar_2023 = tatar_2023[6]
total_tatar_2023 = float(deaths_abs_tatar_2023)/(float(deaths_tatar_2023)/1000)

print(f'Список из файла росстата с данными о естественном движении населения Владимирской области - {vladimir_2023}')
print(f'Список из файла росстата с данными о естественном движении населения Республики Татарстан -{tatar_2023}')



print(f'Рассчитанная на основании показателя смертности среднегодовая численность населения Владимирской области в 2023 году = {total_vladimir_2023}')
print(f'Рассчитанная на основании показателя смертности среднегодовая численность населения Республики Татарстан в 2023 году = {total_tatar_2023}')

#Проделываем те же операции, что и в первый раз, но сейчас создаем переменные, где будет хранится информация о демографических показателях, необходимых для анализа: рождаемость, смертность, естественный прирост, коэффициент рождаемости, коэффициент смертности, коэффициент естественного прироста.
#Также считаем среднегодовую численность населения через относительные/абсолютные показатели.

In [21]:
# Рассчитываем показатели за 2010 год

with open('data_2010_2.txt', 'r+', encoding = 'ansi') as data_2010_2:
        filedata = data_2010_2.read()
        filedata = filedata.replace(',', '.')
        pass
        data_2010_2.write(filedata)
        data_2010_2.close()
with open('data_2010_2.txt', encoding = 'ansi') as f:
    file_content = f.readline()
    for n, line in enumerate(f):
        if 'Владимир' in line:
            line_vladimir = line.rstrip()
        if 'Татарстан' in line:
            line_tatar = line.rstrip()
vladimir_2010_2 = line_vladimir.split('	')
tatar_2010_2 = line_tatar.split('	')
births_abs_vladimir_2010 = vladimir_2010_2[1]
deaths_abs_vladimir_2010 = vladimir_2010_2[4]
encrease_abs_vladimir_2010 = vladimir_2010_2[7]
births_abs_tatar_2010 = tatar_2010_2[1]
deaths_abs_tatar_2010 = tatar_2010_2[4]
encrease_abs_tatar_2010 = tatar_2010_2[7]

with open('data_2010_3.txt', 'r+', encoding = 'ansi') as data_2010_3:
        filedata = data_2010_3.read()
        filedata = filedata.replace(',', '.')
        data_2010_3.truncate(0)
        data_2010_3.write(filedata)
        data_2010_3.close()
with open('data_2010_3.txt', encoding = 'ansi') as f:
    file_content = f.readline()
    for n, line in enumerate(f):
        if 'Владимир' in line:
            line_vladimir = line.rstrip()
        if 'Татарстан' in line:
            line_tatar = line.rstrip()
vladimir_2010_3 = line_vladimir.split('	')
tatar_2010_3 = line_tatar.split('	')
births_vladimir_2010 = vladimir_2010_3[1]
deaths_vladimir_2010 = vladimir_2010_3[3]
encrease_vladimir_2010 = vladimir_2010_3[5]
births_tatar_2010 = tatar_2010_3[1]
deaths_tatar_2010 = tatar_2010_3[3]
encrease_tatar_2010 = tatar_2010_3[5]
total_vladimir_2010 = float(births_abs_vladimir_2010)/float(births_vladimir_2010)*1000
total_tatar_2010 = float(births_abs_tatar_2010)/float(births_tatar_2010)*1000



In [23]:
print(f'Численность населения Республики Татарстан на 2010 год = {total_tatar_2010} человек.')
print(f'Численность населения Владимирской области на 2010 год = {total_vladimir_2010} человек.')

forecast_tatar_2010_23 = total_tatar_2010*((1+(float(encrease_tatar_2010)/100))**13)
forecast_vladimir_2010_23 = total_vladimir_2010*((1+(float(encrease_vladimir_2010)/100))**13)
# Делаем прогноз

#Сравним полученные значения численности населения для демографической оценки ситуации в регионе, а также для выявления влияния внешних факторов на демографические процессы.

print(f'Прогнозированная на основе демографических показателей 2010-го года численность населения Республики Татарстан в 2023 году = {forecast_tatar_2010_23}, реальная численность населения = {total_tatar_2023}, разница между рассчитаным и реальным значением = {forecast_tatar_2010_23 - total_tatar_2023}')
print(f'Прогнозированная на основе демографических показателей 2010-го года численность населения Владимирской области в 2023 году = {forecast_vladimir_2010_23}, реальная численность населения = {total_vladimir_2023}, разница между рассчитаным и реальным значением = {forecast_vladimir_2010_23 - total_vladimir_2023}')


Численность населения Республики Татарстан на 2010 год = 3782248.0620155036 человек.
Численность населения Владимирской области на 2010 год = 1452523.3644859814 человек.
Прогнозированная на основе демографических показателей 2010-го года численность населения Республики Татарстан в 2023 году = 3685081.063128448, реальная численность населения = 3990000.0, разница между рассчитаным и реальным значением = -304918.9368715519
Прогнозированная на основе демографических показателей 2010-го года численность населения Владимирской области в 2023 году = 542200.1967238038, реальная численность населения = 1318000.0, разница между рассчитаным и реальным значением = -775799.8032761962


## Сравнение основных демографических показателей 2010 и 2023-го годов

*Основные демографические показатели - показатели отражающие состояние естественного движения населения: численности, рождаемости, смертности и естественного прироста* 

Сравнив демографические показатели мы сможем понять, чем обусловлено несоответствие прогнозируемой и реальной численности населения в исследуемых регионах

## Владимирская область

In [93]:
print(f'Коэффициент рождаемости в 2010 г. = {births_vladimir_2010}, коэффициент рождаемости в 2023 г. = {births_vladimir_2023} \nУменьшение коэффициента рождаемости свидетельствует о завершении демографического перехода и тотальном старении населения\n' )

print(f'Прогнозированная на основе демографических показателей 2010-го года численность населения Владимирской области в 2023 году = {forecast_vladimir_2010_23}, реальная численность населения = {total_vladimir_2023}, разница между рассчитаным и реальным значением = {forecast_vladimir_2010_23 - total_vladimir_2023}\nБольшое различие между реальной и прогнозируемой численностью населения должна обьясняться через коэффициент смертности, так как рождаемость значитлеьно снизилась, а население не настолько значительно уменьшилось как прогнозировалось\n\nРассмотрим коэффициенты смертности\n')
print(f'Коэффициент смертности в 2010 г. = {deaths_vladimir_2010}, а в 2023 = {deaths_vladimir_2023} \nВо-первых, на разницу прогноза и реальной ситуации повлияла засуха 2010-го года, которая значительно повысила смертность в 2010 г. (стоит отметить, что в 2023 году уровень смертности тоже достаточно высок, что можно связать с пост-ковидным трендом в достаточно "старом" регионе). Во-вторых, сравнение показателей за данные годы, к сожалению, не показывает повышение уровня рождаемости в "сытые" десятые, которые тоже значительно сказались на точности прогноза численности\n')


Коэффициент рождаемости в 2010 г. = 10.7, коэффициент рождаемости в 2023 г. = 6.4 
Уменьшение коэффициента рождаемости свидетельствует о завершении демографического перехода и тотальном старении населения

Прогнозированная на основе демографических показателей 2010-го года численность населения Владимирской области в 2023 году = 542200.1967238038, реальная численность населения = 1318000.0, разница между рассчитаным и реальным значением = -775799.8032761962
Большое различие между реальной и прогнозируемой численностью населения должна обьясняться через коэффициент смертности, так как рождаемость значитлеьно снизилась, а население не настолько значительно уменьшилось как прогнозировалось

Рассмотрим коэффициенты смертности

Коэффициент смертности в 2010 г. = 18, а в 2023 = 15.5 
Во-первых, на разницу прогноза и реальной ситуации повлияла засуха 2010-го года, которая значительно повысила смертность в 2010 г. (стоит отметить, что в 2023 году уровень смертности тоже достаточно высок, что м

**В итоге можно сказать, что данная модель не до конца описывает динамику базовых показателей, для лучшего описания результатов необходимо обращаться к сторонним данным - значениям за 2015-2017 годы**

## Республика Татарстан

In [112]:
print(f'Коэффициент рождаемости в 2010 г. = {births_tatar_2010}, коэффициент рождаемости в 2023 г. = {births_tatar_2023} \nУменьшение коэффициента рождаемости также как и в случае с Владимирской областью свидетельствует о завершении демографического перехода и тотальном старении населения, однако меньшие темпы снижения данного показателя наверняка свидетельствуют о религиозности и традиционности данного полу-исламского региона\n' )
print(f'Прогнозированная на основе демографических показателей 2010-го года численность населения Республики Татарстан в 2023 году = {forecast_tatar_2010_23}, реальная численность населения = {total_tatar_2023}\nРазличие по сравнению со Владимирской областью между прогнозируемой и реальной численностью уже гораздо меньше, однако также объясняется повышенной смертностью 2010-го годов и ростом уровня естественного прироста (даже до нуля) в 2010-е, что, к сожалению не демонстрируется данными датасетами. Меньшая разница также объясняется национальной идентичностью этого региона.\n')

print(f'Коэффициент смертности в 2010 г. = {deaths_tatar_2010}, коэффициент смертности в 2023 г. = {deaths_tatar_2023}. В данном случае наблюдается интересный тренд: рост коэффициента смертности в 2010 вследствие аномальной жары превышает рост годичный, даже постковидный, что свидетельствует о незавершившемся демографическом переходе и повышенным уровнем воспроизводства в Республике Татарстан.')


Коэффициент рождаемости в 2010 г. = 12.9, коэффициент рождаемости в 2023 г. = 9.1 
Уменьшение коэффициента рождаемости также как и в случае с Владимирской областью свидетельствует о завершении демографического перехода и тотальном старении населения, однако меньшие темпы снижения данного показателя наверняка свидетельствуют о религиозности и традиционности данного полу-исламского региона

Прогнозированная на основе демографических показателей 2010-го года численность населения Республики Татарстан в 2023 году = 3685081.063128448, реальная численность населения = 3990000.0
Различие по сравнению со Владимирской областью между прогнозируемой и реальной численностью уже гораздо меньше, однако также объясняется повышенной смертностью 2010-го годов и ростом уровня естественного прироста (даже до нуля) в 2010-е, что, к сожалению не демонстрируется данными датасетами. Меньшая разница также объясняется национальной идентичностью этого региона.

Коэффициент смертности в 2010 г. = 13.1, коэффицие

**Выводы:**
Модель интересно описывает динамику показателей естественного движения населения Татарстана. Смертность снижается, однако рождаемость тоже, что приводит к итоговому небольшому снижению численности населения. Прогноз несколько занижен, вследствие недоучета благополучных 10-ых годов.

## Общие выводы
В целом можно сказать, что исследование получилось очень интересное, а главное, оно значительно упрощает работу с датасетами росстата. В дальнейшем данные блоки кода могут быть использованы для написания научных исследовательских работ и для базового демографического анализа.

С любовью, авторы работы, Зоя и Рома!