#### JupyterNotebook Gruppe A
# Untersuchung des Bevölkerungsanstieges der Stadt Magdeburg seit 2004 bis 2017


## Inhaltsverzeichnis
1. Einleitung und Forschungsfrage
2. Datenaufbereitung
3. Berechnung
    3.1. demografische Zusammensetzung
    3.2  ethnische Zusammensetzung
4. Ergebnisse



## 1. Einleitung und Forschungsfrage

2004 hatte Magdeburg mit 226.610 Einwohnern den geringsten Einwohnerwert seit der Wiedervereinigung erreicht (Anm. noch mit Quelle belegen, Henning). Seitdem ist die Bevölkerungszahl wieder kontinuierlich gestiegen. 2017 lebten mit 241.769 Einwohnern 6,69% mehr Menschen in der Stadt als noch 2004. Die 5. Regionalisierte Bevölkerungsprognose (RBP) für Sachsen-Anhalt ging 2008 noch von einer Stadtbevölkerung von 232.154 Einwohnern im Jahr 2017 aus. Diese Prognose ging mit einem stetigen Bevölkerungsrückgang in den darauffolgenden Jahren einher. (Quelle: https://www.destatis.de/GPStatistik/servlets/MCRFileNodeServlet/STHeft_derivate_00000013/6A111_2008_2025.pdf, S. 25). Der 2006 von der Bertelsmann Stiftung publizierte “Wegweiser Demographischer Wandel 2020” ging sogar noch einen Schritt weiter und prognostizierte für das Jahr 2020 einen Bevölkerungsrückgang um 11,2%, verglichen mit dem Stichjahr 2003. Dies entspricht, bei einer Bevölkerung von ursprünglich 227.129 Menschen (Stand: 2003), insgesamt 201.691 Einwohner. (Quelle: http://shrinking.ums-riate.fr/Ressources/Chap_07/SCH_06.pdf, S. 43)

Die Projektgruppe möchte sich deshalb mit folgender Forschungsfrage beschäftigen:

#### “Hat sich im Zuge des Bevölkerungsanstieges der Stadt Magdeburg seit 2004 bis 2017 die Zusammensetzung der Bevölkerung verändert?”

Dazu wird konkret folgende Unterfrage bearbeitet:
#### Wie setzt(e) sich die Bevölkerung im Jahr 2004 gegenüber der Bevölkerung im Jahr 2017 ethnisch und demografisch zusammen?

Zusätzlich soll eine Alterssegregation sowie eine ethnische Segregation berechnet werden.


## 2. Datenaufbereitung

Die benötigten Daten wurden von der Stadt Magdeburg bereit gestellt unter folgendem Link bereit gestellt: https://www.magdeburg.de/extern/statistik/stadtteilkatalog/atlas.html (letzer Zugriff: 06.01.2019)
Die Abkürzungen für die verschiedenen Variablen haben folgende Bedeutung:
EW = Einwohnerzahl,
JQ = Jugendquote,
ZUZ = Zuzüge,
WEG = Wegzüge,
GEB = Geburtenrate,
SF = ,
MBEV = ,
WBEV = ,
ABEV = Ausländische Bevölkerung ,
AQ = Altenquote ,
BV = ,
DA = ,

In [1]:
#Importieren des Pandas Pakets
import pandas as pd 

#Einlesen des Forschungsdatensatzes
magdeb = pd.read_csv("MagdeburgBereinigterDatensatzVers_demo_006.csv", sep = ";", decimal=",")
print(magdeb)


    STD_NR           STD_name  EW_2004  EW_2005  EW_2006  EW_2007  EW_2008  \
0        1           Altstadt    12786    13580    13892    14140    14532   
1        2             Werder     2490     2594     2691     2663     2709   
2        4      Alte Neustadt     9050     9183     9347     9534     9641   
3        6      Neue Neustadt    13572    13566    13583    13631    13757   
4        8     Neustädter See    11902    11784    11829    11784    11557   
5       10        Kannenstieg     6877     6735     6676     6594     6383   
6       12    Neustädter Feld     9828    10011     9980     9946     9847   
7       18           Nordwest     4547     4511     4522     4544     4609   
8       20     Alt Olvenstedt     3945     4111     4262     4278     4199   
9       22     Neu Olvenstedt    14257    13488    12733    12017    11741   
10      24      Stadtfeld Ost    22225    22912    23506    23923    24170   
11      26     Stadtfeld West    14367    14528    14844    1483

## 3. Berechnung

### 3.1. Berechnung demografische Zusammensetzung und Alterssegregation für die Zeitpunkte 2006, 2010 und 2017

#### Ziele:
1. Variable erstellen mit der (Rest)-Quote für das mittlere Alter in den Stadtteilen (Hintergrund: Als Daten liegen uns die Quoten für die Jugend und das Alter vor) und im Datensatz anhängen als neue Variablen
2. Absolute Werte für alle drei Altersgruppen erstellen und im Datensatz anhängen als neue Variablen
3. Für jede Altersgruppe die Summe bilden (diese wird dann als Gesamt-Magedeburg verstanden) und als extra Obejkt verwenden (nicht als neue Zeile an den Datensatz anhängen, da es dann zu verfälschten Werten bei der SEgregation führen würde)
4. Mit den Summen der Altersverteilung die relative Verteilung der Altersklassen für gesamt Magdeburg berechnen
5. Mit den errechneten absoluten Werten für die Altersklassen aus den Stadtteilen die demografische Segregation für Magdeburg berechnen

#### Schritt 0 - Datensatz einlesen

In [3]:
# Importieren des Paket Pandas, da wir mit einem DataFrame arbeiten wollen
import pandas as pd

# Einlesen des Forschungsdatensatzes
magdeb = pd.read_csv("MagdeburgBereinigterDatensatzVers_demo_006.csv", sep = ";", decimal=",")

print(magdeb)

    STD_NR           STD_name  EW_2004  EW_2005  EW_2006  EW_2007  EW_2008  \
0        1           Altstadt    12786    13580    13892    14140    14532   
1        2             Werder     2490     2594     2691     2663     2709   
2        4      Alte Neustadt     9050     9183     9347     9534     9641   
3        6      Neue Neustadt    13572    13566    13583    13631    13757   
4        8     Neustädter See    11902    11784    11829    11784    11557   
5       10        Kannenstieg     6877     6735     6676     6594     6383   
6       12    Neustädter Feld     9828    10011     9980     9946     9847   
7       18           Nordwest     4547     4511     4522     4544     4609   
8       20     Alt Olvenstedt     3945     4111     4262     4278     4199   
9       22     Neu Olvenstedt    14257    13488    12733    12017    11741   
10      24      Stadtfeld Ost    22225    22912    23506    23923    24170   
11      26     Stadtfeld West    14367    14528    14844    1483

#### Schritt 1 - Restquote für das mittlere Alter berechnen

In [17]:
# benötigte Variablen

# magdeb["AQ_2004"]
# magdeb["JQ_2004"]

# magdeb["AQ_2010"]
# magdeb["JQ_2010"]

# magdeb["AQ_2017"]
# magdeb["JQ_2017"]

# 1. Es werden für jedes Jahr jeweils die Altersquote (AQ) und die Jugendquote (JQ) addiert
#    magdeb["AQ_2004"] + magdeb["JQ_2004"]

# 2. der errechnete Wert soll von 100 abgeogen werden, um die Restquote zu erhalten
#    100 - (magdeb["AQ_2004"] + magdeb["JQ_2004"])

# 3. diese werden in neuen Variablen gespeicher
#    magdeb["MAQ_2004"] = 100 - (magdeb["AQ_2004"] + magdeb["JQ_2004"])

magdeb["MAQ_2004"] = 100 - (magdeb["AQ_2004"] + magdeb["JQ_2004"])
magdeb["MAQ_2010"] = 100 - (magdeb["AQ_2010"] + magdeb["JQ_2010"])
magdeb["MAQ_2017"] = 100 - (magdeb["AQ_2017"] + magdeb["JQ_2017"])

print(magdeb)
print("")
print("Das das anbinden der Variablen funktinoniert hat, sieht man daran, dass die Zusammenfassung am Ende des prints von magde um 3 colums gestiegen ist")
print("")
print("Die drei neuen Variablen:")
print(magdeb["MAQ_2004"])
print(magdeb["MAQ_2010"])
print(magdeb["MAQ_2017"])



    STD_NR           STD_name  EW_2004  EW_2005  EW_2006  EW_2007  EW_2008  \
0        1           Altstadt    12786    13580    13892    14140    14532   
1        2             Werder     2490     2594     2691     2663     2709   
2        4      Alte Neustadt     9050     9183     9347     9534     9641   
3        6      Neue Neustadt    13572    13566    13583    13631    13757   
4        8     Neustädter See    11902    11784    11829    11784    11557   
5       10        Kannenstieg     6877     6735     6676     6594     6383   
6       12    Neustädter Feld     9828    10011     9980     9946     9847   
7       18           Nordwest     4547     4511     4522     4544     4609   
8       20     Alt Olvenstedt     3945     4111     4262     4278     4199   
9       22     Neu Olvenstedt    14257    13488    12733    12017    11741   
10      24      Stadtfeld Ost    22225    22912    23506    23923    24170   
11      26     Stadtfeld West    14367    14528    14844    1483

#### Schritt 2 

### 3.2 Berechnung der ethnischen Zusammensetzung für die Zeitpunkte 2004, 2010 und 2017

Die drei Zeitpunkte wurden aus folgenden Gründen ausgewählt ... 

#### Ziele 

<br> Schritt 1: den Anteil der ausländischen Bevölkerung für die Zeitpunkte 2004, 20010 und 2017 berechnen <br/>
<br> Schritt 2: in Schritt 2 wird der Segregationsindex für die Jahre 2004, 2010 und 2017 berechnet. <br/>

#### Schritt 1

Da die Daten 'ABEV' in absoluten Zahlen angegeben sind, müssen diese erst als Prozentzahl von der Gesamtbevölkerung berechnet werden.
Da die Ausländische Bevölkerung (ABEV) pro Stadtteil angegeben ist, muss zuerst die Gesamtzahl pro Jahr berechnet werden. Dazu werden alle Daten pro Stadtteil pro Jahr addiert. 

In [45]:
#benötigte Variablen sind: ABEV_2004, ABEV_2010 und ABEV_2017 sowie EW_2004, EW_2010 und EW_2017

#zunächst wird die Berechnung des Anteils für das Jahr 2004 durchgeführt
#Importieren des Pandas Pakets
import pandas as pd

#Einlesen des Forschungsdatensatzes der Version 007 
# --> in dieser Version wurden die Stadtteile Pechau und Randau-Cale gelöscht, da diese für die Variable ABEV nicht vollständig sind
magdeb007 = pd.read_csv("MagdeburgBereinigterDatensatzVers_demo_007.csv", sep = ";", decimal=",")
print(magdeb007)



    STD_NR           STD_name  EW_2004  EW_2005  EW_2006  EW_2007  EW_2008  \
0        1           Altstadt    12786    13580    13892    14140    14532   
1        2             Werder     2490     2594     2691     2663     2709   
2        4      Alte Neustadt     9050     9183     9347     9534     9641   
3        6      Neue Neustadt    13572    13566    13583    13631    13757   
4        8     Neustädter See    11902    11784    11829    11784    11557   
5       10        Kannenstieg     6877     6735     6676     6594     6383   
6       12    Neustädter Feld     9828    10011     9980     9946     9847   
7       18           Nordwest     4547     4511     4522     4544     4609   
8       20     Alt Olvenstedt     3945     4111     4262     4278     4199   
9       22     Neu Olvenstedt    14257    13488    12733    12017    11741   
10      24      Stadtfeld Ost    22225    22912    23506    23923    24170   
11      26     Stadtfeld West    14367    14528    14844    1483

In [46]:
#Auswählen der Spalte 'EW_2004'
print(magdeb007['EW_2004'])

#Addieren der Werte und speichern in der neuen Variable sumEW_2004
sumEW_2004 = sum(magdeb007['EW_2004'])

#ohne Stadtteile Randau-Cale und Pechau
print("Die Gesamteinwohnerzahl beträgt:" + str(sumEW_2004))

#das Gleiche für die Variable ABEV_2004, also die Ausländische Bevölkerung im Jahr 2004
sumABEV_2004 = sum(magdeb007['ABEV_2004'])

print("Die Anzahl der Menschen mit Migrationshintergrund beträgt:" + str(sumABEV_2004))

#jetzt soll der Anteil der Ausländischen Bevölkerung im Jahr 2004 ausgerechnet werden
anteilABEV_2004 = (sumABEV_2004/sumEW_2004)*100

print('Der Anteil der Ausländischen Bevölkerung im Jahr 2004 beträgt:'+ str(anteilABEV_2004))
anteilABEV_2004_round = round (anteilABEV_2004, 1)

print('Der Anteil auf die erste Stelle hinter dem Komma gerundet')
print(anteilABEV_2004_round)


0     12786
1      2490
2      9050
3     13572
4     11902
5      6877
6      9828
7      4547
8      3945
9     14257
10    22225
11    14367
12     3418
13    16549
14     9795
15     2050
16    13981
17    14086
18     4528
19     4340
20     3108
21     3999
22     3121
23     3019
24     2134
25     8402
26     1891
27      913
28     2727
29     1232
Name: EW_2004, dtype: int64
Die Gesamteinwohnerzahl beträgt:225139
Die Anzahl der Menschen mit Migrationshintergrund beträgt:8092
Der Anteil der Ausländischen Bevölkerung im Jahr 2004 beträgt:3.5942240127210296
Der Anteil auf die erste Stelle hinter dem Komma gerundet
3.6


In [47]:
#die gleiche Berechnung führen wir jetzt für die Zeitpunkte 2010 und 2017 durch. Zuerst für das Jahr 2010:
sumEW_2010 = sum(magdeb007['EW_2010'])

print("Die Gesamteinwohnerzahl beträgt im Jahr 2010:" + str(sumEW_2010))

sumABEV_2010 = sum(magdeb007['ABEV_2010'])
print("Die Anzahl der Menschen mit Migrationshintergrund im Jahr 2010 beträgt:" + str(sumABEV_2010))

anteilABEV_2010 = (sumABEV_2010/sumEW_2010)*100

print("Die Anteil der Menschen mit Migrationshintergrund ist:" + str(anteilABEV_2010))
anteilABEV_2010_round = round (anteilABEV_2010, 1)

print('Hier wird es spannend:Der Anteil auf die erste Stelle hinter dem Komma gerundet beträgt:')
print(anteilABEV_2010_round)

#jetzt noch für das Jahr 2017

sumEW_2017 = sum(magdeb007['EW_2017'])

print("Die Gesamteinwohnerzahl beträgt im Jahr 2017:" + str(sumEW_2017))

sumABEV_2017 = sum(magdeb007['ABEV_2017'])
print("Die Anzahl der Menschen mit Migrationshintergrund im Jahr 2017 beträgt:" + str(sumABEV_2017))

anteilABEV_2017 = (sumABEV_2017/sumEW_2017)*100

print("Die Anteil der Menschen mit Migrationshintergrund ist:" + str(anteilABEV_2017))
anteilABEV_2017_round = round (anteilABEV_2017, 1)

print('Hier wird es spannend:Der Anteil auf die erste Stelle hinter dem Komma gerundet beträgt:')
print(anteilABEV_2017_round)

Die Gesamteinwohnerzahl beträgt im Jahr 2010:229705
Die Anzahl der Menschen mit Migrationshintergrund im Jahr 2010 beträgt:8153
Die Anteil der Menschen mit Migrationshintergrund ist:3.5493350166517925
Hier wird es spannend:Der Anteil auf die erste Stelle hinter dem Komma gerundet beträgt:
3.5
Die Gesamteinwohnerzahl beträgt im Jahr 2017:240298
Die Anzahl der Menschen mit Migrationshintergrund im Jahr 2017 beträgt:20636
Die Anteil der Menschen mit Migrationshintergrund ist:8.58767030936587
Hier wird es spannend:Der Anteil auf die erste Stelle hinter dem Komma gerundet beträgt:
8.6


#### Schritt 2

Nun wird der Segregationsindex für die Jahre 2004, 2010 und 2017 exemplarisch berechnet.


In [48]:
#für 2004:
sum_ABEV_2004 = magdeb007['ABEV_2004'].sum()
sum_EW_2004 = magdeb007['EW_2004'].sum()
print ("Auch die alternative Berechnung mittels Summenformel resultiert in den gleichen Ergebnissen:"
       +str(sum_ABEV_2004)+ "," + str(sum_EW_2004) )

#Anteile berechnen
magdeb007['anteilABEV_2004'] = magdeb007['ABEV_2004']/sum_ABEV_2004
magdeb007['anteilnichtABEV_2004'] = (magdeb007['EW_2004'] - magdeb007['ABEV_2004']) / (sum_EW_2004 - sum_ABEV_2004)
print(magdeb007)

#Verhältnis von ABEV_2004 zur Einwohnerzahl mithilfe der abs() Funktion berechnen
magdeb007['verh_ABEV_zu_EW_2004'] = abs(magdeb007['anteilABEV_2004']- magdeb007['anteilnichtABEV_2004'])
print(magdeb007)

#Segregationsindex berechnen
segIndex_04 = 0.5 * magdeb007['verh_ABEV_zu_EW_2004'].sum()
print('Der Segregationsindex beträgt:' + str(segIndex_04))

Auch die alternative Berechnung mittels Summenformel resultiert in den gleichen Ergebnissen:8092,225139
    STD_NR           STD_name  EW_2004  EW_2005  EW_2006  EW_2007  EW_2008  \
0        1           Altstadt    12786    13580    13892    14140    14532   
1        2             Werder     2490     2594     2691     2663     2709   
2        4      Alte Neustadt     9050     9183     9347     9534     9641   
3        6      Neue Neustadt    13572    13566    13583    13631    13757   
4        8     Neustädter See    11902    11784    11829    11784    11557   
5       10        Kannenstieg     6877     6735     6676     6594     6383   
6       12    Neustädter Feld     9828    10011     9980     9946     9847   
7       18           Nordwest     4547     4511     4522     4544     4609   
8       20     Alt Olvenstedt     3945     4111     4262     4278     4199   
9       22     Neu Olvenstedt    14257    13488    12733    12017    11741   
10      24      Stadtfeld Ost    22225

In [49]:
#für 2010:
sum_ABEV_2010 = magdeb007['ABEV_2010'].sum()
sum_EW_2010 = magdeb007['EW_2010'].sum()
print ("Auch die alternative Berechnung mittels Summenformel resultiert in den gleichen Ergebnissen:"
       +str(sum_ABEV_2010)+ "," + str(sum_EW_2010) )

#Anteile berechnen
magdeb007['anteilABEV_2010'] = magdeb007['ABEV_2010']/sum_ABEV_2010
magdeb007['anteilnichtABEV_2010'] = (magdeb007['EW_2010'] - magdeb007['ABEV_2010']) / (sum_EW_2010 - sum_ABEV_2010)
print(magdeb007)

#Verhältnis von ABEV_2010 zur Einwohnerzahl mithilfe der abs() Funktion berechnen
magdeb007['verh_ABEV_zu_EW_2010'] = abs(magdeb007['anteilABEV_2010']- magdeb007['anteilnichtABEV_2010'])
print(magdeb007)

#Segregationsindex berechnen
segIndex_10 = 0.5 * magdeb007['verh_ABEV_zu_EW_2010'].sum()
print('Der Segregationsindex beträgt:' + str(segIndex_10))

Auch die alternative Berechnung mittels Summenformel resultiert in den gleichen Ergebnissen:8153,229705
    STD_NR           STD_name  EW_2004  EW_2005  EW_2006  EW_2007  EW_2008  \
0        1           Altstadt    12786    13580    13892    14140    14532   
1        2             Werder     2490     2594     2691     2663     2709   
2        4      Alte Neustadt     9050     9183     9347     9534     9641   
3        6      Neue Neustadt    13572    13566    13583    13631    13757   
4        8     Neustädter See    11902    11784    11829    11784    11557   
5       10        Kannenstieg     6877     6735     6676     6594     6383   
6       12    Neustädter Feld     9828    10011     9980     9946     9847   
7       18           Nordwest     4547     4511     4522     4544     4609   
8       20     Alt Olvenstedt     3945     4111     4262     4278     4199   
9       22     Neu Olvenstedt    14257    13488    12733    12017    11741   
10      24      Stadtfeld Ost    22225

In [50]:
#für 2017:
sum_ABEV_2017 = magdeb007['ABEV_2017'].sum()
sum_EW_2017 = magdeb007['EW_2017'].sum()
print ("Auch die alternative Berechnung mittels Summenformel resultiert in den gleichen Ergebnissen:"
       +str(sum_ABEV_2017)+ "," + str(sum_EW_2017) )

#Anteile berechnen
magdeb007['anteilABEV_2017'] = magdeb007['ABEV_2017']/sum_ABEV_2017
magdeb007['anteilnichtABEV_2017'] = (magdeb007['EW_2017'] - magdeb007['ABEV_2017']) / (sum_EW_2017 - sum_ABEV_2017)
print(magdeb007)

#Verhältnis von ABEV_2017 zur Einwohnerzahl mithilfe der abs() Funktion berechnen
magdeb007['verh_ABEV_zu_EW_2017'] = abs(magdeb007['anteilABEV_2017']- magdeb007['anteilnichtABEV_2017'])
print(magdeb007)

#Segregationsindex berechnen
segIndex_17 = 0.5 * magdeb007['verh_ABEV_zu_EW_2017'].sum()
print('Der Segregationsindex beträgt:' + str(segIndex_17))

Auch die alternative Berechnung mittels Summenformel resultiert in den gleichen Ergebnissen:20636,240298
    STD_NR           STD_name  EW_2004  EW_2005  EW_2006  EW_2007  EW_2008  \
0        1           Altstadt    12786    13580    13892    14140    14532   
1        2             Werder     2490     2594     2691     2663     2709   
2        4      Alte Neustadt     9050     9183     9347     9534     9641   
3        6      Neue Neustadt    13572    13566    13583    13631    13757   
4        8     Neustädter See    11902    11784    11829    11784    11557   
5       10        Kannenstieg     6877     6735     6676     6594     6383   
6       12    Neustädter Feld     9828    10011     9980     9946     9847   
7       18           Nordwest     4547     4511     4522     4544     4609   
8       20     Alt Olvenstedt     3945     4111     4262     4278     4199   
9       22     Neu Olvenstedt    14257    13488    12733    12017    11741   
10      24      Stadtfeld Ost    2222