## IRIS

### Typologie des IRIS

sources: [Insee](https://www.insee.fr/fr/metadonnees/definition/c1523), [geoconcept]
(https://fr.geoconcept.com/zone-iris)<br>
<br>
Les IRIS constituent chacun un « micro quartier », composé d'un ensemble **d'îlots contigus et homogènes**, regroupant **2000 habitants ou plus**.

Chaque IRIS constitue un secteur communal de base, un « micro quartier » géographique et démographique homogène, clairement et durablement defini. Sur ce « maillon élémentaire » est pratiquée la collecte de données statistiques et démographiques. Ces données sont ensuite analysées et les résultats publiés par l'INSEE.

La France compte 50 800 IRIS, dont 700 dans les DOM répartis comme suit :

- 16 100 IRIS, dont 650 dans les DOM, issus du découpage des communes de plus de 10 000 habitants, et la plupart des communes de 5 000 à 10 000 habitants,
- 34 800 IRIS, constitués par les communes non-découpées.


Les IRIS se déclinent en trois types de zones :

- **IRIS d'habitat (H)** : IRIS dont la population se situe entre 1 800 et 5 000 habitants ; ils sont homogènes quant au type d'habitat ;
- **IRIS d'activité (A)**: IRIS regroupant plus de 1 000 salariés et comptent deux fois plus d'emplois salariés que de population résidente ;
- **IRIS divers (D)**: IRIS de superficie importante à usage particulier (bois, parcs, zones portuaires...).
- **IRIS autres (Z)**.<br>
Plus de 92% des IRIS sont des IRIS d’habitat, 5% des IRIS d’activité.


### Code IRIS
À chaque îlot est associé un code IRIS. Composé de 9 caractères. Il permet d'identifier de manière univoque un îlot. Les cinq premiers caractères du code IRIS correspondent au code Insee de la commune sur le territoire de laquelle est situé l'îlot.

### Différentes bdd sur bases IRIS :
- Population 2016
- Couple, familles, ménages 2016
- Logements 2016
- Activités des résidents 2016
<br>
(Non pris en compte Diplômes et formation 2016.)

In [1]:
import pandas as pd
import numpy as np

## Revenus Disponible par UC 2016 (IRIS) - France Metropolitaine, Martinique, La Réunion
infra-communales<br>
(géographie au 01 jan 2017 - rappel population, ménage, logement sont géographie au 01 jan 2018).
<br>

> **Revenu disponible d'un ménage**<br>
Est le revenu à la disposition du ménage pour consommer et épargner. Il comprend les revenus d'activité, indemnités de chômage, retraites et pensions, revenus fonciers, les revenus financiers (imputés pour ceux qui ne sont pas soumis à déclaration : livrets exonérés, PEA, LEP, CEL, PEL, produits d'assurance-vie) et les prestations sociales reçues (prestations familiales, minima sociaux et prestations logement). Au total de ces ressources, on déduit les impôts directs (impôt sur le revenu, taxe d'habitation) et les prélèvements sociaux : contribution sociale généralisée (CSG), contribution au remboursement de la dette sociale (CRDS).<br>
<br>
**Revenu disponible par unité de consommation (UC)**<br>
Est également appelé "niveau de vie", est le revenu disponible par "équivalent adulte". Il est calculé en rapportant le revenu disponible du ménage au nombre d'unités de consommation qui le composent. Toutes les personnes rattachées au même ménage fiscal ont le même revenu disponible par UC (ou niveau de vie).

In [2]:
# Population hors ménages![image.png](attachment:image.png)
varrevIR = pd.read_excel('IRIS_revenue/variable_dispo.xlsx')
varrevIR

Unnamed: 0,VAR_ID,VAR_LIB,VAR_LIB_LONG
0,IRIS,IRIS,Code du département suivi du numéro de commune...
1,LIBIRIS,Libellé de l'IRIS,Libellé de l'IRIS à l'intérieur de la commune ...
2,COM,Commune ou ARM,Code du département suivi du numéro de commune...
3,LIBCOM,Libellé commune ou ARM,Libellé de la commune ou de l'arrondissement m...
4,DISP_TP6016,Taux de pauvreté au seuil de 60 % (%),Taux de pauvreté au seuil de 60 % du revenu di...
5,DISP_Q116,1er quartile (€),1er quartile du revenu disponible par unité de...
6,DISP_MED16,Médiane (€),Médiane du revenu disponible par unité de cons...
7,DISP_Q316,3e quartile (€),3e quartile du revenu disponible par unité de ...
8,DISP_EQ16,Écart inter-quartile rapporté à la médiane,Écart inter-quartile rapporté à la médiane
9,DISP_D116,1er décile (€),1er décile du revenu disponible par unité de c...


In [3]:
revIR = pd.read_excel('IRIS_revenue/BASE_TD_FILO_DISPO_IRIS_2016_cIA.xls')

In [4]:
revIR.head(10)

Unnamed: 0,IRIS,LIBIRIS,COM,LIBCOM,DISP_TP6016,DISP_Q116,DISP_MED16,DISP_Q316,DISP_EQ16,DISP_D116,...,DISP_PCHO16,DISP_PBEN16,DISP_PPEN16,DISP_PPAT16,DISP_PPSOC16,DISP_PPFAM16,DISP_PPMINI16,DISP_PPLOGT16,DISP_PIMPOT16,DISP_NOTE16
0,10040101,Les Perouses-Triangle d'Activite,1004,Ambérieu-en-Bugey,19.456617,13480.416667,18652.857143,24093.0,0.568952,10237.096774,...,4.4,2.5,28.1,7.3,8.3,3.4,2.8,2.2,-13.5,0
1,10040102,Longeray-Gare,1004,Ambérieu-en-Bugey,26.082937,12331.0,16899.0,22640.0,0.610036,9347.222222,...,4.2,2.5,26.5,6.4,10.9,3.5,3.9,3.4,-12.9,0
2,10040201,Centre-St Germain-Vareilles,1004,Ambérieu-en-Bugey,17.868458,14040.0,19090.0,24539.047619,0.549976,10292.0,...,3.3,4.3,28.3,7.3,7.5,2.9,2.2,2.3,-15.3,0
3,10040202,Tiret-Les Allymes,1004,Ambérieu-en-Bugey,8.850575,17547.777778,23449.047619,30489.047619,0.551889,13136.666667,...,2.4,4.2,26.2,11.7,3.7,2.1,0.8,0.8,-18.2,0
4,10330101,Coupy-Vanchy,1033,Bellegarde-sur-Valserine,19.722772,14211.111111,20741.0,30992.857143,0.80911,9735.0,...,4.4,1.8,23.3,4.6,4.6,1.6,1.8,1.2,-12.6,0
5,10330102,Centre Ville,1033,Bellegarde-sur-Valserine,20.774194,13524.347826,18823.333333,27200.666667,0.726562,10135.0,...,4.9,2.2,26.0,7.9,5.4,1.7,1.9,1.8,-13.3,0
6,10330201,Arc Vouvray-Gare-Chatillon,1033,Bellegarde-sur-Valserine,14.353086,15586.666667,22792.0,34087.2,0.811712,10901.034483,...,3.4,4.2,26.9,5.9,3.6,1.6,1.1,1.0,-14.5,0
7,10330202,Plateau de Musinens,1033,Bellegarde-sur-Valserine,23.187325,12894.0,17180.0,24488.666667,0.674893,9681.851852,...,4.2,1.3,30.3,5.0,8.4,3.0,3.1,2.3,-12.3,0
8,10330301,Arlod,1033,Bellegarde-sur-Valserine,19.821958,13804.5,19839.0,28439.5,0.737688,9822.0,...,5.7,0.3,20.2,4.4,6.1,3.0,1.6,1.4,-11.9,0
9,10530101,Centre-Ville,1053,Bourg-en-Bresse,21.76378,13033.888889,18426.5,25270.0,0.66405,9262.307692,...,3.7,4.1,23.2,12.9,7.6,1.8,3.0,2.8,-16.9,0


## Revenus
- IRIS Niveau de vie<br>
**GEO** : IRIS / Libé commune ou ARM<br>
**Niv. de vie**: 1er décile (€) / 2ème décile (€) / ... / 9ème décile (€)<br>

In [5]:
revIR_base = revIR[['IRIS', 'LIBIRIS', 'COM', 'LIBCOM', 'DISP_D116', 'DISP_D216', 'DISP_D316', 'DISP_D416',
                    'DISP_D616',
                    'DISP_D716',
                    'DISP_D816',
                    'DISP_D916']]
# remarque: il n'existe pas dans la base de '5ème décile'.

In [6]:
revIR_new = revIR_base.drop(columns=['LIBIRIS', 'COM'])

In [7]:
revIR_new.head()

Unnamed: 0,IRIS,LIBCOM,DISP_D116,DISP_D216,DISP_D316,DISP_D416,DISP_D616,DISP_D716,DISP_D816,DISP_D916
0,10040101,Ambérieu-en-Bugey,10237.096774,12705.0,14169.0,16312.5,20790.0,22967.619048,25564.666667,30336.0
1,10040102,Ambérieu-en-Bugey,9347.222222,11428.695652,13101.923077,14881.666667,19042.666667,21270.0,24101.333333,28802.0
2,10040201,Ambérieu-en-Bugey,10292.0,12961.904762,15145.0,17101.333333,20873.333333,23141.333333,26113.809524,31911.333333
3,10040202,Ambérieu-en-Bugey,13136.666667,16272.0,18626.5,20981.5,25822.380952,28908.0,32841.333333,39363.888889
4,10330101,Bellegarde-sur-Valserine,9735.0,12525.0,15038.148148,17306.0,24056.0,28341.666667,36179.2,48223.809524


In [8]:
revIR_new.apply(lambda x: len(x.unique()))

IRIS         12285
LIBCOM         977
DISP_D116    11194
DISP_D216    11418
DISP_D316    11453
DISP_D416    11573
DISP_D616    11619
DISP_D716    11649
DISP_D816    11727
DISP_D916    11794
dtype: int64

In [9]:
revIR_new.shape

(12285, 10)

### Checking missing values

In [10]:
revIR_new.isnull().sum()/len(revIR_new)*100

IRIS         0.0000
LIBCOM       0.0000
DISP_D116    0.0814
DISP_D216    0.0814
DISP_D316    0.0814
DISP_D416    0.0814
DISP_D616    0.0814
DISP_D716    0.0814
DISP_D816    0.0814
DISP_D916    0.0814
dtype: float64

In [11]:
# recherche des IRIS où il manque la donnée
nulle = revIR_new.isnull()
revIR_nul = revIR_new[(nulle.values  == True)]

findTheIris = revIR_nul['IRIS'].unique()
for i in findTheIris:
    libcom = revIR_new[(revIR_new.values == i)]['LIBCOM']
    print("IRIS:", i, "Libcom:", libcom)

IRIS: 132110701 Libcom: 1216    Marseille 11e Arrondissement
Name: LIBCOM, dtype: object
IRIS: 250560301 Libcom: 1772    Besançon
Name: LIBCOM, dtype: object
IRIS: 751166121 Libcom: 7590    Paris 16e Arrondissement
Name: LIBCOM, dtype: object
IRIS: 751197413 Libcom: 7806    Paris 19e Arrondissement
Name: LIBCOM, dtype: object
IRIS: 765400405 Libcom: 8123    Rouen
Name: LIBCOM, dtype: object
IRIS: 765400902 Libcom: 8136    Rouen
Name: LIBCOM, dtype: object
IRIS: 800212204 Libcom: 8893    Amiens
Name: LIBCOM, dtype: object
IRIS: 914210102 Libcom: 9756    Montgeron
Name: LIBCOM, dtype: object
IRIS: 930050207 Libcom: 10524    Aulnay-sous-Bois
Name: LIBCOM, dtype: object
IRIS: 956800113 Libcom: 11917    Villiers-le-Bel
Name: LIBCOM, dtype: object


In [12]:
# example
revIR_new[(revIR_new.values == 'Marseille 11e Arrondissement')]

Unnamed: 0,IRIS,LIBCOM,DISP_D116,DISP_D216,DISP_D316,DISP_D416,DISP_D616,DISP_D716,DISP_D816,DISP_D916
1202,132110101,Marseille 11e Arrondissement,15683.333333,19310.666667,22082.0,24748.666667,30150.0,33381.25,38960.0,47142.857143
1203,132110201,Marseille 11e Arrondissement,12035.0,14752.666667,17500.5,19465.333333,23644.0,25540.37037,28785.333333,34316.0
1204,132110301,Marseille 11e Arrondissement,14433.333333,18832.0,21765.714286,24139.333333,29453.6,33064.0,38224.0,47458.666667
1205,132110401,Marseille 11e Arrondissement,14630.0,18954.0,22184.0,24442.857143,29624.285714,33164.666667,39087.307692,53866.0
1206,132110501,Marseille 11e Arrondissement,9946.4,12400.0,14527.0,16875.5,22335.5,24723.333333,27534.4,32448.0
1207,132110601,Marseille 11e Arrondissement,8032.380952,8989.62963,10177.5,11543.2,13778.846154,15350.0,17631.73913,20948.0
1208,132110602,Marseille 11e Arrondissement,7138.275862,8417.741935,9419.0,10528.0,12486.585366,13677.692308,16288.095238,19418.666667
1209,132110603,Marseille 11e Arrondissement,11421.333333,13845.0,15760.0,18124.761905,21782.666667,23468.0,25913.888889,30712.857143
1210,132110604,Marseille 11e Arrondissement,11196.666667,14100.5,16961.538462,18726.315789,22301.333333,24490.869565,27576.0,33404.5
1211,132110605,Marseille 11e Arrondissement,9815.0,12652.0,14954.4,16930.769231,20089.230769,22092.777778,24709.5,29171.333333


In [17]:
marseille = revIR_new[(revIR_new.values == 'Marseille 11e Arrondissement')]
for column in ['DISP_D116', 'DISP_D216', 'DISP_D316', 'DISP_D416', 'DISP_D616', 'DISP_D716', 'DISP_D816', 'DISP_D916']:
    marseille[column].fillna(marseille[column].mode()[0], inplace=True)

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  **kwargs


In [18]:
revIR_new[(revIR_new.values == 'Marseille 11e Arrondissement')]

Unnamed: 0,IRIS,LIBCOM,DISP_D116,DISP_D216,DISP_D316,DISP_D416,DISP_D616,DISP_D716,DISP_D816,DISP_D916
1202,132110101,Marseille 11e Arrondissement,15683.333333,19310.666667,22082.0,24748.666667,30150.0,33381.25,38960.0,47142.857143
1203,132110201,Marseille 11e Arrondissement,12035.0,14752.666667,17500.5,19465.333333,23644.0,25540.37037,28785.333333,34316.0
1204,132110301,Marseille 11e Arrondissement,14433.333333,18832.0,21765.714286,24139.333333,29453.6,33064.0,38224.0,47458.666667
1205,132110401,Marseille 11e Arrondissement,14630.0,18954.0,22184.0,24442.857143,29624.285714,33164.666667,39087.307692,53866.0
1206,132110501,Marseille 11e Arrondissement,9946.4,12400.0,14527.0,16875.5,22335.5,24723.333333,27534.4,32448.0
1207,132110601,Marseille 11e Arrondissement,8032.380952,8989.62963,10177.5,11543.2,13778.846154,15350.0,17631.73913,20948.0
1208,132110602,Marseille 11e Arrondissement,7138.275862,8417.741935,9419.0,10528.0,12486.585366,13677.692308,16288.095238,19418.666667
1209,132110603,Marseille 11e Arrondissement,11421.333333,13845.0,15760.0,18124.761905,21782.666667,23468.0,25913.888889,30712.857143
1210,132110604,Marseille 11e Arrondissement,11196.666667,14100.5,16961.538462,18726.315789,22301.333333,24490.869565,27576.0,33404.5
1211,132110605,Marseille 11e Arrondissement,9815.0,12652.0,14954.4,16930.769231,20089.230769,22092.777778,24709.5,29171.333333


In [15]:
# nouvelle verifications de données manquantes
revIR_new.isnull().sum()/len(revIR_new)*100

IRIS         0.0000
LIBCOM       0.0000
DISP_D116    0.0814
DISP_D216    0.0814
DISP_D316    0.0814
DISP_D416    0.0814
DISP_D616    0.0814
DISP_D716    0.0814
DISP_D816    0.0814
DISP_D916    0.0814
dtype: float64

# WIP

In [16]:
revIR_new.to_csv('IRIS_revenue/IRIS_revenue.csv')