# Libraries

In [3]:
import pandas as pd
from pandas import Series, DataFrame
import numpy as np
import matplotlib.pyplot as plt 
import chardet

In [4]:
import geopandas as gpd
from geopandas import GeoSeries
from shapely.geometry import Point, LineString
import folium 
from folium import Marker, GeoJson
from folium.plugins import MarkerCluster, HeatMap

In [2]:
pwd

'/Users/ricardo/Documents/GitHub/Hospitals-Access-Peru/code'

# Reading, handling and processing IPRESS.csv

In [5]:
base = open('../data/IPRESS.csv', 'rb').read()
det = chardet.detect(base)
charenc = det['encoding']
charenc

'MacRoman'

In [6]:
csv_data = pd.read_csv('../data/IPRESS.csv', encoding=charenc)


In [7]:
csv_data = csv_data[['UBIGEO','InstituciÛn', 'Nombre del establecimiento', 'ClasificaciÛn', 'Departamento', 'Provincia', 'Distrito', 'Estado' ,'NORTE' ,'ESTE']]
csv_data.rename(columns={'InstituciÛn':'INSTITUCIÓN', 'Nombre del establecimiento': 'NOMBRE DEL ESTABLECIMIENTO', 'ClasificaciÛn':'CLASIFICACION', 'Departamento':'DEPARTAMENTO', 'Provincia':'PROVINCIA', 'Distrito':'DISTRITO', 'Estado':'ESTADO' ,'NORTE':'LATITUD' ,'ESTE':'LONGITUD'}, inplace=True)
cleaned_csv = csv_data.loc[csv_data['ESTADO'] == 'ACTIVADO'].dropna(subset=['LATITUD', 'LONGITUD'])
cleaned_csv.head()

Unnamed: 0,UBIGEO,INSTITUCIÓN,NOMBRE DEL ESTABLECIMIENTO,CLASIFICACION,DEPARTAMENTO,PROVINCIA,DISTRITO,ESTADO,LATITUD,LONGITUD
1,60611,GOBIERNO REGIONAL,AMBATO,PUESTOS DE SALUD O POSTAS DE SALUD,CAJAMARCA,CUTERVO,SANTA CRUZ,ACTIVADO,-78.85838,-6.133523
2,160302,GOBIERNO REGIONAL,SANTA ISABEL DE YUMBATURO,PUESTOS DE SALUD O POSTAS DE SALUD,LORETO,LORETO,PARINARI,ACTIVADO,-74.258139,-4.581509
6,150142,MINSA,PUESTO DE SALUD HEROES DEL CENEPA,PUESTOS DE SALUD O POSTAS DE SALUD,LIMA,LIMA,VILLA EL SALVADOR,ACTIVADO,-76.930608,-12.248699
12,250101,GOBIERNO REGIONAL,NUEVA BETANIA,PUESTOS DE SALUD O POSTAS DE SALUD,UCAYALI,CORONEL PORTILLO,CALLERIA,ACTIVADO,-74.296531,-8.398366
15,220907,GOBIERNO REGIONAL,PONGO ISLA,PUESTOS DE SALUD O POSTAS DE SALUD,SAN MARTIN,SAN MARTIN,HUIMBAYOC,ACTIVADO,-75.885812,-6.438298


In [8]:
cleaned_csv.info()

<class 'pandas.core.frame.DataFrame'>
Index: 7956 entries, 1 to 20818
Data columns (total 10 columns):
 #   Column                      Non-Null Count  Dtype  
---  ------                      --------------  -----  
 0   UBIGEO                      7956 non-null   int64  
 1   INSTITUCIÓN                 7956 non-null   object 
 2   NOMBRE DEL ESTABLECIMIENTO  7956 non-null   object 
 3   CLASIFICACION               7951 non-null   object 
 4   DEPARTAMENTO                7956 non-null   object 
 5   PROVINCIA                   7956 non-null   object 
 6   DISTRITO                    7956 non-null   object 
 7   ESTADO                      7956 non-null   object 
 8   LATITUD                     7956 non-null   float64
 9   LONGITUD                    7956 non-null   float64
dtypes: float64(2), int64(1), object(7)
memory usage: 683.7+ KB


# Distritos Shape file 

In [18]:
maps = gpd.read_file('../data/distritos/DISTRITOS.shp')
maps = maps[['IDDIST', 'geometry']]
maps = maps.rename({'IDDIST':'UBIGEO'}, axis = 1 )
maps['UBIGEO'] = maps['UBIGEO'].astype(str).astype(int)
maps

Unnamed: 0,UBIGEO,geometry
0,100902,"POLYGON ((-75.31797 -9.29529, -75.31710 -9.297..."
1,100904,"POLYGON ((-74.64136 -8.82302, -74.64036 -8.828..."
2,250305,"POLYGON ((-75.02253 -8.74193, -75.02267 -8.742..."
3,250302,"POLYGON ((-75.13864 -8.56712, -75.13956 -8.569..."
4,250304,"POLYGON ((-75.01589 -8.44637, -75.01585 -8.446..."
...,...,...
1868,100608,"POLYGON ((-76.08083 -9.13017, -76.08026 -9.130..."
1869,100609,"POLYGON ((-75.88828 -9.00906, -75.88756 -9.010..."
1870,100610,"POLYGON ((-75.91141 -8.88593, -75.91182 -8.886..."
1871,211105,"POLYGON ((-70.13203 -15.33382, -70.12355 -15.3..."


#### Making sure the format is WGS-84 (EPSG:4326)

In [19]:
maps = maps.to_crs(epsg=4326)
maps.crs

<Geographic 2D CRS: EPSG:4326>
Name: WGS 84
Axis Info [ellipsoidal]:
- Lat[north]: Geodetic latitude (degree)
- Lon[east]: Geodetic longitude (degree)
Area of Use:
- name: World.
- bounds: (-180.0, -90.0, 180.0, 90.0)
Datum: World Geodetic System 1984 ensemble
- Ellipsoid: WGS 84
- Prime Meridian: Greenwich

#### Merged data

In [20]:
final_dataset = pd.merge(maps, cleaned_csv, how="inner", on="UBIGEO")
final_dataset

Unnamed: 0,UBIGEO,geometry,INSTITUCIÓN,NOMBRE DEL ESTABLECIMIENTO,CLASIFICACION,DEPARTAMENTO,PROVINCIA,DISTRITO,ESTADO,LATITUD,LONGITUD
0,100902,"POLYGON ((-75.31797 -9.29529, -75.31710 -9.297...",GOBIERNO REGIONAL,CODO DEL POZUZO,CENTROS DE SALUD O CENTROS MEDICOS,HUANUCO,PUERTO INCA,CODO DEL POZUZO,ACTIVADO,-75.463665,-9.669402
1,100902,"POLYGON ((-75.31797 -9.29529, -75.31710 -9.297...",GOBIERNO REGIONAL,HUAMPOMAYO,PUESTOS DE SALUD O POSTAS DE SALUD,HUANUCO,PUERTO INCA,CODO DEL POZUZO,ACTIVADO,-75.591200,-9.969250
2,100902,"POLYGON ((-75.31797 -9.29529, -75.31710 -9.297...",GOBIERNO REGIONAL,CHORROPAMPA,PUESTOS DE SALUD O POSTAS DE SALUD,HUANUCO,PUERTO INCA,CODO DEL POZUZO,ACTIVADO,-75.394620,-9.850610
3,100904,"POLYGON ((-74.64136 -8.82302, -74.64036 -8.828...",GOBIERNO REGIONAL,PRINCIPE DE PAZ,PUESTOS DE SALUD O POSTAS DE SALUD,HUANUCO,PUERTO INCA,TOURNAVISTA,ACTIVADO,-74.683542,-8.995790
4,100904,"POLYGON ((-74.64136 -8.82302, -74.64036 -8.828...",GOBIERNO REGIONAL,TOURNAVISTA,CENTROS DE SALUD O CENTROS MEDICOS,HUANUCO,PUERTO INCA,TOURNAVISTA,ACTIVADO,-74.702805,-8.934338
...,...,...,...,...,...,...,...,...,...,...,...
7903,150806,"POLYGON ((-77.37630 -10.89734, -77.37604 -10.8...",GOBIERNO REGIONAL,PE—ICO,PUESTOS DE SALUD O POSTAS DE SALUD,LIMA,HUAURA,HUAURA,ACTIVADO,-77.437500,-10.931177
7904,150806,"POLYGON ((-77.37630 -10.89734, -77.37604 -10.8...",ESSALUD,CENTRO DE ATENCION PRIMARIA I HUMAYA,PUESTOS DE SALUD O POSTAS DE SALUD,LIMA,HUAURA,HUAURA,ACTIVADO,-77.409616,-11.098534
7905,150806,"POLYGON ((-77.37630 -10.89734, -77.37604 -10.8...",GOBIERNO REGIONAL,VILCAHUAURA,PUESTOS DE SALUD O POSTAS DE SALUD,LIMA,HUAURA,HUAURA,ACTIVADO,-77.474190,-11.072751
7906,150806,"POLYGON ((-77.37630 -10.89734, -77.37604 -10.8...",GOBIERNO REGIONAL,HUMAYA,PUESTOS DE SALUD O POSTAS DE SALUD,LIMA,HUAURA,HUAURA,ACTIVADO,-77.409943,-11.099675


# Task 1: Static maps: count of hospitals by district