# Sistema Nacional de Información e Indicadores de Vivienda

ID |Descripción
---|:----------
P0405|Viviendas Verticales
P0406|Viviendas urbanas en PCU U1 y U2
P0411|Subsidios CONAVI

In [2]:
descripciones = {
    'P0405': 'Viviendas Verticales',
    'P0406': 'Viviendas urbanas en PCU U1 y U2',
    'P0411': 'Subsidios CONAVI'
}

In [92]:
# Librerias utilizadas
import pandas as pd
import sys
import urllib
import os
import csv
import zeep
import requests
from lxml import etree
import xmltodict

In [4]:
# Configuracion del sistema
print('Python {} on {}'.format(sys.version, sys.platform))
print('Pandas version: {}'.format(pd.__version__))
import platform; print('Running on {} {}'.format(platform.system(), platform.release()))

Python 3.6.1 |Anaconda 4.4.0 (64-bit)| (default, May 11 2017, 13:25:24) [MSC v.1900 64 bit (AMD64)] on win32
Pandas version: 0.20.1
Running on Windows 8.1


## 2. Descarga de datos
Los datos se descargan por medio de una conexión a un servicio SOAP proporcionado por el SNIIV. Para acceder a los datos proporcionados por cada uno de los servicios del SNIIV, tiene que hacerse un POST request, especificando en el encabezado el servicio al que se busca acceder y en el cuerpo de la petición, un XML con parametros para que el servidor de SNIIV pueda regresar una respuesta 

In [85]:
# Esta celda contiene textos estándar para los encabezados y el cuerpo de la operación que se solicita al servidor.
# los textos entre corchetes {} sirven para especificar la operacion a la que se busca tener acceso
scheme = r'http://www.conavi.gob.mx:8080/WS_App_SNIIV.asmx?WSDL'       #El scheme siempre es el mismo
SOAPAction = ('http://www.conavi.gob.mx:8080/WS_App_SNIIV/{}')
xmlbody = (
'<?xml version="1.0" encoding="utf-8"?>'
'<soap:Envelope xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/">'
  '<soap:Body>'
    '<{} xmlns="http://www.conavi.gob.mx:8080/WS_App_SNIIV">'
      '<dat></dat>'
    '</{}>'
  '</soap:Body>'
'</soap:Envelope>'
)


In [119]:
# Conexion y descarga de datos
operacion = 'Subsidios'
heads = {'Content-Type': 'text/xml; charset=utf-8', 
           'SOAPAction': SOAPAction.format(operacion)}
body = xmlbody.format(operacion, operacion)
r = requests.post(scheme, data=body, headers=heads)
print(r.content[0:300])

b'<?xml version="1.0" encoding="utf-8"?><soap:Envelope xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema"><soap:Body><SubsidiosResponse xmlns="http://www.conavi.gob.mx:8080/WS_App_SNIIV"><SubsidiosRe'


In [131]:
list(r.headers.keys())

['Cache-Control',
 'Content-Type',
 'Server',
 'X-AspNet-Version',
 'X-Powered-By',
 'Date',
 'Content-Length']

In [103]:
r = xmltodict.parse(r.content)
r.keys()

odict_keys(['soap:Envelope'])

In [114]:
# Después de parseada la respuesta a un diccionario de Python, los datos se encuentran varios niveles por debajo, por lo que es 
# necesario explorar estos niveles hasta llegar a los datos útiles
rodict = r['soap:Envelope']['soap:Body']['{}Response'.format(operacion)]['{}Result'.format(operacion)]['app_sniiv_rep_subs']
rodict[0]

OrderedDict([('cve_ent', '01'),
             ('tipo_ee', 'NO DISPONIBLE'),
             ('modalidad', 'Autoproducción'),
             ('acciones', '11'),
             ('monto', '781626.56')])

In [116]:
# Con los datos parseados en forma de OrderedDict ya es posible hacer un DataFrame de la siguiente manera.
pd.DataFrame(rodict, columns=rodict[0].keys()).head()

Unnamed: 0,cve_ent,tipo_ee,modalidad,acciones,monto
0,1,NO DISPONIBLE,Autoproducción,11,781626.56
1,1,INFONAVIT,Nueva,234,13556833.79
2,1,INFONAVIT,Usada,6,318407.02
3,1,RIF - FOVI,Nueva,1,47500.0
4,2,INFONAVIT,Nueva,280,12989084.57


Lo anterior es un ejemplo de cómo pueden obtenerse datos desde el servicio montado por el SNIIV. Con base en este ejemplo es posible hacer una función que realice las peticiones de manera más compacta en cada caso.

In [144]:
def getsoap(operacion):
    scheme = r'http://www.conavi.gob.mx:8080/WS_App_SNIIV.asmx?WSDL'       #El scheme siempre es el mismo
    SOAPAction = ('http://www.conavi.gob.mx:8080/WS_App_SNIIV/{}')
    xmlbody = (
    '<?xml version="1.0" encoding="utf-8"?>'
    '<soap:Envelope xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/">'
      '<soap:Body>'
        '<{} xmlns="http://www.conavi.gob.mx:8080/WS_App_SNIIV">'
          '<dat></dat>'
        '</{}>'
      '</soap:Body>'
    '</soap:Envelope>'
    )
    heads = {'Content-Type': 'text/xml; charset=utf-8', 
           'SOAPAction': SOAPAction.format(operacion)}
    body = xmlbody.format(operacion, operacion)
    r = requests.post(scheme, data=body, headers=heads)
    if r.status_code != 200:          # 
        print('status: {}\n**Operacion terminada**'.format(r.status_code))
        return
    else:
        print('status: {}\nContent Type: {}'.format(r.status_code, r.headers['Content-Type']))
        print('Date: {}\nContent Lenght: {}'.format(r.headers['Date'], r.headers['Content-Length']))
        r = xmltodict.parse(r.content)
#        return r
        rodict = r['soap:Envelope']['soap:Body']['{}Response'.format(operacion)]['{}Result'.format(operacion)][list(test.keys())[0]]
        return pd.DataFrame(rodict, columns=rodict[0].keys()).head()
    

In [145]:
test = getsoap('viv_vig_x_avnc')

status: 200
Content Type: text/xml; charset=utf-8
Date: Fri, 20 Apr 2018 15:17:40 GMT
Content Lenght: 8422


'app_sniiv_vv_x_avanc'

In [146]:
test

OrderedDict([('app_sniiv_vv_x_avanc',
              [OrderedDict([('cve_ent', '01'),
                            ('entidad', 'AGUASCALIENTES'),
                            ('viv_proc_m50', '4114'),
                            ('viv_proc_50_99', '2485'),
                            ('viv_term_rec', '1843'),
                            ('viv_term_ant', '6353'),
                            ('total', '14795')]),
               OrderedDict([('cve_ent', '02'),
                            ('entidad', 'BAJA CALIFORNIA'),
                            ('viv_proc_m50', '6289'),
                            ('viv_proc_50_99', '4476'),
                            ('viv_term_rec', '2080'),
                            ('viv_term_ant', '5959'),
                            ('total', '18804')]),
               OrderedDict([('cve_ent', '03'),
                            ('entidad', 'BAJA CALIFORNIA SUR'),
                            ('viv_proc_m50', '1358'),
                            ('viv_proc_50_99', '