## Using Web Services

Una vez que fue fácil recuperar documentos y analizar documentos a través de HTTP utilizando programas, no pasó mucho tiempo para desarrollar un enfoque donde

comenzó a producir documentos que fueron diseñados específicamente para ser consumidos por otros programas (es decir, no HTML para mostrarse en un navegador).

Hay dos formatos comunes que usamos cuando intercambiamos datos a través de la web. El "lenguaje de marcado extensible" o XML ha estado en uso durante mucho tiempo y es el más adecuado para el intercambio de datos de estilo de documento. Cuando los programas solo desean intercambiar diccionarios, listas u otra información interna entre ellos, usan JavaScript Object Notation o JSON (consulte www.json.org). Veremos ambos formatos.

## eXtensible Markup Language - XML(Lenguaje de marcado extensible)
XML se ve muy similar a HTML, pero XML está más estructurado que HTML. Aquí hay una muestra de un documento XML:

In [None]:
<person>
  <name>Chuck</name>
  <phone type="intl">
     +1 734 303 4456
   </phone>
   <email hide="yes"/>
</person>

A menudo es útil pensar en un documento XML como una estructura de árbol donde hay una persona de etiqueta superior y otras etiquetas, como el teléfono, dibujadas como elementos secundarios de sus nodos principales.

![](arbol.svg)

### La representacion de arbol en XML


## Parsing XML (Análisis XML)
Aquí hay una aplicación simple que analiza algunos XML y extrae algunos elementos de datos del XML:

In [3]:
import xml.etree.ElementTree as ET

data = '''
<person>
  <name>Chuck</name>
  <phone type="intl">
     +1 734 303 4456
   </phone>
   <email hide="yes"/>
</person>'''

tree = ET.fromstring(data)
print('Name:', tree.find('name').text)
print('Attr:', tree.find('email').get('hide'))

# Code: http://www.py4e.com/code3/xml1.py
    

Name: Chuck
Attr: yes


Llamar <b>fromstring convierte la representación de cadena del XML en un "árbol" de nodos XML</b>. Cuando XML está en un árbol, tenemos una serie de métodos a los que podemos llamar para extraer porciones de datos del XML.

La find function busca en el árbol XML y recupera un nodo que coincide con la etiqueta especificada. Cada nodo puede tener texto, algunos atributos (como hide) y algunos nodos "secundarios"(child nodes). Cada nodo puede ser la parte superior de un árbol de nodos.

El uso de un analizador XML como ElementTree tiene la ventaja de que si bien el XML en este ejemplo es bastante simple, resulta que hay muchas reglas sobre XML válido y el uso de ElementTree nos permite extraer datos de XML sin preocuparse por las reglas de la sintaxis XML.

## Looping through nodes (Looping a través de los nodos)
A menudo, el XML tiene múltiples nodos y necesitamos escribir un bucle para procesar todos los nodos. En el siguiente programa, recorremos todos los nodos de usuario

In [21]:
import xml.etree.ElementTree as ET

input = '''
<stuff>
    <users>
        <user x="2">
            <id>001</id>
            <name>Chuck</name>
        </user>
        <user x="7">
            <id>009</id>
            <name>Brent</name>
        </user>
    </users>
</stuff>''' #colocamos en un comentario multilinea lo que guardaremos en la variable input

stuff = ET.fromstring(input) #Convierte el testo input en un diagrama de arbol tipo xml
print(stuff)
lst = stuff.findall('users/user') #Sub arboles del arbol
print(lst)
print('User count:', len(lst)) # Imprime la cantidad de ramas Users/user que existen 

for item in lst:
    print('Name', item.find('name').text)
    print('Id', item.find('id').text)
    print('Attribute', item.get("x"))

# Code: http://www.py4e.com/code3/xml2.py

<Element 'stuff' at 0x7facf4181318>
[<Element 'user' at 0x7facf41811d8>, <Element 'user' at 0x7facf4165ea8>]
User count: 2
Name Chuck
Id 001
Attribute 2
Name Brent
Id 009
Attribute 7


El método findall recupera una lista de Python de subárboles que representan las estructuras de usuario en el árbol XML. Luego, podemos escribir un bucle for que examina cada uno de los nodos de usuario, e imprime los elementos de nombre y texto, así como también el atributo x del nodo de usuario.

## JavaScript Object Notation - JSON (Notación de objetos JavaScript - JSON)

El formato JSON se inspiró en el objjet and array format, utilizado en el lenguaje JavaScript. Pero como Python se inventó antes que JavaScript, la sintaxis de Python para diccionarios y listas influyó en la sintaxis de JSON. Entonces, el formato de JSON es casi idéntico a una combinación de listas y diccionarios de Python.

Aquí hay una codificación JSON que es más o menos equivalente al XML simple de arriba:

In [1]:
{
  "name" : "Chuck",
  "phone" : {
    "type" : "intl",
    "number" : "+1 734 303 4456"
   },
   "email" : {
     "hide" : "yes"
   }
}

{'email': {'hide': 'yes'},
 'name': 'Chuck',
 'phone': {'number': '+1 734 303 4456', 'type': 'intl'}}

Notarás algunas diferencias. Primero, en XML, podemos agregar atributos como "intl" a la etiqueta "teléfono". En JSON, simplemente tenemos pares clave-valor. Además, la etiqueta XML "persona" se ha ido, reemplazada por un conjunto de llaves externas.

En general, las estructuras JSON son más simples que XML porque JSON tiene menos capacidades que XML. Pero JSON tiene la ventaja de que se asigna directamente a una combinación de diccionarios y listas. Y dado que casi todos los lenguajes de programación tienen algo equivalente a los diccionarios y listas de Python, JSON es un formato muy natural para que dos programas cooperantes intercambien datos.

JSON se está convirtiendo rápidamente en el formato de elección para casi todos los intercambios de datos entre aplicaciones debido a su relativa simplicidad en comparación con XML.

## Parsing JSON

Construimos nuestro JSON anidando diccionarios (objetos) y listas según sea necesario. En este ejemplo, representamos una lista de usuarios en donde cada usuario es un conjunto de pares clave-valor (es decir, un diccionario). Entonces tenemos una lista de diccionarios.

En el siguiente programa, usamos la biblioteca json incorporada para analizar el JSON y leer los datos. Compare esto de cerca con los datos XML equivalentes y el código anterior. El JSON tiene menos detalles, por lo que debemos saber de antemano que estamos obteniendo una lista y que la lista de usuarios y que cada uno es un conjunto de pares clave-valor. El JSON es también sucinto (una ventaja) pero también es menos autodescriptivo (una desventaja).

In [4]:
import json

data = '''
[
  { "id" : "001",
    "x" : "2",
    "name" : "Chuck"
  } ,
  { "id" : "009",
    "x" : "7",
    "name" : "Chuck"
  }
]'''

info = json.loads(data)
print('User count:', len(info))
print(info)
for item in info:
    print('Name', item['name'])
    print('Id', item['id'])
    print('Attribute', item['x'])
    
type(item)

# Code: http://www.py4e.com/code3/json2.py

User count: 2
[{'id': '001', 'x': '2', 'name': 'Chuck'}, {'id': '009', 'x': '7', 'name': 'Chuck'}]
Name Chuck
Id 001
Attribute 2
Name Chuck
Id 009
Attribute 7


dict

Si compara el código para extraer datos de JSON y XML analizados, verá que lo que obtenemos de json.loads () es una lista de Python que atravesamos con un bucle for , y cada elemento dentro de esa lista es un diccionario de Python. Una vez que se ha analizado el JSON, podemos usar el operador de índice de Python para extraer los diversos bits de datos para cada usuario. No tenemos que usar la biblioteca JSON para explorar el JSON analizado, ya que los datos devueltos son simplemente estructuras nativas de Python.

El resultado de este programa es exactamente el mismo que la versión XML anterior.

En general, hay una tendencia de la industria de XML y hacia JSON para servicios web. Debido a que el JSON es más simple y se asigna de forma más directa a las estructuras de datos nativas que ya tenemos en los lenguajes de programación, el código de análisis y extracción de datos suele ser más simple y directo cuando se usa JSON. Pero XML es más autodescriptivo que JSON, por lo que hay algunas aplicaciones donde XML conserva una ventaja. Por ejemplo, la mayoría de los procesadores de texto almacenan documentos internamente usando XML en lugar de JSON.

## Application Programming Interfaces(Interfaces de programación de aplicaciones API)
Ahora tenemos la capacidad de intercambiar datos entre aplicaciones usando el protocolo de transporte de hipertexto (HTTP) y una forma de representar datos complejos que estamos enviando hacia adelante y hacia atrás entre estas aplicaciones usando eXtensible Markup Language (XML) o JavaScript Object Notation (JSON).

El siguiente paso es comenzar a definir y documentar los "contratos" entre las aplicaciones que utilizan estas técnicas. El nombre general para estos contratos de aplicación a aplicación es Interfaces de programa de aplicación o API. <b>Cuando usamos una API, generalmente un programa hace que un conjunto de servicios esté disponible para su uso por otras aplicaciones y publica las API (es decir, las "reglas") que se deben seguir para acceder a los servicios proporcionados por el programa</b>.

Cuando comenzamos a construir nuestros programas donde la funcionalidad de nuestro programa incluye el acceso a servicios provistos por otros programas, llamamos al enfoque una Arquitectura Orientada a Servicios o SOA. Un enfoque SOA es aquel en el que nuestra aplicación general hace uso de los servicios de otras aplicaciones. Un enfoque no SOA es cuando la aplicación es una aplicación independiente que contiene todo el código necesario para implementar la aplicación.

Vemos muchos ejemplos de SOA cuando usamos la web. Podemos ir a un único sitio web y reservar viajes aéreos, hoteles y automóviles, todo desde un único sitio. Los datos de los hoteles no se almacenan en las computadoras de las aerolíneas. En cambio, las computadoras de las aerolíneas se comunican con los servicios en las computadoras del hotel y recuperan los datos del hotel y se los presentan al usuario. Cuando el usuario acepta hacer una reserva de hotel utilizando el sitio de la aerolínea, el sitio de la aerolínea usa otro servicio web en los sistemas del hotel para realizar la reserva. Y cuando llega el momento de cargar su tarjeta de crédito por toda la transacción, otras computadoras se involucran en el proceso.

![](imagenapi.svg)

## Service Oriented Architecture(Arquitectura orientada a Servicios SOA)

Una arquitectura orientada a servicios tiene muchas ventajas, entre las que se incluyen: (1) siempre mantenemos una sola copia de datos (esto es particularmente importante para cosas como reservas de hotel en las que no queremos realizar demasiados compromisos) y (2) los propietarios de los datos puede establecer las reglas sobre el uso de sus datos. Con estas ventajas, un sistema SOA debe diseñarse cuidadosamente para tener un buen rendimiento y satisfacer las necesidades del usuario.

Cuando una aplicación hace que un conjunto de servicios en su API esté disponible en la web, llamamos a estos servicios web .

## Google geocoding web service(Servicio web de geocodificación de Google)
Google tiene un excelente servicio web que nos permite hacer uso de su gran base de datos de información geográfica. Podemos enviar una cadena de búsqueda geográfica como "Ann Arbor, MI" a su API de geocodificación y hacer que Google arroje su mejor estimación sobre en qué lugar del mapa podemos encontrar nuestra cadena de búsqueda y cuéntenos sobre los puntos de referencia cercanos.

El servicio de geocodificación es gratuito pero tiene una tarifa limitada por lo que no puede hacer un uso ilimitado de la API en una aplicación comercial. Pero si tiene algunos datos de encuestas donde un usuario final ha ingresado una ubicación en un cuadro de entrada de formato libre, puede usar esta API para limpiar sus datos bastante bien.

Cuando utilizas una API gratuita como la API de geocodificación de Google, debes ser respetuoso con el uso de estos recursos. Si demasiadas personas abusan del servicio, Google podría suspender o reducir significativamente su servicio gratuito.

Puede leer la documentación en línea para este servicio, pero es bastante simple e incluso puede probarlo usando un navegador escribiendo la siguiente URL en su navegador:

http://maps.googleapis.com/maps/api/geocode/json?address=Ann+Arbor%2C+MI

Asegúrese de desenvolver la URL y eliminar los espacios de la URL antes de pegarla en su navegador.

La siguiente es una aplicación simple para solicitar al usuario una cadena de búsqueda, llamar a la API de geocodificación de Google y extraer información del JSON devuelto.

In [1]:
import urllib.request, urllib.parse, urllib.error
import json #librerias para extracccion de datos en archivos xml

# Note that Google is increasingly requiring keys
# for this API
serviceurl = 'http://maps.googleapis.com/maps/api/geocode/json?' #Almacenamiento del link del archivo json

while True:
    address = input('Enter location: ')
    if len(address) < 1: break

    url = serviceurl + urllib.parse.urlencode(
        {'address': address}) #Convierte la informacion en un formato ASCII

    print('Retrieving', url) #Imprime la URL que se ha analizado
    uh = urllib.request.urlopen(url) #abre la URL con la informacion que posee
    data = uh.read().decode() # Lee la informacion de la URL y la decodifica a formato normal
    print('Retrieved', len(data), 'characters')#Imprime el numero de caracteres

    try:
        js = json.loads(data)
    except:
        js = None

    if not js or 'status' not in js or js['status'] != 'OK':
        print('==== Failure To Retrieve ====')
        print(data)
        continue

    print(json.dumps(js, indent=4))#Imprime el codigo Json

    lat = js["results"][0]["geometry"]["location"]["lat"]
    lng = js["results"][0]["geometry"]["location"]["lng"]
    print('lat', lat, 'lng', lng)
    location = js['results'][0]['formatted_address']
    print(location)
    print('===================================================')
# Code: http://www.py4e.com/code3/geojson.py

Enter location: Guatemala
Retrieving http://maps.googleapis.com/maps/api/geocode/json?address=Guatemala
Retrieved 271 characters
==== Failure To Retrieve ====
{
   "error_message" : "You have exceeded your daily request quota for this API. We recommend registering for a key at the Google Developers Console: https://console.developers.google.com/apis/credentials?project=_",
   "results" : [],
   "status" : "OVER_QUERY_LIMIT"
}



KeyboardInterrupt: 

El programa toma la cadena de búsqueda y construye una URL con la cadena de búsqueda como un parámetro codificado correctamente y <b>luego usa urllib para recuperar el texto de la API de geocodificación de Google</b>. A diferencia de una página web fija, los datos que obtenemos dependen de los parámetros que enviamos y de los datos geográficos almacenados en los servidores de Google.

Una vez que recuperamos los datos JSON, los analizamos con la biblioteca json y hacemos algunas comprobaciones para asegurarnos de que recibimos buenos datos, luego extraemos la información que estamos buscando.

El resultado del programa se mostro antenriormente.

You can download www.py4e.com/code3/geoxml.py to explore the XML variant of the Google geocoding API.

## Seguridad y uso de API
Es bastante común que necesite algún tipo de "clave API" para hacer uso de la API de un proveedor. La idea general es que quieren saber quién está usando sus servicios y cuánto está usando cada usuario. Tal vez tengan niveles gratuitos y de pago de sus servicios o tengan una política que limite el número de solicitudes que un individuo puede hacer durante un período de tiempo en particular.

A veces, una vez que obtiene su clave API, simplemente incluye la clave como parte de los datos POST o quizás como un parámetro en la URL al llamar a la API.

Otras veces, el vendedor desea una mayor seguridad del origen de las solicitudes y, por lo tanto, agregan que espera que envíe mensajes firmados criptográficamente utilizando claves y secretos compartidos.<b> Una tecnología muy común que se utiliza para firmar solicitudes a través de Internet se llama OAuth </b>. Puede leer más sobre el protocolo OAuth en www.oauth.net .

A medida que la API de Twitter se volvió cada vez más valiosa, Twitter pasó de ser una API abierta y pública a una API que requería el uso de firmas OAuth en cada solicitud API. Afortunadamente, todavía hay varias librerías OAuth cómodas y gratuitas para que pueda evitar escribir desde cero una implementación de OAuth al leer las especificaciones. Estas bibliotecas son de complejidad variable y tienen diversos grados de riqueza. El sitio web de OAuth tiene información sobre varias bibliotecas de OAuth.

Para este próximo programa de ejemplo, descargaremos los archivos twurl.py , hidden.py , oauth.py y twitter1.py de www.py4e.com/code y los pondremos todos en una carpeta en su computadora.

Para hacer uso de estos programas, deberá tener una cuenta de Twitter y autorizar su código de Python como una aplicación, configurar una clave, secreto, token y secreto de token. Editarás el archivo hidden.py y colocarás estas cuatro cadenas en las variables apropiadas en el archivo:

In [3]:
# Keep this file separate

# https://apps.twitter.com/
# Create new App and get the four strings

def oauth():
    return {"consumer_key": "h7Lu...Ng",
            "consumer_secret": "dNKenAC3New...mmn7Q",
            "token_key": "10185562-eibxCp9n2...P4GEQQOSGI",
            "token_secret": "H0ycCFemmC4wyf1...qoIpBo"}

# Code: http://www.py4e.com/code3/hidden.py

Se accede al servicio web de Twitter usando una URL como esta:

https://api.twitter.com/1.1/statuses/user_timeline.json

Pero una vez que se haya agregado toda la información de seguridad, la URL se verá más como:

In [None]:
https://api.twitter.com/1.1/statuses/user_timeline.json?count=2
&oauth_version=1.0&oauth_token=101...SGI&screen_name=drchuck
&oauth_nonce=09239679&oauth_timestamp=1380395644
&oauth_signature=rLK...BoD&oauth_consumer_key=h7Lu...GNg
&oauth_signature_method=HMAC-SHA1

Puede leer la especificación OAuth si quiere saber más sobre el significado de los diversos parámetros que se agregan para cumplir con los requisitos de seguridad de OAuth.

Para los programas que ejecutamos con Twitter, ocultamos toda la complejidad en los archivos oauth.py y twurl.py . Simplemente establecemos los secretos en hidden.py y luego enviamos la URL deseada a la función twurl.augment () y el código de la biblioteca agrega todos los parámetros necesarios a la URL.

Este programa recupera la línea de tiempo para un usuario de Twitter en particular y nos la devuelve en formato JSON en una cadena. Simplemente imprimimos los primeros 250 caracteres de la cadena:

## Problemas propuestos

In [3]:
import urllib.request, urllib.parse, urllib.error
import json #librerias para extracccion de datos en archivos xml

# Note that Google is increasingly requiring keys
# for this API
serviceurl = 'http://maps.googleapis.com/maps/api/geocode/json?' #Almacenamiento del link del archivo json

while True:
    address = input('Enter location: ')
    if len(address) < 1: break

    url = serviceurl + urllib.parse.urlencode(
        {'address': address}) #Convierte la informacion en un formato ASCII

    print('Retrieving', url) #Imprime la URL que se ha analizado
    uh = urllib.request.urlopen(url) #abre la URL con la informacion que posee
    data = uh.read().decode() # Lee la informacion de la URL y la decodifica a formato normal
    print('Retrieved', len(data), 'characters')#Imprime el numero de caracteres

    try:
        js = json.loads(data)
    except:
        js = None

    if not js or 'status' not in js or js['status'] != 'OK':
        print('==== Failure To Retrieve ====')
        print(data)
        continue

    print(json.dumps(js, indent=4))

    lat = js["results"][0]["geometry"]["location"]["lat"]
    lng = js["results"][0]["geometry"]["location"]["lng"]
    print('lat', lat, 'lng', lng)
    location = js['results'][0]['formatted_address']
    print(location)

# Code: http://www.py4e.com/code3/geojson.py

Enter location: villa nueva
Retrieving http://maps.googleapis.com/maps/api/geocode/json?address=villa+nueva
Retrieved 1595 characters
{
    "results": [
        {
            "geometry": {
                "location": {
                    "lat": 14.5298287,
                    "lng": -90.5920027
                },
                "viewport": {
                    "northeast": {
                        "lat": 14.5855985,
                        "lng": -90.55343630000002
                    },
                    "southwest": {
                        "lat": 14.4812231,
                        "lng": -90.6360054
                    }
                },
                "bounds": {
                    "northeast": {
                        "lat": 14.5855985,
                        "lng": -90.55343630000002
                    },
                    "southwest": {
                        "lat": 14.4812231,
                        "lng": -90.6360054
                    }
                },


KeyboardInterrupt: 

In [4]:
import xml.etree.ElementTree as ET

input = ''' 
<comment>
  <name>Matthias</name>
  <count>97</count>
</comment>
''' #colocamos en un comentario multilinea lo que guardaremos en la variable input

commentinfo = ET.fromstring(input) #Convierte el testo input en un diagrama de arbol tipo xml
lst = commentinfo.findall('.//count') #Almacena el contenido del arbol de users/user
print(commentinfo)
print(lst)
print('User count:', len(lst)) # Imprime la cantidad de usuarios que hay


for item in lst:
    #print('Name', item.find('name').text)
   # print('Count', item.find('count').text)
    print('count2', item.get("count"))

# Code: http://www.py4e.com/code3/xml2.py

<Element 'comment' at 0x7f0cd4ee3228>
[<Element 'count' at 0x7f0cd4ee3818>]
User count: 1
count2 None


## Glosario

<b>La geocodificación</b> es el proceso de transformar una descripción de una ubicación (por ejemplo, un par de coordenadas, una dirección o un nombre de un lugar) en una ubicación de la superficie de la Tierra. Se puede geocodificar introduciendo una descripción de una ubicación a la vez o proporcionando muchas de ellas al mismo tiempo en una tabla. Las ubicaciones que se obtienen se transforman en entidades geográficas con atributos, que se pueden utilizar para la representación cartográfica o el para análisis espacial.

## Bibliografia extra
Como usar urllib()
http://christophergs.github.io/python/2016/12/03/python-urllib-parse

Conversion de Python a Json
http://www.bogotobogo.com/python/python-json-dumps-loads-file-read-write.php


## urlencode
Convierte un objeto de mapeo (diccionario) o una secuencia de tuplas de dos elementos en una cadena de texto ASCII codificada en porcentaje.

El módulo <b>urllib.request</b> define funciones y clases que ayudan a abrir URL (principalmente HTTP) en un mundo complejo: autenticación básica y resumida, redirecciones, cookies y más.

El módulo urllib.request define las siguientes funciones:

urllib.request.urlopen (url [, data] [, timeout])
Abra la url URL, que puede ser una cadena o un objeto Request.


## json.dumps () y json.loads ()
<b>dumps()</b> takes an object and produces a string:

a = {'foo': 3} 
json.dumps(a)


<b>load()</b> Tomaría un objeto similar a un archivo, leería los datos de ese objeto y usaría esa cadena para crear un objeto:

with open('file.son') as fh:
    a = json.load(fh)


In [6]:
#Ejemplo urlncode
import urllib.request

data = urllib.parse.urlencode({'type': 'customer foo','client_id': 123})
print('respuesta urlencode:', data)
#'client_id=123&type=customer'

respuesta: client_id=123&type=customer+foo
