# Datos en la Web

Con HTTP Request/Response se entiende que hay una forma natural a intercambiar datas usando este protocolo.
 

# Usando servicios web (web services)

Cuando trabajamos con sistemas webs existen diferentes tipos de formatos que pueden ser usados para almacenar y mostrar contenido. Tres formatos son los más comunes: HTML, XML y JSON. Los dos primeros HTML y XML son lenguajes de marcado utilizados para expresar y estructurar contenido. El tercer formato es JSON, que es un formato de intercambio de datos ligero y popular utilizado en muchas aplicaciones web hoy en día. 

Los lenguajes de marcado están diseñados para adornar textos de forma automática y legible para humanos, generalmente para agregar significado o estructura, se basan en etiquetas para marcar cómo se interpretan ciertos fragmentos de texto. 
Estas etiquetas son a menudo palabras estandares que puede definir para algún significado o propósito. 

Por ejemplo:
```
<adjective> Servicio Orientado</adjective>
<noun> Arquitectura </noun>.
```
Por lo general, no hay sintaxis de programación en Markup Language (lenguaje de marcado), solamente usa etiquetas para convertir un simple archivo de texto en algo que una computadora puede manipular o que un humano puede entender. 

El texto en las páginas web está estructurado a través de un Markup Language: HTML.

HTML se centra en estructurar, no en diseñar, el texto, marcando qué partes del texto de la página son el título, encabezados, párrafos, etc., que deben ser representados adecuadamente por un navegador web. HTML tiene un conjunto predefinido de etiquetas que sirven para diferentes propósitos.


Este fragmento de código muestra las características más básicas de un documento HTML. 

```HTML
<!DOCTYPE html>
<html>
<title> Page Title </title>
</head>
<body>
<p>
<h1>This is heading </h1>
If you like, you can switch to the
<a href="http://www.dr-chuck.com/page2.htm">
Second Page</a>.
</p>
</body>
</html>
```

Por lo general, un documento HTML se divide en dos secciones, la cabeza y el cuerpo. Hay etiquetas que contienen la información del encabezado y el cuerpo del documento. El encabezado generalmente contiene metadatos utilizados por la página. El cuerpo contiene el contenido principal y la información de su página web, además contiene el texto, enlaces, imágenes, listas y otros datos que se desea presentar. Normalmente no hay información de estilo en este documento HTML. Si desea agregar una estética como fuentes y colores, puede aplicar una hoja de estilo en cascada o estilo CSS (Cascading Style Sheet). CSS puede hacer referencia a las etiquetas HTML estándar para aplicar estilos específicos al texto dentro de esas etiquetas (tags).Este estilo se puede aplicar a través de un archivo CSS separado o directamente dentro del documento HTML.
Por ejemplo, este archivo CSS mostrado a continuación daría estilo a todo el texto dentro de las etiquetas HTML de párrafo, con el color azul. 

```CSS
p{
color:blue;
}
```

## XML

Extensible Markup Language, o XML, es un lenguaje de marcado destinado a almacenar y transportar datos. Al igual que con los otros lenguajes de marcado, es legible por máquina y por humanos. Por lo general, XML se utiliza para enviar datos estructurados dentro de un sistema basado en la web. En este ejemplo, mostradao abajo, tenemos un documento XML. 

```XML
<?xml version ="1.0"
encoding ="UTF-8">
<note>
<to> John </to>
<from> Jane
</from>
<heading> Reminder </heading>
<body> Don´t forget the dogs </body>
</note>
```

Intuitivamente, tenemos una nota para John de Jane con un encabezado, un recordatorio y el texto del cuerpo: No olvidar los perros. Puede definir un esquema XML para las etiquetas válidas y su estructura adecuada para un documento XML. 

Un ejemplo de XML se muestra a continuación:
```XML
<person>
<name>Chuck</name>
<phone type="intl">
+1 734 303 4456
</phone>
<email hide="yes" />
</person>
```

Otro ejemplo de XML:
```XML
<breakfast_menu>
<food>
<name>Belgian Waffles</name>
<price>$5.95</price>
<description>
Two of our famous Belgian Waffles with plenty of real maple syrup
</description>
<calories>650</calories>
</food>
<food>
<name>Strawberry Belgian Waffles</name>
<price>$7.95</price>
<description>
Light Belgian waffles covered with strawberries and whipped cream
</description>
<calories>900</calories>
</food>
<food>
<name>Berry-Berry Belgian Waffles</name>
<price>$8.95</price>
<description>
Light Belgian waffles covered with an assortment of fresh berries and whipped cream
</description>
<calories>900</calories>
</food>
<food>
<name>French Toast</name>
<price>$4.50</price>
<description>
Thick slices made from our homemade sourdough bread
</description>
<calories>600</calories>
</food>
<food>
<name>Homestyle Breakfast</name>
<price>$6.95</price>
<description>
Two eggs, bacon or sausage, toast, and our ever-popular hash browns
</description>
<calories>950</calories>
</food>
</breakfast_menu>
```

Revisar: <https://es.wikipedia.org/wiki/Extensible_Markup_Language>

## Analizando (parsing) XML

In [37]:
import xml.etree.ElementTree as ET

data = '''
<person>
  <name>Chuck</name>
  <phone type="intl">
    +1 734 303 4456
  </phone>
  <email hide="yes" />
</person>'''
#print(type(data))

tree = ET.fromstring(data)
#print(type(tree))
#print(tree.tag)
#print(tree.attrib)

#for elem in tree:
#   print(elem.tag,elem.attrib)

print('nombre:', tree.find('name').text)
print('atributo:', tree.find('email').get('hide'))

nombre: Chuck
atributo: yes


## Recorriendo nodos

In [62]:
import xml.etree.ElementTree as ET

input = '''
<stuff>
  <users>
    <user x="2" cd="nivel2">
      <id>001</id>
      <name>Chuck</name>
    </user>
    <user x="7" cd="nivel1">
      <id>009</id>
      <name>Brent</name>
    </user>
  </users>
</stuff>'''

stuff = ET.fromstring(input)
#lst = stuff.findall('users/user/id')

for item in stuff.findall('users/user/id'):
    print(item.text)

#print('conteo:', len(lst))
  
#for item in lst:
#    print('nombre', item.find('name').text)
#    print('Id', item.find('id').text)
#    print('Attribute', item.get('cd'))
   
#lst = stuff.findall('users/user')
#print('número de user:', len(lst))

#lst2 = stuff.findall('user')
#print('User count:', len(lst2))  


001
009


In [2]:
import xml.etree.ElementTree as ET
import csv
menu='''
<breakfast_menu>
<food>
<name>Belgian Waffles</name>
<price>$5.95</price>
<description>
Two of our famous Belgian Waffles with plenty of real maple syrup
</description>
<calories>650</calories>
</food>
<food>
<name>Strawberry Belgian Waffles</name>
<price>$7.95</price>
<description>
Light Belgian waffles covered with strawberries and whipped cream
</description>
<calories>900</calories>
</food>
<food>
<name>Berry-Berry Belgian Waffles</name>
<price>$8.95</price>
<description>
Light Belgian waffles covered with an assortment of fresh berries and whipped cream
</description>
<calories>900</calories>
</food>
<food>
<name>French Toast</name>
<price>$4.50</price>
<description>
Thick slices made from our homemade sourdough bread
</description>
<calories>600</calories>
</food>
<food>
<name>Homestyle Breakfast</name>
<price>$6.95</price>
<description>
Two eggs, bacon or sausage, toast, and our ever-popular hash browns
</description>
<calories>950</calories>
</food>
</breakfast_menu>
'''
##A.Script para extraer los nombres de las comidas
##B.Script para extraer los precios de las comidas
##C.Script para extraer la cantidad de calorías por comida
##D.Almacenarlo en una lista con tres columnas: nombre, precios cantidad

menu= ET.fromstring(menu)
comidas = menu.findall('food')
print('User count:', len(comidas))

archivo=[]

for item in comidas:
        prov=[]
        prov.append(item.find('name').text)
        prov.append(item.find('price').text)
        prov.append(item.find('calories').text)
        archivo.append(prov)
print(archivo)

import csv 
Columnas = ['Nombre', 'precio', 'calorías']  
with open('comidas.csv', 'w',newline ='') as f: 
    write = csv.writer(f) 
    write.writerow(Columnas) 
    write.writerows(archivo) 

User count: 5
[['Belgian Waffles', '$5.95', '650'], ['Strawberry Belgian Waffles', '$7.95', '900'], ['Berry-Berry Belgian Waffles', '$8.95', '900'], ['French Toast', '$4.50', '600'], ['Homestyle Breakfast', '$6.95', '950']]
