<img src="../Images/Level1Beginner.png" alt="Beginner" width="128" height="128" align="right">

## Web en Python

En Python el acceso a los "recursos" que se encuentran en la World Wide Web se hace utilizando librerías (paquetes) que permiten realizar las distintas tareas que cada caso requiere

Muchas personas en la comunidad de Python utilizan (al menos comienzan utilizando) la librería **requests** cuya documentación se encuentra en: [Requests: HTTP para Humanos](https://docs.python-requests.org/es/latest/index.html)


In [None]:
import requests

In [None]:

try :
    r = requests.get("https://pyb2i.com")
    data = r.content
    print(data)

except Exception as e:
    print("Error de Entrada/Salida:", e)

else :
    r.close()

In [None]:

try :
    r = requests.get("https://pyb2i.com")
    
    print("\nHeaders\n", r.headers)

    print("\nTexto\n", r.text)

except Exception as e:
    print("Error de Entrada/Salida:", e)

else :
    r.close()


Se recomienda comenzar el aprendizaje y entrenamiento de cómo utilizar esta librería por [Quickstart](https://docs.python-requests.org/es/latest/user/quickstart.html)

En el URL de PyB2I se encuentra una página web muy simple; demopage.html

In [None]:

try :
    r = requests.get("https://pyb2i.com/demopage.html")
    
    print("\nHeaders\n")
    for k, v in r.headers.items() :
        print(k, ":", v)
    
    print("\nTexto\n", r.text)

except Exception as e:
    print("Error de Entrada/Salida:", e)

else :
    r.close()


---
### HTML y XHTML

El contenido de las páginas web se entregaba en formato **HTML - HyperText Markup Language**, los sitios actualizados entregan el contenido en **XHTML - eXtensible Hyper Text Markup Language** [estándard](https://www.w3.org/blog/news/archives/4167#:~:text=The%20HTML%20Working%20Group%20today,of%20the%20Open%20Web%20Platform.)

Todo **lenguaje de marcado** se basa en el uso de la **identificación de apertura y cierre de marcas**

Se ha establecido como un estandar utilizar los símbolos **<** (menor) y **>** (mayor) para identificar la apertura de una marca y el símbolo **/** (barra) después del símbolo menor para identifcar el cierre de una marca; de este modo

\<h1> indica la apertura de la marca "h1"
   
\</h1> indica el cierre de la marca "h1"

Existen excepciones que se pueden hallar en la documentación oficial

El procesamiento de un **texto en lenguaje de marcado** implica detectar las "marcas" y actuar en consecuencia, en el caso de documentos para páginas web significa presentar la información mediante un "browser" o navegador web

Con el tiempo HTML y actualmente XHTML incorporarón un enorme conjunto de "marcas" para **formatear** la información no solamente presentar; estas marcas evolucionaron a lo que hoy se conoce como **CSS - Cascading Style Sheets** [estandard](https://www.w3.org/Style/CSS/#specs)

<img src="../Images/Level1Beginner.png" alt="Beginner" width="128" height="128" align="right">


### XML

**XML - eXtensible Markup Language** es un lenguaje de marcado sin marcas preestablecidas [estandard](https://www.w3.org/XML/)

Bajo el mismo principio de "abrir y cerrar marcas", en XML se espera que quién crea un documento utilice correctamente las marcas que necesite

    <personas>
        <persona lastname="Tentor" firstname="Julio"></persona>
        <persona lastname="Perez" firstname="Juan"></persona>
    </personas>'''

La librería básica para procesar datos en formato XML es **xml.etree.ElementTree** que normalmente se importa como **ET**


In [None]:
import xml.etree.ElementTree as ET

In [None]:

data = '''
<personas>
    <persona lastname="Tentor" firstname="Julio"></persona>
    <persona lastname="Perez" firstname="Juan"></persona>
</personas>'''

root = ET.fromstring(data)

print(root.tag)
for child in root :
    print(child.tag, child.attrib)


---
### JSON

**JSON - JavaScript Object Notation** es un formato para manter datos como listas de pares clave-valor, en Python eso se conoce como una lista de dicccionarios



In [None]:
import json

In [None]:
data = '''
[
    { "lastname": "Tentor", "firstname" : "Julio" },
    { "lastname": "Perez", "firstname" : "Juan" }
]'''

persons = json.loads(data)
for person in persons :
    for k, v in person.items() :
        print(k, v)

---
El formato JSON es muy útil para almacenar datos de un programa en Python

In [None]:
filename = "agenda.txt"
try :
    file = open(filename, mode='rt', encoding='UTF8')

    persons = json.load(file)
    for person in persons :
        for k, v in person.items() :
            print(k, v)
    
except Exception as e:
    print("Error de Entrada/Salida:", e)

else :
    file.close()
