# Generación de un feed RSS

Para generar un feed RSS en Python podemos utilizar la librería `feedgen`. El primer paso será instalarla.

## Instalar librería

In [None]:
pip install feedgen

Collecting feedgen
  Downloading feedgen-0.9.0.tar.gz (217 kB)
[K     |████████████████████████████████| 217 kB 5.5 MB/s 
Building wheels for collected packages: feedgen
  Building wheel for feedgen (setup.py) ... [?25l[?25hdone
  Created wheel for feedgen: filename=feedgen-0.9.0-py2.py3-none-any.whl size=44383 sha256=7de2974a9f11346146b1647cd42b5a553686137f512d2e1769374844f3d93721
  Stored in directory: /root/.cache/pip/wheels/41/38/49/6076f92487edf3b4e4d79f1ac91edda8648b19bc130ef48d11
Successfully built feedgen
Installing collected packages: feedgen
Successfully installed feedgen-0.9.0


## Crear feed RSS

Para crear un feed utilizamos el constructor `FeedGenerator`. Luego tendremos que añadirle los atributos obligatorios y opcionales que queramos del canal (channel).

In [None]:
from feedgen.feed import FeedGenerator
fg = FeedGenerator()
fg.id('Identificador del feed')
fg.title('IES Rafael Alberti')
fg.author( {'name':'1º DAM','email':'1dam@iesrafaelalberti.es'} )
fg.link( href='iesrafaelalberti.es', rel='alternate' )
fg.logo('http://iesrafaelalberti.es/logo.jpg')
fg.subtitle('Subtítulo del feed')
fg.link( href='https://iesrafaelalberti.es/rss.xml', rel='self' )
fg.language('es-ES')

# Podemos imprimir un string con toda la información añadida al feed hasta el momento
print(fg.rss_str())

b'<?xml version=\'1.0\' encoding=\'UTF-8\'?>\n<rss xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/" version="2.0"><channel><title>IES Rafael Alberti</title><link>https://iesrafaelalberti.es/rss.xml</link><description>Subt\xc3\xadtulo del feed</description><atom:link href="https://iesrafaelalberti.es/rss.xml" rel="self"/><docs>http://www.rssboard.org/rss-specification</docs><generator>python-feedgen</generator><image><url>http://iesrafaelalberti.es/logo.jpg</url><title>IES Rafael Alberti</title><link>https://iesrafaelalberti.es/rss.xml</link></image><language>es-ES</language><lastBuildDate>Mon, 04 Apr 2022 07:29:29 +0000</lastBuildDate></channel></rss>'


## Añadir entradas al feed

Una vez tenemos el canal configurado, utilizamos el método `add_entry` para añadir entradas de noticias (o lo que queramos) a nuestro feed.

In [None]:
fe = fg.add_entry()
fe.id('Identificador de la entrada')
fe.title('INFORMACIÓN SOBRE LA BECA GENERAL DEL PRÓXIMO CURSO 2022/2023')
fe.link(href="https://iesrafaelalberti.es/informacion-sobre-la-beca-general-del-proximo-curso-2022-2023/")
fe.description("Para el próximo curso 2022/2023 se ha adelantado el plazo para solicitar la Beca de la convocatoria general para estudiante de estudios postobligatorios, siendo el mismo desde el 30 de marzo al 12 de mayo de 2022. A fin de dar difusión al alumnado interesado se envía documento informativo.")

'Para el próximo curso 2022/2023 se ha adelantado el plazo para solicitar la Beca de la convocatoria general para estudiante de estudios postobligatorios, siendo el mismo desde el 30 de marzo al 12 de mayo de 2022. A fin de dar difusión al alumnado interesado se envía documento informativo.'

## Exportar feed

Podemos exportar el feed en un string con todo su contenido o directamente en un archivo, tanto en formato RSS como Atom.

In [None]:
atomfeed = fg.atom_str(pretty=True) # Obtiene el feed ATOM como cadena
fg.atom_file('atom.xml') # Escribe el feed ATOM a un fichero

rssfeed  = fg.rss_str(pretty=True) # Obtiene el feed RSS como cadena
fg.rss_file('rss.xml') # Escribe el feed RSS a un fichero

# Validación de un feed

La librería que vamos a utilizar para validar un feed no se encuentra en los repositorios de PyPi. Así que tendrás que descargarla del siguiente enlace:

https://github.com/IES-Rafael-Alberti/LMSGI-21-22-codes/raw/main/xml/rss/feedvalidator.zip

Descomprime el archivo, crea una carpeta con el nombre `feedvalidator` en los archivos de este cuaderno y copia todos los archivos .py dentro.

Tendremos que instalar la librería `html5lib`, que es requisito para `feedvalidator`:

In [1]:
pip install html5lib



Después de eso podrás importarla:

In [None]:
import feedvalidator

Para validar el archivo RSS, lo abres como cualquier otro archivo en Python y se lo pasas al método `validateStream` de `feedvalidator`. Te mostrará un log de la validación, indicando si hay algún elemento erróneo. Esta librería es la que utiliza W3C en la web https://validator.w3.org/feed/.

In [None]:
archivo = open("rss.xml", "rb") 
feedvalidator.validateStream(archivo)

{'feedType': 2,
 'loggedEvents': [<feedvalidator.logging.ValidElement at 0x7f9b7787a0d0>,
  <feedvalidator.logging.ValidElement at 0x7f9b7787a2d0>,
  <feedvalidator.logging.ValidElement at 0x7f9b7787ae90>,
  <feedvalidator.logging.ValidURI at 0x7f9b7787aad0>,
  <feedvalidator.logging.ValidElement at 0x7f9b7787a190>,
  <feedvalidator.logging.ValidElement at 0x7f9b7787a810>,
  <feedvalidator.logging.ValidElement at 0x7f9b7787a050>,
  <feedvalidator.logging.ValidAtomLinkRel at 0x7f9b7787af10>,
  <feedvalidator.logging.ValidURI at 0x7f9b77880f10>,
  <feedvalidator.logging.SelfDoesntMatchLocation at 0x7f9b77880dd0>,
  <feedvalidator.logging.ValidURI at 0x7f9b77880490>,
  <feedvalidator.logging.ValidElement at 0x7f9b7791f110>,
  <feedvalidator.logging.ValidElement at 0x7f9b7791f250>,
  <feedvalidator.logging.ValidElement at 0x7f9b7791f450>,
  <feedvalidator.logging.ValidURI at 0x7f9b7767c110>,
  <feedvalidator.logging.ValidElement at 0x7f9b7767c5d0>,
  <feedvalidator.logging.ValidTitle at 0x

# Lectura de un feed RSS

Para leer un feed RSS desde Python (en inglés sería parsear el fichero), utilizaremos la librería `feedparser`.

## Instalar librería

In [None]:
pip install feedparser

Collecting feedparser
  Downloading feedparser-6.0.8-py3-none-any.whl (81 kB)
[?25l[K     |████                            | 10 kB 22.1 MB/s eta 0:00:01[K     |████████                        | 20 kB 21.8 MB/s eta 0:00:01[K     |████████████▏                   | 30 kB 24.4 MB/s eta 0:00:01[K     |████████████████▏               | 40 kB 13.9 MB/s eta 0:00:01[K     |████████████████████▏           | 51 kB 6.3 MB/s eta 0:00:01[K     |████████████████████████▎       | 61 kB 7.4 MB/s eta 0:00:01[K     |████████████████████████████▎   | 71 kB 8.1 MB/s eta 0:00:01[K     |████████████████████████████████| 81 kB 4.7 MB/s 
[?25hCollecting sgmllib3k
  Downloading sgmllib3k-1.0.0.tar.gz (5.8 kB)
Building wheels for collected packages: sgmllib3k
  Building wheel for sgmllib3k (setup.py) ... [?25l[?25hdone
  Created wheel for sgmllib3k: filename=sgmllib3k-1.0.0-py3-none-any.whl size=6066 sha256=8692baf4b91e1dbac0ad00b855c875033ebd962b8ee0e0d88174dbd6cd7c5234
  Stored in directory

## Leer de un feed

Para parsear un feed, simplemente le pasamos a un objeto de la librería `feedparser` el nombre del archivo RSS usando el método `parse`. Este método también admite una URL o una string con el contenido del archivo.

In [None]:
import feedparser
file = feedparser.parse(r'rss.xml')

# El objeto file.feed contiene todas las etiquetas relativas al canal
print(file.feed.title)

# file.entries es un array con todas las entradas
print(file.entries[0].title)

IES Rafael Alberti
INFORMACIÓN SOBRE LA BECA GENERAL DEL PRÓXIMO CURSO 2022/2023
