# Working with RSS Feeds Lab

Complete the following set of exercises to solidify your knowledge of parsing RSS feeds and extracting information from them.

### 1. Use feedparser to parse the following RSS feed URL.

In [1]:
url = 'https://www.francetvinfo.fr/titres.rss'

import feedparser
from pprint import pprint

ffeed = feedparser.parse(url)

### 2. Obtain a list of components (keys) that are available for this feed.

In [2]:
ffeed.keys()

dict_keys(['bozo', 'entries', 'feed', 'headers', 'etag', 'updated', 'updated_parsed', 'href', 'status', 'encoding', 'version', 'namespaces'])

### 3. Obtain a list of components (keys) that are available for the *feed* component of this RSS feed.

In [4]:
print(type(ffeed.feed))

<class 'feedparser.util.FeedParserDict'>


In [5]:
print(ffeed.feed.keys())

dict_keys(['title', 'title_detail', 'subtitle', 'subtitle_detail', 'published', 'published_parsed', 'generator_detail', 'generator', 'links', 'link'])


### 4. Extract and print the feed title, published, published_parsed and link.

In [21]:
print(ffeed.feed['title'])
print(ffeed.feed['published'])
print(ffeed.feed['published_parsed'])
print(ffeed.feed['link'])    

Franceinfo - Les Titres
Thu, 08 Apr 2021 12:33:04 +0200
time.struct_time(tm_year=2021, tm_mon=4, tm_mday=8, tm_hour=10, tm_min=33, tm_sec=4, tm_wday=3, tm_yday=98, tm_isdst=0)
https://www.francetvinfo.fr/titres/


### 5. Count the number of entries that are contained in this RSS feed.

In [7]:
print(type(ffeed['entries']))
print(len(ffeed['entries']))
for entry in ffeed.entries:
    pprint(entry)
    break

<class 'list'>
34
{'guidislink': False,
 'id': 'https://www.francetvinfo.fr/societe/euthanasie/fin-de-vie-comment-la-crise-du-covid-19-a-fait-resurgir-le-debat-sur-le-suicide-assiste-et-l-euthanasie_4346873.html#xtor=RSS-3-[lestitres]',
 'link': 'https://www.francetvinfo.fr/societe/euthanasie/fin-de-vie-comment-la-crise-du-covid-19-a-fait-resurgir-le-debat-sur-le-suicide-assiste-et-l-euthanasie_4346873.html#xtor=RSS-3-[lestitres]',
 'links': [{'href': 'https://www.francetvinfo.fr/societe/euthanasie/fin-de-vie-comment-la-crise-du-covid-19-a-fait-resurgir-le-debat-sur-le-suicide-assiste-et-l-euthanasie_4346873.html#xtor=RSS-3-[lestitres]',
            'rel': 'alternate',
            'type': 'text/html'},
           {'href': 'https://www.francetvinfo.fr/image/75whucv4j-308d/500/281/23395429.png',
            'length': '29001',
            'rel': 'enclosure',
            'type': 'image/jpeg'}],
 'published': 'Thu, 08 Apr 2021 11:34:08 +0200',
 'published_parsed': time.struct_time(tm_year=2

### 6. Obtain a list of components (keys) available for an entry.

*Hint: Remember to index first before requesting the keys*

In [8]:
ffeed.entries[0].keys()

dict_keys(['title', 'title_detail', 'summary', 'summary_detail', 'published', 'published_parsed', 'links', 'link', 'id', 'guidislink'])

### 7. Extract a list of entry titles.

In [9]:
listoftitles = [ffeed.entries[i]['title'] for i in range(len(ffeed.entries))]
print(len(listoftitles))
listoftitles

34


["Fin de vie : comment la crise du Covid-19 a fait resurgir le débat sur le suicide assisté et l'euthanasie",
 'VIDEO. Christiane, atteinte de la maladie de Charcot, a choisi de se faire euthanasier en Belgique',
 'Euthanasie : "Il faut trouver une solution en France", affirme un médecin belge qui voit arriver des Français "au bout du bout"',
 'Euthanasie : "Quand quelqu\'un est incurable, c\'est inhumain de ne pas abréger ses souffrances", juge Françoise Hardy',
 'REPORTAGE. Débat sur l’euthanasie : plongée dans une unité de soins palliatifs',
 'Euthanasie : "Il y a d\'autres voies" pour le député-médecin Marc Delatte, qui soulève un problème "éthique"',
 "Emmanuel Macron va annoncer la suppression de l'ENA cet après-midi",
 'Enseignement à distance : le Cned annonce être de nouveau victime de cyberattaques',
 'Vrai ou faux "Salvator Mundi" ? : révélations autour du "tableau le plus cher au monde" dans un documentaire diffusé sur France 5',
 "Tennis : le tournoi de Roland-Garros repor

### 8. Calculate the percentage of entry titles that start with the word "Covid".

In [10]:
perc = round(len([i for i in listoftitles if i.startswith("Covid")])*100/len(listoftitles))
print(f'{perc} %')

3 %


### 9. Create a list of entry titles whose summary includes the word "vaccin".

In [11]:
titlelist = [listoftitles[i] for i in range(len(listoftitles)) if "vaccin" in ffeed.entries[i].summary]
print(len(titlelist))
titlelist

5


["Vaccin AstraZeneca : quelles conséquences en France après le rapport de l'Agence européenne du médicament ?",
 'DIRECT. Covid-19 : plus de 5\xa0700 malades dans les services de soins critiques',
 "Vaccination contre le Covid-19 : ce que dit l'Institut Pasteur à propos d'une possible fin des gestes barrières à l'automne",
 "Ce que l'on sait du lien entre le vaccin AstraZeneca et les très rares cas de thromboses après la mise au point de l'Agence européenne des médicaments",
 "Covid-19 : la Belgique réserve le vaccin AstraZeneca aux plus de 55 ans, l'Italie et l'Espagne aux plus de 60 ans"]

### 10. Create a Pandas data frame from the feed's entries.

In [12]:
import pandas as pd
df = pd.DataFrame(ffeed.entries)
df.head()

Unnamed: 0,title,title_detail,summary,summary_detail,published,published_parsed,links,link,id,guidislink
0,Fin de vie : comment la crise du Covid-19 a fa...,"{'type': 'text/plain', 'language': None, 'base...","Une proposition de loi pour une ""fin de vie li...","{'type': 'text/html', 'language': None, 'base'...","Thu, 08 Apr 2021 11:34:08 +0200","(2021, 4, 8, 9, 34, 8, 3, 98, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/societe/euthanasie...,https://www.francetvinfo.fr/societe/euthanasie...,False
1,"VIDEO. Christiane, atteinte de la maladie de C...","{'type': 'text/plain', 'language': None, 'base...",Le débat à l'Assemblée nationale ce jeudi 8&nb...,"{'type': 'text/html', 'language': None, 'base'...","Thu, 08 Apr 2021 11:18:12 +0200","(2021, 4, 8, 9, 18, 12, 3, 98, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/sante/maladie/vide...,https://www.francetvinfo.fr/sante/maladie/vide...,False
2,"Euthanasie : ""Il faut trouver une solution en ...","{'type': 'text/plain', 'language': None, 'base...","Médecin généraliste à Bruxelles, il pratique l...","{'type': 'text/html', 'language': None, 'base'...","Thu, 08 Apr 2021 09:37:05 +0200","(2021, 4, 8, 7, 37, 5, 3, 98, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/societe/euthanasie...,https://www.francetvinfo.fr/societe/euthanasie...,False
3,"Euthanasie : ""Quand quelqu'un est incurable, c...","{'type': 'text/plain', 'language': None, 'base...",Les députés examinent&nbsp;jeudi 8 avril une p...,"{'type': 'text/html', 'language': None, 'base'...","Thu, 08 Apr 2021 08:59:26 +0200","(2021, 4, 8, 6, 59, 26, 3, 98, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/societe/euthanasie...,https://www.francetvinfo.fr/societe/euthanasie...,False
4,REPORTAGE. Débat sur l’euthanasie : plongée da...,"{'type': 'text/plain', 'language': None, 'base...","Les députés examineront, jeudi, un texte pour ...","{'type': 'text/html', 'language': None, 'base'...","Wed, 07 Apr 2021 23:28:46 +0200","(2021, 4, 7, 21, 28, 46, 2, 97, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/societe/euthanasie...,https://www.francetvinfo.fr/societe/euthanasie...,False


In [13]:
# or
from pandas import json_normalize
df2 = json_normalize(ffeed.entries)
df2.head(1)

Unnamed: 0,title,summary,published,published_parsed,links,link,id,guidislink,title_detail.type,title_detail.language,title_detail.base,title_detail.value,summary_detail.type,summary_detail.language,summary_detail.base,summary_detail.value
0,Fin de vie : comment la crise du Covid-19 a fa...,"Une proposition de loi pour une ""fin de vie li...","Thu, 08 Apr 2021 11:34:08 +0200","(2021, 4, 8, 9, 34, 8, 3, 98, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/societe/euthanasie...,https://www.francetvinfo.fr/societe/euthanasie...,False,text/plain,,https://www.francetvinfo.fr/titres.rss,Fin de vie : comment la crise du Covid-19 a fa...,text/html,,https://www.francetvinfo.fr/titres.rss,"Une proposition de loi pour une ""fin de vie li..."


### 11. Sort the DataFrame by title name in ascending order, then descending order.

In [14]:
df.sort_values(by = 'title').head()

Unnamed: 0,title,title_detail,summary,summary_detail,published,published_parsed,links,link,id,guidislink
15,"""Personne n'a envie de tuer des moulins..."" : ...","{'type': 'text/plain', 'language': None, 'base...",Les députés ont adopté mercredi un amendement ...,"{'type': 'text/html', 'language': None, 'base'...","Thu, 08 Apr 2021 12:22:28 +0200","(2021, 4, 8, 10, 22, 28, 3, 98, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/monde/environnemen...,https://www.francetvinfo.fr/monde/environnemen...,False
21,"""Punk, dépressif... héros"" : le portrait décal...","{'type': 'text/plain', 'language': None, 'base...",C’est sans doute l’un des ouvrages les plus in...,"{'type': 'text/html', 'language': None, 'base'...","Thu, 08 Apr 2021 09:56:33 +0200","(2021, 4, 8, 7, 56, 33, 3, 98, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/culture/patrimoine...,https://www.francetvinfo.fr/culture/patrimoine...,False
33,APPEL A TEMOIGNAGES. Confinement : familles mo...,"{'type': 'text/plain', 'language': None, 'base...","En raison de la fermeture des écoles, les fami...","{'type': 'text/html', 'language': None, 'base'...","Wed, 07 Apr 2021 19:09:38 +0200","(2021, 4, 7, 17, 9, 38, 2, 97, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/sante/maladie/coro...,https://www.francetvinfo.fr/sante/maladie/coro...,False
12,APPEL A TEMOIGNAGES. Covid-19 : l'un de vos pr...,"{'type': 'text/plain', 'language': None, 'base...","Depuis le début de la pandémie, le Covid-19 a ...","{'type': 'text/html', 'language': None, 'base'...","Tue, 06 Apr 2021 19:02:59 +0200","(2021, 4, 6, 17, 2, 59, 1, 96, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/sante/maladie/coro...,https://www.francetvinfo.fr/sante/maladie/coro...,False
14,"Avec la parution des ""75 Feuillets et autres m...","{'type': 'text/plain', 'language': None, 'base...",Ces manuscrits étaient restés cachés depuis pr...,"{'type': 'text/html', 'language': None, 'base'...","Thu, 08 Apr 2021 12:12:21 +0200","(2021, 4, 8, 10, 12, 21, 3, 98, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/culture/livres/rom...,https://www.francetvinfo.fr/culture/livres/rom...,False


In [15]:
df.sort_values(by = 'title', ascending = False).head()

Unnamed: 0,title,title_detail,summary,summary_detail,published,published_parsed,links,link,id,guidislink
8,"Vrai ou faux ""Salvator Mundi"" ? : révélations ...","{'type': 'text/plain', 'language': None, 'base...","Authentifié dans le passé comme un vrai Vinci,...","{'type': 'text/html', 'language': None, 'base'...","Thu, 08 Apr 2021 12:08:26 +0200","(2021, 4, 8, 10, 8, 26, 3, 98, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/culture/arts-expos...,https://www.francetvinfo.fr/culture/arts-expos...,False
23,Vaccination contre le Covid-19 : ce que dit l'...,"{'type': 'text/plain', 'language': None, 'base...",Des chercheurs&nbsp;ont déterminé le taux de c...,"{'type': 'text/html', 'language': None, 'base'...","Wed, 07 Apr 2021 17:00:49 +0200","(2021, 4, 7, 15, 0, 49, 2, 97, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/sante/maladie/coro...,https://www.francetvinfo.fr/sante/maladie/coro...,False
10,Vaccin AstraZeneca : quelles conséquences en F...,"{'type': 'text/plain', 'language': None, 'base...","Mercredi 7 avril, l'Agence européenne du médic...","{'type': 'text/html', 'language': None, 'base'...","Thu, 08 Apr 2021 11:51:27 +0200","(2021, 4, 8, 9, 51, 27, 3, 98, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/sante/vaccin-astra...,https://www.francetvinfo.fr/sante/vaccin-astra...,False
17,"VIDEO. François Bayrou est ""pleinement engagé ...","{'type': 'text/plain', 'language': None, 'base...","""Ma certitude, c'est que cet homme-là est à la...","{'type': 'text/html', 'language': None, 'base'...","Thu, 08 Apr 2021 10:23:18 +0200","(2021, 4, 8, 8, 23, 18, 3, 98, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/politique/emmanuel...,https://www.francetvinfo.fr/politique/emmanuel...,False
1,"VIDEO. Christiane, atteinte de la maladie de C...","{'type': 'text/plain', 'language': None, 'base...",Le débat à l'Assemblée nationale ce jeudi 8&nb...,"{'type': 'text/html', 'language': None, 'base'...","Thu, 08 Apr 2021 11:18:12 +0200","(2021, 4, 8, 9, 18, 12, 3, 98, 0)","[{'rel': 'alternate', 'type': 'text/html', 'hr...",https://www.francetvinfo.fr/sante/maladie/vide...,https://www.francetvinfo.fr/sante/maladie/vide...,False


### 12. Add a new column to the data frame that contains the length (number of characters) of each entry title. Return a data frame that contains the title and title length of each entry in descending order (longest title length at the top).

In [16]:
df['title length'] = df['title'].apply(len)
df[['title', 'title length']].sort_values(by = 'title length', ascending=False).head()

Unnamed: 0,title,title length
25,Ce que l'on sait du lien entre le vaccin Astra...,150
33,APPEL A TEMOIGNAGES. Confinement : familles mo...,148
14,"Avec la parution des ""75 Feuillets et autres m...",139
19,"REPORTAGE. Orléans : dans le théâtre occupé, d...",134
12,APPEL A TEMOIGNAGES. Covid-19 : l'un de vos pr...,131


### 13. Count the number of titles per date and sort them in descending order.

In [17]:
df['day_published'] = df['published'].apply(lambda x:x[:12])
df2 = df.groupby('day_published').agg({'title':'count'})
df2.sort_values('title', ascending = False)

Unnamed: 0_level_0,title
day_published,Unnamed: 1_level_1
"Thu, 08 Apr",24
"Wed, 07 Apr",9
"Tue, 06 Apr",1


In [18]:
df2 = df.groupby('day_published', as_index=False).agg({'title':'count'})
df2.sort_values('title', ascending = False)

Unnamed: 0,day_published,title
0,"Thu, 08 Apr",24
2,"Wed, 07 Apr",9
1,"Tue, 06 Apr",1
